濮阳杆衣贸易有限公司

主頁 > 知識庫 > 解決python 使用openpyxl讀寫大文件的坑

解決python 使用openpyxl讀寫大文件的坑

熱門標(biāo)簽:汕頭電商外呼系統(tǒng)供應(yīng)商 北京外呼電銷機(jī)器人招商 云南地圖標(biāo)注 crm電銷機(jī)器人 鄭州智能外呼系統(tǒng)中心 400電話 申請 條件 南京crm外呼系統(tǒng)排名 賓館能在百度地圖標(biāo)注嗎 電銷機(jī)器人 金倫通信

由于需要處理xlsx類型的文件,我使用了openpyxl來處理,然而文件比較大,大約有60多MB。讀文件的時候雖然慢了一點(diǎn),但還是能夠讀出來,但是當(dāng)我想寫入時卻報錯了。

顯示設(shè)備沒有多余的空間,百度了一下,發(fā)現(xiàn)有不少關(guān)于openpyxl讀寫大文件的問題??偨Y(jié)來看,解決方案主要有以下兩種,當(dāng)然,我兩種都用上了。

手動釋放內(nèi)存

del wb, ws
gc.collect()

這一招還算有用,在讀完文件后可以看到內(nèi)存占用明顯下降了一點(diǎn)。

安裝lxml

使用命令·pip install lxml安裝依賴

這個依賴并非必須安裝的依賴,但是可以使openpyxl流式處理數(shù)據(jù)。

總之使用了以上兩種方案后,終于可以成功處理數(shù)據(jù)了。

補(bǔ)充:openpyxl讀取大文件的若干問題

需要編寫一個EXCEL文件對比工具

excel文件通常8MB,300張左右的表,每張表實(shí)際范圍為ZZ500.

使用openpyxl對表格進(jìn)行遍歷,完成兩個表之間的對比,找出公式不相同的單元格編程中遇到若干問題

1、讀取時報錯,錯誤代碼忘記了,原因是通過數(shù)組的方式讀取了一個不存在的數(shù)值

如 SS['AA'],這個數(shù)值沒有定義,因此報錯(PHP直接返回空值),使用SS.get('AA',null)進(jìn)行修改

D:\Python34\Lib\site-packages\openpyxl\reader\style.py

164: format_code = builtin_formats.get(numFmtId,'General')

2、讀取時內(nèi)存占用過大

基本就是內(nèi)存占用了2G以上以后,程序就不動了,原因是某些表格的表格范圍識別的非常大,最大可為ZZ65535

通過研究,代碼進(jìn)行了如下修改

1:使用X64版本,X64版本在運(yùn)行時,可以運(yùn)行4G以內(nèi)內(nèi)存占用的程序,比2G大一倍,能夠完成大部分表格的讀取,如ZZ5000,但是遇到ZZ65535范圍的表格,內(nèi)存占用達(dá)到了4G+,也會導(dǎo)致程序停止運(yùn)行.

2:限制最大單元格遍歷范圍,最大限制為ZZ5000,能夠有效降低內(nèi)存占用

3:定時重新讀取EXCEL文件(如每對比30張表),釋放內(nèi)存,(Python內(nèi)存釋放真的很痛苦,全部是指針引用,A=B,DEL A;是不會釋放空間的,要DEL B才行).

4:雖然openpyxl讀取文件時有個只讀模式(性能模式),但是速度實(shí)在是太慢了.

通過代碼修改,現(xiàn)在完成文件對比所用的內(nèi)存通常在2G以內(nèi)

以上為個人經(jīng)驗(yàn),希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。

您可能感興趣的文章:
  • python 辦公自動化——基于pyqt5和openpyxl統(tǒng)計符合要求的名單
  • Python Excel處理庫openpyxl詳解
  • python使用openpyxl庫讀寫Excel表格的方法(增刪改查操作)
  • Python利器openpyxl之操作excel表格
  • Python離線安裝openpyxl模塊的步驟
  • Python openpyxl 無法保存文件的解決方案
  • python openpyxl 帶格式復(fù)制表格的實(shí)現(xiàn)
  • python 使用openpyxl讀取excel數(shù)據(jù)
  • python openpyxl的使用方法

標(biāo)簽:浙江 懷化 梅州 錫林郭勒盟 昆明 石家莊 西寧 文山

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《解決python 使用openpyxl讀寫大文件的坑》,本文關(guān)鍵詞  解決,python,使用,openpyxl,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《解決python 使用openpyxl讀寫大文件的坑》相關(guān)的同類信息!
  • 本頁收集關(guān)于解決python 使用openpyxl讀寫大文件的坑的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    佳木斯市| 石城县| 沙雅县| 桂平市| 岳西县| 老河口市| 疏附县| 嘉峪关市| 科技| 大竹县| 洛阳市| 迁安市| 阿图什市| 卢龙县| 德州市| 裕民县| 个旧市| 永城市| 新源县| 东至县| 左贡县| 柯坪县| 司法| 定陶县| 神池县| 永登县| 太仓市| 焉耆| 宿迁市| 铜鼓县| 蒲江县| 唐河县| 方山县| 达日县| 叶城县| 遂平县| 贵阳市| 宣威市| 哈巴河县| 商河县| 孝昌县|