濮阳杆衣贸易有限公司

主頁(yè) > 知識(shí)庫(kù) > 8行代碼實(shí)現(xiàn)Python文件去重

8行代碼實(shí)現(xiàn)Python文件去重

熱門標(biāo)簽:電梯新時(shí)達(dá)系統(tǒng)外呼顯示e 百應(yīng)電話機(jī)器人總部 宿州電話機(jī)器人哪家好 成都呼叫中心外呼系統(tǒng)哪家強(qiáng) 南昌地圖標(biāo)注 西青語(yǔ)音電銷機(jī)器人哪家好 地圖標(biāo)注與注銷 旅游廁所地圖標(biāo)注怎么弄 無(wú)錫智能外呼系統(tǒng)好用嗎

需求描述

上周突然接到一個(gè)任務(wù),要通過(guò)XX網(wǎng)站導(dǎo)出XX年-XX年之間的數(shù)據(jù),導(dǎo)出后的文件名就是對(duì)應(yīng)日期,導(dǎo)出后發(fā)現(xiàn),竟然有的文件大小是一樣,但文件名又沒(méi)有重復(fù),所以打開(kāi)文件看了下,確實(shí)重復(fù)了,原因暫時(shí)不清楚,預(yù)測(cè)是網(wǎng)站的原因,最后發(fā)現(xiàn)大概只有 30% 的數(shù)據(jù)沒(méi)有重復(fù)。我淦!


啥也不說(shuō),首要任務(wù)還是把那些沒(méi)有重復(fù)的文件給篩選出來(lái),或是刪除重復(fù)的文件。文件很多幾百個(gè),通過(guò)一個(gè)個(gè)的對(duì)比文件去刪除估計(jì)又要加班,然后突然想到 Python 有個(gè)內(nèi)置的 filecmp 能夠貌似是比較文件的,于是乎就有了這篇文章~

擼代碼ing

導(dǎo)出的文件都是保存在同一文件夾下的,格式也相同。然后,上網(wǎng)查了下 filecmp.cmp() 的用法。

filecmp.cmp(f1, f2, shallow=True)

f1/f2:待比較的兩個(gè)文件路徑。shallow :默認(rèn)為True,即只比較os.stat()獲取的元數(shù)據(jù)(創(chuàng)建時(shí)間,大小等信息)是否相同,設(shè)置為False的話,在對(duì)比文件的時(shí)候還要比較文件內(nèi)容。
from pathlib import Path
import filecmp

path_list = [path for path in Path(r'C:\Users\pc\Desktop\test').iterdir() if path.is_file()]

for front in range(len(path_list) - 1):
    for later in range(front + 1, len(path_list)):
        if filecmp.cmp(path_list[front], path_list[later], shallow=False):
            path_list[front].unlink()    # 刪除文件
            break

為了防止代碼有問(wèn)題,我先創(chuàng)建了一個(gè) test 文件夾,在文件夾下手動(dòng)創(chuàng)建了6個(gè)文件,1~5中只有1,2,3,4,5對(duì)應(yīng)的數(shù)字內(nèi)容,第6個(gè)為空文件。


之后再將文件全部復(fù)制一份。


▶️運(yùn)行效果

到此這篇關(guān)于8行代碼實(shí)現(xiàn)Python文件去重的文章就介紹到這了,更多相關(guān)Python文件去重內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • python實(shí)現(xiàn)MD5進(jìn)行文件去重的示例代碼
  • 對(duì)python讀寫文件去重、RE、set的使用詳解
  • Python實(shí)現(xiàn)的txt文件去重功能示例

標(biāo)簽:七臺(tái)河 渭南 辛集 雅安 濰坊 西安 贛州 許昌

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《8行代碼實(shí)現(xiàn)Python文件去重》,本文關(guān)鍵詞  8行,代碼,實(shí)現(xiàn),Python,文件,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《8行代碼實(shí)現(xiàn)Python文件去重》相關(guān)的同類信息!
  • 本頁(yè)收集關(guān)于8行代碼實(shí)現(xiàn)Python文件去重的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    监利县| 九寨沟县| 平昌县| 区。| 钟祥市| 保康县| 赤城县| 东台市| 南京市| 册亨县| 田东县| 临泉县| 乌兰察布市| 绥阳县| 新乡市| 富阳市| 五峰| 揭阳市| 炉霍县| 铜川市| 桃源县| 绥德县| 临沂市| 佳木斯市| 兴文县| 鄂托克旗| 安龙县| 来安县| 满洲里市| 平陆县| 斗六市| 河北区| 神木县| 汤阴县| 夹江县| 灌阳县| 噶尔县| 普兰店市| 鄱阳县| 象州县| 巴彦淖尔市|