您的位置:首頁技術文章
文章詳情頁

Python使用fliecmp實現比較文件的操作

瀏覽:3日期:2022-06-17 11:27:17
目錄前言生成示例文件cmp()(比較文件)cmpfiles()(比較一組文件)dircmp()(比較目錄)left_list與right_list忽略部分文件進行對比其他屬性前言

對于文件的比較一般有幾種,比如比較文件的內容,比較文件的大小,或者直接對比整個項目文件。特別是在項目的更新迭代中,可以通過該庫來比較當前版本與之前版本有哪些文件不同。

所以,本篇將詳細講解Python的文件比較庫:filecmp。

生成示例文件

在比較文件之前,我們首先需要有用于比較的文件。所以,為了后面的測試,我們先來創建一些文件。示例如下:

def mkfile(filename,content): with open(filename,’w’) as f:f.write(content or filename) returnmkfile(’filecmps/one.txt’,’1212121212’)mkfile(’filecmps/two.txt’,’1212121212’)mkfile(’filecmps/three.txt’,’333333333’)

這里,我們先創建3個文件,其中2個文件的內容相等。

cmp()(比較文件)

fliecmp庫提供了cmp()函數用于比較文件系統上的兩個文件。示例如下:

import filecmpprint(filecmp.cmp(’filecmps/one.txt’, ’filecmps/two.txt’, shallow=False))print(filecmp.cmp(’filecmps/one.txt’, ’filecmps/three.txt’, shallow=False))print(filecmp.cmp(’filecmps/one.txt’, ’filecmps/two.txt’))print(filecmp.cmp(’filecmps/one.txt’, ’filecmps/one.txt’))

運行之后,效果如下:

Python使用fliecmp實現比較文件的操作

如果參數shallow為True,只判斷os.stat()函數返回內容是否相同,如果相同就返回True,否則再比較文件內容是否相同,如果相同也返回True。使用shallow參數可以快速地比較文件是否有修改過。(shallow參數默認為True)

cmpfiles()(比較一組文件)

cmp()函數用于單個文件的比較,而要對比兩個目錄中的一組文件,我們需要使用cmpfiles()函數,示例如下:

import filecmpprint(filecmp.cmpfiles(’filecmps’, ’text’, common=[’13.png’, ’14.png’, ’one.txt’]))

運行之后,效果如下:

Python使用fliecmp實現比較文件的操作

這里返回了3個列表,分別是相同列表,不同列表以及錯誤列表。相同列表放的是兩個目錄中相同的文件,不同列表是兩個目錄中不同的文件,但需要注意common指定了需要對比的文件,也就是說這3個列表的每個文件必須在common指定中才會用于對比,不指定不會對比也不會存在于列表中,哪怕文件夾下面有其他文件。錯誤列表指的是某個目錄根本沒有該文件。

dircmp()(比較目錄)

前面2個函數都是針對文件進行的比較,但是項目文件的迭代對比往往直接對比的是整個目錄結構,所以我們還需要掌握目錄的比較。fliecmp庫提供的目錄比較函數為:dircmp()。示例如下:

import filecmpdc = filecmp.dircmp(’filecmps’, ’text’)dc.report()

運行之后,效果如下:

Python使用fliecmp實現比較文件的操作

第1行為對比的兩個文件夾,第2第3行為對比的兩個目錄中的所有文件。第4行是對比后的結果,這里只有3個文件完全相同。但是需要注意的是,report()函數只是用于比較當前目錄下的文件,不包括里面文件夾以及文件夾下面的文件。如果需要遞歸比較所有目錄文件,需要用到report_full_closure()。

示例如下:

import filecmpdc = filecmp.dircmp(’filecmps’, ’text’)dc.report_full_closure()

運行之后,效果如下:

Python使用fliecmp實現比較文件的操作

left_list與right_list

在對比文件之前,我們可以列出所比較目錄中的文件以及子目錄。示例如下:

import filecmpdc = filecmp.dircmp(’filecmps’, ’text’)print(dc.left_list)print(dc.right_list)

運行之后,效果如下:

Python使用fliecmp實現比較文件的操作

left_list為第1個參數的目錄,right_list為第2個參數的目錄,把2個參數看成左右,自然很好區分。

忽略部分文件進行對比

在對比兩個目錄的所有文件之時,我們還可以手動的過濾掉不需要對比的文件及文件夾,比如我們不對比文件中的123文件夾中的所有文件,可以直接這樣操作:

import filecmpdc = filecmp.dircmp(’filecmps’, ’text’,ignore=[’123’])dc.report_full_closure()

運行之后,效果如下:

Python使用fliecmp實現比較文件的操作

report_full_closure()函數本來需要一層一層目錄去對比的。這里,博主過濾掉了其唯一的子目錄123,所以只存在一層文件的對比。目錄結構如下:

Python使用fliecmp實現比較文件的操作

其他屬性

除了這些方法與屬性之外,還有其他的屬性供開發者調用,比如只查找相同的文件,或者只判斷某個目錄的獨有文件,可以這樣操作:

import filecmpdc = filecmp.dircmp(’filecmps’, ’text’)print(dc.common)print(dc.right_only)print(dc.left_only)

運行之后,效果如下:

Python使用fliecmp實現比較文件的操作

common:為2目錄同時存在的文件名

right_only:為右目錄獨有的文件

left_only:為左目錄獨有的文件。

這里的common公共目錄還可以進一步的操作,示例如下:

import filecmpdc = filecmp.dircmp(’filecmps’, ’text’)print(dc.common_dirs)print(dc.common_files)print(dc.common_funny)

運行之后,效果如下:

Python使用fliecmp實現比較文件的操作

common_dirs:公共的文件夾

common_files:公共的文件

common_funny: 2個目錄中類型不同的內容,或os.stat()指出的有錯誤的地方(可以簡單的理解有一個文件夾是123,一個文件也是123,那么就會出現在common_files中)

以上是相同的劃分,我們還有不同的劃分,示例如下:

import filecmpdc = filecmp.dircmp(’filecmps’, ’text’)print(dc.same_files)print(dc.diff_files)print(dc.funny_files)

這里一一對應上面的公共,只是是不同的不是公共的。運行之后,效果如下:

Python使用fliecmp實現比較文件的操作

最后還有一個屬性:subdirs,用于將目錄名映射到新的dircmp對象。示例如下:

import filecmpdc = filecmp.dircmp(’filecmps’, ’text’)print(dc.subdirs)

運行之后,效果如下:

Python使用fliecmp實現比較文件的操作

到此這篇關于Python使用fliecmp實現比較文件的操作的文章就介紹到這了,更多相關Python 比較文件內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: Python 編程
相關文章:
国产综合久久一区二区三区