文章詳情頁

Python圖像讀寫方法對比

瀏覽：4日期：2022-07-05 13:46:12

1 實驗標準

因為訓練使用的框架是Pytorch，因此讀取的實驗標準如下：

1、讀取分辨率都為1920x1080的5張圖片（png格式一張，jpg格式四張）并保存到數組。

2、將讀取的數組轉換為維度順序為CxHxW的Pytorch張量，并保存到顯存中（我使用GPU訓練），其中三個通道的順序為RGB。

3、記錄各個方法在以上操作中所耗費的時間。因為png格式的圖片大小差不多是質量有微小差異的jpg格式的10倍，所以數據集通常不會用png來保存，就不比較這兩種格式的讀取時間差異了。

寫入的實驗標準如下：

1、將5張1920x1080的5張圖像對應的Pytorch張量轉換為對應方法可使用的數據類型數組。

2、以jpg格式保存五張圖片。

3、記錄各個方法保存圖片所耗費的時間。

2 實驗情況

2.1 cv2

因為有GPU，所以cv2讀取圖片有兩種方式：

1、先把圖片都讀取為一個numpy數組，再轉換成保存在GPU中的pytorch張量。

2、初始化一個保存在GPU中的pytorch張量，然后將每張圖直接復制進這個張量中。

第一種方式實驗代碼如下：

import os, torchimport cv2 as cv import numpy as np from time import time read_path = ’D:test’write_path = ’D:testwrite’ # cv2讀取 1start_t = time()imgs = np.zeros([5, 1080, 1920, 3])for img, i in zip(os.listdir(read_path), range(5)): img = cv.imread(filename=os.path.join(read_path, img)) imgs[i] = img imgs = torch.tensor(imgs).to(’cuda’)[...,[2,1,0]].permute([0,3,1,2])/255 print(’cv2 讀取時間1：’, time() - start_t) # cv2保存start_t = time()imgs = (imgs.permute([0,2,3,1])[...,[2,1,0]]*255).cpu().numpy()for i in range(imgs.shape[0]): cv.imwrite(write_path + str(i) + ’.jpg’, imgs[i])print(’cv2 保存時間：’, time() - start_t)

　實驗結果：

cv2 讀取時間1： 0.39693760871887207cv2 保存時間： 0.3560612201690674

第二種方式實驗代碼如下：

import os, torchimport cv2 as cv import numpy as np from time import time read_path = ’D:test’write_path = ’D:testwrite’ # cv2讀取 2start_t = time()imgs = torch.zeros([5, 1080, 1920, 3], device=’cuda’)for img, i in zip(os.listdir(read_path), range(5)): img = torch.tensor(cv.imread(filename=os.path.join(read_path, img)), device=’cuda’) imgs[i] = img imgs = imgs[...,[2,1,0]].permute([0,3,1,2])/255 print(’cv2 讀取時間2：’, time() - start_t) # cv2保存start_t = time()imgs = (imgs.permute([0,2,3,1])[...,[2,1,0]]*255).cpu().numpy()for i in range(imgs.shape[0]): cv.imwrite(write_path + str(i) + ’.jpg’, imgs[i])print(’cv2 保存時間：’, time() - start_t)

實驗結果：

cv2 讀取時間2： 0.23636841773986816cv2 保存時間： 0.3066873550415039

2.2 matplotlib

同樣兩種讀取方式，第一種代碼如下：

import os, torch import numpy as npimport matplotlib.pyplot as plt from time import time read_path = ’D:test’write_path = ’D:testwrite’ # matplotlib 讀取 1start_t = time()imgs = np.zeros([5, 1080, 1920, 3])for img, i in zip(os.listdir(read_path), range(5)): img = plt.imread(os.path.join(read_path, img)) imgs[i] = img imgs = torch.tensor(imgs).to(’cuda’).permute([0,3,1,2])/255 print(’matplotlib 讀取時間1：’, time() - start_t) # matplotlib 保存start_t = time()imgs = (imgs.permute([0,2,3,1])).cpu().numpy()for i in range(imgs.shape[0]): plt.imsave(write_path + str(i) + ’.jpg’, imgs[i])print(’matplotlib 保存時間：’, time() - start_t)

實驗結果：

matplotlib 讀取時間1： 0.45380306243896484matplotlib 保存時間： 0.768944263458252

第二種方式實驗代碼：

import os, torch import numpy as npimport matplotlib.pyplot as plt from time import time read_path = ’D:test’write_path = ’D:testwrite’ # matplotlib 讀取 2start_t = time()imgs = torch.zeros([5, 1080, 1920, 3], device=’cuda’)for img, i in zip(os.listdir(read_path), range(5)): img = torch.tensor(plt.imread(os.path.join(read_path, img)), device=’cuda’) imgs[i] = img imgs = imgs.permute([0,3,1,2])/255 print(’matplotlib 讀取時間2：’, time() - start_t) # matplotlib 保存start_t = time()imgs = (imgs.permute([0,2,3,1])).cpu().numpy()for i in range(imgs.shape[0]): plt.imsave(write_path + str(i) + ’.jpg’, imgs[i])print(’matplotlib 保存時間：’, time() - start_t)

實驗結果：

matplotlib 讀取時間2： 0.2044532299041748matplotlib 保存時間： 0.4737534523010254

需要注意的是，matplotlib讀取png格式圖片獲取的數組的數值是在[0,1][0,1]范圍內的浮點數，而jpg格式圖片卻是在[0,255][0,255]范圍內的整數。所以如果數據集內圖片格式不一致，要注意先轉換為一致再讀取，否則數據集的預處理就麻煩了。

2.3 PIL

PIL的讀取與寫入并不能直接使用pytorch張量或numpy數組，要先轉換為Image類型，所以很麻煩，時間復雜度上肯定也是占下風的，就不實驗了。

2.4 torchvision

torchvision提供了直接從pytorch張量保存圖片的功能，和上面讀取最快的matplotlib的方法結合，代碼如下：

import os, torch import matplotlib.pyplot as plt from time import time from torchvision import utils read_path = ’D:test’write_path = ’D:testwrite’ # matplotlib 讀取 2start_t = time()imgs = torch.zeros([5, 1080, 1920, 3], device=’cuda’)for img, i in zip(os.listdir(read_path), range(5)): img = torch.tensor(plt.imread(os.path.join(read_path, img)), device=’cuda’) imgs[i] = img imgs = imgs.permute([0,3,1,2])/255 print(’matplotlib 讀取時間2：’, time() - start_t) # torchvision 保存start_t = time() for i in range(imgs.shape[0]): utils.save_image(imgs[i], write_path + str(i) + ’.jpg’)print(’torchvision 保存時間：’, time() - start_t)

實驗結果：

matplotlib 讀取時間2： 0.15358829498291016torchvision 保存時間： 0.14760661125183105

可以看出這兩個是最快的讀寫方法。另外，要讓圖片的讀寫盡量不影響訓練進程，我們還可以讓這兩個過程與訓練并行。另外，utils.save_image可以將多張圖片拼接成一張來保存，具體使用方法如下：

utils.save_image(tensor = imgs, # 要保存的多張圖片張量 shape = [n, C, H, W] fp = ’test.jpg’, # 保存路徑 nrow = 5, # 多圖拼接時，每行所占的圖片數 padding = 1, # 多圖拼接時，每張圖之間的間距 normalize = True, # 是否進行規范化，通常輸出圖像用tanh，所以要用規范化 range = (-1,1)) # 規范化的范圍

以上就是Python圖像讀寫方法對比的詳細內容，更多關于python 圖像讀寫的資料請關注好吧啦網其它相關文章！

Python 編程

上一條：使用Pytorch搭建模型的步驟下一條：Python根據URL地址下載文件并保存至對應目錄的實現

相關文章：

1. 使用Python和百度語音識別生成視頻字幕的實現2. 淺談SpringMVC jsp前臺獲取參數的方式 EL表達式3. Java封裝數組實現包含、搜索和刪除元素操作詳解4. Gitlab CI-CD自動化部署SpringBoot項目的方法步驟5. ajax請求添加自定義header參數代碼6. JAVA上加密算法的實現用例7. 基于javascript處理二進制圖片流過程詳解8. Django-migrate報錯問題解決方案9. ASP刪除img標簽的style屬性只保留src的正則函數10. ASP中解決“對象關閉時,不允許操作。”的詭異問題……

排行榜

					
					基于javascript處理二進制圖片流過程詳解
ASP刪除img標簽的style屬性只保留src的正則函數
ASP中解決“對象關閉時,不允許操作?！钡脑幃悊栴}……
淺談SpringMVC jsp前臺獲取參數的方式 EL表達式
使用Python和百度語音識別生成視頻字幕的實現
Django-migrate報錯問題解決方案
ajax請求添加自定義header參數代碼
JAVA上加密算法的實現用例
idea打開多個窗口的操作方法
IntelliJ IDEA設置條件斷點的方法步驟
Docker容器如何更新打包并上傳到阿里云
				

熱門標簽

国产综合久久一区二区三区