您的位置:首頁技術文章
文章詳情頁

Python加速程序運行的方法

瀏覽:2日期:2022-07-16 08:12:52

問題

你的程序運行太慢,你想在不使用復雜技術比如C擴展或JIT編譯器的情況下加快程序運行速度。

解決方案

關于程序優化的第一個準則是“不要優化”,第二個準則是“不要優化那些無關緊要的部分”。 如果你的程序運行緩慢,首先你得使用14.13小節的技術先對它進行性能測試找到問題所在。

通常來講你會發現你得程序在少數幾個熱點位置花費了大量時間, 比如內存的數據處理循環。一旦你定位到這些點,你就可以使用下面這些實用技術來加速程序運行。

使用函數

很多程序員剛開始會使用Python語言寫一些簡單腳本。 當編寫腳本的時候,通常習慣了寫毫無結構的代碼,比如:

# somescript.pyimport sysimport csvwith open(sys.argv[1]) as f: for row in csv.reader(f): # Some kind of processing pass

很少有人知道,像這樣定義在全局范圍的代碼運行起來要比定義在函數中運行慢的多。 這種速度差異是由于局部變量和全局變量的實現方式(使用局部變量要更快些)。 因此,如果你想讓程序運行更快些,只需要將腳本語句放入函數中即可:

# somescript.pyimport sysimport csvdef main(filename): with open(filename) as f: for row in csv.reader(f): # Some kind of processing passmain(sys.argv[1])

速度的差異取決于實際運行的程序,不過根據經驗,使用函數帶來15-30%的性能提升是很常見的。

盡可能去掉屬性訪問

每一次使用點(.)操作符來訪問屬性的時候會帶來額外的開銷。 它會觸發特定的方法,比如 __getattribute__() 和 __getattr__() ,這些方法會進行字典操作操作。

通常你可以使用 from module import name 這樣的導入形式,以及使用綁定的方法。 假設你有如下的代碼片段:

import mathdef compute_roots(nums): result = [] for n in nums: result.append(math.sqrt(n)) return result# Testnums = range(1000000)for n in range(100): r = compute_roots(nums)

在我們機器上面測試的時候,這個程序花費了大概40秒。現在我們修改 compute_roots() 函數如下:

from math import sqrtdef compute_roots(nums): result = [] result_append = result.append for n in nums: result_append(sqrt(n)) return result

修改后的版本運行時間大概是29秒。唯一不同之處就是消除了屬性訪問。 用 sqrt() 代替了 math.sqrt() 。 The result.append() 方法被賦給一個局部變量 result_append ,然后在內部循環中使用它。

不過,這些改變只有在大量重復代碼中才有意義,比如循環。 因此,這些優化也只是在某些特定地方才應該被使用。

理解局部變量

之前提過,局部變量會比全局變量運行速度快。 對于頻繁訪問的名稱,通過將這些名稱變成局部變量可以加速程序運行。 例如,看下之前對于 compute_roots() 函數進行修改后的版本:

import mathdef compute_roots(nums): sqrt = math.sqrt result = [] result_append = result.append for n in nums: result_append(sqrt(n)) return result

在這個版本中,sqrt 從 math 模塊被拿出并放入了一個局部變量中。 如果你運行這個代碼,大概花費25秒(對于之前29秒又是一個改進)。 這個額外的加速原因是因為對于局部變量 sqrt 的查找要快于全局變量 sqrt

對于類中的屬性訪問也同樣適用于這個原理。 通常來講,查找某個值比如 self.name 會比訪問一個局部變量要慢一些。 在內部循環中,可以將某個需要頻繁訪問的屬性放入到一個局部變量中。例如:

# Slowerclass SomeClass: ... def method(self): for x in s: op(self.value)# Fasterclass SomeClass: ... def method(self): value = self.value for x in s: op(value)

避免不必要的抽象

任何時候當你使用額外的處理層(比如裝飾器、屬性訪問、描述器)去包裝你的代碼時,都會讓程序運行變慢。 比如看下如下的這個類:

class A: def __init__(self, x, y): self.x = x self.y = y @property def y(self): return self._y @y.setter def y(self, value): self._y = value

現在進行一個簡單測試:

>>> from timeit import timeit>>> a = A(1,2)>>> timeit(’a.x’, ’from __main__ import a’)0.07817923510447145>>> timeit(’a.y’, ’from __main__ import a’)0.35766440676525235>>>

可以看到,訪問屬性y相比屬性x而言慢的不止一點點,大概慢了4.5倍。 如果你在意性能的話,那么就需要重新審視下對于y的屬性訪問器的定義是否真的有必要了。 如果沒有必要,就使用簡單屬性吧。 如果僅僅是因為其他編程語言需要使用getter/setter函數就去修改代碼風格,這個真的沒有必要。

使用內置的容器

內置的數據類型比如字符串、元組、列表、集合和字典都是使用C來實現的,運行起來非???。 如果你想自己實現新的數據結構(比如鏈接列表、平衡樹等), 那么要想在性能上達到內置的速度幾乎不可能,因此,還是乖乖的使用內置的吧。

避免創建不必要的數據結構或復制

有時候程序員想顯擺下,構造一些并沒有必要的數據結構。例如,有人可能會像下面這樣寫:

values = [x for x in sequence]squares = [x*x for x in values]

也許這里的想法是首先將一些值收集到一個列表中,然后使用列表推導來執行操作。 不過,第一個列表完全沒有必要,可以簡單的像下面這樣寫:

squares = [x*x for x in sequence]

與此相關,還要注意下那些對Python的共享數據機制過于偏執的程序所寫的代碼。 有些人并沒有很好的理解或信任Python的內存模型,濫用 copy.deepcopy() 之類的函數。 通常在這些代碼中是可以去掉復制操作的。

討論

在優化之前,有必要先研究下使用的算法。 選擇一個復雜度為 O(n log n) 的算法要比你去調整一個復雜度為 O(n**2) 的算法所帶來的性能提升要大得多。

如果你覺得你還是得進行優化,那么請從整體考慮。 作為一般準則,不要對程序的每一個部分都去優化,因為這些修改會導致代碼難以閱讀和理解。 你應該專注于優化產生性能瓶頸的地方,比如內部循環。

你還要注意微小優化的結果。例如考慮下面創建一個字典的兩種方式:

a = { ’name’ : ’AAPL’, ’shares’ : 100, ’price’ : 534.22}b = dict(name=’AAPL’, shares=100, price=534.22)

后面一種寫法更簡潔一些(你不需要在關鍵字上輸入引號)。 不過,如果你將這兩個代碼片段進行性能測試對比時,會發現使用 dict() 的方式會慢了3倍。 看到這個,你是不是有沖動把所有使用 dict() 的代碼都替換成第一種。 不夠,聰明的程序員只會關注他應該關注的地方,比如內部循環。在其他地方,這點性能損失沒有什么影響。

如果你的優化要求比較高,本節的這些簡單技術滿足不了,那么你可以研究下基于即時編譯(JIT)技術的一些工具。 例如,PyPy工程是Python解釋器的另外一種實現,它會分析你的程序運行并對那些頻繁執行的部分生成本機機器碼。 它有時候能極大的提升性能,通??梢越咏麮代碼的速度。 不過可惜的是,到寫這本書為止,PyPy還不能完全支持Python3. 因此,這個是你將來需要去研究的。你還可以考慮下Numba工程, Numba是一個在你使用裝飾器來選擇Python函數進行優化時的動態編譯器。 這些函數會使用LLVM被編譯成本地機器碼。它同樣可以極大的提升性能。 但是,跟PyPy一樣,它對于Python 3的支持現在還停留在實驗階段。

最后我引用John Ousterhout說過的話作為結尾:“最好的性能優化是從不工作到工作狀態的遷移”。 直到你真的需要優化的時候再去考慮它。確保你程序正確的運行通常比讓它運行更快要更重要一些(至少開始是這樣的).

以上就是Python加速程序運行的方法的詳細內容,更多關于Python加速程序運行的資料請關注好吧啦網其它相關文章!

標簽: Python 編程
相關文章:
国产综合久久一区二区三区