排序是编程经常遇到的场景,在 Python 中,对一个列表进行排序有两种方法,一个是 list.sort 可以对列表原地排序,另一个是 Python 的内建方法 sorted,它不改变原始列表,而是返回一个新的列表,那到底用哪一个呢?
如果你不想改变原始列表,那肯定选择 sorted 啊,如果改变不改变都无所谓呢?本文就来回到这个问题。
可以先大胆猜测一下,sorted 不改变原始列表,相当于内部对列表进行了深 copy,这个过程必然更占用内存,更慢一些。
现在我们通过实际运行来比较一下:
先看下结果:
代码:
复制
import random import resource import sys import time from sniffing import FunctionSniffingClass def list_sort(arr): return arr.sort() def sorted_builtin(arr): return sorted(arr) if __name__ == "__main__": if len(sys.argv) != 2: sys.exit("Please run: python (sort|sorted)") elif sys.argv[1] == "sorted": func = sorted_builtin elif sys.argv[1] == "sort": func = list_sort else: sys.exit("Please run: python (sort|sorted)") # Lib Testing Code arr = [random.randint(0, 50) for r in range(1_000_000)] mythread = FunctionSniffingClass(func, arr) mythread.start() used_mem = 0 max_memory = 0 memory_usage_refresh = 0.005 # Seconds while 1: time.sleep(memory_usage_refresh) used_mem = resource.getrusage(resource.RUSAGE_SELF).ru_maxrss if used_mem > max_memory: max_memory = used_mem # Check to see if the function call is complete if mythread.isShutdown(): # Uncomment if yu want to see the results # print(mythread.results) break print("\nMAX Memory Usage:", round(max_memory / (2 ** 20), 3), "MB")
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
很明显,内建的 sorted 函数占用的内存更多。代码用到了 FunctionSniffingClass 类,这里就不展开了,完整代码请访问:https://github.com/DahlitzFlorian/list-sort-vs-sorted-list/tree/master/memory_measurement
测试代码:
复制
import random from somedecorators import timeit @timeit() def list_sort(arr): return arr.sort() @timeit() def sorted_builtin(arr): return sorted(arr) def main(): arr = [random.randint(0, 50) for r in range(10_000_000)] sorted_builtin(arr) list_sort(arr) if __name__ == "__main__": main()
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
从结果来看,符合预期,如果不考虑是否改变原始列表的顺序,无论是内存占用还是速度,list.sort 总是更优秀。
但是,请记住,这 list.sort 仅适用于列表,而 sorted 接受任何可迭代对象。此外,如果您使用 list.sort,您将丢失原始列表的次序。