List.sort 和 Sorted 用哪个比较好?

排序是编程经常遇到的场景,在 Python 中,对一个列表进行排序有两种方法,一个是 list.sort 可以对列表原地排序,另一个是 Python 的内建方法 sorted,它不改变原始列表,而是返回一个新的列表,那到底用哪一个呢?
首页 新闻资讯 行业资讯 List.sort 和 Sorted 用哪个比较好?

[[433436]]

排序是编程经常遇到的场景,在 Python 中,对一个列表进行排序有两种方法,一个是 list.sort 可以对列表原地排序,另一个是 Python  的内建方法 sorted,它不改变原始列表,而是返回一个新的列表,那到底用哪一个呢?

如果你不想改变原始列表,那肯定选择 sorted 啊,如果改变不改变都无所谓呢?本文就来回到这个问题。

可以先大胆猜测一下,sorted 不改变原始列表,相当于内部对列表进行了深 copy,这个过程必然更占用内存,更慢一些。

现在我们通过实际运行来比较一下:

内存占用比较

先看下结果:

代码:

复制

import random import resource import sys import time from sniffing import FunctionSniffingClass  def list_sort(arr):     return arr.sort()   def sorted_builtin(arr):     return sorted(arr)  if __name__ == "__main__":     if len(sys.argv) != 2:         sys.exit("Please run: python (sort|sorted)")     elif sys.argv[1] == "sorted":         func = sorted_builtin     elif sys.argv[1] == "sort":         func = list_sort     else:         sys.exit("Please run: python (sort|sorted)")      # Lib Testing Code     arr = [random.randint(0, 50) for r in range(1_000_000)]     mythread = FunctionSniffingClass(func, arr)     mythread.start()      used_mem = 0     max_memory = 0     memory_usage_refresh = 0.005  # Seconds      while 1:         time.sleep(memory_usage_refresh)         used_mem = resource.getrusage(resource.RUSAGE_SELF).ru_maxrss         if used_mem > max_memory:             max_memory = used_mem          # Check to see if the function call is complete         if mythread.isShutdown():             # Uncomment if yu want to see the results             # print(mythread.results)             break      print("\nMAX Memory Usage:", round(max_memory / (2 ** 20), 3), "MB")
  • 1.

  • 2.

  • 3.

  • 4.

  • 5.

  • 6.

  • 7.

  • 8.

  • 9.

  • 10.

  • 11.

  • 12.

  • 13.

  • 14.

  • 15.

  • 16.

  • 17.

  • 18.

  • 19.

  • 20.

  • 21.

  • 22.

  • 23.

  • 24.

  • 25.

  • 26.

  • 27.

  • 28.

  • 29.

  • 30.

  • 31.

  • 32.

  • 33.

  • 34.

  • 35.

  • 36.

  • 37.

  • 38.

  • 39.

  • 40.

  • 41.

  • 42.

  • 43.

  • 44.

  • 45.

很明显,内建的 sorted 函数占用的内存更多。代码用到了 FunctionSniffingClass  类,这里就不展开了,完整代码请访问:https://github.com/DahlitzFlorian/list-sort-vs-sorted-list/tree/master/memory_measurement

速度比较

测试代码:

复制

import random  from somedecorators import timeit  @timeit() def list_sort(arr):     return arr.sort()   @timeit() def sorted_builtin(arr):     return sorted(arr)   def main():     arr = [random.randint(0, 50) for r in range(10_000_000)]      sorted_builtin(arr)      list_sort(arr)  if __name__ == "__main__":     main()
  • 1.

  • 2.

  • 3.

  • 4.

  • 5.

  • 6.

  • 7.

  • 8.

  • 9.

  • 10.

  • 11.

  • 12.

  • 13.

  • 14.

  • 15.

  • 16.

  • 17.

  • 18.

  • 19.

  • 20.

  • 21.

  • 22.

  • 23.

最后

从结果来看,符合预期,如果不考虑是否改变原始列表的顺序,无论是内存占用还是速度,list.sort 总是更优秀。

但是,请记住,这 list.sort 仅适用于列表,而 sorted 接受任何可迭代对象。此外,如果您使用  list.sort,您将丢失原始列表的次序。

 

19    2021-11-05 07:13:46    Python