Python 实现循环的最快方式（for、while 等速度对比）

link管理

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

热心的楼梯 · 创建关联表 - SQLModel - ...· 2 月前 ·

温柔的电梯 · golang构建强大交互式命令行提示插件库g ...· 2 月前 ·

帅气的便当 · GoLang TUI 库 tview 入门 ...· 2 月前 ·

细心的手术刀 · esbuild - API - ...· 1 月前 ·

文武双全的荒野 · 內地版《少年四大名捕》魔幻化? ...· 5 月前 ·

谈吐大方的大象 · 2018年1月3日人民币汇率中间价_管理信息 ...· 5 月前 ·

爱吹牛的瀑布 · 中国儿童近视率为什么这么高？原因终于找到了！· 9 月前 ·

高大的茄子 · 最优化：建模、算法与理论/最优化计算方法· 1 年前 ·

沉稳的键盘 · 习近平在亚洲基础设施投资银行开业仪式上的致辞 ...· 1 年前 ·

众所周知，Python 不是一种执行效率较高的语言。此外在任何语言中，循环都是一种非常消耗时间的操作。假如任意一种简单的单步操作耗费的时间为 1 个单位，将此操作重复执行上万次，最终耗费的时间也将增长上万倍。

while 和 for 是 Python 中常用的两种实现循环的关键字，它们的运行效率实际上是有差距的。比如下面的测试代码：

import timeit
def while_loop(n=100_000_000):
    i = 0
    s = 0
    while i < n:
        s += i
        i += 1
    return s
def for_loop(n=100_000_000):
    s = 0
    for i in range(n):
        s += i
    return s
def main():
    print('while loop\t\t', timeit.timeit(while_loop, number=1))
    print('for loop\t\t', timeit.timeit(for_loop, number=1))
if __name__ == '__main__':
    main()
# => while loop               4.718853999860585
# => for loop                 3.211570399813354
这是一个简单的求和操作，计算从 1 到 n 之间所有自然数的总和。可以看到 for 循环相比 while 要快 1.5 秒。 
其中的差距主要在于两者的机制不同。 
在每次循环中， while 实际上比 for 多执行了两步操作：边界检查和变量 i 的自增。即每进行一次循环，while 都会做一次边界检查 ( while i < n ）和自增计算（ i +=1 ）。这两步操作都是显式的纯 Python 代码。 
for 循环不需要执行边界检查和自增操作，没有增加显式的 Python 代码（纯 Python 代码效率低于底层的 C 代码）。当循环的次数足够多，就出现了明显的效率差距。 
可以再增加两个函数，在 for 循环中加上不必要的边界检查和自增计算： 
import timeit
def while_loop(n=100_000_000):
    i = 0
    s = 0
    while i < n:
        s += i
        i += 1
    return s
def for_loop(n=100_000_000):
    s = 0
    for i in range(n):
        s += i
    return s
def for_loop_with_inc(n=100_000_000):
    s = 0
    for i in range(n):
        s += i
        i += 1
    return s
def for_loop_with_test(n=100_000_000):
    s = 0
    for i in range(n):
        if i < n:
        s += i
    return s
def main():
    print('while loop\t\t', timeit.timeit(while_loop, number=1))
    print('for loop\t\t', timeit.timeit(for_loop, number=1))
    print('for loop with increment\t\t',
          timeit.timeit(for_loop_with_inc, number=1))
    print('for loop with test\t\t', timeit.timeit(for_loop_with_test, number=1))
if __name__ == '__main__':
    main()
# => while loop               4.718853999860585
# => for loop                 3.211570399813354
# => for loop with increment          4.602369500091299
# => for loop with test               4.18337869993411
可以看出，增加的边界检查和自增操作确实大大影响了 for 循环的执行效率。 
前面提到过，Python 底层的解释器和内置函数是用 C 语言实现的。而 C 语言的执行效率远大于 Python。 
对于上面的求等差数列之和的操作，借助于 Python 内置的 sum 函数，可以获得远大于 for 或 while 循环的执行效率。 
import timeit
def while_loop(n=100_000_000):
    i = 0
    s = 0
    while i < n:
        s += i
        i += 1
    return s
def for_loop(n=100_000_000):
    s = 0
    for i in range(n):
        s += i
    return s
def sum_range(n=100_000_000):
    return sum(range(n))
def main():
    print('while loop\t\t', timeit.timeit(while_loop, number=1))
    print('for loop\t\t', timeit.timeit(for_loop, number=1))
    print('sum range\t\t', timeit.timeit(sum_range, number=1))
if __name__ == '__main__':
    main()
# => while loop               4.718853999860585
# => for loop                 3.211570399813354
# => sum range                0.8658821999561042
可以看到，使用内置函数 sum 替代循环之后，代码的执行效率实现了成倍的增长。 
内置函数 sum 的累加操作实际上也是一种循环，但它由 C 语言实现，而 for 循环中的求和操作是由纯 Python 代码 s += i 实现的。C > Python。 
再拓展一下思维。小时候都听说过童年高斯巧妙地计算 1 到 100 之和的故事。1…100 之和等于 (1 + 100) * 50。这个计算方法同样可以应用到上面的求和操作中。 
import timeit
def while_loop(n=100_000_000):
    i = 0
    s = 0
    while i < n:
        s += i
        i += 1
    return s
def for_loop(n=100_000_000):
    s = 0
    for i in range(n):
        s += i
    return s
def sum_range(n=100_000_000):
    return sum(range(n))
def math_sum(n=100_000_000):
    return (n * (n - 1)) // 2
def main():
    print('while loop\t\t', timeit.timeit(while_loop, number=1))
    print('for loop\t\t', timeit.timeit(for_loop, number=1))
    print('sum range\t\t', timeit.timeit(sum_range, number=1))
    print('math sum\t\t', timeit.timeit(math_sum, number=1))
if __name__ == '__main__':
    main()
# => while loop               4.718853999860585
# => for loop                 3.211570399813354
# => sum range                0.8658821999561042
# => math sum                 2.400018274784088e-06
最终 math sum 的执行时间约为 2.4e-6 ，缩短了上百万倍。这里的思路就是，既然循环的效率低，一段代码要重复执行上亿次。 
索性直接不要循环，通过数学公式，把上亿次的循环操作变成只有一步操作。效率自然得到了空前的加强。 
最后的结论（有点谜语人）： 
实现循环的最快方式—— —— —— 就是不用循环 
对于 Python 而言，则尽可能地使用内置函数，将循环中的纯 Python 代码降到最低。
			（3）将需要处理的图像分为若干个部分，使用multiprocessing多进程并行化，充分利用CPU；
			（4）采用numba(@njit)加速循环部分（但是与multiprocessing似乎不兼容）；
			（5）采用Cython，修改少量代码，...
from multiprocessing.dummy import Pool as ThreadPool
items = list()
pool = ThreadPool()
pool.map(process, items)
pool.close()
pool.join()
# -*- coding: utf-8 -*-
import time
from multiprocessing.dummy import Pool as ThreadPool
def process(item):
				不知道大家有没有考虑过，用循环与不用循环到底哪个速度快？什么原因导致速度快慢的呢？今天通过常用的循环来分析一下。
人生苦短，快学Python！众所周知，Python 不是一种执行效率较高的语言。此外在任何语言中，循环都是一种非常消耗时间的操作。假如任意一种简单的单步操作耗费的时间为 1 个单位，将此操作重复执行上万次，最终耗费的时间也将增长上万倍。while 和 for 是 Python 中常用的两种实现循环的关键字，它们的运行效率实际上是有差距的。比如下面的测试代码：
这是一个简单的求和操作，计算从 1 
				对于某个城市的出租车数据，一天就有33210000条记录，如何将每辆车的数据单独拎出来放到一个专属的文件中呢？
思路很简单：
就是循环33210000条记录，将每辆车的数据搬运到它该去的文件中。
但是对于3000多万条数据，一个一个循环太消耗时间，我花了2个小时才搬运了60万数据，算算3000万我需要花费100个小时，也就需要4-5天。并且还需要保证这五天全天开机，不能出现卡机的事故。
因此，需要...
例如：while True 或者其它类型：while i<1（即只要当i小于1时就可以执行）
(2)while关键字后跟随的是一个循环条件判断，它的执行过程大概可用自然语言描述为：
解释器首先判断while循环条件是否成立，若成立，执行语句，执行完毕后再次判断循环条件是否成立，若成立，再次执行语句，以次类似进行，但当条件不成立时，则退出循