Python - 让程序轻松加速的方法

最近，我读了一篇有趣的文章，文中介绍了一些未充分使用的Python特性的。在文章中，作者提到，从Python 3.2开始，标准库附带了一个内置的装饰器functools.lru_cache。我发现这个装饰器很令人兴奋，有了它，我们有可能轻松地为许多应用程序加速。

你可能在想，这很好，但这个装饰器究竟是什么？它提供对已构建的缓存的访问，该缓存使用LRU（译者注： Least Recently Used的缩写，即最近最少使用，是一种常用的页面置换算法，选择最近最久未使用的页面予以淘汰。）的置换策略，因此被命名为lru_cache。当然，这句话听起来可能有点令人胆怯，所以让我们把它分解一下。

什么是缓存？

缓存是一个可以快速访问的地方，可以在它里面存储访问速度较慢的内容。为了演示这一点，让我们以你的web浏览器为例。

从网络上读取网页可能需要几秒钟，即使是快速的网络连接也如此。在计算机时代，这个问题是永恒的。为了解决这个问题，浏览器将你已经访问过的网页存储在计算机的缓存中，这样访问速度会加快数千倍。

使用缓存下载网页的步骤如下：

检查页面的本地缓存。如果页面在那里，返回该页面。
在因网上找到网页并从那里下载。
将该网页存储在缓存中，以便将来更快地访问。

虽然缓存并不会让你第一次访问网页的速度加快，但通常你是要屡次访问某一个网站页面的（想想Facebook——注：对多数国人来讲，可能不是这个网站，或者你的电子邮件），有了缓存之后，以后每次访问都会更快。

浏览器并不是唯一使用缓存的，从服务器到CPU和硬盘或SSD之间的计算机硬件，它们无处不在。从缓存中可以很快地获取数据，因此当你不止一次获取数据时，它可以大大加快程序的速度。

LRU是什么意思？

缓存只能存储有限数量的东西，而且通常它比可能存入所缓存的东西要小得多（例如，你的硬盘比互联网小得多）。这意味着有时需要将缓存中已有内容替换掉，放入其他内容。对于去掉什么的决策方法被称为置换策略。

这就是LRU的用武之地。LRU代表最近用得最少的缓存中内容，这是一种常用的缓存置换策略。

为什么置换策略很重要？

“最近使用最少”这种置换策略的基本思想是：如果你有一段时间没有访问过某个东西，你可能近期不会访问它。要使用此策略，只需在缓存已满时删除最早使用的项即可。

在上图中，缓存中的每个项都附带了访问时间。依据LRU策略，选择访问时间为2:55PM 的项作为要置换的项，因为它是最早被访问的。如果有两个对象具有相同的访问时间，那么LRU将从中随机选择一个。

这种去掉长时间不用的东西的策略，被称为Bélády的最优算法，它是置换缓存内容的最佳策略。当然，我们根本不知道未来会有什么操作。谢天谢地，在许多情况下，LRU提供了近乎最佳的性能。

怎样使用它？

functools.lru_cache是一个装饰器，因此你可以将它放在函数的顶部：

import functools

@functools.lru_cache(maxsize=128)
def fib(n):
  if n < 2:
    return 1
  return fib(n-1) + fib(n-2)

Fibonacci数列在递归示例中经常被用到，要提升这个函数的速度，使用functools.lru_cache之后，不费吹灰之力，就能让这个递归函数狂飙。在我的机器上运行这些代码，得到了这个函数有缓存版本和没有缓存版本的以下结果。

$ python3 -m timeit -s 'from fib_test import fib' 'fib(30)'
10 loops, best of 3: 282 msec per loop

$ python3 -m timeit -s 'from fib_test import fib_cache' 'fib_cache(30)'
10000000 loops, best of 3: 0.0791 usec per loop

增加一行代码之后，速度提高了3565107倍。

当然，我认为很难看出你在实际中会如何使用它，因为我们很少需要计算斐波那契数列。回到web页面示例，我们可以举一个更实际的用缓存渲染前端模板的例子。

在服务器开发中，通常单个页面存储为具有占位符变量的模板。例如，下面是一个页面模板，该页面显示某一天各种足球比赛的结果。


  
    Matches for {{day}}
    
      {% for match in matches %}
      
      {% endfor %}
    
      
        Home team
        Away team
        Score
      

        {{match["home"]}}
        {{match["away"]}}
        {{match["home_goals"]}} - {{match["away_goals"]}}

呈现模板时，看起来如下所示：

这是缓存的主要目标，因为每天的结果不会改变，而且很可能每天会有多次访问。下面是一个提供此模板的Flask应用程序。我引入了50ms的延迟来模拟通过网络或者从大型数据库获取匹配字典。

import json
import time
from flask import Flask, render_template


app = Flask(__name__)


with open('match.json','r') as f:
    match_dict = json.load(f)


def get_matches(day):
    # simulate network/database delay
    time.sleep(0.05)
    return match_dict[day]


@app.route('/matches/')
def show_matches(day):
    matches = get_matches(day)
    return render_template('matches.html', matches=matches, day=day)


if __name__ == "__main__":
    app.run()

使用requests在不缓存的情况下获得三天的数据，在我的计算机上本地运行平均需要171ms。这还不错，但我们可以做得更好，即使考虑到人为的延迟。


@app.route('/matches/')
@functools.lru_cache(maxsize=4)
def show_matches(day):
    matches = get_matches(day)
    return render_template('matches.html', matches=matches, day=day)

在本例中，我设置了maxsize=4，因为我的测试脚本只有相同的三天，最好设置2次幂。使用这种方法，10个循环的平均速度可以降到13.7ms。

还有什么应该知道？

Python文档虽然很详细，但是有一些东西还是要强调的。

内置函数

装饰器附带了一些很有用的内置函数。cache_info()返回访问数（hits）、未访问数（misses）和当前缓存使用量（currsize）、最大容量（maxsize），帮助你了解缓存使用情况。cache_clear()将删除缓存中的所有元素。

有时候不要使用缓存

通常，只有在以下情况下才能使用缓存：

在缓存期内，数据不会更改。
函数将始终为相同的参数返回相同的值（因此时间和随机对缓存没有意义）。
函数没有副作用。如果缓存被访问，则永远不会调用该函数，因此请确保不更改其中的任何状态。
函数不返回不同的可变对象。例如，返回列表的函数不适合缓存，因为将要缓存的是对列表的引用，而不是列表内容。

展开阅读全文

页面更新：2024-04-21

标签：递归缓存函数模板策略速度东西轻松页面网页程序方法内容

1 2 3 4 5

Python - 让程序轻松加速的方法

什么是缓存？

LRU是什么意思？

怎样使用它？

Matches for {{day}}

还有什么应该知道？

内置函数

有时候不要使用缓存

ChatGPT颠覆行业已是板上钉钉！英伟达赢麻了，三星SK海力士笑了

苏大《Nature》子刊：一种高性能胶体量子点蓝色发光二极管！

性能强且易上手大疆Vlog拍摄神器推荐

Go开发03 切片彻底研究（三）

销售超百亿美元，TikTok上带货游戏产品可以怎么玩？

Nexus3部署docker私有仓库-企业版

戴尔要去中国化？计划全面停用中国芯片，还要将一半产能转去越南

用Python解析古籍《史记》（一）

株洲国投控股宜安科技研发全国首款可降解镁骨钉完成临床试验入组

鞍山人社政策天天讲（第五讲）：养老保险常见情况（中）

新华全媒+企业眼里的黑龙江经济脉动

2023年销量目标4.5万辆，智己汽车规划多款新车，能否扭转颓势？

上海市首发经济引领性本土品牌榜单发布，闵行出品的知名国货品牌再次入选

创无人机产业集群！2023首届河北省无人机产业大会成功举办

沧州经济开发区在京举行招商推介会

Win11测试新功能：无需任务管理器即可杀死程序

DNF搬砖装备搭配：低血流再次进化，生存+速度+伤害，太猛了！

化瘀先活血，活血先健脾，教你一招，健脾活血化血栓，一身轻松

爱奇艺热播剧被搬运到外网，境内外访问内容还不同……

早春防湿寒别吃过多寒凉水果，推荐3个养生方法，健脾胃、

正确喝水的10个方法，你都知道吗？

微软Edge浏览器111 Beta发布：增强安全性，添加新策略

粤东西北承接产业转移！广东鼓励珠三角保留纺织服装高端

华为程序员，985本科毕业，36岁公司通知不再续约，你怎么看？

女生一定要逼自己练这9样东西

Home team	Away team	Score
{{match["home"]}}	{{match["away"]}}	{{match["home_goals"]}} - {{match["away_goals"]}}