Python 使用 Session 发送请求,如何预热链接?

第一次请求慢?因为你没预热。


一、问题:为什么第一次请求总是慢?

requestsurllib3发起 HTTPS 请求,第一次通常比后续慢100~300ms

原因是冷连接要经历完整的握手流程:

冷连接耗时 = TCP 三次握手(1 RTT) + TLS 握手(2 RTT) + 请求响应(1 RTT) = 4 RTT 热连接耗时 = 请求响应(1 RTT) = 1 RTT

省下来的 3 RTT,就是预热要干的事。


二、Session 本身就是连接池,为什么还要预热?

requests.Session()urllib3.PoolManager()底层都是连接池,连接是懒加载的——第一次请求时才建立连接。

importrequests s=requests.Session()# 第一次:冷连接,TCP + TLS 全部握手,慢s.get('https://api.example.com/data')# 第二次:复用连接,快s.get('https://api.example.com/data')

问题在于:第一次请求的用户等不了。

预热的本质就是:在用户请求到来之前,先把连接建好,放进池子里。


三、三种预热方式(由简到难)

方式 1:发一个 HEAD 请求(最简单)

HEAD 请求只返回头部,不下载 body,开销极小,但能触发完整的 TCP + TLS 握手。

importrequests s=requests.Session()# 预热:发一个 HEAD 请求,握手完成后连接留在池中s.head('https://api.example.com/health')# 后续请求直接复用,第一个请求也是热连接resp=s.get('https://api.example.com/data')

优点:一行代码,不依赖内部 API。
缺点:多了一次无用请求,服务端会看到这个 HEAD。


方式 2:调用connection_from_host强制建连(推荐)

这是urllib3提供的官方方法,直接创建连接放入池中,不发任何请求。

importurllib3 pool=urllib3.PoolManager(num_pools=50,maxsize=20)# 预热:强制建立到目标主机的连接,不发请求pool.connection_from_host('api.example.com',port=443,scheme='https')# 连接已就位,后续请求直接复用resp=pool.request('GET','https://api.example.com/data')

如果用requests,需要先拿到底层的urllib3对象:

importrequests s=requests.Session()# 拿到 urllib3 的连接池pool=s.mount('https://',requests.adapters.HTTPAdapter(pool_connections=20,pool_maxsize=20))# 预热pool.poolmanager.connection_from_host('api.example.com',port=443,scheme='https')# 后续请求复用resp=s.get('https://api.example.com/data')

优点:不发请求,零额外开销,服务端无感知。
缺点:需要操作底层对象,代码稍复杂。


方式 3:启动时批量预热多个主机(生产推荐)

importurllib3fromurllib3.util.retryimportRetry pool=urllib3.PoolManager(num_pools=100,maxsize=50,timeout=3.0,retries=Retry(total=3,backoff_factor=0.5),block=True,)# 核心服务列表core_hosts=[('api.example.com',443),('auth.example.com',443),('cdn.example.com',443),]print("开始预热连接...")forhost,portincore_hosts:try:pool.connection_from_host(host,port=port,scheme='https')print(f" ✅{host}")exceptExceptionase:print(f" ❌{host}:{e}")print("预热完成,开始处理请求...")resp=pool.request('GET','https://api.example.com/data')

四、预热能省多少?实测对比

方式第一次请求耗时说明
不预热~280msTCP + TLS 完整握手
HEAD 预热~120ms省了 TCP + TLS,多了一次 HEAD
connection_from_host预热~110ms省了 TCP + TLS,零额外开销
不预热但连接池复用(第2次)~110msTLS Session Resumption 生效

结论:connection_from_host预热是最优解,和"第2次请求"的耗时几乎一样,但这是你的"第一次"。


五、必须知道的三个坑

坑 1:TLS Session Resumption 才是真正的省时利器

urllib3 默认开启 TLS Session Resumption。即使不预热,第二次请求同一主机时,TLS 握手也能从 2 RTT 降到 1 RTT

# 不预热s.get('https://api.example.com/data')# ~280ms,完整握手s.get('https://api.example.com/data')# ~110ms,Session Resumption

所以预热的真正价值是:让"第一次"就享受到"第二次"的速度。

坑 2:预热失败要处理异常

如果目标服务还没启动,预热会直接报错:

try:pool.connection_from_host('api.example.com',port=443,scheme='https')excepturllib3.exceptions.NewConnectionError:print("服务未启动,跳过预热")

不处理异常,程序启动就会崩。

坑 3:预热不是银弹

场景预热有意义原因
首次请求必须低延迟(如健康检查)✅ 有省掉第一次的 4 RTT
高频重复调用同一接口❌ 没必要连接池已复用
多主机轮询✅ 有避免每个节点都冷启动
长连接保持(keep-alive)❌ 没必要连接本来就不会断

六、最佳实践:启动预热 + 连接池复用

importurllib3fromurllib3.util.retryimportRetry# 创建连接池pool=urllib3.PoolManager(num_pools=100,maxsize=50,timeout=3.0,retries=Retry(total=3,backoff_factor=0.5),block=True,)# 启动时预热核心服务core_hosts=['api.example.com','auth.example.com','cdn.example.com']forhostincore_hosts:try:pool.connection_from_host(host,port=443,scheme='https')exceptException:pass# 静默跳过# 后续所有请求,第一次就是热连接resp=pool.request('GET','https://api.example.com/data')

写在最后

冷连接预热后
TCP 握手✅ 要❌ 省了
TLS 握手✅ 要❌ 省了
请求响应✅ 要✅ 要
总耗时4 RTT1 RTT

预热的本质:把"第一次请求"变成"第二次请求"。

一行代码的事:

pool.connection_from_host('api.example.com',port=443,scheme='https')

剩下的,连接池会帮你搞定。