目标服务器对单个ip的请求速率有限制，这个请求速率是什么？怎么衡量？

技术

yuzhiblue

2025年1月20日 20:19

目标服务器对单个 IP 的请求速率限制是指服务器在单位时间内允许从一个 IP 地址发起的请求数量的上限。这种限制通常用于防止恶意爬虫或滥用行为，保护服务器的稳定性和资源。

1. 请求速率的定义

请求速率：单位时间内允许的请求数量，通常以 每秒请求数（RPS，Requests Per Second） 或 每分钟请求数（RPM，Requests Per Minute） 来衡量。
限制方式：
硬限制：超过限制后，服务器会直接拒绝请求（返回 429 状态码）。
软限制：超过限制后，服务器可能会降低响应优先级或延迟响应。

2. 如何衡量请求速率

（1）通过响应头获取速率限制信息

一些服务器会在响应头中返回速率限制信息，常见的字段包括： - X-RateLimit-Limit：允许的最大请求数。 - X-RateLimit-Remaining：当前剩余的请求数。 - X-RateLimit-Reset：速率限制重置的时间（通常是 Unix 时间戳）。

示例：

HTTP/1.1 200 OK
X-RateLimit-Limit: 100
X-RateLimit-Remaining: 95
X-RateLimit-Reset: 1698765432

（2）通过测试确定速率限制

如果服务器没有明确返回速率限制信息，可以通过测试来确定： 1. 逐步增加请求频率：从低频率开始，逐步增加请求频率，观察服务器的响应。 2. 观察响应状态码： - 429 Too Many Requests：表示请求速率超过限制。 - 503 Service Unavailable：表示服务器因过载而暂时不可用。 3. 记录触发限制的阈值：当收到 429 或 503 状态码时，记录当前的请求频率。

示例代码：

import asyncio
import aiohttp

async def test_rate_limit(url):
    async with aiohttp.ClientSession() as session:
        request_count = 0
        while True:
            async with session.get(url) as response:
                request_count += 1
                print(f"请求 {request_count}: 状态码 {response.status}")
                if response.status == 429:
                    print(f"触发速率限制，当前请求频率: {request_count} 次/秒")
                    break
            await asyncio.sleep(0.1)  # 调整请求间隔

asyncio.run(test_rate_limit("https://example.com"))

3. 如何应对速率限制

（1）降低请求频率

根据服务器的速率限制，调整请求间隔时间。
示例： python await asyncio.sleep(1) # 每秒发送 1 个请求

（2）使用代理 IP 池

通过多个代理 IP 分散请求，避免单个 IP 触发速率限制。
示例： python proxy = "http://user:pass@proxy_ip:port" async with session.get(url, proxy=proxy) as response: ...

（3）自动限速

使用 asyncio 和 aiohttp 的自动限速功能，动态调整请求频率。
示例： ```python from aiolimiter import AsyncLimiter

limiter = AsyncLimiter(max_rate=10, time_period=1) # 每秒最多 10 个请求

async def fetch(url): async with limiter: async with session.get(url) as response: return await response.text() ```

（4）错误重试

当触发速率限制时，等待一段时间后重试。
示例： python async def fetch(url): retries = 3 for attempt in range(retries): async with session.get(url) as response: if response.status == 429: await asyncio.sleep(2 ** attempt) # 指数退避 continue return await response.text()