解决 OpenAI API 429 限流错误

一句话回答

429 错误表示请求频率超过了限制。解决方法包括减少并发请求、添加重试逻辑、使用指数退避策略，或升级 API 套餐。

429 错误的含义

429 Too Many Requests 表示你在一定时间内发送了太多 API 请求，服务端暂时限制了你的访问。这是一种保护机制，防止单个用户占用过多资源。

常见原因

1. 短时间大量并发请求

使用批量处理或循环调用时，可能在几秒内发送几十甚至上百个请求。

2. 多个工具共用同一个 Key

如果你同时在 Cursor、Dify、n8n 和自研应用中使用同一个 API Key，累计请求量可能超过限制。

3. 代码中没有做重试控制

请求失败后立即重试，没有设置等待间隔，导致请求越积越多。

解决方案

1. 降低并发数

在代码中：控制同时进行的请求数量，使用队列或信号量限制并发。

import asyncio

semaphore = asyncio.Semaphore(5)  # 最多同时 5 个请求

async def call_api(prompt):
    async with semaphore:
        return await openai_call(prompt)

在 n8n 中：调整 OpenAI 节点的并发设置，或在工作流中添加 Wait 节点控制频率。

在 Dify 中：查看应用设置的速率限制配置。

2. 添加指数退避重试

不要在请求失败后立即重试，而是等待越来越长的时间。典型的重试策略：

第 1 次重试：等待 1 秒
第 2 次重试：等待 2 秒
第 3 次重试：等待 4 秒
第 4 次重试：等待 8 秒
...直到最大重试次数

import time

def call_with_retry(prompt, max_retries=3):
    for i in range(max_retries):
        try:
            return openai_call(prompt)
        except RateLimitError:
            wait = 2 ** i
            time.sleep(wait)
    raise Exception("重试次数已用完")

3. 使用缓存减少重复请求

如果多个请求的内容相同（如系统提示词、常见问题的回复），可以通过缓存避免重复调用。

cache = {}

def cached_call(prompt):
    key = hash(prompt)
    if key in cache:
        return cache[key]
    result = openai_call(prompt)
    cache[key] = result
    return result

4. 升级套餐

TokenCheap 不同套餐有不同的速率限制。如果你确实需要高并发，可以联系技术支持了解更高额度的套餐方案。

快速排查清单

检查代码中是否有死循环调用
确认并发请求数量是否过高
检查是否多个工具同时使用同一个 Key
代码中是否添加了重试和退避逻辑
如有必要，联系技术支持升级速率限制

仍然无法解决？

如果按以上步骤优化后仍频繁遇到 429 错误：

联系 TokenCheap 技术支持：微信 TokenCheap
说明你的使用场景和预期的请求频率
我们会帮你评估是否需要升级套餐或优化架构