指南
OpenRouter 免费模型:完整列表 + 速率限制详解
OpenRouter 免费模型完整列表及速率限制详解。涵盖编码性能、API 密钥设置、模型轮换和常见错误修复。
简短回答: OpenRouter 是通过一个 API 密钥调用多种 LLM 的最快方式,包括供应商允许时的免费或 :free 模型路由。预算大约 15分钟 注册、复制密钥并发送第一个请求。技能要求:你能运行 curl 或将 Python 粘贴到 notebook 中。
我们最后一次验证模型页面和实时 API 调用是在 2026年6月13日。免费 ID 会变化,所以请将下面的表格视为模式参考而非永久列表。
最后更新:2026年6月13日。
快速列表:OpenRouter 上的免费模型(2026年6月)
| 模型 | Slug 模式 | 类型 | 最适合 |
|---|---|---|---|
| Qwen3-Coder | qwen/qwen3-coder:free | 免费 | 编码(我们的 #1 免费首选) |
| Poolside Laguna | poolside/laguna-xs.2:free | 免费 | 编码智能体、内联建议 |
| NVIDIA Nemotron 3 Ultra | nvidia/nemotron-3-ultra-550b-a55b:free | 免费 | 1M 上下文智能体任务 |
| Google Gemma 4 | google/gemma-4-31b-it:free | 免费 | 多模态 + 文本问答 |
| OpenAI OSS 120B | openai/gpt-oss-120b:free | 免费 | 推理密集型草稿 |
| Nous Hermes | nousresearch/hermes-3-llama-3.1-405b:free | 免费 | 通用型、无审查草稿 |
| Z AI GLM | z-ai/glm-4.5-air:free | 免费 | 轻量级通用任务 |
| Meta Llama 3.3 70B | meta-llama/llama-3.3-70b-instruct:free | 免费 | 后备(可能退出免费) |
| MiniMax M3 | minimax/minimax-m3 | 付费($0.30/$1.20) | 最便宜的 1M 上下文编码 |
| Kimi K2.7 Code | moonshotai/kimi-k2.7-code | 付费($0.95/$4.00) | 高端开源权重编码 |
| DeepSeek V4-Pro | deepseek/deepseek-v4-pro | 付费(低) | 最具性价比的前沿模型 |
| GPT-5.5 | openai/gpt-5.5 | 付费(高) | 最终补丁、智能体循环 |
| Claude Opus 4.8 | anthropic/claude-opus-4-8 | 付费(高) | 生产代码、复杂推理 |
有速率限制。 免费模型在高负载下会限流。添加 $5 积分以避免402错误。Slug 每周都可能变化——请始终在 openrouter.ai/models 上验证。
你需要准备的
| 项目 | 说明 |
|---|---|
| OpenRouter 账户 | openrouter.ai 注册(邮箱或 OAuth) |
| API 密钥 | 仪表板 → Keys → 创建 |
| 可选积分 | 某些”免费”促销仍需要正余额以防滥用 |
| HTTP 客户端 | curl、Python openai SDK 或你的 IDE |
| 模型 slug | 从目录复制,例如 qwen/qwen3-coder:free 或以 :free 结尾的名称 |

快速对比:免费 vs 付费路由
| 路由类型 | 成本信号 | 最适合 | 注意事项 |
|---|---|---|---|
:free 或目录标价 $0 的模型 | 目录上每 token $0 | 学习、草稿、个人脚本 | 速率限制、突然下架 |
| 便宜的付费(Flash、Mistral) | 每百万 token 几美分 | 批量代码生成、摘要 | 工具调用质量参差不齐 |
| 前沿付费(GPT-5.5、Opus) | 每百万 token 几美元 | 最终补丁、智能体 | 如果精准使用,仍比浪费人工时间便宜 |
关于这些模型在编码方面的比较,请参阅 DeepSeek V4 vs ChatGPT vs Claude 和最新AI模型中心。
第1步:创建账户和密钥
- 前往 openrouter.ai 并登录。
- 在仪表板中打开 Keys。
- 点击 Create Key,命名(例如
aitoolsradar-dev),复制一次。 - 本地导出:
export OPENROUTER_API_KEY="sk-or-v1-xxxxxxxx"预期结果: Keys 页面显示你的新密钥及其创建日期。如果你不小心在截图中暴露了密钥,请立即撤销。
常见错误: 将密钥提交到 GitHub。使用 .env 并将 .env 添加到 .gitignore。
第2步:在目录中查找免费模型
- 在仪表板中打开 Models(或访问公开模型页面)。
- 按价格升序排序或筛选。
- 查找带有 :free 后缀或行中输入和输出均为 $0 的模型。
- 精确复制模型 ID 字符串,包括供应商前缀。
预期结果: 你有一个可用于 JSON 中 model 字段的 slug,例如 qwen/qwen3-coder:free 或 openrouter/free(自动选择一个免费路由)。
常见错误: 供应商重命名了检查点后仍使用旧博客中的 slug。以目录为准。
第3步:用 curl 发送测试请求
curl https://openrouter.ai/api/v1/chat/completions \
-H "Authorization: Bearer $OPENROUTER_API_KEY" \
-H "Content-Type: application/json" \
-H "HTTP-Referer: https://aitoolsradar.org" \
-H "X-Title: AI Tools Radar Test" \
-d '{
"model": "REPLACE_WITH_FREE_MODEL_ID",
"messages": [
{"role": "user", "content": "Reply with exactly: openrouter ok"}
]
}'将 REPLACE_WITH_FREE_MODEL_ID 替换为你复制的 slug。
预期结果: JSON 中 choices[0].message.content 包含你的回复。
常见错误: 忘记 Authorization 头。你会收到一个简短错误体的401响应。
第4步:使用 OpenAI Python SDK
安装一次:
pip install openai脚本:
import os
from openai import OpenAI
client = OpenAI(
base_url="https://openrouter.ai/api/v1",
api_key=os.environ["OPENROUTER_API_KEY"],
)
resp = client.chat.completions.create(
model="REPLACE_WITH_FREE_MODEL_ID",
messages=[
{"role": "user", "content": "Write a one-line Python hello world."}
],
extra_headers={
"HTTP-Referer": "https://aitoolsradar.org",
"X-Title": "AI Tools Radar Script",
},
)
print(resp.choices[0].message.content)预期结果: 终端打印来自免费模型的代码或文本。
常见错误: 使用 OpenRouter 模型 slug 时将默认 OpenAI 客户端指向 api.openai.com。base URL 必须是 OpenRouter。
第5步:草稿用便宜的,最终版用贵的
这是我们2026年6月使用的模式:
- 分类任务:草稿 vs 最终版,公开 vs 机密。
- 草稿使用免费模型(
moonshotai/kimi-k2.6:free做通用工作、qwen/qwen3-coder:free做代码、poolside/laguna-xs.2:free做智能体编码,或任何能处理你任务的:freeslug)。 - 最终版在 OpenRouter 或直接 API 上使用
gpt-5.5或claude-opus-4-8。 - 在应用日志中记录每个请求的
model以便成本审计。
两步 Python 模式示例:
DRAFT_MODEL = "REPLACE_WITH_FREE_OR_FLASH_ID"
FINAL_MODEL = "openai/gpt-5.5" # verify slug on catalog
def draft(prompt: str) -> str:
return chat(DRAFT_MODEL, prompt)
def finalize(draft_text: str, rubric: str) -> str:
return chat(
FINAL_MODEL,
f"Improve this answer.\nRubric: {rubric}\n\n{draft_text}",
)预期结果: 在内部工具上保持可接受质量的同时降低月度账单。
OpenRouter 定价表(2026年6月信号)
发布预算文档前请先验证实时价格。
| 模型类别 | 示例目录模式 | 输入 / 输出(典型) | 免费? |
|---|---|---|---|
| 免费促销 | *:free 后缀 | 列出时 $0 / $0 | 是,在列出期间 |
| Qwen3-Coder | qwen/qwen3-coder:free | :free 激活时 $0 | 是,在列出期间 |
| DeepSeek V4-Pro | deepseek/deepseek-v4-pro | 相比美国前沿模型较低 | 否 |
| Mistral Large | mistralai/mistral-large-* | 中等 | 否 |
| GPT-5.5 | openai/gpt-5.5 | 高 | 否 |
| Claude Opus 4.8 | anthropic/claude-opus-4-8 | 高 | 否 |
| Moonshot Kimi K2.6 | moonshotai/kimi-k2.6 | 中等(6月13日失去 :free) | 否 |
| Moonshot Kimi K2.7 Code | moonshotai/kimi-k2.7-code | 中等(6月12日新增) | 否 |
| MiniMax M3 | minimax/minimax-m3 | 低(促销 $0.30/$1.20) | 否 |
OpenRouter 还在每个模型卡片上显示每次请求费用和上下文定价。即使每 token 费率看起来很低,1M 上下文模型上的长提示仍可能产生实际费用。
在 Cursor 中使用 OpenRouter(可选)
- 打开 Cursor Settings → Models(措辞可能因版本而异)。
- 如果可用,添加一个 OpenAI 兼容 自定义供应商,或使用 OpenRouter base URL 字段(如果存在)。
- Base URL:
https://openrouter.ai/api/v1 - API key:你的
OPENROUTER_API_KEY - Model:粘贴目录中的 slug。
预期结果: 内联聊天使用你输入的 slug。
常见错误: 假设每个免费模型都像 GPT-5.5 一样支持工具调用。先运行一个工具密集型提示做冒烟测试。
什么时候跳过 OpenRouter
- 你的法务团队要求仅与 OpenAI 或 Anthropic 签订直接 DPA。
- 你需要一个固定模型版本十二个月不重命名。
- 你运行高流量生产流量,路由器加价在规模上很重要且直接合同更便宜。
当你跳过时,仍然请阅读最新AI模型中心了解能力背景。
故障排查
| 问题 | 解决方案 |
|---|---|
| 401 Unauthorized | 检查 OPENROUTER_API_KEY 导出和 Bearer 头 |
| 402 或积分错误 | 在 Billing 中添加少量余额 |
| 模型未找到 | 重新从目录复制 slug;在2026年6月下线日期前退役旧的 DeepSeek ID |
| 免费层速度慢 | 队列繁忙;在非高峰期重试或切换到便宜的付费 Flash |
| 工具 JSON 为空或乱码 | 将智能体步骤转移到 GPT-5.5 或 Opus 做工具调用 |
免费模型工作流的提示模板
总结日志(低成本)
Summarize this log in five bullets: first error, likely cause, suggested fix.
Do not invent file names not present in the log.
[paste log]仅草稿声明
Draft an answer. Mark uncertain claims with [verify].
I will run a second pass on a frontier model.我们在2026年6月观察到的免费模型模式
目录会轮换。即使确切的 slug 变化,这些模式会重复出现:
| 模式 | 示例 slug 格式 | 适合 | 限制 |
|---|---|---|---|
| OpenRouter 免费路由器 | openrouter/free | 不选模型的快速测试 | 轮换供应商;行为不一 |
Qwen3-Coder :free | qwen/qwen3-coder:free | 最佳免费编码选项 | 1M 上下文;验证工具调用 |
| Moonshot Kimi K2.7 Code | moonshotai/kimi-k2.7-code | 高端开源编码:preserve_thinking、多模态 | $0.95/$4.00 每百万;256K 上下文 |
| MiniMax M3 | minimax/minimax-m3 | 最便宜的 1M 上下文编码 + 多模态开源权重 | $0.30/$1.20 促销;检查许可证 |
Poolside Laguna :free | poolside/laguna-xs.2:free、poolside/laguna-m.1:free | 编码智能体、内联建议 | 262K 上下文;目录新增 |
| OpenAI OSS 免费 | openai/gpt-oss-120b:free、openai/gpt-oss-20b:free | 推理密集型草稿 | 卡片上131K 上下文 |
NVIDIA Nemotron :free | nvidia/nemotron-3-super-120b-a12b:free、nvidia/nemotron-3-ultra-550b-a55b:free | 智能体式任务、安全检查 | 大型 MoE;检查延迟 |
Google Gemma 4 :free | google/gemma-4-31b-it:free、google/gemma-4-26b-a4b-it:free | 多模态 + 文本问答 | 检查卡片上的上下文窗口 |
Z AI GLM :free | z-ai/glm-4.5-air:free | 轻量级通用任务 | 131K 上下文 |
Nous Hermes :free | nousresearch/hermes-3-llama-3.1-405b:free | 通用型、无审查草稿 | 131K 上下文 |
Meta Llama instruct :free | meta-llama/llama-3.3-70b-instruct:free、meta-llama/llama-3.2-3b-instruct:free | 仅后备 | 很快会退出免费层;2026年中期相关性降低 |

我们实践中如何选择免费路由
- 打开模型页面,按价格升序筛选。
- 用同一个任务(一个编码提示)复制三个候选。
- 在电子表格中记录延迟、拒绝率和回答质量。
- 将胜出者提升到
.env中作为DRAFT_MODEL使用两周。 - 每周一重新运行第1步;免费路由会在没有邮件通知的情况下消失。
Node.js 和 TypeScript 代码片段
用于小型内部工具:
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://openrouter.ai/api/v1",
apiKey: process.env.OPENROUTER_API_KEY!,
});
const model = process.env.DRAFT_MODEL ?? "REPLACE_WITH_FREE_MODEL_ID";
const completion = await client.chat.completions.create({
model,
messages: [{ role: "user", content: "List three risks of using free LLM APIs." }],
});
console.log(completion.choices[0]?.message?.content);预期结果: 控制台打印一个简短列表。在运行时替换 model 做 A/B 测试。
常见错误: 在十个仓库中硬编码一个免费 slug。在一个密钥管理器中集中管理 DRAFT_MODEL。
安全和密钥管理
- 在任何外包人员离职或截图泄露后轮换密钥。
- 在 OpenRouter 仪表板中(如果可用)按环境限定密钥范围(
dev、staging、prod)。 - 永远不要为了”省钱”而通过免费模型发送客户 PII。免费层仍然会将数据发送到你的网络之外。
- 日志留存: OpenRouter 可能根据其政策保留元数据。在做 HIPAA 或欧盟客户工作之前请阅读。
- 当法务问”谁是子处理者”时,与直接 OpenAI/Anthropic 企业 DPA 对比。
我们不是律师。有疑问时,阻止路由器并使用经批准的直接 API。
在费用令你惊讶之前监控支出
- 每周在 OpenRouter 仪表板中打开 Activity 或 Usage。
- 如果 UI 提供的话设置积分告警,或为实验保持手动 $20 充值上限。
- 在你的应用日志中标记请求:
model、route、user_id、feature。 - 绘制每个功能的 token 量。当某个功能的 token 量暴增10倍时,通常就是从免费升级到付费的时候。
- 如果支出突增,先检查是否有智能体循环每三十秒调用一次
gpt-5.5,然后再怪罪免费层。
我们在 AI Tools Radar 使用的规则: 免费模型仅用于内部草稿。任何面向客户的内容都通过付费前沿路由并经过人工抽查。
OpenRouter vs Together vs Groq(各一段)
Together 在你已经托管微调模型或想在他们的云上使用开源模型时很强。你会失去 OpenRouter 提供的统一目录。
Groq 在支持的 Llama/Mixtral 芯片上速度取胜。适合延迟演示,但不一定有 OpenRouter 那样完整的模型列表。
Fireworks 是另一个开发者喜爱的快速开源权重推理平台。同样的道理:比较目录,而不是品牌忠诚度。
OpenRouter 的优势是一个集成界面用于实验。仅当特定模型未列出或企业定价在你的流量下优于路由器时,才选择第二个供应商。
替代方案
- Together、Groq、Fireworks: 如果你的团队已有积分,可以不通过 OpenRouter 使用相同的草稿/最终版模式。
- 本地 Llama: 如果你有 GPU 时间则零 API 成本;配置更慢。
- 直接 DeepSeek API: 当你只需要一个供应商时跳过路由器加价;参见 DeepSeek 对比。
- LiteLLM 代理: 如果你想为十个微服务建立一个内部网关,可将 OpenRouter 包装在 LiteLLM 后面。
结论
当你在学习、原型开发或在非关键草稿上削减成本时,使用 OpenRouter 免费模型。当你上线智能体、工具循环或面向客户的功能时,添加付费积分。当免费路由在代码质量上漂移时,搭配 GPT-5.5 或 Claude 做最终版。
我们在6月第1周雷达中每周关注目录,并在主要免费路由变化时更新本指南。配合阅读 GPT-5.5 Excel 指南(2026) 了解电子表格最终版,用AI工具赚钱(2026) 了解销售 API 辅助的自由职业工作。
更新日志
- 2026-06-13: 实时目录检查。Moonshot Kimi K2.6 从免费列表中移除(失去
:free标签)。添加了 Kimi K2.7 Code 和 MiniMax M3 作为付费开源权重选项。更新了免费模型 FAQ 推荐。链接了两个新模型的完整评测。 - 2026-06-05: 实时目录检查。移除了
deepseek/deepseek-v4-flash:free(不再:free)。添加了 Qwen3-Coder、Poolside Laguna、Moonshot Kimi K2.6、GLM-4.5-Air、Nous Hermes,扩展了 Nemotron/OSS/Gemma/Llama 免费 slug。更新了 FAQ 和定价表。 - 2026-06-02: 事实核查。更新了验证日期;刷新了2026年6月免费模型示例(
openrouter/free、deepseek-v4-flash:free、Gemma/Nemotron/OSS 路由)。确认openai/gpt-5.5在 OpenRouter 目录上。 - 2026-05-29: 首次发布。记录了账户设置、curl 和 Python 示例、定价表模式、Cursor 说明、草稿/最终版路由、八个常见问题。
常见问题
8 个问题OpenRouter 有免费模型吗?
有。OpenRouter 在模型页面上列出了带有 free 后缀标签或输入/输出价格为零的模型。可用性会随着供应商添加或移除促销活动而变化。在将免费 ID 固化到生产环境之前,请务必查阅实时模型目录。
如何获取 OpenRouter API 密钥?
在 openrouter.ai 创建账户,在仪表板中打开 Keys,生成密钥。将其存储在环境变量中,例如 OPENROUTER_API_KEY。不要将密钥提交到 git。即使每 token 价格显示为零,某些模型仍需要你添加小额积分余额。
OpenRouter 和 OpenAI API 一样吗?
不一样。OpenRouter 提供兼容 OpenAI 的聊天补全接口,但模型 ID 指向多个供应商(DeepSeek、Meta、Google、Anthropic、OpenAI、Mistral 等)。你只需替换 base URL 和模型字符串。除非你使用其文档中的供应商特定路由选项,否则计费通过 OpenRouter 积分进行。
OpenRouter 上最好的免费编码模型是什么?
2026年6月我们的首选免费编码模型是 **Qwen3-Coder**(`:free`)。**Poolside Laguna**(`:free`)适合编码智能体和内联建议。**NVIDIA Nemotron 3 Ultra**(`:free`)在促销期间以零成本处理 1M 上下文智能体任务。注意:截至6月13日 Moonshot Kimi K2.6 已失去 `:free` 标签。可使用新的 **Kimi K2.7 Code**(付费,$0.95/$4.00 每百万token)或 **MiniMax M3**(付费,$0.30/$1.20 促销价)获取开源权重级别的前沿编码体验。每周重新检查目录。生产代码的最终审查请使用付费前沿模型。
为什么我的 OpenRouter 免费请求失败了?
常见原因包括速率限制耗尽、模型 ID 已弃用、账户积分不足或供应商暂停了免费推理。用另一个免费 ID 重试或添加 $5 积分。记录完整的错误响应体。OpenRouter 在 JSON 中返回供应商提示。
我能在 Cursor 中使用 OpenRouter 吗?
可以。将 Cursor 或其他兼容 OpenAI 的客户端指向 https://openrouter.ai/api/v1,使用你的 OpenRouter 密钥和其目录中的模型 slug。某些功能需要付费模型才能保证工具调用的可靠性。在依赖它用于智能体之前,先在你的确切模型上测试工具使用。
OpenRouter vs 直接使用 Anthropic 或 OpenAI API?
当你想用一个 SDK 访问多个模型进行实验、免费草稿和快速 A/B 测试时,使用 OpenRouter。当你需要企业 DPA、固定模型版本或单一供应商的支持工单时,使用直接 API。混合配置在2026年很常见。
如果我不用免费模型,OpenRouter 多少钱?
你按每个模型列表价格加上结算时显示的 OpenRouter 费用付款。DeepSeek 和 Mistral 路由通常是最便宜的付费编码路径。GPT-5.5 和 Claude Opus 路由每 token 成本更高。仪表板使用页面是你支出的权威来源。
更多指南
查看全部更多文章
查看全部
GLM-5.2:开源前沿模型,百万上下文、基准测试与本地部署指南(2026)
GLM-5.2 是智谱 AI 推出的 744B 开源权重模型,MIT 许可证。基准测试、定价、vLLM 和 llama.cpp 本地部署,以及与 Claude Opus 4.8 和 GPT-5.5 的对比。
模型

Kimi K2.7 Code(2026):1T MoE 编程模型、基准测试与定价
Kimi K2.7 Code:Moonshot AI 推出的 1T 开源编程模型,32B 激活 MoE,preserve_thinking 模式,对比 GPT-5.5 和 Claude Opus 基准测试。
模型

MiniMax M3开源版(2026):428B模型、百万上下文与基准测试
MiniMax M3:428B开放权重模型,通过稀疏注意力实现百万上下文,原生多模态输入,编程基准测试有竞争力,价格比GPT-5.5便宜10倍。
模型

美国政府封禁Anthropic Fable 5与Mythos 5(2026)
美国政府封禁Anthropic:商务部于2026年6月12日下令暂停Fable 5和Mythos 5。长达四个月的冲突完整时间线。
模型


