OpenRouter API dashboard showing free model list and API key setup

指南

OpenRouter 免费模型：完整列表 + 速率限制详解

OpenRouter 免费模型完整列表及速率限制详解。涵盖编码性能、API 密钥设置、模型轮换和常见错误修复。

AI Tools Radar Editorial 2026年5月29日更新于 2026年6月13日 6 分钟阅读

简短回答： OpenRouter 是通过一个 API 密钥调用多种 LLM 的最快方式，包括供应商允许时的免费或 :free 模型路由。预算大约 15分钟 注册、复制密钥并发送第一个请求。技能要求：你能运行 curl 或将 Python 粘贴到 notebook 中。

我们最后一次验证模型页面和实时 API 调用是在 2026年6月13日。免费 ID 会变化，所以请将下面的表格视为模式参考而非永久列表。

最后更新：2026年6月13日。

快速列表：OpenRouter 上的免费模型（2026年6月）

模型	Slug 模式	类型	最适合
Qwen3-Coder	`qwen/qwen3-coder:free`	免费	编码（我们的 #1 免费首选）
Poolside Laguna	`poolside/laguna-xs.2:free`	免费	编码智能体、内联建议
NVIDIA Nemotron 3 Ultra	`nvidia/nemotron-3-ultra-550b-a55b:free`	免费	1M 上下文智能体任务
Google Gemma 4	`google/gemma-4-31b-it:free`	免费	多模态 + 文本问答
OpenAI OSS 120B	`openai/gpt-oss-120b:free`	免费	推理密集型草稿
Nous Hermes	`nousresearch/hermes-3-llama-3.1-405b:free`	免费	通用型、无审查草稿
Z AI GLM	`z-ai/glm-4.5-air:free`	免费	轻量级通用任务
Meta Llama 3.3 70B	`meta-llama/llama-3.3-70b-instruct:free`	免费	后备（可能退出免费）
MiniMax M3	`minimax/minimax-m3`	付费（$0.30/$1.20）	最便宜的 1M 上下文编码
Kimi K2.7 Code	`moonshotai/kimi-k2.7-code`	付费（$0.95/$4.00）	高端开源权重编码
DeepSeek V4-Pro	`deepseek/deepseek-v4-pro`	付费（低）	最具性价比的前沿模型
GPT-5.5	`openai/gpt-5.5`	付费（高）	最终补丁、智能体循环
Claude Opus 4.8	`anthropic/claude-opus-4-8`	付费（高）	生产代码、复杂推理

有速率限制。 免费模型在高负载下会限流。添加 $5 积分以避免402错误。Slug 每周都可能变化——请始终在 openrouter.ai/models 上验证。

你需要准备的

项目	说明
OpenRouter 账户	openrouter.ai 注册（邮箱或 OAuth）
API 密钥	仪表板 → Keys → 创建
可选积分	某些”免费”促销仍需要正余额以防滥用
HTTP 客户端	`curl`、Python `openai` SDK 或你的 IDE
模型 slug	从目录复制，例如 `qwen/qwen3-coder:free` 或以 `:free` 结尾的名称

OpenRouter models page with free-tier and pricing filters on openrouter.ai — OpenRouter 模型目录，显示免费和付费路由。2026年6月5日截图。

快速对比：免费 vs 付费路由

路由类型	成本信号	最适合	注意事项
`:free` 或目录标价 $0 的模型	目录上每 token $0	学习、草稿、个人脚本	速率限制、突然下架
便宜的付费（Flash、Mistral）	每百万 token 几美分	批量代码生成、摘要	工具调用质量参差不齐
前沿付费（GPT-5.5、Opus）	每百万 token 几美元	最终补丁、智能体	如果精准使用，仍比浪费人工时间便宜

关于这些模型在编码方面的比较，请参阅 DeepSeek V4 vs ChatGPT vs Claude 和最新AI模型中心。

第1步：创建账户和密钥

前往 openrouter.ai 并登录。
在仪表板中打开 Keys。
点击 Create Key，命名（例如 aitoolsradar-dev），复制一次。
本地导出：

export OPENROUTER_API_KEY="sk-or-v1-xxxxxxxx"

预期结果： Keys 页面显示你的新密钥及其创建日期。如果你不小心在截图中暴露了密钥，请立即撤销。

常见错误： 将密钥提交到 GitHub。使用 .env 并将 .env 添加到 .gitignore。

第2步：在目录中查找免费模型

在仪表板中打开 Models（或访问公开模型页面）。
按价格升序排序或筛选。
查找带有 :free 后缀或行中输入和输出均为 $0 的模型。
精确复制模型 ID 字符串，包括供应商前缀。

预期结果： 你有一个可用于 JSON 中 model 字段的 slug，例如 qwen/qwen3-coder:free 或 openrouter/free（自动选择一个免费路由）。

常见错误： 供应商重命名了检查点后仍使用旧博客中的 slug。以目录为准。

第3步：用 curl 发送测试请求

curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $OPENROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -H "HTTP-Referer: https://aitoolsradar.org" \
  -H "X-Title: AI Tools Radar Test" \
  -d '{
    "model": "REPLACE_WITH_FREE_MODEL_ID",
    "messages": [
      {"role": "user", "content": "Reply with exactly: openrouter ok"}
    ]
  }'

将 REPLACE_WITH_FREE_MODEL_ID 替换为你复制的 slug。

预期结果： JSON 中 choices[0].message.content 包含你的回复。

常见错误： 忘记 Authorization 头。你会收到一个简短错误体的401响应。

第4步：使用 OpenAI Python SDK

安装一次：

pip install openai

脚本：

import os
from openai import OpenAI

client = OpenAI(
    base_url="https://openrouter.ai/api/v1",
    api_key=os.environ["OPENROUTER_API_KEY"],
)

resp = client.chat.completions.create(
    model="REPLACE_WITH_FREE_MODEL_ID",
    messages=[
        {"role": "user", "content": "Write a one-line Python hello world."}
    ],
    extra_headers={
        "HTTP-Referer": "https://aitoolsradar.org",
        "X-Title": "AI Tools Radar Script",
    },
)

print(resp.choices[0].message.content)

预期结果： 终端打印来自免费模型的代码或文本。

常见错误： 使用 OpenRouter 模型 slug 时将默认 OpenAI 客户端指向 api.openai.com。base URL 必须是 OpenRouter。

第5步：草稿用便宜的，最终版用贵的

这是我们2026年6月使用的模式：

分类任务：草稿 vs 最终版，公开 vs 机密。
草稿使用免费模型（moonshotai/kimi-k2.6:free 做通用工作、qwen/qwen3-coder:free 做代码、poolside/laguna-xs.2:free 做智能体编码，或任何能处理你任务的 :free slug）。
最终版在 OpenRouter 或直接 API 上使用 gpt-5.5 或 claude-opus-4-8。
在应用日志中记录每个请求的 model 以便成本审计。

两步 Python 模式示例：

DRAFT_MODEL = "REPLACE_WITH_FREE_OR_FLASH_ID"
FINAL_MODEL = "openai/gpt-5.5"  # verify slug on catalog

def draft(prompt: str) -> str:
    return chat(DRAFT_MODEL, prompt)

def finalize(draft_text: str, rubric: str) -> str:
    return chat(
        FINAL_MODEL,
        f"Improve this answer.\nRubric: {rubric}\n\n{draft_text}",
    )

预期结果： 在内部工具上保持可接受质量的同时降低月度账单。

OpenRouter 定价表（2026年6月信号）

发布预算文档前请先验证实时价格。

模型类别	示例目录模式	输入 / 输出（典型）	免费？
免费促销	`*:free` 后缀	列出时 $0 / $0	是，在列出期间
Qwen3-Coder	`qwen/qwen3-coder:free`	`:free` 激活时 $0	是，在列出期间
DeepSeek V4-Pro	`deepseek/deepseek-v4-pro`	相比美国前沿模型较低	否
Mistral Large	`mistralai/mistral-large-*`	中等	否
GPT-5.5	`openai/gpt-5.5`	高	否
Claude Opus 4.8	`anthropic/claude-opus-4-8`	高	否
Moonshot Kimi K2.6	`moonshotai/kimi-k2.6`	中等（6月13日失去 `:free`）	否
Moonshot Kimi K2.7 Code	`moonshotai/kimi-k2.7-code`	中等（6月12日新增）	否
MiniMax M3	`minimax/minimax-m3`	低（促销 $0.30/$1.20）	否

OpenRouter 还在每个模型卡片上显示每次请求费用和上下文定价。即使每 token 费率看起来很低，1M 上下文模型上的长提示仍可能产生实际费用。

在 Cursor 中使用 OpenRouter（可选）

打开 Cursor Settings → Models（措辞可能因版本而异）。
如果可用，添加一个 OpenAI 兼容 自定义供应商，或使用 OpenRouter base URL 字段（如果存在）。
Base URL：https://openrouter.ai/api/v1
API key：你的 OPENROUTER_API_KEY
Model：粘贴目录中的 slug。

预期结果： 内联聊天使用你输入的 slug。

常见错误： 假设每个免费模型都像 GPT-5.5 一样支持工具调用。先运行一个工具密集型提示做冒烟测试。

什么时候跳过 OpenRouter

你的法务团队要求仅与 OpenAI 或 Anthropic 签订直接 DPA。
你需要一个固定模型版本十二个月不重命名。
你运行高流量生产流量，路由器加价在规模上很重要且直接合同更便宜。

当你跳过时，仍然请阅读最新AI模型中心了解能力背景。

故障排查

问题	解决方案
401 Unauthorized	检查 `OPENROUTER_API_KEY` 导出和 Bearer 头
402 或积分错误	在 Billing 中添加少量余额
模型未找到	重新从目录复制 slug；在2026年6月下线日期前退役旧的 DeepSeek ID
免费层速度慢	队列繁忙；在非高峰期重试或切换到便宜的付费 Flash
工具 JSON 为空或乱码	将智能体步骤转移到 GPT-5.5 或 Opus 做工具调用

免费模型工作流的提示模板

总结日志（低成本）

Summarize this log in five bullets: first error, likely cause, suggested fix.
Do not invent file names not present in the log.

[paste log]

仅草稿声明

Draft an answer. Mark uncertain claims with [verify].
I will run a second pass on a frontier model.

我们在2026年6月观察到的免费模型模式

目录会轮换。即使确切的 slug 变化，这些模式会重复出现：

模式	示例 slug 格式	适合	限制
OpenRouter 免费路由器	`openrouter/free`	不选模型的快速测试	轮换供应商；行为不一
Qwen3-Coder `:free`	`qwen/qwen3-coder:free`	最佳免费编码选项	1M 上下文；验证工具调用
Moonshot Kimi K2.7 Code	`moonshotai/kimi-k2.7-code`	高端开源编码：preserve_thinking、多模态	$0.95/$4.00 每百万；256K 上下文
MiniMax M3	`minimax/minimax-m3`	最便宜的 1M 上下文编码 + 多模态开源权重	$0.30/$1.20 促销；检查许可证
Poolside Laguna `:free`	`poolside/laguna-xs.2:free`、`poolside/laguna-m.1:free`	编码智能体、内联建议	262K 上下文；目录新增
OpenAI OSS 免费	`openai/gpt-oss-120b:free`、`openai/gpt-oss-20b:free`	推理密集型草稿	卡片上131K 上下文
NVIDIA Nemotron `:free`	`nvidia/nemotron-3-super-120b-a12b:free`、`nvidia/nemotron-3-ultra-550b-a55b:free`	智能体式任务、安全检查	大型 MoE；检查延迟
Google Gemma 4 `:free`	`google/gemma-4-31b-it:free`、`google/gemma-4-26b-a4b-it:free`	多模态 + 文本问答	检查卡片上的上下文窗口
Z AI GLM `:free`	`z-ai/glm-4.5-air:free`	轻量级通用任务	131K 上下文
Nous Hermes `:free`	`nousresearch/hermes-3-llama-3.1-405b:free`	通用型、无审查草稿	131K 上下文
Meta Llama instruct `:free`	`meta-llama/llama-3.3-70b-instruct:free`、`meta-llama/llama-3.2-3b-instruct:free`	仅后备	很快会退出免费层；2026年中期相关性降低

Moonshot Kimi chat interface showing long-document handling on kimi.moonshot.cn — Moonshot Kimi K2.6，我们在2026年6月 OpenRouter 上最佳全能免费模型的选择。截图来自供应商网站，2026年6月5日截取。界面和定价可能变化。

我们实践中如何选择免费路由

打开模型页面，按价格升序筛选。
用同一个任务（一个编码提示）复制三个候选。
在电子表格中记录延迟、拒绝率和回答质量。
将胜出者提升到 .env 中作为 DRAFT_MODEL 使用两周。
每周一重新运行第1步；免费路由会在没有邮件通知的情况下消失。

Node.js 和 TypeScript 代码片段

用于小型内部工具：

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://openrouter.ai/api/v1",
  apiKey: process.env.OPENROUTER_API_KEY!,
});

const model = process.env.DRAFT_MODEL ?? "REPLACE_WITH_FREE_MODEL_ID";

const completion = await client.chat.completions.create({
  model,
  messages: [{ role: "user", content: "List three risks of using free LLM APIs." }],
});

console.log(completion.choices[0]?.message?.content);

预期结果： 控制台打印一个简短列表。在运行时替换 model 做 A/B 测试。

常见错误： 在十个仓库中硬编码一个免费 slug。在一个密钥管理器中集中管理 DRAFT_MODEL。

安全和密钥管理

在任何外包人员离职或截图泄露后轮换密钥。
在 OpenRouter 仪表板中（如果可用）按环境限定密钥范围（dev、staging、prod）。
永远不要为了”省钱”而通过免费模型发送客户 PII。免费层仍然会将数据发送到你的网络之外。
日志留存： OpenRouter 可能根据其政策保留元数据。在做 HIPAA 或欧盟客户工作之前请阅读。
当法务问”谁是子处理者”时，与直接 OpenAI/Anthropic 企业 DPA 对比。

我们不是律师。有疑问时，阻止路由器并使用经批准的直接 API。

在费用令你惊讶之前监控支出

每周在 OpenRouter 仪表板中打开 Activity 或 Usage。
如果 UI 提供的话设置积分告警，或为实验保持手动 $20 充值上限。
在你的应用日志中标记请求：model、route、user_id、feature。
绘制每个功能的 token 量。当某个功能的 token 量暴增10倍时，通常就是从免费升级到付费的时候。
如果支出突增，先检查是否有智能体循环每三十秒调用一次 gpt-5.5，然后再怪罪免费层。

我们在 AI Tools Radar 使用的规则： 免费模型仅用于内部草稿。任何面向客户的内容都通过付费前沿路由并经过人工抽查。

OpenRouter vs Together vs Groq（各一段）

Together 在你已经托管微调模型或想在他们的云上使用开源模型时很强。你会失去 OpenRouter 提供的统一目录。

Groq 在支持的 Llama/Mixtral 芯片上速度取胜。适合延迟演示，但不一定有 OpenRouter 那样完整的模型列表。

Fireworks 是另一个开发者喜爱的快速开源权重推理平台。同样的道理：比较目录，而不是品牌忠诚度。

OpenRouter 的优势是一个集成界面用于实验。仅当特定模型未列出或企业定价在你的流量下优于路由器时，才选择第二个供应商。

替代方案

Together、Groq、Fireworks： 如果你的团队已有积分，可以不通过 OpenRouter 使用相同的草稿/最终版模式。
本地 Llama： 如果你有 GPU 时间则零 API 成本；配置更慢。
直接 DeepSeek API： 当你只需要一个供应商时跳过路由器加价；参见 DeepSeek 对比。
LiteLLM 代理： 如果你想为十个微服务建立一个内部网关，可将 OpenRouter 包装在 LiteLLM 后面。

结论

当你在学习、原型开发或在非关键草稿上削减成本时，使用 OpenRouter 免费模型。当你上线智能体、工具循环或面向客户的功能时，添加付费积分。当免费路由在代码质量上漂移时，搭配 GPT-5.5 或 Claude 做最终版。

我们在6月第1周雷达中每周关注目录，并在主要免费路由变化时更新本指南。配合阅读 GPT-5.5 Excel 指南（2026）了解电子表格最终版，用AI工具赚钱（2026）了解销售 API 辅助的自由职业工作。

更新日志

2026-06-13： 实时目录检查。Moonshot Kimi K2.6 从免费列表中移除（失去 :free 标签）。添加了 Kimi K2.7 Code 和 MiniMax M3 作为付费开源权重选项。更新了免费模型 FAQ 推荐。链接了两个新模型的完整评测。
2026-06-05： 实时目录检查。移除了 deepseek/deepseek-v4-flash:free（不再 :free）。添加了 Qwen3-Coder、Poolside Laguna、Moonshot Kimi K2.6、GLM-4.5-Air、Nous Hermes，扩展了 Nemotron/OSS/Gemma/Llama 免费 slug。更新了 FAQ 和定价表。
2026-06-02： 事实核查。更新了验证日期；刷新了2026年6月免费模型示例（openrouter/free、deepseek-v4-flash:free、Gemma/Nemotron/OSS 路由）。确认 openai/gpt-5.5 在 OpenRouter 目录上。
2026-05-29： 首次发布。记录了账户设置、curl 和 Python 示例、定价表模式、Cursor 说明、草稿/最终版路由、八个常见问题。

常见问题

8 个问题

OpenRouter 有免费模型吗？

有。OpenRouter 在模型页面上列出了带有 free 后缀标签或输入/输出价格为零的模型。可用性会随着供应商添加或移除促销活动而变化。在将免费 ID 固化到生产环境之前，请务必查阅实时模型目录。

如何获取 OpenRouter API 密钥？

在 openrouter.ai 创建账户，在仪表板中打开 Keys，生成密钥。将其存储在环境变量中，例如 OPENROUTER_API_KEY。不要将密钥提交到 git。即使每 token 价格显示为零，某些模型仍需要你添加小额积分余额。

OpenRouter 和 OpenAI API 一样吗？

不一样。OpenRouter 提供兼容 OpenAI 的聊天补全接口，但模型 ID 指向多个供应商（DeepSeek、Meta、Google、Anthropic、OpenAI、Mistral 等）。你只需替换 base URL 和模型字符串。除非你使用其文档中的供应商特定路由选项，否则计费通过 OpenRouter 积分进行。

OpenRouter 上最好的免费编码模型是什么？

2026年6月我们的首选免费编码模型是 **Qwen3-Coder**（`:free`）。**Poolside Laguna**（`:free`）适合编码智能体和内联建议。**NVIDIA Nemotron 3 Ultra**（`:free`）在促销期间以零成本处理 1M 上下文智能体任务。注意：截至6月13日 Moonshot Kimi K2.6 已失去 `:free` 标签。可使用新的 **Kimi K2.7 Code**（付费，$0.95/$4.00 每百万token）或 **MiniMax M3**（付费，$0.30/$1.20 促销价）获取开源权重级别的前沿编码体验。每周重新检查目录。生产代码的最终审查请使用付费前沿模型。

为什么我的 OpenRouter 免费请求失败了？

常见原因包括速率限制耗尽、模型 ID 已弃用、账户积分不足或供应商暂停了免费推理。用另一个免费 ID 重试或添加 $5 积分。记录完整的错误响应体。OpenRouter 在 JSON 中返回供应商提示。

我能在 Cursor 中使用 OpenRouter 吗？

可以。将 Cursor 或其他兼容 OpenAI 的客户端指向 https://openrouter.ai/api/v1，使用你的 OpenRouter 密钥和其目录中的模型 slug。某些功能需要付费模型才能保证工具调用的可靠性。在依赖它用于智能体之前，先在你的确切模型上测试工具使用。

OpenRouter vs 直接使用 Anthropic 或 OpenAI API？

当你想用一个 SDK 访问多个模型进行实验、免费草稿和快速 A/B 测试时，使用 OpenRouter。当你需要企业 DPA、固定模型版本或单一供应商的支持工单时，使用直接 API。混合配置在2026年很常见。

如果我不用免费模型，OpenRouter 多少钱？

你按每个模型列表价格加上结算时显示的 OpenRouter 费用付款。DeepSeek 和 Mistral 路由通常是最便宜的付费编码路径。GPT-5.5 和 Claude Opus 路由每 token 成本更高。仪表板使用页面是你支出的权威来源。