AI Tools Radar
English
OpenRouter API dashboard showing free model list and API key setup

指南

OpenRouter 免费模型:完整列表 + 速率限制详解

OpenRouter 免费模型完整列表及速率限制详解。涵盖编码性能、API 密钥设置、模型轮换和常见错误修复。

AI Tools Radar Editorial 6 分钟阅读

简短回答: OpenRouter 是通过一个 API 密钥调用多种 LLM 的最快方式,包括供应商允许时的免费或 :free 模型路由。预算大约 15分钟 注册、复制密钥并发送第一个请求。技能要求:你能运行 curl 或将 Python 粘贴到 notebook 中。

我们最后一次验证模型页面和实时 API 调用是在 2026年6月13日。免费 ID 会变化,所以请将下面的表格视为模式参考而非永久列表。

最后更新:2026年6月13日。

快速列表:OpenRouter 上的免费模型(2026年6月)

模型Slug 模式类型最适合
Qwen3-Coderqwen/qwen3-coder:free免费编码(我们的 #1 免费首选)
Poolside Lagunapoolside/laguna-xs.2:free免费编码智能体、内联建议
NVIDIA Nemotron 3 Ultranvidia/nemotron-3-ultra-550b-a55b:free免费1M 上下文智能体任务
Google Gemma 4google/gemma-4-31b-it:free免费多模态 + 文本问答
OpenAI OSS 120Bopenai/gpt-oss-120b:free免费推理密集型草稿
Nous Hermesnousresearch/hermes-3-llama-3.1-405b:free免费通用型、无审查草稿
Z AI GLMz-ai/glm-4.5-air:free免费轻量级通用任务
Meta Llama 3.3 70Bmeta-llama/llama-3.3-70b-instruct:free免费后备(可能退出免费)
MiniMax M3minimax/minimax-m3付费($0.30/$1.20)最便宜的 1M 上下文编码
Kimi K2.7 Codemoonshotai/kimi-k2.7-code付费($0.95/$4.00)高端开源权重编码
DeepSeek V4-Prodeepseek/deepseek-v4-pro付费(低)最具性价比的前沿模型
GPT-5.5openai/gpt-5.5付费(高)最终补丁、智能体循环
Claude Opus 4.8anthropic/claude-opus-4-8付费(高)生产代码、复杂推理

有速率限制。 免费模型在高负载下会限流。添加 $5 积分以避免402错误。Slug 每周都可能变化——请始终在 openrouter.ai/models 上验证。

你需要准备的

项目说明
OpenRouter 账户openrouter.ai 注册(邮箱或 OAuth)
API 密钥仪表板 → Keys → 创建
可选积分某些”免费”促销仍需要正余额以防滥用
HTTP 客户端curl、Python openai SDK 或你的 IDE
模型 slug从目录复制,例如 qwen/qwen3-coder:free 或以 :free 结尾的名称

OpenRouter models page with free-tier and pricing filters on openrouter.ai

OpenRouter 模型目录,显示免费和付费路由。2026年6月5日截图。

快速对比:免费 vs 付费路由

路由类型成本信号最适合注意事项
:free 或目录标价 $0 的模型目录上每 token $0学习、草稿、个人脚本速率限制、突然下架
便宜的付费(Flash、Mistral)每百万 token 几美分批量代码生成、摘要工具调用质量参差不齐
前沿付费(GPT-5.5、Opus)每百万 token 几美元最终补丁、智能体如果精准使用,仍比浪费人工时间便宜

关于这些模型在编码方面的比较,请参阅 DeepSeek V4 vs ChatGPT vs Claude最新AI模型中心

第1步:创建账户和密钥

  1. 前往 openrouter.ai 并登录。
  2. 在仪表板中打开 Keys
  3. 点击 Create Key,命名(例如 aitoolsradar-dev),复制一次。
  4. 本地导出:
export OPENROUTER_API_KEY="sk-or-v1-xxxxxxxx"

预期结果: Keys 页面显示你的新密钥及其创建日期。如果你不小心在截图中暴露了密钥,请立即撤销。

常见错误: 将密钥提交到 GitHub。使用 .env 并将 .env 添加到 .gitignore

第2步:在目录中查找免费模型

  1. 在仪表板中打开 Models(或访问公开模型页面)。
  2. 价格升序排序或筛选。
  3. 查找带有 :free 后缀或行中输入和输出均为 $0 的模型。
  4. 精确复制模型 ID 字符串,包括供应商前缀。

预期结果: 你有一个可用于 JSON 中 model 字段的 slug,例如 qwen/qwen3-coder:freeopenrouter/free(自动选择一个免费路由)。

常见错误: 供应商重命名了检查点后仍使用旧博客中的 slug。以目录为准。

第3步:用 curl 发送测试请求

curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $OPENROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -H "HTTP-Referer: https://aitoolsradar.org" \
  -H "X-Title: AI Tools Radar Test" \
  -d '{
    "model": "REPLACE_WITH_FREE_MODEL_ID",
    "messages": [
      {"role": "user", "content": "Reply with exactly: openrouter ok"}
    ]
  }'

REPLACE_WITH_FREE_MODEL_ID 替换为你复制的 slug。

预期结果: JSON 中 choices[0].message.content 包含你的回复。

常见错误: 忘记 Authorization 头。你会收到一个简短错误体的401响应。

第4步:使用 OpenAI Python SDK

安装一次:

pip install openai

脚本:

import os
from openai import OpenAI

client = OpenAI(
    base_url="https://openrouter.ai/api/v1",
    api_key=os.environ["OPENROUTER_API_KEY"],
)

resp = client.chat.completions.create(
    model="REPLACE_WITH_FREE_MODEL_ID",
    messages=[
        {"role": "user", "content": "Write a one-line Python hello world."}
    ],
    extra_headers={
        "HTTP-Referer": "https://aitoolsradar.org",
        "X-Title": "AI Tools Radar Script",
    },
)

print(resp.choices[0].message.content)

预期结果: 终端打印来自免费模型的代码或文本。

常见错误: 使用 OpenRouter 模型 slug 时将默认 OpenAI 客户端指向 api.openai.com。base URL 必须是 OpenRouter。

第5步:草稿用便宜的,最终版用贵的

这是我们2026年6月使用的模式:

  1. 分类任务:草稿 vs 最终版,公开 vs 机密。
  2. 草稿使用免费模型(moonshotai/kimi-k2.6:free 做通用工作、qwen/qwen3-coder:free 做代码、poolside/laguna-xs.2:free 做智能体编码,或任何能处理你任务的 :free slug)。
  3. 最终版在 OpenRouter 或直接 API 上使用 gpt-5.5claude-opus-4-8
  4. 在应用日志中记录每个请求的 model 以便成本审计。

两步 Python 模式示例:

DRAFT_MODEL = "REPLACE_WITH_FREE_OR_FLASH_ID"
FINAL_MODEL = "openai/gpt-5.5"  # verify slug on catalog

def draft(prompt: str) -> str:
    return chat(DRAFT_MODEL, prompt)

def finalize(draft_text: str, rubric: str) -> str:
    return chat(
        FINAL_MODEL,
        f"Improve this answer.\nRubric: {rubric}\n\n{draft_text}",
    )

预期结果: 在内部工具上保持可接受质量的同时降低月度账单。

OpenRouter 定价表(2026年6月信号)

发布预算文档前请先验证实时价格。

模型类别示例目录模式输入 / 输出(典型)免费?
免费促销*:free 后缀列出时 $0 / $0是,在列出期间
Qwen3-Coderqwen/qwen3-coder:free:free 激活时 $0是,在列出期间
DeepSeek V4-Prodeepseek/deepseek-v4-pro相比美国前沿模型较低
Mistral Largemistralai/mistral-large-*中等
GPT-5.5openai/gpt-5.5
Claude Opus 4.8anthropic/claude-opus-4-8
Moonshot Kimi K2.6moonshotai/kimi-k2.6中等(6月13日失去 :free
Moonshot Kimi K2.7 Codemoonshotai/kimi-k2.7-code中等(6月12日新增)
MiniMax M3minimax/minimax-m3低(促销 $0.30/$1.20)

OpenRouter 还在每个模型卡片上显示每次请求费用上下文定价。即使每 token 费率看起来很低,1M 上下文模型上的长提示仍可能产生实际费用。

在 Cursor 中使用 OpenRouter(可选)

  1. 打开 Cursor Settings → Models(措辞可能因版本而异)。
  2. 如果可用,添加一个 OpenAI 兼容 自定义供应商,或使用 OpenRouter base URL 字段(如果存在)。
  3. Base URL:https://openrouter.ai/api/v1
  4. API key:你的 OPENROUTER_API_KEY
  5. Model:粘贴目录中的 slug。

预期结果: 内联聊天使用你输入的 slug。

常见错误: 假设每个免费模型都像 GPT-5.5 一样支持工具调用。先运行一个工具密集型提示做冒烟测试。

什么时候跳过 OpenRouter

  • 你的法务团队要求仅与 OpenAI 或 Anthropic 签订直接 DPA
  • 你需要一个固定模型版本十二个月不重命名。
  • 你运行高流量生产流量,路由器加价在规模上很重要且直接合同更便宜。

当你跳过时,仍然请阅读最新AI模型中心了解能力背景。

故障排查

问题解决方案
401 Unauthorized检查 OPENROUTER_API_KEY 导出和 Bearer 头
402 或积分错误在 Billing 中添加少量余额
模型未找到重新从目录复制 slug;在2026年6月下线日期前退役旧的 DeepSeek ID
免费层速度慢队列繁忙;在非高峰期重试或切换到便宜的付费 Flash
工具 JSON 为空或乱码将智能体步骤转移到 GPT-5.5 或 Opus 做工具调用

免费模型工作流的提示模板

总结日志(低成本)

Summarize this log in five bullets: first error, likely cause, suggested fix.
Do not invent file names not present in the log.

[paste log]

仅草稿声明

Draft an answer. Mark uncertain claims with [verify].
I will run a second pass on a frontier model.

我们在2026年6月观察到的免费模型模式

目录会轮换。即使确切的 slug 变化,这些模式会重复出现:

模式示例 slug 格式适合限制
OpenRouter 免费路由器openrouter/free不选模型的快速测试轮换供应商;行为不一
Qwen3-Coder :freeqwen/qwen3-coder:free最佳免费编码选项1M 上下文;验证工具调用
Moonshot Kimi K2.7 Codemoonshotai/kimi-k2.7-code高端开源编码:preserve_thinking、多模态$0.95/$4.00 每百万;256K 上下文
MiniMax M3minimax/minimax-m3最便宜的 1M 上下文编码 + 多模态开源权重$0.30/$1.20 促销;检查许可证
Poolside Laguna :freepoolside/laguna-xs.2:freepoolside/laguna-m.1:free编码智能体、内联建议262K 上下文;目录新增
OpenAI OSS 免费openai/gpt-oss-120b:freeopenai/gpt-oss-20b:free推理密集型草稿卡片上131K 上下文
NVIDIA Nemotron :freenvidia/nemotron-3-super-120b-a12b:freenvidia/nemotron-3-ultra-550b-a55b:free智能体式任务、安全检查大型 MoE;检查延迟
Google Gemma 4 :freegoogle/gemma-4-31b-it:freegoogle/gemma-4-26b-a4b-it:free多模态 + 文本问答检查卡片上的上下文窗口
Z AI GLM :freez-ai/glm-4.5-air:free轻量级通用任务131K 上下文
Nous Hermes :freenousresearch/hermes-3-llama-3.1-405b:free通用型、无审查草稿131K 上下文
Meta Llama instruct :freemeta-llama/llama-3.3-70b-instruct:freemeta-llama/llama-3.2-3b-instruct:free仅后备很快会退出免费层;2026年中期相关性降低

Moonshot Kimi chat interface showing long-document handling on kimi.moonshot.cn

Moonshot Kimi K2.6,我们在2026年6月 OpenRouter 上最佳全能免费模型的选择。截图来自供应商网站,2026年6月5日截取。界面和定价可能变化。

我们实践中如何选择免费路由

  1. 打开模型页面,按价格升序筛选。
  2. 用同一个任务(一个编码提示)复制三个候选。
  3. 在电子表格中记录延迟、拒绝率和回答质量。
  4. 将胜出者提升到 .env 中作为 DRAFT_MODEL 使用两周。
  5. 每周一重新运行第1步;免费路由会在没有邮件通知的情况下消失。

Node.js 和 TypeScript 代码片段

用于小型内部工具:

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://openrouter.ai/api/v1",
  apiKey: process.env.OPENROUTER_API_KEY!,
});

const model = process.env.DRAFT_MODEL ?? "REPLACE_WITH_FREE_MODEL_ID";

const completion = await client.chat.completions.create({
  model,
  messages: [{ role: "user", content: "List three risks of using free LLM APIs." }],
});

console.log(completion.choices[0]?.message?.content);

预期结果: 控制台打印一个简短列表。在运行时替换 model 做 A/B 测试。

常见错误: 在十个仓库中硬编码一个免费 slug。在一个密钥管理器中集中管理 DRAFT_MODEL

安全和密钥管理

  • 在任何外包人员离职或截图泄露后轮换密钥
  • 在 OpenRouter 仪表板中(如果可用)按环境限定密钥范围devstagingprod)。
  • 永远不要为了”省钱”而通过免费模型发送客户 PII。免费层仍然会将数据发送到你的网络之外。
  • 日志留存: OpenRouter 可能根据其政策保留元数据。在做 HIPAA 或欧盟客户工作之前请阅读。
  • 当法务问”谁是子处理者”时,与直接 OpenAI/Anthropic 企业 DPA 对比

我们不是律师。有疑问时,阻止路由器并使用经批准的直接 API。

在费用令你惊讶之前监控支出

  1. 每周在 OpenRouter 仪表板中打开 ActivityUsage
  2. 如果 UI 提供的话设置积分告警,或为实验保持手动 $20 充值上限。
  3. 在你的应用日志中标记请求:modelrouteuser_idfeature
  4. 绘制每个功能的 token 量。当某个功能的 token 量暴增10倍时,通常就是从免费升级到付费的时候。
  5. 如果支出突增,先检查是否有智能体循环每三十秒调用一次 gpt-5.5,然后再怪罪免费层。

我们在 AI Tools Radar 使用的规则: 免费模型仅用于内部草稿。任何面向客户的内容都通过付费前沿路由并经过人工抽查。

OpenRouter vs Together vs Groq(各一段)

Together 在你已经托管微调模型或想在他们的云上使用开源模型时很强。你会失去 OpenRouter 提供的统一目录。

Groq 在支持的 Llama/Mixtral 芯片上速度取胜。适合延迟演示,但不一定有 OpenRouter 那样完整的模型列表。

Fireworks 是另一个开发者喜爱的快速开源权重推理平台。同样的道理:比较目录,而不是品牌忠诚度。

OpenRouter 的优势是一个集成界面用于实验。仅当特定模型未列出或企业定价在你的流量下优于路由器时,才选择第二个供应商。

替代方案

  • Together、Groq、Fireworks: 如果你的团队已有积分,可以不通过 OpenRouter 使用相同的草稿/最终版模式。
  • 本地 Llama: 如果你有 GPU 时间则零 API 成本;配置更慢。
  • 直接 DeepSeek API: 当你只需要一个供应商时跳过路由器加价;参见 DeepSeek 对比
  • LiteLLM 代理: 如果你想为十个微服务建立一个内部网关,可将 OpenRouter 包装在 LiteLLM 后面。

结论

当你在学习、原型开发或在非关键草稿上削减成本时,使用 OpenRouter 免费模型。当你上线智能体、工具循环或面向客户的功能时,添加付费积分。当免费路由在代码质量上漂移时,搭配 GPT-5.5 或 Claude 做最终版。

我们在6月第1周雷达中每周关注目录,并在主要免费路由变化时更新本指南。配合阅读 GPT-5.5 Excel 指南(2026) 了解电子表格最终版,用AI工具赚钱(2026) 了解销售 API 辅助的自由职业工作。

更新日志

  • 2026-06-13: 实时目录检查。Moonshot Kimi K2.6 从免费列表中移除(失去 :free 标签)。添加了 Kimi K2.7 Code 和 MiniMax M3 作为付费开源权重选项。更新了免费模型 FAQ 推荐。链接了两个新模型的完整评测。
  • 2026-06-05: 实时目录检查。移除了 deepseek/deepseek-v4-flash:free(不再 :free)。添加了 Qwen3-Coder、Poolside Laguna、Moonshot Kimi K2.6、GLM-4.5-Air、Nous Hermes,扩展了 Nemotron/OSS/Gemma/Llama 免费 slug。更新了 FAQ 和定价表。
  • 2026-06-02: 事实核查。更新了验证日期;刷新了2026年6月免费模型示例(openrouter/freedeepseek-v4-flash:free、Gemma/Nemotron/OSS 路由)。确认 openai/gpt-5.5 在 OpenRouter 目录上。
  • 2026-05-29: 首次发布。记录了账户设置、curl 和 Python 示例、定价表模式、Cursor 说明、草稿/最终版路由、八个常见问题。

常见问题

8 个问题
OpenRouter 有免费模型吗?

有。OpenRouter 在模型页面上列出了带有 free 后缀标签或输入/输出价格为零的模型。可用性会随着供应商添加或移除促销活动而变化。在将免费 ID 固化到生产环境之前,请务必查阅实时模型目录。

如何获取 OpenRouter API 密钥?

在 openrouter.ai 创建账户,在仪表板中打开 Keys,生成密钥。将其存储在环境变量中,例如 OPENROUTER_API_KEY。不要将密钥提交到 git。即使每 token 价格显示为零,某些模型仍需要你添加小额积分余额。

OpenRouter 和 OpenAI API 一样吗?

不一样。OpenRouter 提供兼容 OpenAI 的聊天补全接口,但模型 ID 指向多个供应商(DeepSeek、Meta、Google、Anthropic、OpenAI、Mistral 等)。你只需替换 base URL 和模型字符串。除非你使用其文档中的供应商特定路由选项,否则计费通过 OpenRouter 积分进行。

OpenRouter 上最好的免费编码模型是什么?

2026年6月我们的首选免费编码模型是 **Qwen3-Coder**(`:free`)。**Poolside Laguna**(`:free`)适合编码智能体和内联建议。**NVIDIA Nemotron 3 Ultra**(`:free`)在促销期间以零成本处理 1M 上下文智能体任务。注意:截至6月13日 Moonshot Kimi K2.6 已失去 `:free` 标签。可使用新的 **Kimi K2.7 Code**(付费,$0.95/$4.00 每百万token)或 **MiniMax M3**(付费,$0.30/$1.20 促销价)获取开源权重级别的前沿编码体验。每周重新检查目录。生产代码的最终审查请使用付费前沿模型。

为什么我的 OpenRouter 免费请求失败了?

常见原因包括速率限制耗尽、模型 ID 已弃用、账户积分不足或供应商暂停了免费推理。用另一个免费 ID 重试或添加 $5 积分。记录完整的错误响应体。OpenRouter 在 JSON 中返回供应商提示。

我能在 Cursor 中使用 OpenRouter 吗?

可以。将 Cursor 或其他兼容 OpenAI 的客户端指向 https://openrouter.ai/api/v1,使用你的 OpenRouter 密钥和其目录中的模型 slug。某些功能需要付费模型才能保证工具调用的可靠性。在依赖它用于智能体之前,先在你的确切模型上测试工具使用。

OpenRouter vs 直接使用 Anthropic 或 OpenAI API?

当你想用一个 SDK 访问多个模型进行实验、免费草稿和快速 A/B 测试时,使用 OpenRouter。当你需要企业 DPA、固定模型版本或单一供应商的支持工单时,使用直接 API。混合配置在2026年很常见。

如果我不用免费模型,OpenRouter 多少钱?

你按每个模型列表价格加上结算时显示的 OpenRouter 费用付款。DeepSeek 和 Mistral 路由通常是最便宜的付费编码路径。GPT-5.5 和 Claude Opus 路由每 token 成本更高。仪表板使用页面是你支出的权威来源。

更多指南

查看全部