雷达
2026年新AI工具(五月下旬):六月发布前测试的7款工具
2026年新AI工具(五月下旬):六月发布周前测试的七款工具,含定价及推荐使用/观察/跳过评定。
2026年五月下旬雷达 在第二季度之后继续 2026年新AI工具 系列。目录对随机小工具冷却了热情,转向了 智能体升级、IDE 更新 和 Q2 后定价变更。阅读 六月第四周 了解视频集群。将此页面与 2026年最新AI模型对比 配合阅读以获取基准更新。核心评测:Manus、SlideAI 和 六月模型中心。
五月下旬雷达一览
| 工具 | 赛道 | 评定 | 完整评测 |
|---|---|---|---|
| Manus AI(六月更新) | 智能体 | 观察 | Manus 评测 |
| ChatGPT Agent(八月版本) | 智能体 | 观察 | 仅雷达 |
| Claude Code | 建站 | 推荐使用 | 仅雷达 |
| Cursor 1.6 agent | 建站 | 推荐使用 | 对比文章 |
| Genspark AI | 智能体 | 推荐使用 | 评测计划中 |
| Replit Agent 4 | 建站 | 观察 | 七月回顾 |
| Gamma(定价更新) | 幻灯片 | 推荐使用 | 仅雷达 |
注:Manus 是本周的锚定智能体,因为八月的搜索仍然聚集在 manus ai review 查询上,即使目录突出显示了更新的名字。

变更日志
- 2026-05-15: 五月下旬雷达发布。链接模型中心。因搜索需求保留 Manus 锚定位。Gamma 导出限制于2026年5月30日复查。
- 2026-06-02: 事实核查。Manus 评定 观察(与完整评测一致)。Claude Code 标签已澄清(无未经验证的”2.x”版本号)。
方法论简述
八月雷达使用相同的 编辑政策 关卡。我们增加了一个 Q2 幸存过滤器:六月为”观察”的工具必须展示改善的定价透明度,否则我们会在八月后期的幸存者文章中将其移至”跳过”。
1. Manus AI(搜索锚点)
评定:观察(智能体;见完整评测)
Manus 不是新发布的产品。它仍然是2026年六月 搜索意图最高的智能体。根据用户报告,信用额度定价和队列行为在七月有小幅变化。我们没有重新运行完整的八十分钟应用构建测试。我们确认了免费计划在6月1日仍提供每日刷新信用额度和聊天模式。
操作: 阅读 Manus AI 评测(2026) 了解工作流。在第三季度客户工作之前截图你的计划页面。
跳过条件: 与中国相关的供应商风险阻碍采购(见评测中的 Meta 收购背景)。
- 赛道: 智能体
- 模型: 与 模型中心 上的 GPT-5.5 或 Claude 行配对
2. ChatGPT Agent(八月版本)
评定:观察
OpenAI 持续迭代 ChatGPT Plus 和 Pro 中的 智能体模式。八月版本在营销文案中增加了更多计划任务。在我们七月的抽检中,多小时任务的可靠性仍落后于 Manus。
定价: 包含在订阅中。无逐任务透明度。
最适合: 在你已付费的 ChatGPT 中进行日常自动化。
跳过条件: 你需要每次运行都带有审计追踪的文件交付。
- 赛道: 智能体
3. Claude Code
评定:推荐使用(建站)
Claude Code 为 Anthropic 用户收紧了 代码库感知智能体(版本标签经常变化;请验证你的 CLI 版本)。如果你已经付费 Claude Team,这是八月最低摩擦的编码智能体升级。
我们测试了什么: 一个 TypeScript 服务的重构。智能体遵守了 .claude 指令文件。人工审查后测试通过。
定价信号: 使用 Claude 订阅或 API token。Opus 级别的运行比 Sonnet 更贵。
最适合: 已标准化使用 Anthropic 并获得合规审批的团队。
跳过条件: 你只使用 Codex 且有 OpenAI 专属合同。
- 赛道: 建站
- 中心: 模型中心 上的 Claude Opus 4.8 部分
4. Cursor 1.6 agent
评定:推荐使用(建站)
Cursor 的 1.6 agent 营销重点在于代码仓库内更长时间的自主运行。适合迁移类工作。仍需 git 纪律。
定价: Pro 计划的智能体使用上限适用(请核实最新信息)。后台智能体如果不小心循环,一下午就能烧掉月度配额。
最适合: 已在使用 Cursor 的日常工程师。
跳过条件: 公司政策禁止对你的代码仓库进行云索引。
- 赛道: 建站
- 对比: Devin Desktop vs Cursor——待发布
5. Genspark AI
评定:推荐使用(智能体)
Genspark 在经过六月第二周起两个月的”观察”后,于八月升级为 推荐使用。工作区稳定性提升。幻灯片导出仍需人工设计修改。
最适合: 顾问的一站式研究加演示文稿大纲。
跳过条件: 你已分别标准化使用 Manus 加 SlideAI。
- 赛道: 智能体
6. Replit Agent 4
评定:观察
从七月起仍为 观察。长智能体循环中的信用额度意外仍然是我们通过 ddgs(2026年6月)看到的论坛帖子中的头号抱怨。适合原型开发。在没有代码审查的情况下用于客户生产环境有风险。
- 赛道: 建站
7. Gamma(八月定价更新)
评定:推荐使用(幻灯片)
Gamma 对于链接优先的演示文稿仍为 推荐使用。6月1日检查:PPTX 导出在我们的测试账户上仍需付费。PDF 导出在免费版上仍可用但有信用额度限制。
对比: SlideAI 评测 了解以 $1.99 / 20 信用额度起步的信用额度包。Dokie 用于 PPTX 优先导出(六月第三周雷达)。
- 赛道: 创作者 / 幻灯片
本周跳过的
| 工具 | 原因 |
|---|---|
| VidFlux | 无新版权数据 |
| OpenClaw | 托管捆绑仍不清晰 |
| 加密货币 AI 包装器 | 非相关赛道 |
| 人性化工具 | 政策跳过 |
下周观察名单
- 八月最佳新AI工具 幸存者综述
- 我们停用的AI工具 流失报告
- Manus vs ChatGPT Agent vs Claude 对比
- 方法论页面 排名透明度
赛道分布
| 赛道 | 工具 |
|---|---|
| 智能体 | Manus, ChatGPT Agent, Genspark |
| 建站 | Claude Code, Cursor, Replit Agent |
| 幻灯片 | Gamma |
Q2 至八月评定变化
| 工具 | 六月评定 | 八月评定 | 变化原因 |
|---|---|---|---|
| Genspark | 观察 | 推荐使用 | 工作区稳定性 |
| Lovable | 观察 | 推荐使用(七月) | 域名 + 表单 |
| VmakeAI | 观察 | 放弃 | 版权仍不清晰 |
| WebZum | 观察 | 放弃 | 移动端性能 |
| Manus | 推荐使用(雷达) | 观察(评测) | 雷达与评测的”观察”评定对齐;仍是搜索量最高的智能体 |
| Replit Agent 4 | 观察 | 观察 | 信用额度意外仍存在 |
完整幸存者叙述:八月最佳新AI工具。
我们追踪的八月搜索查询
这些短语决定了工具是否在九月仍留在雷达上:
manus ai review(仍然很高;锚定位置合理)cursor agent 2026(IDE 智能体升级)claude code review(Anthropic 编码赛道)genspark ai workspace(全能挑战者)gamma ai pricing(导出付费墙投诉)
如果某个查询上升但没有匹配的测试,我们将其添加到下一个每周 slug 中,而不是让这个 URL 臃肿。
八月三栈建议
| 角色 | 技术栈 |
|---|---|
| 顾问 | Genspark + SlideAI + Claude Opus |
| 工程师 | Cursor + Exa MCP + DeepSeek Flash 草稿 |
| 增长负责人 | Manus 研究 + Kling 视频片段 + Gamma 链接演示文稿 |
不要购买每一项。将技术栈匹配到每周的客户交付需求。
FAQ 风格读者问答
我应该因为 ChatGPT Agent 的存在而取消 Manus 吗?
如果 Manus 仍然返回你需要的文件,就不应该。ChatGPT Agent 适合快速的聊天内任务。在我们的测试中,Manus 在异步 CSV 和多步研究方面胜出。参见 Manus 评测。
如果 PPTX 需要付费,Gamma 还是”推荐使用”吗?
对于链接演示文稿来说是的。对于仅需 PPTX 的客户则不是。当客户附件必须是 .pptx 时,配合 Dokie 或 SlideAI。
我需要同时使用 Claude Code 和 Cursor 吗?
大多数独立开发者选择一个 IDE。团队有时根据供应商审批来分配,而非功能羡慕。
总结: 观察 Manus 直到你的试点与完整评测匹配;推荐使用 Claude Code、Cursor agent、Genspark 和 Gamma 用于上述命名的工作。继续 观察 ChatGPT Agent 和 Replit Agent 4。在 八月中心 更新模型信息。
常见问题
6 个问题这篇文章包含模型中心更新吗?
仅限模型的 API 变更保留在动态模型中心。本雷达覆盖七款工具,而不仅是模型差异。
这与"六月最佳新AI工具"综述有什么不同?
这篇是七款新发布的工具。幸存者综述覆盖的是我们经过数周测试后保留的工具。
2026年六月 Manus 还值得使用吗?
如果你的合规负责人批准,用于异步研究交付任务仍然值得。请参阅 Manus 评测了解信用额度计算。它不在本周的七个名额中。
本周哪些赛道占主导?
在经历了以视频为主的一段时间后,智能体和建站赛道回归。我们保留了一个创作者名额用于演示文稿更新。
这是什么时候测试的?
我们在2026年5月30日之前完成了实际测试,早于6月2日的发布周。
幻灯片工具在哪里?
SlideAI 和 Dokie 保留在评测和对比文章中。本周仅在第七个名额中包含 Gamma 的定价更新。
更多雷达
查看全部更多文章
查看全部
GLM-5.2:开源前沿模型,百万上下文、基准测试与本地部署指南(2026)
GLM-5.2 是智谱 AI 推出的 744B 开源权重模型,MIT 许可证。基准测试、定价、vLLM 和 llama.cpp 本地部署,以及与 Claude Opus 4.8 和 GPT-5.5 的对比。
模型

Kimi K2.7 Code(2026):1T MoE 编程模型、基准测试与定价
Kimi K2.7 Code:Moonshot AI 推出的 1T 开源编程模型,32B 激活 MoE,preserve_thinking 模式,对比 GPT-5.5 和 Claude Opus 基准测试。
模型

MiniMax M3开源版(2026):428B模型、百万上下文与基准测试
MiniMax M3:428B开放权重模型,通过稀疏注意力实现百万上下文,原生多模态输入,编程基准测试有竞争力,价格比GPT-5.5便宜10倍。
模型

美国政府封禁Anthropic Fable 5与Mythos 5(2026)
美国政府封禁Anthropic:商务部于2026年6月12日下令暂停Fable 5和Mythos 5。长达四个月的冲突完整时间线。
模型


