雷达
2026年最佳新AI工具(六月):哪些幸存、哪些失败
2026年最佳新AI工具(六月):我们仍在使用的幸存者、已放弃的工具,以及现在值得付费的产品。精选测试。
2026年六月是 2026年最佳新AI工具 不再意味着”Product Hunt 上发布的所有东西”的时候。我们进行了五月和六月的雷达周测试(第一周、第二周、第三周、六月第四周)。这篇文章回答我们 仍在付费使用 什么、降级了 什么、以及 从技术栈中移除了 什么。配合 2026年最新AI模型对比 了解模型选择,配合 Manus 和 SlideAI 了解深度评测。
第二季度幸存者记分卡
| 工具 | 赛道 | Q2 初始评定 | 八月评定 | 幸存原因 |
|---|---|---|---|---|
| Manus AI | 智能体 | 观察(评测) | 保留 | 在追踪信用额度的情况下仍是最佳异步文件交付工具;主评定为”观察”直到试点通过 |
| SlideAI | 幻灯片 | 推荐使用 | 保留 | 快速演示文稿文案;每日信用额度可预测 |
| Dokie AI | 幻灯片 | 观察(评测) | 保留 | Plus 层级 PPTX 导出;模板测试后保留 |
| Claude Opus 4.8 | 模型 | 推荐使用 | 保留 | 谨慎写作和分析的默认选择 |
| GPT-5.5 | 模型 | 推荐使用 | 保留 | Codex 风格编码的默认选择 |
| DeepSeek V4 | 模型 | 推荐使用 | 保留 | 政策允许时的低成本 API 草稿 |
| Kling AI 3.0 | 视频 | 从观察到推荐使用 | 保留 | 短广告片段质量超越 2.x |
| Lovable | 建站 | 从观察到推荐使用 | 保留 | 一个会话内完成着陆页 |
| Exa MCP | 建站 | 推荐使用 | 保留 | 比通用搜索更好的 IDE 研究体验 |
| Genspark | 智能体 | 从观察到推荐使用 | 保留 | 顾问的一站式工作区 |
| Devin Desktop / Cursor | 建站 | 推荐使用 | 保留 | IDE 选择因人而异;两者都保留;Devin Desktop 于6月2日从 Windsurf 更名 |
| VmakeAI | 视频 | 观察 | 放弃 | 音乐和虚拟形象版权仍不清晰 |
| WebZum | 建站 | 观察 | 放弃 | 移动端部署的 Lighthouse 分数较弱 |
| OpenClaw | 智能体 | 观察 | 放弃 | 托管捆绑模糊了智能体成本 |
| OpenClaw OSS 混淆 | 智能体 | 观察 | 跳过 | 与 Hostinger SKU 名称冲突 |

变更日志
- 2026-05-15: 初始第二季度幸存者发布。来源:六月至七月雷达测试和五月下旬雷达复查。
- 2026-06-05: 更名更新。Windsurf 于2026年6月2日官方公告后更名为 Devin Desktop。已更新所有引用。
- 2026-06-02: 事实核查。Manus/Dokie 的幸存者 保留 评定不变;这些工具的雷达评定按完整评测为 观察。
幸存原因(通俗解释)
智能体: Manus 和 Genspark 分工合作。Manus 在过夜研究和文件交付上获胜。Genspark 在同一会话中进行实时工作区和幻灯片方面获胜。ChatGPT Agent 模式未能取代任何一个,因为在我们的测试中账单透明度和交付一致性落后。
幻灯片: Dokie、SlideAI 和 Gamma 覆盖三种不同的导出习惯。我们保留了全部三个标签,而非一个赢家,因为客户仍然分别需要 PPTX、链接演示文稿和低成本草稿信用额度。阅读 SlideAI 评测 了解披露和信用额度表。
建站: Cursor 加 Devin Desktop 用于编码。Lovable 用于营销网站。Replit Agent 在信用额度可预测性改善之前仍未进入幸存者名单(见七月雷达)。
视频: Kling 3.0 幸存。VmakeAI 未能幸存。版权文书比 4K 营销宣传更重要。
模型: 没有单一模型独自幸存。团队保持 路由思维:GPT-5.5 用于代码定稿,Claude 用于写作,DeepSeek 用于低成本草稿。详情见 六月模型中心 和 八月更新。想用幸存工具赚钱的自由职业者:2026年用AI工具赚钱。
第二季度失败的工具(诚实流失报告)
| 工具 | 我们放弃的原因 |
|---|---|
| VmakeAI | 无法验证商业音乐和虚拟形象广告版权 |
| WebZum | 预览漂亮,但生产 URL 的移动端性能分数差 |
| OpenClaw (Hostinger) | 定价与托管追加销售捆绑;难以中立测试 |
| Roger (Google Ads) | 英文搜索需求不足;自动化风险对我们的受众来说太高 |
| OminiGate | 在我们的延迟抽检中没有优于 OpenRouter |
| Perplexity Pages | 适合快速页面,但在可重复的客户交付上不如 Manus |
| Kimi PPT(英文界面) | 导出路径在美国季度商业回顾模板上仍弱于 Dokie |
这里的失败意味着 我们停止了日常使用,而非该产品对所有人都没有价值。
2026年六月值得付费的工具
| 支出类别 | 工具 | 大致信号(请核实最新信息) |
|---|---|---|
| 智能体信用额度 | Manus Pro | 信用额度包;按完成的任务追踪 |
| IDE | Cursor Pro 或 Devin Desktop Pro | ~$20 级别的层级;注意智能体使用上限 |
| 幻灯片 | SlideAI 信用额度包 / Dokie 信用额度 / Gamma Plus | 按导出类型选择 |
| 视频 | Kling 信用额度 | 按视频片段付费;测试水印层级 |
| API | DeepSeek V4-Pro | 每百万 token 成本低于前沿模型 |
| 研究 MCP | Exa API | 先试用,再按用量付费 |
除非你的工作流每周都用到每个赛道,否则不要叠加每一项。
跳过的(从未进入第二季度候选名单)
Clearfy、Sherlock Face Search、Coralflavor Unfiltered、IG 抓取工具、人性化工具集群。参见 编辑政策 和 排名方法论。
第三季度观察名单
- Manus vs ChatGPT Agent vs Claude 对比——待智能体定价稳定后
- Replit Agent 4 如果计费仪表盘改善
- late May radar radar](/blog/radar/new-ai-tools-2026-august-week-1/) 新发布的工具
- 我们停用的AI工具 配套文章详细叙述
赛道分布(仅幸存者)
| 赛道 | 仍在技术栈中 |
|---|---|
| 智能体 | Manus, Genspark |
| 幻灯片 | SlideAI, Dokie, Gamma |
| 建站 | Cursor 或 Devin Desktop, Lovable, Exa MCP |
| 视频 | Kling 3.0 |
| 模型 | GPT-5.5, Claude Opus 4.8, DeepSeek V4 |
我们如何评估第二季度(透明评分标准)
我们没有使用虚假的 1 到 10 分。每个工具面对 排名方法论 中的五个问题:
- 它是否在我们的测试账户上 端到端完成了任务?
- 我们测试那周,定价 是否在官方计划页面上可见?
- 读者能否在 30 分钟内 复现 测试?
- 同赛道中是否已有 推荐使用 的工具超越了它?
- 是否有任何 政策 障碍(人性化工具、监控、未过滤的成人内容)?
高权重项目中有两个”否”意味着 放弃 或 跳过。
幻灯片赛道:三个幸存者,三种工作
| 工具 | 工作 | 八月备注 |
|---|---|---|
| SlideAI | 快速大纲 + 可选研究 | $1.99 / 20 信用额度信号 |
| Dokie | PPTX 优先的企业演示文稿 | 在季度商业回顾模板上导出正常 |
| Gamma | 链接原生的视觉演示文稿 | 我们6月1日检查时 PPTX 仍需付费 |
我们故意保留 三个 幻灯片工具,因为客户需求仍然分布在文件、链接和快速草稿三个方面。在 SlideAI 评测 和 六月第三周雷达 中进行对比。
智能体赛道:谁击败了谁
| 任务 | Q2 赢家 | 亚军 |
|---|---|---|
| 过夜 CSV + 简报 | Manus | Genspark |
| 实时工作区 + 幻灯片 | Genspark | Manus |
| 快速引用问答 | Perplexity(非幸存者) | ChatGPT |
| 文件优先的客户交付 | Manus | Perplexity Pages(已放弃) |
在标准化智能体支出之前,请阅读 Manus AI 评测(2026)。
八月的模型支出(与工具配对)
| 模型 | 仍为默认选择 | 配对工具 |
|---|---|---|
| GPT-5.5 | 编码定稿 | Cursor, Codex |
| Claude Opus 4.8 | 备忘录、编辑 | Claude Code, Genspark |
| DeepSeek V4-Flash | 批量草稿 | OpenRouter, CI 机器人 |
| Gemini 3.1 Pro | 原生 Workspace 团队 | 仅幻灯片大纲 |
总结: 第二季度奖励了 清晰的定价、可交付的导出 和 你能向客户解释的版权。Manus、幻灯片三件套、IDE 双组合、Kling、Lovable 和 Exa MCP 幸存了。VmakeAI、WebZum、OpenClaw 和半成品智能体未能幸存。在续费年度计划之前,先更新 八月中心 的模型信息。
常见问题
6 个问题这篇文章与每周雷达有什么不同?
每周雷达覆盖七个新发布的工具。这篇是回顾性文章。我们对五月和六月测试过的工具进行评分,并说明哪些幸存了下来。
"目前幸存"是什么意思?
幸存意味着我们在六月仍在用它运行真实工作流,定价仍然可理解,且同赛道中没有更好的工具替代它。
SlideAI 在幸存者名单上吗?
是的,用于演示文稿草稿。我们列出的局限性与其他工具一样。
Manus 在第二季度幸存了吗?
是的,用于带信用额度追踪的异步研究交付任务。注意企业合规团队需关注供应商所有权稳定性。
第二季度有什么失败了?
版权不清晰、信用额度意外或存在政策风险的工具被移至"已放弃"。详见本文中的失败表格。
模型选择在哪里?
在动态模型中心。本文链接到 GPT-5.5、Claude Opus 4.8 和 DeepSeek V4 的选择页面。
更多雷达
查看全部更多文章
查看全部
GLM-5.2:开源前沿模型,百万上下文、基准测试与本地部署指南(2026)
GLM-5.2 是智谱 AI 推出的 744B 开源权重模型,MIT 许可证。基准测试、定价、vLLM 和 llama.cpp 本地部署,以及与 Claude Opus 4.8 和 GPT-5.5 的对比。
模型

Kimi K2.7 Code(2026):1T MoE 编程模型、基准测试与定价
Kimi K2.7 Code:Moonshot AI 推出的 1T 开源编程模型,32B 激活 MoE,preserve_thinking 模式,对比 GPT-5.5 和 Claude Opus 基准测试。
模型

MiniMax M3开源版(2026):428B模型、百万上下文与基准测试
MiniMax M3:428B开放权重模型,通过稀疏注意力实现百万上下文,原生多模态输入,编程基准测试有竞争力,价格比GPT-5.5便宜10倍。
模型

美国政府封禁Anthropic Fable 5与Mythos 5(2026)
美国政府封禁Anthropic:商务部于2026年6月12日下令暂停Fable 5和Mythos 5。长达四个月的冲突完整时间线。
模型


