雷达
2026年我们停用的AI工具(7个失败实验)
2026年我们停用的AI工具:七个失败的工作流、我们放弃的原因以及替代方案。一份诚实的反炒作报告。
我们每周测试 2026年新AI工具。停用是工作的一部分。这篇文章列出了我们在第二季度实际实验后 流失的七个工具、它们为何在 我们的 工作流中失败,以及我们的替代方案。这不是对供应商的攻击文章,而是一份忙碌团队的审计报告。关于幸存者,请阅读 2026年最佳新AI工具(六月)。关于我们仍然推荐的工具,请参阅 Manus AI 评测(2026)、SlideAI 评测(2026) 和 2026年最新AI模型对比。
七个停用工具一览
| 工具 | 赛道 | 用途 | 停用原因 | 替代方案 |
|---|---|---|---|---|
| VmakeAI | 视频 | Shopify UGC 测试 | 付费广告的音乐和虚拟形象版权不明确 | Kling 3.0(核实条款) |
| WebZum | 建站 | 活动着陆页 | 移动端 Lighthouse 评分很差;表单钩子需要付费层 | Lovable |
| OpenClaw (Hostinger) | 智能体 | 副项目智能体 | 托管套餐隐藏了真实的智能体成本 | 你已付费的 Manus 或 ChatGPT |
| OminiGate | API 路由 | 第二故障转移路由 | 在我们的测试中延迟没有优于 OpenRouter | OpenRouter + 模型中心 |
| Roger | 智能体 | Google Ads 实验 | 预算风险;对我们的读者搜索需求较弱 | 人工 PPC + Manus 仅用于研究 |
| Perplexity Pages | 智能体 | 客户研究微站 | 与 Manus 文件输出相比不可重复 | Manus 评测 |
| 通用人性化工具 (Clearfy 类) | 政策 | ”AI检测”绕过测试 | 编辑政策禁止;无SEO价值 | 使用 Claude 或 GPT 起草后重写 |

变更日志
- 2026-05-17: 初始流失报告。基于五月和六月雷达笔记及 六月幸存者文章。
- 2026-06-02: 事实核查。VmakeAI → vmake.ai;WebZum → webzum.com。产品仍在运行;我们因工作流原因停止了日常使用。
1. VmakeAI
VmakeAI 仍在运行。我们想为一个电商测试 SKU 快速制作 UGC 广告。视频质量没问题,但法律方面不行。条款没有明确允许在付费 Meta 投放中使用默认音乐。合成虚拟形象触发了内部政策审查。两条视频后我们停止了支出。
替代方案: 在阅读当前条款后使用 Kling AI 3.0 vs Grok vs Veo(2026) 进行渲染。脚本来自 GPT-5.5 或 Claude,详见 模型中心。
2. WebZum
WebZum 几分钟内就生成了一个 漂亮的首屏。但在真实手机上通过 LTE 访问时,Largest Contentful Paint 表现滞后。联系表单需要升级。我们无法为客户交付找到合理理由。
替代方案: 使用 Lovable AI 评测(2026) 制作着陆页草稿,然后进行人工 CSS 优化。
3. OpenClaw(Hostinger 套餐)
营销宣传承诺 在你的网站旁边部署一个智能体。但结账时推销托管计划。我们无法分离出纯智能体的成本。感觉像是基础设施追加销售,而非中立的智能体软件。
替代方案: 在合规允许时使用 Manus 处理多步骤交付任务。
4. OminiGate
我们测试了 OminiGate 作为 第二个 API 路由器。在三个编码提示上(2026年6月),p50 延迟和错误率并未优于 OpenRouter。维护两套密钥不值得。
替代方案: 使用 模型中心 中的 OpenRouter 方案,直到我们的专用指南发布。
5. Roger
Roger 可以操作 实时广告支出。一次错误的自动暂停比一个糟糕的幻灯片大纲伤害更大。roger google ads ai 的搜索量一直很低。
替代方案: 人工审批的 PPC 变更。Manus 仅用于关键词研究导出。
6. Perplexity Pages
Pages 非常适合 快速生成可分享的摘要。但客户想要 CSV 和幻灯片文件,而不是另一个公开 URL。Manus 和 SlideAI 在交付类型上更胜一筹。
替代方案: 用 Manus 生成文件,用 SlideAI 制作演示文稿文案。
7. 通用人性化工具(Clearfy 类)
我们出于研究目的试用了一个 人性化 工具。它违反了我们的 编辑政策。而且它产出的文章质量不如 Claude 配合一个简单的”缩短并变化句子长度”提示词。
替代方案: 使用前沿模型进行诚实编辑。不搞检测器博弈。
跳过的工具(从未采用)
| 工具 | 原因 |
|---|---|
| Sherlock Face Search | 监控政策 |
| IG Comments Scraper | 抓取风险 |
| Coralflavor Unfiltered | 成人内容政策风险 |
观察名单(可能重试)
| 工具 | 什么情况下我们会改变想法 |
|---|---|
| VmakeAI | 明确的商业音乐和虚拟形象许可条款 |
| Replit Agent 4 | 可预测的信用额度仪表盘 |
| ChatGPT Agent | 稳定的过夜任务并支持文件导出 |
| Kimi PPT | 在企业模板上可靠的英文 PPTX 输出 |
赛道分布(流失视角)
| 赛道 | 停用数量 |
|---|---|
| 视频 | 1 (VmakeAI) |
| 建站 | 1 (WebZum) |
| 智能体 | 3 (OpenClaw, Roger, Perplexity Pages) |
| API | 1 (OminiGate) |
| 政策 | 1 (人性化工具类) |
推荐阅读
使用错误工具的成本(真实数据)
以下是 内部自由职业者的案例,并非通用定价:
| 停用的工具 | 停用前月支出 | 替代成本 | 每月节省的时间 |
|---|---|---|---|
| VmakeAI + 额外音乐许可搜索 | ~$45 | Kling 试用 ~$30 | ~4小时法务沟通 |
| WebZum + 设计师修复 | ~$25 | Lovable ~$20 | ~6小时移动端CSS |
| OpenClaw 托管追加销售 | ~$35 | Manus 信用额度 ~$40 | ~2小时(Manus 在产出质量上胜出) |
| OminiGate 第二路由器 | ~$15 API | 仅 OpenRouter ~$15 | ~1小时密钥轮换 |
| Roger 广告实验 | ~$0 工具 + $200 广告风险 | 人工 PPC | 避免了一次错误暂停事故 |
停用不一定第一个月就更便宜。它换来的是 可预测性。
重试标准(我们何时会重新注册)
| 工具 | 重试条件…… |
|---|---|
| VmakeAI | 条款明确允许在付费 Meta 广告中使用默认音频 |
| WebZum | 公开变更日志显示4G下移动端LCP低于2.5秒 |
| OpenClaw | 独立的智能体定价页面,无需捆绑托管套餐 |
| OminiGate | 在五个编码提示上公布的 p50 延迟优于 OpenRouter |
| Roger | 只读模式加上支出变更需人工审批 |
| Perplexity Pages | 批量 CSV 导出加上研究团队的 SLA |
| Replit Agent 4 | 智能体循环开始前提供信用额度估算器 |
技术栈审计的经验教训
- 版权先于渲染: 当音频条款模糊时,视频工具在客户项目中会失败。
- 托管套餐隐藏智能体成本: OpenClaw 教会我们仔细阅读结账明细。
- 路由器需要证据: 第二路由器必须在延迟上击败现有方案,而非仅靠营销。
- 广告智能体需要人工把关: Roger 类工具是责任倍增器。
- 交付形式很重要: Pages 输给了文件,因为客户想要附件。
每季度进行一次这样的审计。使用 六月幸存者清单 作为本文的正面对照。
我们仍在使用的工具(快速链接)
总结: 我们停用了七个浪费时间、金钱或政策保护的工具。视频版权、托管捆绑、不透明路由器和实时广告自动化是主要问题。Manus、SlideAI、Kling、Lovable 和双 IDE 技术栈仍然保留。只有当被流失工具的条款或计费仪表盘修复了我们指出的具体问题时,才重新尝试。
常见问题
6 个问题为什么要发布你们停用的工具?
读者想知道哪些被炒作的产品在实际工作中失败了。流失报告补充了我们的"推荐使用"评定,减少读者浪费注册时间。
停用是否意味着产品已关停?
不是。停用意味着我们结束了日常使用。这里列出的大多数工具仍在运行,只是我们找到了更好的替代方案或遇到了政策限制。
SlideAI 在停用名单上吗?
不在。SlideAI 仍用于演示文稿草稿,已披露其局限性。请参阅 SlideAI 评测。
你们停用了 Manus AI 吗?
没有。Manus 仍用于异步研究和信用额度追踪。我们停用的是那些在文件交付方面无法超越它的其他智能体。
什么替代了 VmakeAI 的视频测试?
在版权确认后使用 Kling AI 3.0 制作短视频。脚本起草仍使用模型中心的前沿模型。
你们多久更新一次流失清单?
每季度或在工具定价变化足以值得重试时进行重大更新。下一次全面审查计划在2026年11月。
更多雷达
查看全部更多文章
查看全部
GLM-5.2:开源前沿模型,百万上下文、基准测试与本地部署指南(2026)
GLM-5.2 是智谱 AI 推出的 744B 开源权重模型,MIT 许可证。基准测试、定价、vLLM 和 llama.cpp 本地部署,以及与 Claude Opus 4.8 和 GPT-5.5 的对比。
模型

Kimi K2.7 Code(2026):1T MoE 编程模型、基准测试与定价
Kimi K2.7 Code:Moonshot AI 推出的 1T 开源编程模型,32B 激活 MoE,preserve_thinking 模式,对比 GPT-5.5 和 Claude Opus 基准测试。
模型

MiniMax M3开源版(2026):428B模型、百万上下文与基准测试
MiniMax M3:428B开放权重模型,通过稀疏注意力实现百万上下文,原生多模态输入,编程基准测试有竞争力,价格比GPT-5.5便宜10倍。
模型

美国政府封禁Anthropic Fable 5与Mythos 5(2026)
美国政府封禁Anthropic:商务部于2026年6月12日下令暂停Fable 5和Mythos 5。长达四个月的冲突完整时间线。
模型


