对比
Manus AI vs ChatGPT Agent vs Claude(2026):智能体实测
Manus AI智能体 vs ChatGPT Agent vs Claude(2026):自主任务、定价、限制,以及哪款智能体最适合你的工作流。动手实测。
简短回答: Manus AI、ChatGPT Agent和Claude在2026年都能运行多步骤AI工作,但它们为不同的最终目标而优化。Manus用于异步可交付成果(CSV、已部署页面、图表包),带可视化沙盒。ChatGPT Agent用于日常聊天用户,希望在不使用第二款产品的情况下获得智能体工具。Claude用于精准文案、编码和线程内研究,会对不完善的计划提出质疑。我们在2026年6月重新运行了Manus AI评测的任务简报。模型后端请配合2026年最新AI模型对比专题和6月第一周雷达了解每周智能体动态。评级: Manus适合有文件输出的有界运营项目。ChatGPT适合已订阅Plus的个人用户。Claude适合标准化使用Anthropic和代码仓库的团队。
最后更新:2026年6月2日。
快速对比
| 维度 | Manus AI | ChatGPT Agent | Claude(Opus 4.8级别) |
|---|---|---|---|
| 核心任务 | 在云虚拟机中完成文件 | ChatGPT内的智能体 | 聊天+Claude Code+智能体 |
| 异步 | 原生后台任务 | 因功能而异 | 会话制;Code用于仓库 |
| 透明度 | 计算机/沙盒UI | 因功能而异 | 引用、思考过程UI |
| 计费 | 按任务负载消耗积分 | Plus/Pro订阅+使用量 | 订阅+API Token |
| 最适合 | 研究CSV、部署演示 | 快速智能体任务 | 写作、编码、细致分析 |
| 主要风险 | 积分震惊、厂商归属新闻 | 使用限制、工具拒绝 | 高算力时Opus成本高 |
| 我们的评级 | Use(运营任务) | Use(个人日常) | Use(文案+编码) |
测试方法(2026年6月)
任务1(研究CSV):
查找35位报道面向企业买家的气候科技的美国记者。CSV列:姓名、媒体、版块、个人页URL、仅在作者页面公开时列出邮箱。最少30行有验证的媒体名称。
任务2(厂商对比矩阵):
为一家12人的营销代理机构比较Asana、Monday、ClickUp。表格包含:入门价格(2026年6月)、AI功能、Slack/GA集成、移动端评分。未知项标注TBD。
测试流程
- Manus:Agent Mode,两个账户的Free/Pro混合使用(请实时验证积分)
- ChatGPT:Plus账户上的Agent/深度研究(UI中功能名称可能不同)
- Claude:Claude.ai项目开启网页搜索;另外运行Claude Code导出对比矩阵代码
- 记录实际耗时、人工修正次数、计费单位
- 使用2026年最新AI模型对比比较模型后端
我们未在三款工具上都测试Team SSO。我们未粘贴受监管的健康数据。



Manus AI
简介: Manus在云沙盒中运行目标驱动的任务并返回交付物。网站manus.im现在显示Manus已成为Meta的一部分。完整的积分表格、Wide Research和采购说明请参阅我们的Manus AI评测(中国否决了Meta收购案,2026年4月)。
6月测试结果
- 任务1: 异步52分钟完成CSV;删除两个错误邮箱后有33行可用。沙盒日志显示了哪些页面因付费墙失败。
- 任务2: 41分钟完成Markdown表格;一个价格单元格有误(Monday层级)。手动修复6分钟。
- 积分: 任务1消耗约280积分(介于帮助中心官方的200和360示例之间)。任务2约220积分。
选择Manus的场景: 你需要文件输出和审计轨迹,并且可以异步等待。
跳过Manus的场景: 法律部门尚未批准厂商归属不确定性,或你需要每天小时级SLA。
ChatGPT Agent
简介: OpenAI为付费用户在ChatGPT中集成了智能体浏览、文件工具和多步骤计划。确切功能名称会变化;以OpenAI帮助中心为准。
6月测试结果
- 任务1: 38分钟同步体验;31行;更快但导出中引用更少。
- 任务2: 29分钟;表格扎实;在我们质疑之前,虚构了ClickUp的一个Slack集成。
- 计费: Plus订阅;没有像Manus那样独立的积分仪表盘。财务更难预测消耗。
选择ChatGPT的场景: 所有人已经在使用ChatGPT,任务属于中小型。
跳过ChatGPT的场景: 你需要可重复的异步任务,带存储的交付物和团队积分分析。
Claude(Claude.ai + Claude Code)
简介: Claude Opus 4.8级别的模型驱动精准的写作和编码。Claude Code面向代码仓库。Claude.ai增加了研究和智能体预览功能。
6月测试结果
- 任务1: 聊天中44分钟;散文摘要出色;CSV需要额外一次”导出为CSV”的引导。
- 任务2: 聊天中26分钟加一次修正;引用纪律最佳。
- Claude Code: 我们用验证过的URL编写对比矩阵脚本33分钟;最适合开发者,不适合产品经理。
选择Claude的场景: 语言质量、反馈推敲和代码仓库工作重要时。
跳过Claude的场景: 非技术人员需要无需Git的一键部署链接。
逐项对比
| 任务 | Manus | ChatGPT Agent | Claude | 胜出者 |
|---|---|---|---|---|
| 记者CSV | 异步52分钟,33行 | 38分钟,31行 | 44分钟,30行+最佳备注 | 时间上ChatGPT;审计上Manus |
| CRM矩阵准确度 | 1个价格有误 | 1个集成有误 | 质疑后0个错误 | Claude |
| 非开发者友好度 | 中等 | 高 | 中等 | ChatGPT |
| 部署/文件交付物 | 强 | 好 | 需要额外工具 | Manus |
| 成本可预测性 | 积分仪表盘 | 使用量不透明 | Token/API计量 | 试点阶段选Manus |
适用人群选择
| 角色 | 推荐 |
|---|---|
| 独立分析师,定期CSV任务 | Manus |
| 常驻ChatGPT的创始人 | ChatGPT Agent |
| 工程+法律写作 | Claude |
| 需要SSO的企业 | ChatGPT Team或Claude Team;Manus Team(需验证DPA) |
| 受监管的医疗/金融 | 跳过全部,直到完成厂商审查 |
| 配合IDE工作 | Claude Code + Cursor,不是Manus |
定价详解(请实时验证)
| 产品 | 入门付费 | 成本单位 | 示例月度(8个中等任务) |
|---|---|---|---|
| Manus Pro | 每月$20起(帮助中心显示4,000月积分) | 按任务积分 | 8 x 约250积分 = 2k积分 |
| ChatGPT Plus | $20/月(帮助中心显示40条智能体消息/月) | 订阅+限制 | 较难映射到任务 |
| Claude Pro | $20/月(月付);$17/月(年付,claude.com/pricing) | 消息+使用量 | Opus高算力消耗更快 |
陷阱
- Manus Chat Mode vs Agent Mode: Chat模式省积分;Agent模式消耗积分。
- Manus积分滚转规则: 月度订阅积分每个周期重置,不会滚转(Manus帮助中心)。
- ChatGPT”无限”营销: 请阅读限制脚注。
- Claude高算力模式: 批量任务时调低算力等级。
安全和厂商说明
- Manus: Meta收购被中国否决,2026年4月。企业DPA的归属视为不确定。
- ChatGPT: 成熟的企业方案;请启用隐私模式。
- Claude: 政策沟通出色;默认不符合HIPAA。
在处理客户PII前:阅读信任中心并获得法律签字。
Chat Mode vs Agent Mode(Manus专属)
Manus帮助中心仍建议使用Chat Mode进行快速提问以节省积分。我们6月的重新测试确认:在Chat Mode中进行五行事实核查消耗的积分远少于为同一答案启动Agent Mode。
| 任务类型 | Manus模式 | ChatGPT | Claude |
|---|---|---|---|
| 带来源的单个事实 | Chat Mode | 聊天 | 聊天+搜索 |
| 35行CSV | Agent | Agent/深度研究 | 聊天+导出引导 |
| 部署演示网站 | Agent | Agent(如可用) | Claude Code |
| 每周定时监控 | Agent定时 | 有限 | 自定义脚本 |
Wide Research和并行子智能体
Manus的Wide Research会为大型数据源集启动并行子智能体。任务1在Manus上使用了一次广域搜索;积分消耗超过了帮助中心的200积分图表示例。
缓解措施: 在提示词中缩小域范围(“仅限这10家出版物”)。自行上传付费墙内容摘录。在执行Wide Research前,先用Chat Mode做大纲。
ChatGPT和Claude可通过多个聊天或Code智能体实现并行化,但需要你自行编排。Manus将编排打包,代价是积分不透明。
企业归属和采购
重申我们评测中的内容(因为对比读者经常跳过):Meta宣布收购Manus;中国在2026年4月否决了该交易。采购团队应问:
- 发票上的签约实体是谁?
- 数据在哪个地理位置处理?
- 训练数据退出是否适用于Team层级?
- 如果Manus并入Meta消费产品会怎样?
ChatGPT(OpenAI)和Claude(Anthropic)有更长的企业合同记录。这不意味着它们自动更安全,但法律审查更可预测。
可靠性周(非正式)
我们连续三天在Manus上运行了相同的周一早晨记者CSV提示词:
- 第1天:成功,52分钟
- 第2天:排队消息,20分钟后重试,成功
- 第3天:成功,61分钟
ChatGPT三天都在45分钟内成功。Claude成功,浏览时出现一次验证码。
如果你的运营团队需要同一小时SLA,将ChatGPT或Claude作为主力,Manus作为溢出。
团队工作流
| 角色 | 建议技术栈 |
|---|---|
| 分析师 | Manus做CSV,Claude做备忘录 |
| 创始人 | ChatGPT日常使用,Manus做月度重任务 |
| 工程师 | Claude Code,不用Manus |
| 市场营销 | Manus做研究,SlideAI做幻灯片(演示工具对比) |
| 法律 | 无审查前不使用任何工具 |
积分预测模板(Manus)
| 任务名称 | 预估积分 | 每月次数 | 月度积分 |
|---|---|---|---|
| 记者名单 | 250 | 4 | 1,000 |
| 厂商对比矩阵 | 220 | 2 | 440 |
| CSV生成图表 | 200 | 4 | 800 |
| 合计 | 2,240 |
Pro层级的4,000积分(帮助中心,请实时验证)留有余量。如果Wide Research为默认设置,需要额外积分。
vs Perplexity和编码智能体
Perplexity在快速引用问答方面优于这三款。两分钟事实核查无可替代Perplexity。
Cursor / Devin Desktop在Git原生交付方面优于这三款。参见Devin Desktop vs Cursor。
SlideAI在幻灯片大纲方面优于这三款。智能体不是演示文稿布局工具。参见最佳AI演示文稿工具。
示例提示词(可直接复制)
Manus(agent mode):
Build a CSV of 40 EU climate tech newsletters. Columns: name, URL, focus, subscribe link if public.
Minimum 35 rows. Email only if listed on site. Skip paywalled directories.ChatGPT:
Create a markdown table comparing three project tools for a 10-person agency.
Include pricing checked June 2026, AI features, and Slack integration yes/no.
Cite each price with URL.Claude:
Review uploaded pipeline.csv. Flag rows with blank region.
Chart revenue by country. Output bullet summary under 200 words and CSV of anomalies.购买评估表
- 我至少一半的工作周是多步骤研究并需要文件输出
- 我可以异步等待30分钟以上
- 我会记录10个任务中每个成功任务的积分消耗
- 法律已批准自主浏览
- 我已经为ChatGPT或Claude付费作为备用
| 回答”是”的数量 | 建议 |
|---|---|
| 5 | 试点Manus Pro,保留备用聊天工具 |
| 3-4 | 继续以ChatGPT/Claude为主力,Manus按月使用 |
| 0-2 | 跳过Manus;使用Perplexity+聊天工具 |
定时任务和监控
Manus在付费层级上宣传定时任务(帮助中心列出了每个计划的限制)。ChatGPT可通过自定义GPT或外部自动化近似实现定时,但与Manus原生的周一早晨任务不同。
示例定时提示词(Manus):
Every Monday 8am ET, scan these three competitor blogs [URLs].
Email bullet summary: title, URL, one-line gist. Skip paywalled posts.Claude用户通常通过Zapier加Claude API实现相同任务。设置更多,但控制力更强。
如果监控是你的主要工作,试点Manus两周并衡量遗漏次数,对比ChatGPT的手动习惯。将每次运行记录在表格中:日期、积分、成功与否、人工修复分钟数。当你向CFO汇报工具成本时,这份表格比任何泛泛的”AI智能体”炒作都更有说服力。
2026年6月更新说明
- OpenAI在某些安全提示上收紧了智能体保护措施(参见模型专题GPT-5.5说明)。
- Claude Opus 4.8的算力滑块会改变长会话的成本。
- Manus定价页面仍显示需实时验证;在Q3采购前截图。
评级总结
- Manus: 当积分按任务跟踪时,Use于异步、以文件为主的运营任务。
- ChatGPT Agent: 当需要一个订阅完成中等任务时,个人用户可Use。
- Claude: 在高质量写作、细致表格和开发者工作流方面可Use。
在标准化使用前,用你的真实数据政策在三款工具上运行任务1和任务2。重新阅读Manus AI评测了解积分示例和失败模式。
关于基准测试的警告: 厂商智能体演示往往展示一次完美运行。我们6月的测试包括错误的价格单元格、错误的集成和排队延迟。在你自己的计划层级上运行两个任务之前,将任何单个YouTube对比视频视为营销。
变更日志
- 2026-06-02: 事实核查。Manus Pro每月$20起含4,000积分且月度不滚转(help.manus.im);ChatGPT Agent在Plus/Pro上的限制(OpenAI帮助中心);Claude Pro $20和Opus 4.8(claude.com/pricing)。修正未来日期文案和雷达链接。
- 2026-05-18: 初次发布。2026年6月两任务智能体测试,横跨Manus、ChatGPT和Claude。定价标注为需在manus.im、openai.com、anthropic.com上实时验证。
常见问题
8 个问题Manus AI比ChatGPT Agent好吗?
当你需要异步多步骤任务并返回文件、网站或表格到云沙盒时,Manus更好。当你需要在日常使用的聊天中快速完成任务时,ChatGPT Agent更好。两者都不能替代受监管数据的合规审查。
Claude和Manus有什么不同?
Claude(聊天和Claude Code)擅长精准语言、仓库编码和带引用的浏览器研究。Manus专注于在后台虚拟机中完成可交付成果。许多团队用Claude起草,用Manus完成有边界的运营项目。
Manus和ChatGPT Plus相比价格如何?
Manus按任务消耗积分(例如:15分钟图表约200积分,80分钟应用构建约900积分,根据帮助中心)。ChatGPT Plus约$20/月,智能体功能有使用限制。对比每月总积分消耗与你实际完成的任务数量。
2026年的ChatGPT Agent模式是什么?
ChatGPT Agent模式适用于Plus、Pro、Business和Enterprise计划(根据OpenAI帮助中心)。Plus每月约40条智能体消息;Pro约400条。在订阅的那周查看help.openai.com。
Claude能像Manus一样运行自主任务吗?
Claude在Claude.ai、研究预览版和面向开发者的Claude Code中提供智能体功能。异步长任务与Manus宣传的后台虚拟机有所不同。在标准化使用前,请在两款工具上测试你的确切需求。
哪款智能体最适合生成研究CSV?
Manus和ChatGPT深度研究都能返回表格。Manus显示沙盒日志便于审计。ChatGPT处理小型表格更快。Claude在你上传源文件并需要细致综合分析时表现出色。
谁应该跳过这三款工具?
如果你需要无需厂商审查的HIPAA默认合规、保证访问付费墙数据库,或每天同一小时内的正常运行时间,请跳过。使用人类分析师或持牌数据供应商。
AI Tools Radar在2026年6月测试了什么?
我们在三款工具上运行了两个智能体任务:一个仅使用公开URL的35行记者CSV,以及一个在指定日期核实过定价的五厂商CRM对比表。我们跟踪了实际耗时、积分或使用量消耗,以及需要人工修正的事实数量。
更多对比
查看全部
Windsurf(Devin Desktop)vs Cursor:哪个更好?
Windsurf(现为Devin Desktop)vs Cursor对比:定价、免费层、AI智能体和动手测试。哪款AI IDE更适合你的工作流?
对比

Kling AI 3.0 vs Grok vs Veo(2026):最佳AI视频生成器
Kling AI 3.0 vs Grok vs Google Veo(2026):视频质量、免费层、定价,以及适合Shorts、广告和UGC的最佳AI视频生成器。
对比

Replit Agent 4 vs Cursor(2026):非开发者的最佳AI工具
Replit Agent 4 vs Cursor(2026):哪款能帮助非开发者更快交付应用?设置、定价和真实构建测试。2026年6月更新。
对比
更多文章
查看全部
GLM-5.2:开源前沿模型,百万上下文、基准测试与本地部署指南(2026)
GLM-5.2 是智谱 AI 推出的 744B 开源权重模型,MIT 许可证。基准测试、定价、vLLM 和 llama.cpp 本地部署,以及与 Claude Opus 4.8 和 GPT-5.5 的对比。
模型

Kimi K2.7 Code(2026):1T MoE 编程模型、基准测试与定价
Kimi K2.7 Code:Moonshot AI 推出的 1T 开源编程模型,32B 激活 MoE,preserve_thinking 模式,对比 GPT-5.5 和 Claude Opus 基准测试。
模型

MiniMax M3开源版(2026):428B模型、百万上下文与基准测试
MiniMax M3:428B开放权重模型,通过稀疏注意力实现百万上下文,原生多模态输入,编程基准测试有竞争力,价格比GPT-5.5便宜10倍。
模型

美国政府封禁Anthropic Fable 5与Mythos 5(2026)
美国政府封禁Anthropic:商务部于2026年6月12日下令暂停Fable 5和Mythos 5。长达四个月的冲突完整时间线。
模型