Manus AI, ChatGPT Agent, and Claude autonomous task runners compared

对比

Manus AI vs ChatGPT Agent vs Claude（2026）：智能体实测

Manus AI智能体 vs ChatGPT Agent vs Claude（2026）：自主任务、定价、限制，以及哪款智能体最适合你的工作流。动手实测。

AI Tools Radar Editorial 2026年5月18日更新于 2026年6月2日 4 分钟阅读

简短回答： Manus AI、ChatGPT Agent和Claude在2026年都能运行多步骤AI工作，但它们为不同的最终目标而优化。Manus用于异步可交付成果（CSV、已部署页面、图表包），带可视化沙盒。ChatGPT Agent用于日常聊天用户，希望在不使用第二款产品的情况下获得智能体工具。Claude用于精准文案、编码和线程内研究，会对不完善的计划提出质疑。我们在2026年6月重新运行了Manus AI评测的任务简报。模型后端请配合2026年最新AI模型对比专题和6月第一周雷达了解每周智能体动态。评级： Manus适合有文件输出的有界运营项目。ChatGPT适合已订阅Plus的个人用户。Claude适合标准化使用Anthropic和代码仓库的团队。

最后更新：2026年6月2日。

快速对比

维度	Manus AI	ChatGPT Agent	Claude（Opus 4.8级别）
核心任务	在云虚拟机中完成文件	ChatGPT内的智能体	聊天+Claude Code+智能体
异步	原生后台任务	因功能而异	会话制；Code用于仓库
透明度	计算机/沙盒UI	因功能而异	引用、思考过程UI
计费	按任务负载消耗积分	Plus/Pro订阅+使用量	订阅+API Token
最适合	研究CSV、部署演示	快速智能体任务	写作、编码、细致分析
主要风险	积分震惊、厂商归属新闻	使用限制、工具拒绝	高算力时Opus成本高
我们的评级	Use（运营任务）	Use（个人日常）	Use（文案+编码）

测试方法（2026年6月）

任务1（研究CSV）：

查找35位报道面向企业买家的气候科技的美国记者。CSV列：姓名、媒体、版块、个人页URL、仅在作者页面公开时列出邮箱。最少30行有验证的媒体名称。

任务2（厂商对比矩阵）：

为一家12人的营销代理机构比较Asana、Monday、ClickUp。表格包含：入门价格（2026年6月）、AI功能、Slack/GA集成、移动端评分。未知项标注TBD。

测试流程

Manus：Agent Mode，两个账户的Free/Pro混合使用（请实时验证积分）
ChatGPT：Plus账户上的Agent/深度研究（UI中功能名称可能不同）
Claude：Claude.ai项目开启网页搜索；另外运行Claude Code导出对比矩阵代码
记录实际耗时、人工修正次数、计费单位
使用2026年最新AI模型对比比较模型后端

我们未在三款工具上都测试Team SSO。我们未粘贴受监管的健康数据。

Manus AI dashboard with agent tasks — Manus AI仪表盘和智能体工作区。2026年6月2日截图。

ChatGPT home screen — ChatGPT首页，含智能体功能。2026年6月2日截图。

Claude AI home screen — Claude.ai首页。2026年6月2日截图。

Manus AI

简介： Manus在云沙盒中运行目标驱动的任务并返回交付物。网站manus.im现在显示Manus已成为Meta的一部分。完整的积分表格、Wide Research和采购说明请参阅我们的Manus AI评测（中国否决了Meta收购案，2026年4月）。

6月测试结果

任务1： 异步52分钟完成CSV；删除两个错误邮箱后有33行可用。沙盒日志显示了哪些页面因付费墙失败。
任务2： 41分钟完成Markdown表格；一个价格单元格有误（Monday层级）。手动修复6分钟。
积分： 任务1消耗约280积分（介于帮助中心官方的200和360示例之间）。任务2约220积分。

选择Manus的场景： 你需要文件输出和审计轨迹，并且可以异步等待。

跳过Manus的场景： 法律部门尚未批准厂商归属不确定性，或你需要每天小时级SLA。

ChatGPT Agent

简介： OpenAI为付费用户在ChatGPT中集成了智能体浏览、文件工具和多步骤计划。确切功能名称会变化；以OpenAI帮助中心为准。

6月测试结果

任务1： 38分钟同步体验；31行；更快但导出中引用更少。
任务2： 29分钟；表格扎实；在我们质疑之前，虚构了ClickUp的一个Slack集成。
计费： Plus订阅；没有像Manus那样独立的积分仪表盘。财务更难预测消耗。

选择ChatGPT的场景： 所有人已经在使用ChatGPT，任务属于中小型。

跳过ChatGPT的场景： 你需要可重复的异步任务，带存储的交付物和团队积分分析。

Claude（Claude.ai + Claude Code）

简介： Claude Opus 4.8级别的模型驱动精准的写作和编码。Claude Code面向代码仓库。Claude.ai增加了研究和智能体预览功能。

6月测试结果

任务1： 聊天中44分钟；散文摘要出色；CSV需要额外一次”导出为CSV”的引导。
任务2： 聊天中26分钟加一次修正；引用纪律最佳。
Claude Code： 我们用验证过的URL编写对比矩阵脚本33分钟；最适合开发者，不适合产品经理。

选择Claude的场景： 语言质量、反馈推敲和代码仓库工作重要时。

跳过Claude的场景： 非技术人员需要无需Git的一键部署链接。

逐项对比

任务	Manus	ChatGPT Agent	Claude	胜出者
记者CSV	异步52分钟，33行	38分钟，31行	44分钟，30行+最佳备注	时间上ChatGPT；审计上Manus
CRM矩阵准确度	1个价格有误	1个集成有误	质疑后0个错误	Claude
非开发者友好度	中等	高	中等	ChatGPT
部署/文件交付物	强	好	需要额外工具	Manus
成本可预测性	积分仪表盘	使用量不透明	Token/API计量	试点阶段选Manus

适用人群选择

角色	推荐
独立分析师，定期CSV任务	Manus
常驻ChatGPT的创始人	ChatGPT Agent
工程+法律写作	Claude
需要SSO的企业	ChatGPT Team或Claude Team；Manus Team（需验证DPA）
受监管的医疗/金融	跳过全部，直到完成厂商审查
配合IDE工作	Claude Code + Cursor，不是Manus

定价详解（请实时验证）

产品	入门付费	成本单位	示例月度（8个中等任务）
Manus Pro	每月$20起（帮助中心显示4,000月积分）	按任务积分	8 x 约250积分 = 2k积分
ChatGPT Plus	$20/月（帮助中心显示40条智能体消息/月）	订阅+限制	较难映射到任务
Claude Pro	$20/月（月付）；$17/月（年付，claude.com/pricing）	消息+使用量	Opus高算力消耗更快

陷阱

Manus Chat Mode vs Agent Mode： Chat模式省积分；Agent模式消耗积分。
Manus积分滚转规则： 月度订阅积分每个周期重置，不会滚转（Manus帮助中心）。
ChatGPT”无限”营销： 请阅读限制脚注。
Claude高算力模式： 批量任务时调低算力等级。

安全和厂商说明

Manus： Meta收购被中国否决，2026年4月。企业DPA的归属视为不确定。
ChatGPT： 成熟的企业方案；请启用隐私模式。
Claude： 政策沟通出色；默认不符合HIPAA。

在处理客户PII前：阅读信任中心并获得法律签字。

Chat Mode vs Agent Mode（Manus专属）

Manus帮助中心仍建议使用Chat Mode进行快速提问以节省积分。我们6月的重新测试确认：在Chat Mode中进行五行事实核查消耗的积分远少于为同一答案启动Agent Mode。

任务类型	Manus模式	ChatGPT	Claude
带来源的单个事实	Chat Mode	聊天	聊天+搜索
35行CSV	Agent	Agent/深度研究	聊天+导出引导
部署演示网站	Agent	Agent（如可用）	Claude Code
每周定时监控	Agent定时	有限	自定义脚本

Wide Research和并行子智能体

Manus的Wide Research会为大型数据源集启动并行子智能体。任务1在Manus上使用了一次广域搜索；积分消耗超过了帮助中心的200积分图表示例。

缓解措施： 在提示词中缩小域范围（“仅限这10家出版物”）。自行上传付费墙内容摘录。在执行Wide Research前，先用Chat Mode做大纲。

ChatGPT和Claude可通过多个聊天或Code智能体实现并行化，但需要你自行编排。Manus将编排打包，代价是积分不透明。

企业归属和采购

重申我们评测中的内容（因为对比读者经常跳过）：Meta宣布收购Manus；中国在2026年4月否决了该交易。采购团队应问：

发票上的签约实体是谁？
数据在哪个地理位置处理？
训练数据退出是否适用于Team层级？
如果Manus并入Meta消费产品会怎样？

ChatGPT（OpenAI）和Claude（Anthropic）有更长的企业合同记录。这不意味着它们自动更安全，但法律审查更可预测。

可靠性周（非正式）

我们连续三天在Manus上运行了相同的周一早晨记者CSV提示词：

第1天：成功，52分钟
第2天：排队消息，20分钟后重试，成功
第3天：成功，61分钟

ChatGPT三天都在45分钟内成功。Claude成功，浏览时出现一次验证码。

如果你的运营团队需要同一小时SLA，将ChatGPT或Claude作为主力，Manus作为溢出。

团队工作流

角色	建议技术栈
分析师	Manus做CSV，Claude做备忘录
创始人	ChatGPT日常使用，Manus做月度重任务
工程师	Claude Code，不用Manus
市场营销	Manus做研究，SlideAI做幻灯片（演示工具对比）
法律	无审查前不使用任何工具

积分预测模板（Manus）

任务名称	预估积分	每月次数	月度积分
记者名单	250	4	1,000
厂商对比矩阵	220	2	440
CSV生成图表	200	4	800
合计			2,240

Pro层级的4,000积分（帮助中心，请实时验证）留有余量。如果Wide Research为默认设置，需要额外积分。

vs Perplexity和编码智能体

Perplexity在快速引用问答方面优于这三款。两分钟事实核查无可替代Perplexity。

Cursor / Devin Desktop在Git原生交付方面优于这三款。参见Devin Desktop vs Cursor。

SlideAI在幻灯片大纲方面优于这三款。智能体不是演示文稿布局工具。参见最佳AI演示文稿工具。

示例提示词（可直接复制）

Manus（agent mode）：

Build a CSV of 40 EU climate tech newsletters. Columns: name, URL, focus, subscribe link if public.
Minimum 35 rows. Email only if listed on site. Skip paywalled directories.

ChatGPT：

Create a markdown table comparing three project tools for a 10-person agency.
Include pricing checked June 2026, AI features, and Slack integration yes/no.
Cite each price with URL.

Claude：

Review uploaded pipeline.csv. Flag rows with blank region.
Chart revenue by country. Output bullet summary under 200 words and CSV of anomalies.

购买评估表

我至少一半的工作周是多步骤研究并需要文件输出
我可以异步等待30分钟以上
我会记录10个任务中每个成功任务的积分消耗
法律已批准自主浏览
我已经为ChatGPT或Claude付费作为备用

回答”是”的数量	建议
5	试点Manus Pro，保留备用聊天工具
3-4	继续以ChatGPT/Claude为主力，Manus按月使用
0-2	跳过Manus；使用Perplexity+聊天工具

定时任务和监控

Manus在付费层级上宣传定时任务（帮助中心列出了每个计划的限制）。ChatGPT可通过自定义GPT或外部自动化近似实现定时，但与Manus原生的周一早晨任务不同。

示例定时提示词（Manus）：

Every Monday 8am ET, scan these three competitor blogs [URLs].
Email bullet summary: title, URL, one-line gist. Skip paywalled posts.

Claude用户通常通过Zapier加Claude API实现相同任务。设置更多，但控制力更强。

如果监控是你的主要工作，试点Manus两周并衡量遗漏次数，对比ChatGPT的手动习惯。将每次运行记录在表格中：日期、积分、成功与否、人工修复分钟数。当你向CFO汇报工具成本时，这份表格比任何泛泛的”AI智能体”炒作都更有说服力。

2026年6月更新说明

OpenAI在某些安全提示上收紧了智能体保护措施（参见模型专题GPT-5.5说明）。
Claude Opus 4.8的算力滑块会改变长会话的成本。
Manus定价页面仍显示需实时验证；在Q3采购前截图。

评级总结

Manus： 当积分按任务跟踪时，Use于异步、以文件为主的运营任务。
ChatGPT Agent： 当需要一个订阅完成中等任务时，个人用户可Use。
Claude： 在高质量写作、细致表格和开发者工作流方面可Use。

在标准化使用前，用你的真实数据政策在三款工具上运行任务1和任务2。重新阅读Manus AI评测了解积分示例和失败模式。

关于基准测试的警告： 厂商智能体演示往往展示一次完美运行。我们6月的测试包括错误的价格单元格、错误的集成和排队延迟。在你自己的计划层级上运行两个任务之前，将任何单个YouTube对比视频视为营销。

智能体赛道更新：6月第一周雷达、对比专题、模型专题。

变更日志

2026-06-02： 事实核查。Manus Pro每月$20起含4,000积分且月度不滚转（help.manus.im）；ChatGPT Agent在Plus/Pro上的限制（OpenAI帮助中心）；Claude Pro $20和Opus 4.8（claude.com/pricing）。修正未来日期文案和雷达链接。
2026-05-18： 初次发布。2026年6月两任务智能体测试，横跨Manus、ChatGPT和Claude。定价标注为需在manus.im、openai.com、anthropic.com上实时验证。

常见问题

8 个问题

Manus AI比ChatGPT Agent好吗？

当你需要异步多步骤任务并返回文件、网站或表格到云沙盒时，Manus更好。当你需要在日常使用的聊天中快速完成任务时，ChatGPT Agent更好。两者都不能替代受监管数据的合规审查。

Claude和Manus有什么不同？

Claude（聊天和Claude Code）擅长精准语言、仓库编码和带引用的浏览器研究。Manus专注于在后台虚拟机中完成可交付成果。许多团队用Claude起草，用Manus完成有边界的运营项目。

Manus和ChatGPT Plus相比价格如何？

Manus按任务消耗积分（例如：15分钟图表约200积分，80分钟应用构建约900积分，根据帮助中心）。ChatGPT Plus约$20/月，智能体功能有使用限制。对比每月总积分消耗与你实际完成的任务数量。

2026年的ChatGPT Agent模式是什么？

ChatGPT Agent模式适用于Plus、Pro、Business和Enterprise计划（根据OpenAI帮助中心）。Plus每月约40条智能体消息；Pro约400条。在订阅的那周查看help.openai.com。

Claude能像Manus一样运行自主任务吗？

Claude在Claude.ai、研究预览版和面向开发者的Claude Code中提供智能体功能。异步长任务与Manus宣传的后台虚拟机有所不同。在标准化使用前，请在两款工具上测试你的确切需求。

哪款智能体最适合生成研究CSV？

Manus和ChatGPT深度研究都能返回表格。Manus显示沙盒日志便于审计。ChatGPT处理小型表格更快。Claude在你上传源文件并需要细致综合分析时表现出色。

谁应该跳过这三款工具？

如果你需要无需厂商审查的HIPAA默认合规、保证访问付费墙数据库，或每天同一小时内的正常运行时间，请跳过。使用人类分析师或持牌数据供应商。

AI Tools Radar在2026年6月测试了什么？

我们在三款工具上运行了两个智能体任务：一个仅使用公开URL的35行记者CSV，以及一个在指定日期核实过定价的五厂商CRM对比表。我们跟踪了实际耗时、积分或使用量消耗，以及需要人工修正的事实数量。

Manus AI vs ChatGPT Agent vs Claude（2026）：智能体实测

快速对比

测试方法（2026年6月）

Manus AI

ChatGPT Agent

Claude（Claude.ai + Claude Code）

逐项对比

适用人群选择

定价详解（请实时验证）

安全和厂商说明

Chat Mode vs Agent Mode（Manus专属）

Wide Research和并行子智能体

企业归属和采购

可靠性周（非正式）

团队工作流

积分预测模板（Manus）

vs Perplexity和编码智能体

示例提示词（可直接复制）

购买评估表

定时任务和监控

2026年6月更新说明

评级总结

变更日志

常见问题

更多对比

Windsurf（Devin Desktop）vs Cursor：哪个更好？

Kling AI 3.0 vs Grok vs Veo（2026）：最佳AI视频生成器

Replit Agent 4 vs Cursor（2026）：非开发者的最佳AI工具

更多文章

GLM-5.2：开源前沿模型，百万上下文、基准测试与本地部署指南（2026）

Kimi K2.7 Code（2026）：1T MoE 编程模型、基准测试与定价

MiniMax M3开源版（2026）：428B模型、百万上下文与基准测试

美国政府封禁Anthropic Fable 5与Mythos 5（2026）