接棒DeepSeek，Manus带来AI Agent最新工程实践

type

status

date

slug

summary

产品

这部分作者打算先从2个不错的官网案例开始，然后再从优缺点的角度详细的展开产品分析。

2个用例：原码研究、股票分析

官网给出了6个主题共计51个case，覆盖普通用户通用的使用场景，比如生活、办公、自媒体；还包括的面向专业人士的应用场景，比如数据分析、行业研究、教育教学。

这里重点讨论其中的2个Case：开源项目研究、股票分析。

Github开源项目研究

Prompt提示词:

Manus输出结果：

Manus会首先下载开源库的原码，然后进行代码级别的分析，最终会输出一个架构图。

一图剩千言，对于软件行业的技术工程师来讲，技术的迭代发展，经常需要研究新出现库的源码，与产品通常有UI不一样，有些库更多是设计思想级别的工程化实践，不花点时间或者技术储备有限的话，很难在短时间内分析出开源库的框架，而Manus直接给出的框架图，这将大大提高工程师们研究新技术的时间效率。

不足的地方，作者并没有看到在代码性能方面的分析，现实中工程师对于要集成进工程中的库，要求不仅仅是能看明白代码，更需要从性能、安全等方面深度考量。

结果部分截图：

特斯拉股票分析

这个场景中，Mauns直接将分析的结果形成一个Web版本的报告，并直接部署在服务器上，从而让报告能够方便的分享和传播。

Prompt提示词:

Manus输出结果：

分析的结果也是相当惊艳，不仅给出了很直观的投资建议，还给出定性定量的详细分析，比如财务表现、价值分析、技术分析、市场地位，以及经典的SWOT（Strengths、Weakness、Opportunities、Threats）分析。

当然SWOT部分的分析，个人感觉比较偏宏观一些，没有相对细节一点的分析和展开。

结果部分截图：（感兴趣的读者可以访问这里具体查看）

Manus优缺点分析

优点：

产品交互方式惊艳：用户给出提示词之后，任务的分析、拆解、编码、执行过程，完全对用户开放且透明，不需要用户干预且输出结果也很直观。

模拟人类行为：相比更适用特定任务类型的类人的机器人，模拟人类行为的方式，模拟人类与浏览器的交互方式，可以更好的适用通用任务类型。

可视化能力出众：数据分析类型的任务上，通过更具设计感的可视化图表，直观的展现数据之间的数学关系。

集成的代码运行环境：Manus直接集成了基于Linux的虚拟机和Python运行环境，这就让需求的分析、编程实现、运行及结果更完美的融进Agent的执行链路中，极大的扩展了Manus的能力边界，从这一点上来说，对应到了Manus宣传语当中说的“第一款通用型AI Agent”。

不足：

TODO List会一定程度上导致结果趋向平庸：TODO List的方式带来的好处就是结果的快速收敛，但这也带来AI探索在发散方面的丧失，特别是行业分析方向，一定程度上需要根据获得的信息来进行动态的调整。

资料的筛选和合并占据较大的上下文窗口：受限于大模型能力与上下文窗口，资料的筛选和最终结果的合并与整理会消耗掉大量的Token，这会影响最终结果趋向于平庸。

数据采集阶段的成本不低：Manus使用模拟浏览器搜素、点击、滚动、文字图表OCR的方式获取原始的数据，这在时间成本和资源成本方面，都有不小的消耗。

技术

跟ChatGPT和Claude这样能力强悍的通用大模型不一样，Manus更多是在AI落地的“最后一公里”：工程级别的实践。只有资本才看重技术的护城河方面，作者认为技术的本质应该回归实用性，即解决用户问题。

从这个角度讲，被认为是“套壳”的Manus就是有价值的。Manus的出现让“自然语言调用算力达成目标”这件事向前又推进了一步。那Manus是如何进行技术实践的？

Manus技术架构

虚拟机：一个 Linux 系统的虚拟机，包含两个核心组件： • Chrome浏览器，用来访问网页。 • Python运行环境，可以执行脚本分析数据，可以启动一个网页运行环境

任务规划器：根据用户输入的任务请求，拆分成 TODO List，这一块是整个Agent的链路最重要的环节，必须要求模型有很强的推理能力，推测可能是相对经济实惠的Claude 3.7 Sonnet 。

任务调度器：根据上一步的TODO List逐一执行每个任务，根据任务的类型去调度最合适的 Agent。这一步重点在Agent选择上面，所以不需要太强大的模型，开源模型Qwen就可以。

内置AI Agents：Manus 内置了很多不同任务领域的Agent，比如最复杂的应该是类似于OpenAI Operator的网页浏览Agent，比如根据API检索特定数据的Agent。每个Agent在任务完成后会把任务结果写到虚拟机。

任务汇总生成器：每个子任务执行完成后，任务调度器通知任务汇总生成器，任务汇总生成器到虚拟机读取 ToDo List 以及各个子任务的生成结果，把这些结果汇总整理生成最终结果。结果根据任务要求，可能是一份调研报告，也可能是网页程序。由于这一步要求有极强的推理能力和语言能力，所以这一步骤的模型需要比较强，猜测可能是Claude 3.7 Sonnet。

根据以上对Manus实现的拆解可以看出，制约其能力是关键技术在于大模型能力和Agent能力，而Agent又受制于大模型的能力。所以Manus的本质，是基于大模型能力在工程级别的创新实践。

AI产品的护城河在哪里？

既然是基于现有技术能力的工程级别的实践，那么，在AI吸引了绝大部分的资金、工程师、大众注意力的当下，很快就会有“山寨”版的Manus，事实上，Manus发布的第二天就出现了开源版本的OpenManus，第三天某AI开源社区就开直播复刻Mauns工程代码实践。

对于AI产品来说，护城河主要有两点：从AI角度看是基因三件套算力、算法、数据；从产品角度看是用户体验。

AI基因三件套：

算法：

比如OpenAI的Deep Research，虽然开源或者商业的竞品很多，但是效果比它好的还没有第二家，核心原因就是其用来规划任务、选择工具、汇总任务结果的模型是他家最强的推理o3模型，可能也是业界最强的推理模型，无论是推理能力还是上下文长度都超过了公开的 Claude 3.7 Sonnet 模型，同时他们还基于o3针对Deep Research做了大量的强化学习训练，让模型在执行任务和生成内容都可以取得很好的效果，算法就是OpenAI的护城河。

数据：

比如说Google，虽然模型不一定有OpenAI的强，但是它们家的数据及搜索能力是最强的，可以获取到优质的数据源，效果上也还不错，数据就是Google的护城河。

算力：

在”Scaling law“支配下的AI产业，高昂硬件成本让算力成为通用型大模型企业的护城河。OpenAI拥有的算力是35万块NVDIA A100，Elon Musk的Gork拥有算力是20万块NVDIA H100…零一万物已经退出了通用大模型的玩家序列。

用户体验：

这里将用户体验，并不是传统意义上的UI交互层面的体验，而是基于大量用户使用数据进行个性化优化后的优化体验，就是说很懂用户想要什么。

比如，经常被比作是“套壳”的 AI 产品Perplexity，算法（模型）比不过 OpenAI，数据比不上Google，但依然在AI搜索中占有很重要的地位，它依赖的是独特的用户体验，更懂用户，更好的提供了用户想要的搜索结果。

类似的例子还有AI编辑器 Cursor，它也是靠用户体验来吸引用户，虽然它的Composer功能很快就被竞争对手学习借鉴过去了，但是它的自动补全功能却一直没被竞争对手超越。作者是使用感受是，每次修改一点，它就能自动给出要完成的下一步操作，大部分时候，它的建议都是我想要的，就是Cursor懂你心中所想，这是在以往其他IDE中完全没有过的体验。

Perplexity和Cursor这类AI“套壳”产品的护城河，就在于它有大量用户数据沉淀后的用户体验。

AI Agent爆发的年代，如何搭建AI产品的护城河？

根据以上护城河的讨论，算法（这里特指通用型算法）依赖于原创性的技术突破，如Transformer架构；算力需要庞大的资金加持，属于大厂玩家专属。对于广大的应用层玩家来说，能够用来构建护城河的思路还有两个：数据和用户体验。

对于Manus，有人觉得惊艳，有人觉得也就那样，有人觉得没有达到自己期待的样子。其实这一切都因为目前AI还处于很早期，不是 Manus 做得不够好，而是受限于目前AI大模型的能力，只能做到这样。但即使是目前这样，已经让很多人觉得惊艳了。不能因为暂时实现不完美，就不推出产品。有些人开发产品的心态是，不打磨到100分就不推出来。其实产品永远有值得改进的点，难到那就一直改进，一直不推出吗？

最近听说了一种说法：生态位。就是说先推出产品，先占住这个生态位，然后不断迭代，不断提升能力，就能够做得越来越好。相似的例子是Cursor，他们最开始发布的产品，效果也没有那么好，没有那么惊艳，但是他们等到了claude sonnet 3.5 这个模型的出现，全球各地开发者都在自来水推荐 Cursor 。试想一下，如果Cursor 等到了claude sonnet 3.5发布之后，才去开始动手做，那么机会还会是 Cursor 的吗？

集合生态位的思想，先吸引来用户，留住用户，形成口碑，把这些用户数据沉淀下来进一步提升用户体验，以后随着模型能力的升级一起更新迭代，就能真正形成自己的护城河，再难被其他竞品超越。

Manus 开了个好头，但挑战还是不小的，开源的实现、商业上的山寨版本应该很快就要出来了，用户的热度也会消散的很快，一旦有新的热点马上就会去追逐新的热点了，就像你还记得 OpenAI 家的 Operator吗？

未来，对于Manus或者这类产品来说，想形成自己的护城河，不仅仅是要在用户产品体验上的创新，还需要有用户数据上的沉淀，把这种数据变成一种飞轮效应，即基于用户的数据做出更懂用户的体验，更懂用户的体验吸引更多的用户使用。

营销

没有营销专项资金，自己却引爆话题传播，估计节约了上亿的营销费用。

据说Manus产品线内部有组织KOL演示会，其实就相当于组织影评人观看的试映会一样。产品惊艳KOL 也愿意分享给粉丝，出圈后还可以反向蹭 Manus 的热度，这是一种是双赢的合作。

除此之外，短时间内，Manus建设起来的对外发声的渠道已有：官网、公众号、社区（Discord）、社交媒体（X、即刻）、社群（各种讨论群）。

在如今各个老板、主持人、明星等都亲自下场，玩起流量的当下环境，对流量的理解和善用，是把你的核心的产品推而广之的强大“武器”，这里的产品可以是AI应用、可以是你的Paper、可以是电商商品，或者也可以是你的观点。

作者想从营销角度讨论Manus的原因，就是在于学习Mauns的流量打法。这种打法的内核是，一个具有硬核属性的产品，通过KOL们的首轮扩散，之后迅速补齐对外的渠道，让首轮扩散吸引到的用户能够根据官方的渠道进行进一步的了解，进一步的形成第二轮的声量扩散。

这种打法有没有很熟悉？公众号的推荐算法就是这个思路，新发的公众号会进行首轮推荐，数据表现好的话会进入到下一个流量池，之后以此类推。

所以，营销的内核，本质上是产品的硬核。从这次Manus获得的市场声量来看，也一定程度的说明了Manus的创新之处。如果要对这个硬核在进一步拆解的话，那就是连续创业背景的肖红、有技术天赋的季逸超、丰富产品经验的张涛。

最后，AI的进化速度会超越以往的任何一次科技革命，LLM的颠覆程度也远比人们想象的大，不过目前的现状是大家体感并不强烈，这可能主要是因为“生态”的发展是长期和缓慢的。汽车取代马车用了70年，这期间材料工程、汽车生产流水线、大规模道路基建、路政、司机、观念等，都需要逐步跟上。新技术往往带来新的机会，希望大家在AI的生态里，都能找到自己的定位。