从Manus爆火开始 AI Agent不再只是巨头的战场

内容摘要2025年3月5日,一款名为Manus的AI Agent产品横空出世,其内测邀请码在48小时内被炒至10万元天价,带动150余只AI概念股涨停,更催生了加密货币市场的同名代币投机浪潮。这场由华人团队引发的技术风暴,不仅让AI Agent从实

2025年3月5日,一款名为Manus的AI Agent产品横空出世,其内测邀请码在48小时内被炒至10万元天价,带动150余只AI概念股涨停,更催生了加密货币市场的同名代币投机浪潮。这场由华人团队引发的技术风暴,不仅让AI Agent从实验室概念走向大众视野,更标志着该领域正式进入 去中心化竞争 时代——曾经的科技巨头垄断格局,正在被中小型创业团队的创新实践打破。

AI Agent的概念可以追溯到上世纪60年代。1966年,麻省理工学院开发的ELIZA程序通过模式匹配技术模拟心理医生对话,虽然只是简单的规则引擎,却首次展现了人机交互的可能性。1970年代,斯坦福研究院的Shakey机器人通过摄像头和传感器实现了简单的环境感知与行动规划,这被视为物理Agent的雏形。

2010年后,随着智能手机的普及,Siri、Alexa等语音助手开启了Agent的商业化进程。这些早期产品主要依赖预定义规则和有限知识库,只能完成查询天气、设置闹钟等单一任务。直到2016年,Google Assistant引入深度学习技术,通过端到端模型提升了自然语言理解能力,但依然受限于封闭的生态系统。

真正的转折点出现在2023年。OpenAI推出的GPT-4模型在语言理解、逻辑推理和创造力方面实现质的飞跃,为Agent赋予了核心智能。随后,Anthropic的Claude、Google的Gemini等大模型相继问世,形成了 基础模型+插件生态 的新架构。2024年,微软发布的Copilot系统通过整合Office全家桶API,首次实现了办公场景下的多任务协同。

Manus的核心突破在于重新定义了 通用型AI Agent 的产品形态。与传统生成式AI不同,它实现了从 思考 到 行动 的跨越式进化:当用户提出 规划日本深度游 需求时,系统会自主分解任务、调用机票比价API、分析签证政策、生成行程文档,甚至完成酒店预订的全流程操作24。这种端到端的执行闭环,使其在GAIA基准测试中准确率超越OpenAI同类产品,创造了智能体领域的SOTA(当前最佳技术指标)。

值得关注的是,Manus团队选择了一条与巨头截然不同的技术路径。通过整合Claude、阿里千问等第三方大模型,结合自研任务规划引擎和29个外部工具链,他们构建起一个 工程化编排优先 的开放架构。这种策略虽被质疑为 套壳 ,却成功将AI Agent的开发门槛降低到创业团队可承受范围。 

Manus的成功揭示了一个重要趋势:AI Agent的核心竞争力正在从 自建模型 转向 模型应用能力 。根据Crunchbase数据,2024年全球AI初创公司融资中,72%流向了基于开源模型的应用开发,而直接投资基础模型研发的比例降至18%。

基础模型的开源化浪潮始于2022年meta开源的Llama系列。通过Apache 2.0协议,开发者可以自由使用、修改和商业化Llama-2模型。这引发了一场 模型民主化 运动:中国团队开发的MOSS模型通过GPLv3协议开放训练代码,Stability AI推出的StableLM采用Creative Commons协议,允许非商业用途免费使用。

这些开源模型的性能已逼近商业产品。根据Hugging Face的评测数据,微调后的Llama-3-70B在数学推理任务上达到GPT-4的92%水平,而训练成本仅为后者的1/15。初创公司可以通过Hugging Face Hub直接调用预训练模型,结合自身场景数据进行微调,将产品开发周期从18个月缩短至6个月。

这种技术普惠正在重塑行业格局。传统巨头的 数据壁垒 逐渐瓦解,初创公司通过垂直领域的数据积累形成差异化优势。例如,教育类AgentMathMaster利用10万道数学题训练专有知识库,在解题速度上超越通用模型30%;医疗类AgentMedGPT通过整合200万份病例报告,在诊断准确率上达到专科医生水平。

开源协议的创新正在催生全新的商业模式。2024年,GitHub Copilot推出的 模型即服务 (Model-as-a-Service)平台,允许开发者按调用量付费使用微调后的模型。这种模式使小团队能够以每月200美元的成本启动AI Agent项目,而传统自建模型的服务器成本每月超过5万美元。

不同开源协议的选择直接影响产业分工。采用AGPLv3协议的模型要求二次开发者公开修改代码,这推动了 模型开源社区+应用开发公司 的协作模式。例如,RedPajama社区负责基础模型迭代,第三方公司基于其代码开发金融、法律等专业领域的Agent。而采用商业许可的模型则催生了 模型供应商+解决方案商 的生态,如Anthropic与Salesforce合作开发CRM专用Agent。

插件生态的繁荣是开源协议带来的另一变化。截至2025年2月,Hugging Face的插件市场已有超过1200个第三方工具,涵盖电商比价、法律文书生成等垂直领域。初创公司可以通过组合不同插件快速构建复杂功能,而无需从头开发API接口。这种模块化开发模式将产品迭代周期从季度级缩短至周级。

在这场技术民主化浪潮中,无论是巨头还是初创公司都面临着新的挑战。对于传统科技公司而言,其优势正从 技术先发 转向 场景渗透 ,微软在Manus发布一周内紧急推出2款AI Agent,亚马逊组建专项团队应对自动化竞争。

初创公司的突围之道在于 垂直领域深耕 。2024年成立的AgentEdu通过分析2000万份学习数据,开发出个性化学习规划系统,在K12教育市场获得30万付费用户。其创始人李浩然表示: 我们不追求通用智能,而是专注解决具体场景的痛点。 这种 小而美 的策略正在成为行业主流。

开发者社区的作用被提升到前所未有的高度。Manus的成功很大程度上得益于其开源的对话插件框架,吸引了超过1.2万名开发者贡献代码。这种 用户即开发者 的模式正在重塑产品开发逻辑,用户不仅是消费者,更是产品进化的参与者。

随着基础模型性能的持续提升和开源生态的完善,AI Agent的应用场景正在呈现指数级扩展。在教育领域,虚拟教师可以根据学生的认知风格提供个性化辅导;在医疗领域,健康管家能够实时监测体征数据并提供预警;在工业领域,智能助手可以协助工程师完成复杂的设计任务。

技术伦理问题也成为行业关注焦点。欧盟《人工智能法案》要求所有商用Agent必须通过可解释性认证,而美国NIST正在制定AI Agent的安全标准。这些法规将推动行业建立透明的模型训练和使用机制,确保技术发展与人类价值观一致。

Manus的爆火只是这场革命的序曲。当基础模型的普惠性与开源创新形成合力,人工智能将真正走出实验室,成为每个人触手可及的智能伙伴。这个过程不会一帆风顺,但可以确定的是:未来的AI Agent战场,属于所有敢于创新的参与者。

 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐
浙ICP备2021030705号-9