3月6日,一款名叫Manus的AI Agent(智能体)产品在国内科技媒体和社交网络刷屏,甚至被冠以“全球首款通用型智能体”的名号。
据了解,这款一夜爆火的AI智能体Manus运营方为“蝴蝶效应”公司,注册在中国香港,其在中国境内的全资控股公司“红色蝴蝶”(简称Monica.im)总部在北京海淀,并在武汉设立分公司,团队在北京、武汉双地办公。
一夜爆火,邀请码炒出数万元“天价”
根据该团队发布的演示视频,Manus突破一般AI以生成想法为主的限制,实现真正的自主执行能力,例如从包含十来份简历的压缩包里筛选出最符合的求职简历、做房产研究、股票分析等。在接收到用户发送的复杂任务指令时,能够将任务分解为多个子任务,无需用户进行额外的提示或干预,自动规划出合理的执行步骤。
以筛选简历为例,Manus会首先自动理解需要解压打包文件这一隐藏指令,自主完成解压缩,并逐一浏览15份简历,同时记录其中的重要信息。最终,Manus不仅会生成自动排名建议,还会根据工作经验等重要维度,将候选人分为不同等级,提供全面且有条理的筛选结果。在这个过程中,无需用户进行额外的提示或干预,便能够自主地完成整个筛选流程。
Manus还能在虚拟环境中调用各类工具,来完成编写和执行代码、浏览网页、操作应用等复杂任务。在分析过去三年中英伟达、迈威尔科技和台积电股票价格之间的相关性的场景中,Manus先是通过API访问雅虎金融等信息网站,获取股票历史数据,同时还会交叉验证数据准确程度,避免被单一信息来源误导。之后,它使用Python进行数据分析和可视化,引入金融相关的专业工具进行深入分析,最终通过数据可视化图表搭配详尽的综合分析报告,向用户清晰地反馈其中的因果关系。
根据公司在官网中公布的GAIA基准测试(评估通用人工智能助手能力的一个国际化基准测试)表现来看,在基础任务的测试中,Manus已经接近人类水平(Manus基任务准确率达86.5%、中级任务为70.1%、高级任务为57.7%,而人类在GAIA测试中的平均准确率为92%)。
不过,Manus目前仍处于内测阶段,只有获得邀请码的用户才能亲手体验。在二手平台上,甚至有人将其邀请码炒至数万元“天价”。
公司北京+武汉两地办公
Manus背后的创始团队,什么来头?
据了解,创始人肖弘毕业于华中科技大学软件工程专业,具有连续创业经验,2015年创办了武汉夜莺科技有限公司,研发了用于企业微信服务的微伴助手和新媒体工具壹伴助手。2022年创立了“蝴蝶效应”公司,并推出了AI浏览器插件Monica,主要作为AI assistant工具,面向海外用户提供集成主流大模型应用服务,目前Monica的用户数量已达到1000万。
公司联合创始人兼首席科学家季逸超是互联网活跃技术型创业者,曾就读于北大附小、北大附中以及北京信息科技大学,其自高中时代就潜心科技创新创业,创立了从事信息提取与检索技术研发的Peak Labs,并获得红杉资本和真格基金投资。
据悉,“红色蝴蝶”企业总部位于北京市海淀区。2024年4月,企业在武汉设立北京红色蝴蝶科技有限公司武汉分公司,其首席科学家季逸超与合伙人张涛均在海淀办公。海淀区拥有开放活跃的人工智能产业生态,人才、算力、数据、资本各类要素完备,创新资源和政策支持丰富,涌现了生数科技、面壁智能等一批初创期即获超亿元融资的具有爆发增长潜质高科技企业,已形成AI产业创新蓝海。
“下一个DeepSeek”需拭目以待
在Manus火爆的时候,一些人兴奋地将其视为“下一个DeepSeek”,认为是中国AI颠覆行业的又一个代表。不过,记者通过与一些大模型企业、创投机构负责人沟通后发现,相比于DeepSeek火爆初期在行业内的一致认可,目前对Manus的看法尚不统一。以Manus展示的智能体应用场景为例,国内的大模型初创企业智谱、国外的OpenAI其实都展示过类似的功能。
此外,记者注意到Manus此次主要通过视频演示的手段来进行对外展示,其他技术细节还需进一步公开,邀请码式体验模式尚需获得大规模的用户体验检测,“下一个DeepSeek”是否已来,让我们拭目以待。
Manus和DeepSeek的差别是什么?
DeepSeek和Manus究竟谁更厉害些?记者就该问题提问DeepSeek,并打开深度思考和联网搜索,得到的结论如下:需求决定“谁更厉害”。DeepSeek是“最强大脑”,Manus是“全能打工人”,两者并非直接竞争,而是互补关系。
首先DeepSeek从定位差异入手:DeepSeek是知识型大脑,Manus则是全能型执行者。即DeepSeek专注于语言处理、知识整合与专业文本生成。其核心优势在于海量参数(6710亿)支持的深度学习和知识推理能力,例如撰写论文、润色法律合同、解答专业问题等。
而Manus则更强调从规划到交付的闭环能力。它通过工具链调用(如浏览器、代码编辑器)自主执行复杂任务,例如筛选简历、股票分析、生成数据报告等。其技术亮点包括多步骤任务拆解、异步处理与记忆优化,且在GAIA基准测试中性能超越OpenAI。
随后,DeepSeek又从技术路线、适用场景与用户需求、市场表现与行业影响、未来潜力与挑战等方面分析,最终得出结论:若追求“智慧输出”,DeepSeek凭借其知识处理能力更具优势,尤其适合需要专业建议的场景。若追求“高效执行”,Manus的自动化闭环能力更胜一筹,适合流程繁琐的任务。
两者是互补关系,共同推动AI向更实用化、人性化方向发展。未来,随着技术融合(如DeepSeek的知识库与Manus的执行链结合),可能出现更强大的下一代AI产品。
(羊城晚报•羊城派综合自北京日报客户端、极目新闻、大象新闻)
编辑:梁泽铭
来源:羊城晚报•羊城派
评论列表 (0条)