基准测试更是全方位超越OpenAI的同类智能体产品Deep Research。
官方 X 表示:Manus 是第一个通用 AI 智能体,代表了人机协作的未来。
有人称赞其是「智能体的 ChatGPT 时刻」,还有人表示,这是继 DeepSeek 之后,又一个爆款研究。
既然号称首个通用 AI 智能体,Manus 能够处理哪些现实世界的任务呢?
具体来说,Manus 不仅能思考,它还能提供结果。当你休息时,完全可以把事情交给它做,妥妥的工作好帮手。
以前需要人工完成的数据收集与分析、股票市场分析、搜索、找资料、写代码等等它都能帮你,甚至还能直接给你生成一个网页展示。
由于目前只能通过邀请注册,因此我们也就只能看看官方和早期用户分享的示例了。
又或者,上传一个包含多份简历的 zip 压缩包,让 Manus 帮忙筛选简历,帮助公司招募一位强化学习算法工程师:
官网还提供了更多示例,涉及科研、生活、数据分析、教育、生产力等多个方面,感兴趣但没有邀请码的读者可以先去观摩一下。
看完了运行速度超快、任务多样化的用例,我们接下来看 Manus 的基准测试结果。这里用到 GAIA,它是一个用于评估通用 AI 助手解决现实世界难题的测试基准。
结果显示,Manus 在 Level 1、Level 2 和 Level 3 三个难度级别上均取得了 SOTA 表现,不同程度超越了 OpenAI 此前推出的研究型 AI 智能体 Deep Research。团队表示,Manus 是在使用与其生产版本相同的配置下进行的评估,以确保复现性。
不过遗憾的是,目前 Manus 还没有完全开放注册,新用户还需要邀请码。
不过,也有人质疑这波宣传太过了,尤其是铺天盖地的饥饿营销(求邀请码)。至于实际效果,还是要看后续的更多评测和横向比较。
我们了解到,Manus 背后的创始人是一位年轻的(90 后)连续创业者肖弘,他本科毕业于华中科技大学软件工程专业。
2022 年,肖弘抓住了大模型发展的机遇,创建了主攻海外市场的一站式助手 Monica。该助手利用包括 OpenAI、Anthropic、谷歌、DeepSeek 等开发的前沿 AI 模型,帮助用户提升聊天、搜索、写作和编程体验。
此外,Monica 还可以作为 Chrome 和 Edge 浏览器扩展使用,同时提供有桌面端和移动端应用程序。
截至目前,Monica 在 Chrome 插件商店中的安装量已经突破了 300 万,在 Edege 插件应用商店中的安装量也有 70 多万。
同时,Manus 宣传视频中出镜的 Yichao Peak Ji(季逸超)为联合创始人兼首席科学家,也是一位 90 后程序员和创业者。根据网上搜到的资料,他是 Peak Labs 创始人、Magi 智能搜索引擎的开发者,还曾创建过一个名为 Steiner 的推理模型,用以复现 OpenAI o1。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
湖人1-3森林狼 濒临出局!詹姆斯27+12+8一攻一防送好局 华子43+9
衡阳男子带着老乡把湘菜馆开到洛杉矶,生意火爆:美国人喜欢辣椒炒肉和衡东脆肚
法国修女跨越禁忌与教皇生死泪别!金发小丽姐葬礼拒戴面纱,众女领导人集体叛逆?
7-Year-Old Girl Effortlessly Nails Handstand Push-...
萌娃小时和长大的区别,看着一直都是那么可爱,网友:看得出来父母对他的期望
来自萌娃的模特步,小小年纪就有着很好的镜头感,网友:小宝是不是有点顺拐啊
0319-4752228