AI圈正迎接新一輪的技術(shù)爆發(fā)期,DeepSeek以深度推理模型R1震撼海內(nèi)外,OpenAI、Anthropic、谷歌、阿里、字節(jié)、百度等紛紛推進(jìn)自家大模型的新動(dòng)態(tài)。模型層之外,應(yīng)用層也開始多了些新變化。
最近的創(chuàng)新來自一家由中國90后創(chuàng)始團(tuán)隊(duì)推出的新產(chǎn)品——一款號(hào)稱通用AI Agent的應(yīng)用工具M(jìn)anus。
Manus的官網(wǎng)(https://Manus.im/usecases)給出了一些例子可以供我們更加直觀的了解Manus的能力,可以看到它的功能在官方演示中確實(shí)特別強(qiáng)大,目前Manus的使用需要提前獲取邀請(qǐng)碼。
有必要簡單介紹一下Manus。與傳統(tǒng)AI助手相比,類似豆包、Kimi、DeepSeek這些,其局限于信息檢索與建議交互,而Manus首次實(shí)現(xiàn)“自主執(zhí)行復(fù)雜任務(wù)→交付完整成果”的閉環(huán)能力,填補(bǔ)了當(dāng)前市場(chǎng)空白?。
另外一點(diǎn)是通用性定義的突破:跨領(lǐng)域處理復(fù)雜任務(wù)(如股票分析、旅行規(guī)劃、代碼生成等),打破垂直賽道AI的局限性?,這是驚艷的前兩點(diǎn)。第三點(diǎn)是Manus是繼中國團(tuán)隊(duì)做出來DeepSeek之后的又一力作,定位為“手腦并用”的通用助手,強(qiáng)調(diào)“輸入需求→輸出結(jié)果”的無中介執(zhí)行模式,命名源自拉丁語“Mens et Manus”(意為手腦并用),技術(shù)理念主張“Less structure, more intelligence”,減少預(yù)設(shè)流程依賴,強(qiáng)化模型自主進(jìn)化能力。
01 Manus的優(yōu)缺點(diǎn)
總結(jié)一下Manus的核心優(yōu)勢(shì):
全流程自主執(zhí)行:從需求分析(如簡歷篩選)、任務(wù)拆解(如房產(chǎn)選購規(guī)劃)到成果交付(生成Excel/PPT報(bào)告)無需人工干預(yù)?。
多工具鏈整合:支持瀏覽器操作、編程工具調(diào)用、跨平臺(tái)數(shù)據(jù)抓取,實(shí)現(xiàn)復(fù)雜操作(如自動(dòng)解壓簡歷包并分析)?。
覆蓋教育(教學(xué)材料生成)、金融(股票關(guān)系分析)、人力資源(候選人分級(jí))、企業(yè)服務(wù)(自動(dòng)化周報(bào))等多領(lǐng)域?。
跨領(lǐng)域協(xié)同:可同時(shí)處理比如簡歷篩選與房產(chǎn)選購兩類異構(gòu)任務(wù),體現(xiàn)通用Agent特性?。
多Agent協(xié)作系統(tǒng):規(guī)劃、執(zhí)行、驗(yàn)證三模塊分立,云端虛擬機(jī)并行處理任務(wù),提升容錯(cuò)率?。
上面是Manus的優(yōu)勢(shì),同樣Manus也有一些劣勢(shì):
依賴預(yù)設(shè)流程框架:部分任務(wù)需在瀏覽器與操作系統(tǒng)間的“受限環(huán)境”執(zhí)行,無法適配未預(yù)定義的應(yīng)用程序?。
執(zhí)行穩(wěn)定性問題:用戶反饋存在崩潰前生成虛假結(jié)果(如偽造邀請(qǐng)碼)等不可控行為?。
高炒作熱度導(dǎo)致早期用戶預(yù)期與實(shí)際能力落差,部分場(chǎng)景仍需人工修正輸出結(jié)果?。
企業(yè)端部署成本:云端虛擬機(jī)運(yùn)行模式對(duì)算力需求較高,限制中小型企業(yè)使用?。
自主簽署合同的法律效力尚未明確,隱私數(shù)據(jù)跨平臺(tái)調(diào)用可能引發(fā)合規(guī)爭議?。
職場(chǎng)替代焦慮:80%中低頻白領(lǐng)工作(如簡歷篩選、報(bào)表生成)面臨被低成本AI替代的風(fēng)險(xiǎn)?。
02 Manus究竟做了哪些技術(shù)創(chuàng)新?
說完優(yōu)缺點(diǎn)之后,我們?cè)僦攸c(diǎn)看一下使得Manus這么強(qiáng)的背后技術(shù)創(chuàng)新,究竟是什么。
1. 多智能體協(xié)作系統(tǒng)(Multi-Agent Collaboration)
三層架構(gòu)設(shè)計(jì):
規(guī)劃代理(Planning Agent):采用蒙特卡洛樹搜索(MCTS)算法動(dòng)態(tài)拆解任務(wù)優(yōu)先級(jí),支持實(shí)時(shí)調(diào)整執(zhí)行路徑(例如在簡歷篩選中優(yōu)先處理學(xué)歷匹配度)。
執(zhí)行代理(Execution Agent):整合200+工具接口(瀏覽器、Office套件等),通過瀏覽器自動(dòng)化引擎模擬人類操作(點(diǎn)擊、滾動(dòng)、表單填寫),但受限于未開放API的CS架構(gòu)應(yīng)用。
驗(yàn)證代理(Validation Agent):部署對(duì)抗性測(cè)試模塊,檢測(cè)邏輯矛盾(如財(cái)務(wù)數(shù)據(jù)與行業(yè)基準(zhǔn)偏差超5%時(shí)觸發(fā)復(fù)核流程)。
多重簽名系統(tǒng)(Multisig System):由多個(gè)獨(dú)立模型協(xié)同處理子任務(wù),通過交叉驗(yàn)證提升結(jié)果可靠性(例如股票分析中,3個(gè)模型獨(dú)立計(jì)算行業(yè)關(guān)聯(lián)度,取置信度最高值)。
2. 動(dòng)態(tài)訓(xùn)練與優(yōu)化機(jī)制
實(shí)時(shí)反饋迭代:用戶可通過“動(dòng)態(tài)培訓(xùn)”功能修正輸出格式(如指定PPT模板)或調(diào)整執(zhí)行路徑(如跳過特定網(wǎng)站數(shù)據(jù)抓取),模型即時(shí)更新策略。
崩潰恢復(fù)技術(shù):任務(wù)中斷時(shí)自動(dòng)生成替代方案(如簡歷解析失敗后改用關(guān)鍵詞匹配模式),并保留進(jìn)度至本地緩存。
3. 工具鏈深度整合
瀏覽器沙箱技術(shù):在隔離環(huán)境中運(yùn)行跨平臺(tái)操作(如自動(dòng)登錄招聘網(wǎng)站抓取簡歷),避免用戶隱私數(shù)據(jù)泄露。
記憶偏好系統(tǒng):持續(xù)學(xué)習(xí)用戶習(xí)慣(如合同模板偏好),占用云端存儲(chǔ)資源形成個(gè)性化執(zhí)行策略。
4. 性能驗(yàn)證體系
GAIA基準(zhǔn)測(cè)試(https://zhuanlan.zhihu.com/p/669652697)突破:在三級(jí)測(cè)試中分別達(dá)86.5%/70.1%/57.7%,超越OpenAI的DeepResearch模型,接近人類水平(90%)。
真實(shí)場(chǎng)景驗(yàn)證:在Upwork平臺(tái)完成設(shè)計(jì)類任務(wù)(如Logo生成)、Kaggle競賽中實(shí)現(xiàn)數(shù)據(jù)分析自動(dòng)化,驗(yàn)證跨領(lǐng)域執(zhí)行能力。
如果上面Manus的技術(shù)創(chuàng)新讓你眼前一亮,這個(gè)時(shí)候你是不是會(huì)有一個(gè)疑問,為什么是Manus?其他AI廠商,尤其是科技大廠為什么沒有做出這樣的成果,是其他廠商不具備這樣的能力嗎?目前來看,原因或許有以下幾種因素:
1. ?技術(shù)路徑依賴?
?模型規(guī)模優(yōu)先策略?:OpenAI等廠商聚焦于擴(kuò)大模型參數(shù)量(如追求GPT-5),未將工具調(diào)用能力作為核心研發(fā)方向?。
?規(guī)則工程慣性?:傳統(tǒng)AI產(chǎn)品依賴預(yù)設(shè)流程(如客服對(duì)話樹),難以適應(yīng)Manus倡導(dǎo)的“Less structure, more intelligence”理念?。
2. 工程化挑戰(zhàn)
?多工具接口適配成本?:需為瀏覽器、辦公軟件等開發(fā)專用驅(qū)動(dòng),大廠不愿干臟活累活,其他小廠商又缺乏生態(tài)整合能力(如Manus團(tuán)隊(duì)耗時(shí)2年完成200+工具接口開發(fā))?。
?長周期任務(wù)管理難題?:傳統(tǒng)模型受限于會(huì)話式交互,難以實(shí)現(xiàn)“用戶離線后持續(xù)執(zhí)行跨日任務(wù)”的異步工作機(jī)制?。
3. 市場(chǎng)定位差異
?B端服務(wù)壁壘?:微軟Copilot等產(chǎn)品聚焦Office場(chǎng)景,缺乏跨領(lǐng)域泛化能力(如同時(shí)處理簡歷篩選與股票分析)?。
?倫理風(fēng)險(xiǎn)規(guī)避?:頭部廠商忌憚自主決策引發(fā)的法律爭議(如合同簽署效力),選擇保守技術(shù)路線?。
03 Manus的后續(xù)改進(jìn)和行業(yè)影響
針對(duì)目前Manus表現(xiàn)出的一些缺點(diǎn),我們認(rèn)為它未來的改進(jìn)點(diǎn)如下:
增強(qiáng)環(huán)境適應(yīng)性:突破瀏覽器/操作系統(tǒng)的“夾層”限制,實(shí)現(xiàn)更底層的系統(tǒng)權(quán)限調(diào)用?。
降低算力依賴:通過模型壓縮與邊緣計(jì)算結(jié)合,推動(dòng)中小型企業(yè)普及?。
優(yōu)先落地場(chǎng)景:企業(yè)自動(dòng)化辦公(智能客服、合同審核)、教育個(gè)性化教學(xué)(動(dòng)態(tài)生成課件)?。
開源生態(tài)建設(shè):開放部分模型接口,吸引開發(fā)者構(gòu)建插件生態(tài)(如第三方工具集成)?。
建立AI執(zhí)行審計(jì)機(jī)制:對(duì)自主決策過程留痕,明確錯(cuò)誤結(jié)果的責(zé)任歸屬?。
數(shù)據(jù)安全規(guī)范:限制敏感信息(如簡歷、財(cái)務(wù)報(bào)表)的跨平臺(tái)流轉(zhuǎn)權(quán)限?。
但不容忽視的是,Manus的出現(xiàn)肯定會(huì)對(duì)其他廠商帶來一些影響:倒逼OpenAI等廠商加速從“對(duì)話式交互”轉(zhuǎn)向“任務(wù)執(zhí)行型”產(chǎn)品開發(fā)的節(jié)奏,加速Agent技術(shù)迭代?;推動(dòng)多模態(tài)交互(文字/圖表/代碼混合輸出)、工具調(diào)用API集成成為AI產(chǎn)品新基準(zhǔn)?。
根據(jù)Manus計(jì)劃,后續(xù)官方還將開源推理模塊,有望借此催生基于其技術(shù)棧的二次開發(fā)社區(qū)?。
Manus需求爆火,還可能帶動(dòng)邊緣計(jì)算設(shè)備需求激增,使得AI終端部署從云端向本地延伸?,一批國產(chǎn)硬件廠商也有望從中受益。
AI的發(fā)展速度正推動(dòng)各行各業(yè)重新洗牌,未來不是屬于資產(chǎn)的時(shí)代,也不是屬于權(quán)力的時(shí)代,未來將是屬于科技的時(shí)代。