科技圈內正流行起了使喚 AI 買咖啡。
今年 9 月初,支付寶在Inclusion·外灘大會宣布AI生活管家“支小寶”上線時,就用“支小寶”點了一杯星巴克咖啡;10 月 28 日,2024 CNCC 大會上,智譜科技也用其最新的智能體應用 AutoGLM 演示點了一杯咖啡。
不只軟件廠商,越來越多的手機廠商演示 AI 功能時,也開始喜歡從點一杯咖啡切入。
10月上旬,vivo 推出的手機智能體——PhoneGPT,也可以聽取用戶指令執(zhí)行買咖啡的操作;10 月下旬,榮耀 CEO 趙明在發(fā)布會現場也在使用智能助手 YOYO 一句話點咖啡。
從最開始僅支持對話輸出內容的生成式 AI(Generative AI),到能幫人執(zhí)行具體事務的代理式 AI(AI Agent),各家企業(yè)的產品演示方式具體落地到了“點一杯咖啡”這樣的小事上。
AI 的想象當然并不止于此,除了點咖啡,大廠們無疑期望著讓 AI 能跑腿干更多的活,一句話就能自動幫你點外賣、訂酒店、買東西。只是相較于 Agent 這樣廣義而模糊的詞匯而言,“辦事型AI ”顯然有著更低的理解和認同門檻。
隨著辦事型 AI 越來越琳瑯滿目之余,業(yè)內也在開始思考:軟硬件都有各自不可替代的優(yōu)勢,各方如何打通生態(tài)的壁壘,真正為用戶提供有用且便捷的服務。
01、辦事 AI ,能干比會說更實在
過去一兩年,主要占據行業(yè)視野的是生成式 AI ,但現在單純的生成式 AI 已無法充分滿足C端用戶對AI落地的需求。
此前《新立場》的文章中就提到,生成式 AI 和代理式 AI 是人工智能領域中兩個不同的方向,前者主要通過學習數據,生成輸出新內容(文本、圖像、音頻等),最常見的應用就是聊天機器人;后者不僅能聊天,還更側重于模擬智能行為,與環(huán)境進行交互,并根據收集的數據作出決策并執(zhí)行任務。
代理式 AI 可以視為生成式 AI 的遞進。顯而易見,由于 OpenAI 的 ChatGPT 爆火,為AI點明了一個發(fā)展方向,所以過去一兩年國內對于 AI To C 的探索,大多是圍繞生成式 AI 來的。而在技術逐漸落地并面向廣大 C 端用戶時,光是會聽會說的生成式 AI 已然不夠,AI 需要幫人干更多的事情。
于是,各大廠商開始逐步關注代理式 AI 。
這不僅是因為行業(yè)感知到了用戶需求的進化。生成式 AI 的壁壘在于模型的效果和數據的質量,而代理式 AI 的壁壘則在于生態(tài)的豐富性和聯通性。經歷了剛開始的百模大戰(zhàn),到現在的相對冷靜期,廠商們逐漸清楚,在具體的AI應用落地側,單純的卷生成式 AI已經不夠了,AI怎么真正服務生活變得更加重要,上一個移動互聯網時代在各行各業(yè)積累的生態(tài),對于 AI 來說,是一片幾乎未曾開發(fā)的沃土。
近期,似乎越來越多的廠商也意識到了,發(fā)展代理式 AI 從一件具體小事切入的重要性。
就以 9 月支小寶的那場發(fā)布會為例,發(fā)布會結束后,讓 AI 買咖啡在科技圈媒體圈都成為熱議話題。此后的榮耀發(fā)布會,甚至出現了榮耀CEO趙明用 AI下單 2000 杯咖啡的演示。
畢竟買咖啡這樣的行為,可以同時滿足用戶和廠商現階段的核心需求:在用戶看來,一句話一杯咖啡的成本就可以體現 AI 的辦事效率是否有所進步;而在廠商看來,用 AI 買咖啡的行為,囊括了代理式 AI 所有的關鍵流程。
借由讓 AI 買咖啡,一句話讓AI辦事有了更形象且落地的案例,也有了未來更多的想象。
02、能力測評,技術生態(tài)各有所長
當我們想要找一個詞匯形容這類代理式 AI 時,也會自然而然發(fā)現,“辦事 AI ”比 agent 本身更具體,也更有本土特色。
目前辦事AI可以根據廠商性質分為三大類,平臺、硬件、大模型類。以用戶買咖啡這一場景為例,對比三個類型的辦事 AI 具體異同點如下圖。
互聯網平臺類如支付寶推出的“支小寶”,當用戶下達指令,支小寶會調取出相應的服務,如買咖啡、訂機票、打車等,在App內能完成從點單到支付的全流程。從目前測試結果來看,調取的服務和支持的城市仍在逐步開放中。
支小寶的優(yōu)勢是生態(tài)的豐富性。今年 4 月,支付寶開始灰度測試一款全新的智能助理,首頁下拉就能體驗,這就是現在的支小寶前身。直到 9 月,“支小寶”作為一款生活服務類的獨立 App 正式推出,基于支付寶豐富的服務生態(tài),用戶只需要簡單說句話,便可喚起海量的極致服務。
可以說,作為一款國民級應用,支付寶 400 多萬的小程序,以及超 8000 項的數字生活服務,無疑是支小寶可以持續(xù)深耕的沃土。而支小寶未來的優(yōu)勢,則在于其可以橫跨不同的硬件平臺,讓盡可能多的人用上AI服務。
硬件類如榮耀YOYO,當用戶使用手機助手語音下達指令后,AI助手會模擬用戶屏幕交互行為,自動點擊屏幕來調取應用,找到應用中的商戶并自動下單,最后需要用戶確認支付。
不同于支小寶這樣的獨立 app,榮耀YOYO等此類手機的AI助手 ,可以從手機系統層面去調用手機內的其他 app 或服務,可以視為此前手機語音助手的升級版。當然,這類硬件廠商 AI 產品的優(yōu)勢就是占據用戶入口,以及硬件對于 app 的調用權限。
但劣勢在于持續(xù)優(yōu)化迭代的門檻高,廠商可能要為此投入高性能芯片,研發(fā)配套的操作系統等,同時還要考慮用戶更換新手機的情況。因此手機廠商需要不斷地在產品、成本與性能之間尋求平衡,進一步探索AI Agent的應用潛力。
比如十月在榮耀 Magic7發(fā)布會之前,榮耀就已提前發(fā)布AI操作系統 MagicOS 9.0,并在發(fā)布會上跟升級成智能體的 YOYO 一起亮相。
更不用說蘋果為了給 AI 鋪路,除了發(fā)布適配 AI 的新手機、新系統,近期還推出了搭載全新 M4 芯片的 Mac 系列產品,被外界視為進一步向 AI PC 邁進。
由于付出的成本更大,現在硬件類的辦事 AI,每一步走得更加謹慎。
而對于既不占據用戶入口,又沒有生活服務生態(tài)的大模型廠商來說,做辦事 AI 仍具有一定的優(yōu)勢,就是既可以像硬件廠商一般模擬用戶對屏幕的交互行為,但又不受硬件廠商的品牌限制,探索成為一個上下游都開放的平臺。
如智譜科技的 AutoGLM ,用戶下達指令后,應用也會模擬用戶屏幕交互行為來調取其他應用,中間需要用戶干預進行關鍵操作,最后需要用戶確認支付。從定位來看,大模型類廠商的辦事 AI 介于硬件類和平臺類之間。
03、互聯互通,入口要廣應用要多
如果要對各類辦事 AI 的未來做一個預測,可以從一些已經相對成熟的產品來對比。
比如智能家居或車機的語音控制系統,類似生活場景的智能 AI 產品邏輯已經很接近我們現在所說的辦事 AI,但仍有局限性。其本質上還是在“家”或“車”這個封閉環(huán)境中執(zhí)行任務的,提供服務相對有限,對AI下指令也相對更簡單。
但是讓AI“買咖啡”這類事情,顯然發(fā)生在更開放的生活場景中,AI要面對的是更復雜而多元的真實世界。AI 的一端是用戶個性化的生活,另一端是千行百業(yè)的商家或服務。
此時硬件廠和平臺廠做辦事 AI ,都會依托自身掌握的其中一端主動權來發(fā)散。手機、智能穿戴設備、全屋智能家電、智能汽車等硬件,都是用戶觸達 AI更直接的入口,這是硬件廠的源頭優(yōu)勢。
而像支小寶這樣的AI軟件產品,背靠的支付寶不僅僅是支付平臺,更是國內最大的數字生活服務平臺,能用AI來調動更廣大的商家機構,為用戶提供更便捷絲滑的辦事服務。這些復雜的地面基建工作正是平臺在服務生態(tài)上的優(yōu)勢,畢竟在過去的移動支付時代,支付寶就是這么做的:下場鋪二維碼、建小程序,目前支付寶已擁有400萬個小程序、連接超8000萬商家。
到了 AI 時代,支小寶正用AI 的邏輯重構平臺生態(tài)。此前支付寶推出智能體開發(fā)平臺“百寶箱”,正是讓商家機構可以 0 代碼快速創(chuàng)建專屬智能體,并一鍵發(fā)布到支付寶小程序、支付寶App、支小寶App。
目前我們打開支小寶就可以看到,許多第三方服務商家已經有了自己的智能體,比如與黃山景區(qū)推出的“黃小松”智能體、與杭州文旅推出的“杭小憶”智能體等�?梢灶A見未來,其他行業(yè)也會經歷從移動互聯網服務到智能體服務的升級蛻變,而這個過程或許比小程序時代來得更快更猛。
然而,正如移動互聯網的繁榮需要手機廠商與互聯網平臺的開放協作,進入AI時代,讓AI真正長出手和腳,融入生活,幫你辦事,也需要多方合力推動。
畢竟,無論是硬件商還是軟件商,各自AI產品執(zhí)行任務的能力都還需要加強,目前它們都還難以達到一次性拆解復雜指令并完整執(zhí)行任務的效果。
比如當硬件在調用軟件時,在多個關鍵步驟仍然需要用戶介入,智譜的AutoGLM 就跳不過廣告彈窗 ; 而支小寶這樣的軟件調用支付寶內的服務時,跟商家的協同也還需進一步建設。比如當用戶需要訂餐但選擇困難,商家是否能根據用戶的喜好作出智能推薦。
因此,盡管不同類型廠商的辦事 AI 業(yè)務有所重合,但還遠遠不到爭奪AI入口的階段,在開放場景下的辦事 AI ,無論是軟件和硬件廠都需要對方的能力,來完成辦事流程的閉環(huán)。
硬件廠商需要互聯網平臺的生態(tài)資源,才能真正深入數千萬商家機構,深入生活的肌理,擴大服務的供給�;ヂ摼W平臺的AI產品,也需要與硬件結合,比如車機、手表、眼鏡等,才能煥新服務的形式。
此前 ,字節(jié)跳動的豆包就推出了 AI 智能體耳機Ola Friend ,戴上耳機就能查信息、問攻略、學英語等;Rokid也傳出要跟支小寶合作,佩戴AR眼鏡就能讓AI幫忙點咖啡、打車,實現各種一句話辦事。可以看出,現在各類廠商都在積極探索軟硬件結合,為辦事AI的落地尋找最優(yōu)的路徑。
如果我們參考移動互聯網此前十多年的發(fā)展,也會發(fā)現在各大平臺互聯互通程度不斷的提升下,今天的生活辦事更加便利。而AI要真的為人辦事,繞不開的也是互聯互通,這很大程度上決定著下一個階段AI ToC的落地速度。
這條路很長,但我們至少知道方向在哪里。硬件廠商的原生智能體與互聯網平臺的智能體之間如何組合協同,應該遵循什么樣的標準,如何進一步塑造上下游生態(tài)模式,都是業(yè)內需要思考的問題。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...