智能體的浪潮正在改寫AI產業的主導邏輯。
過去一年,從內容生成走向任務執行,智能體成為大模型能力的新出口,也成為獨立模型廠商和互聯網大廠爭相布局的新賽點。
在這場變局中,大模型廠商面臨艱難抉擇:是繼續作為通用能力的提供者,退居底層?還是向上走,構建平臺、直達應用?商業化困局與技術路徑選擇交織下,哪些玩家能留在牌桌?
近期,《虎嗅·AI無悖論》節目特別邀請智譜高級商業副總裁、前字節跳動飛書&Lark全球首席商業官吳瑋杰,以及企業知識開源計劃創始人、前波士頓咨詢Platinion董事總經理、前IBM咨詢全球合伙人陳果進行了探討,請他們分享了智能體技術沖擊下,模型廠商的戰略近況及行業相關的深度思考:
智能體的普及,是在放大大模型的基礎設施作用,還是正在削弱模型廠商的核心價值?
面對創業者蜂擁而上、互聯網大廠全力搶占入口,模型公司能否通過MaaS平臺與智能體生態"再造主導權"?
智能體到底是工具、入口,還是新操作系統?
本期主持人為資深媒體人、熱AInext主理人陳慶春。
以下是交流實錄,有刪編:
智能體是什么,誰在制造?
主持人:智能體(Agent)到底是什么?它和大模型是什么關系?
吳瑋杰:我會把大模型當做是一個圖書館?,F在很多chat類的應用,更像圖書管理員,當它接收到一個用戶的指令,就會去圖書館里查閱各種圖書,給出一個反饋。
但今天的智能體,它更像是一個項目經理或者項目的助手——基于我的某一個目的去圖書館里查閱相應的文獻,最終做出相應的操作,或相應的產品。
陳果:簡單來說,智能體是指一個能感知環境、做出判斷,并據此采取行動以實現目標的智能系統。
智能體真正火起來是在2023年初,背景是2022年底ChatGPT等大模型的爆發。大模型最初用于文本生成,后來擴展到圖像、音頻等"生成式AI"。再往前一步,人們開始思考:既然能生成內容,是否也能"生成并執行動作"?這就進入了智能體的范疇。
簡而言之,大模型驅動的"智能體"代表的是AI從"生成內容"進化為"完成任務"。
主持人:那現在是誰在制造智能體?是專業開發者的專利嗎?
吳瑋杰:現在人人都可以制造智能體。就像幾年前流行"人人都是產品經理"一樣。
對于普通用戶和初級開發者來說,智能體更像是"美圖秀秀"式的輕工具——簡單、好玩,用于生成網頁、聊天機器人等淺層場景。
而對于大模型公司或互聯網大廠,智能體則更像是"Photoshop"——用于深度業務場景,模型公司可以把智能體的部分能力"訓進模型"本身; 互聯網公司更善于結合用戶習慣與入口生態來落地產品。
陳果:我有個朋友創業,做的就是"五分鐘教你做智能體",只要你想學,五分鐘就能做出來一個。
主持人:聽陳總這么一說,吳總作為大模型廠商怎么想?現在智能體的門檻變得這么低,對大模型廠商有什么沖擊?
吳瑋杰:我反而認為這對大模型公司是很好的促進作用。大模型越來越基礎設施化、算力成本降低,才能被用戶真正的用起來。
當然這也帶來一個問題,因為模型廠商更加基礎設施化,相應的玩家會越來越少,這本身是預期內的事情。即便沒有deepseek這樣的開源模型,它也會被淘汰,只是時間早晚的區別。
今天第一梯隊的模型廠商,尤其是服務B端、G端的,在商業化路徑上不再只是"提供一個模型",而是向上層的MaaS平臺、智能體平臺延伸,提供一整套可交付、可執行的能力包。
這種技術的迭代帶來的能力"交替式上升"的競爭,其實有利于整個第一梯隊的所有的玩家。
主持人:那第二梯隊就不存在了嗎?
吳瑋杰:這是個很好的問題。事實上,從2024年底,有一個很大的變化是很多互聯網大玩家進場了,早期的"六小虎"大多在轉型、逐步走向分化,分別聚焦在國內的C端應用、垂直行業的應用、海外的應用。
這個問題,回到當年的SaaS時代是一樣的。現在互聯網大廠做SaaS主要做釘釘、飛書、騰訊會議這類工具類的應用,但是不影響市場上有很多深度的垂直行業的SaaS公司。
陳果:我認為在基礎模型這一層,不會有第二梯隊。大模型是基礎設施,類似于云計算剛興起時的演進邏輯:
一開始很多廠商都能"做云",但最后真正能留下來的不超過五家,因為底層基礎設施的競爭是同質化、高投入、拼成本的,最終往往是頭部廠商形成壟斷格局。
AI也一樣,最底層是算力和GPU,現在全球80%的市場份額在英偉達手中;再往上是基礎大模型層,長期來看也只會剩下極少數具備深厚技術和資源能力的公司。
主持人:那是不是意味著除了頭部廠商,其他都沒有機會了?
陳果:也不是。越往上走、越靠近用戶側,玩家就越多,因為用戶需求復雜,場景多樣;上層應用空間足夠大,足以容納各種差異化定位。
所以,大模型之上的幾個"層級"才是創業和差異化競爭的空間:一是模型微調層(如小模型、二次訓練、蒸餾等)——會有部分專注垂直場景的技術型公司參與; 二是智能體構建層——圍繞不同行業、流程場景構建智能體,是最有可能百花齊放的領域。
主持人:所以吳總作為現在的大模型廠家,是給人類做最基礎的貢獻了?然后會慢慢退出歷史的舞臺,變成另外一種身份?
吳瑋杰:我覺得我們還在舞臺中央。
未來的模型市場,一類是以互聯網大廠為代表的,有自己的生態,有自己的應用場景,長期以一個比較好的身位活著;第二類是國內以to B為主、toC為輔的獨立模型廠商,給不同的企業提供差異化的服務。
我很同意陳總講的,大模型越偏基礎設施這一層,越是贏者通吃。第一、第二名活得很開心,第三名艱難的活著,第四、第五名每天想著能不能活。
中國市場和海外市場始終不一樣的是,無論是SaaS時代,還是今天的模型時代,國外推的很多都是 MCP 標準化的接口。但國內這個生態始終沒有完全接在一起,會給一些特定的企業機會。
主持人:剛才也講到,創業公司可能面臨更大的資源的問題,現在巨頭壓力會傳遞給你們嗎?互聯網巨頭也在搶你的單吧?
吳瑋杰:這是個很好的問題。其實今天市場上有一個很有意思的現象。不少B端和G端項目的招投標,還湊不齊三家去參與競標,因為客戶的要求越來越高。
互聯網大廠其實做的是相對比較通用化的模型,比較easy money。通過API的調用,可以基于自己的生態,去推云智一體——賣大模型的目的是為了推動云,靠大模型虧一點錢,順帶去賣一點算力資源,再賺回這個錢。
陳果:我非常同意剛才吳總說的,去年的時候,大家大部分都在跑比跑分,像原先的手機、攝像跑分一樣。但是跑到一定程度,是有極限的。
你做到95分之后,邊際效率就開始走平了。
吳瑋杰:對,這種情況23年和24年上半年比較多,就是一堆模型公司熱衷于刷榜,這是特別離譜的一件事兒,我們甚至有一個階段性的說法叫道德的下限決定了你排名的上限。
那個時候有很多榜單,它都是一些公開的數據集,你可以有針對性的做數據,很多的模型公司都有一個刷榜小組,專門用于解決榜單排名的問題。
越關注榜單其實是客戶對模型的認知還處于一個比較早期的階段。
主持人:剛才兩位討論了互聯網大廠對to B端的沖擊,to C端的話,大廠的沖擊會不會更強?
吳瑋杰:肯定的,大廠有入口的優勢,天然會獲得更多的C端客戶?,F在甚至有一些大廠在利用現有的壟斷優勢,不允許競爭對手在他們的環境中進行任何的投流工作,只能投自有產品,那這對整個C端的應用場景就造成很大的挑戰。它有更多的語料,所以很容易強者恒強。
主持人:你們會把c端產品當成一個重點的產品來做,或者是商業變現的一個產品來做嗎?
吳瑋杰:目前在商業變現上,通過C端chat類的工具還是比較的難。其實也不只是智譜,所有國內外通過這種聊天類、訂閱的方式去獲得變現還是比較難,最近一個開始全免費的是百度。
主持人:大模型廠商都已經有這么大的壓力了,那比如Manus這種沒有基礎模型、又沒辦法去to B服務的純智能體廠家,壓力會不會更大?
吳瑋杰:我覺得會,這類廠家其實很多的收入來自海外的調用。因為海外的市場成熟度更高,商業市場程度高,用戶愿意為此付費。
主持人:對于其他做智能體創業的公司來說,這種在國外的商業模式是可以復制的嗎?
吳瑋杰:今天很難講任何一種商業模式能復制,如果去看大模型的應用的榜單,其實每半年有50%的明星公司就不在榜單上了。這也是一項技術在高速迭代的過程中,必然會產生的一個情況。
主持人:就是在智能體階段,智能體卻沒有辦法誕生出自己的創業公司?
吳瑋杰 :也不能那么絕對。我們能看到的趨勢是,模型能力跟應用場景在逐步的解耦。
今天模型當中會出現MaaS層、智能體平臺這樣的中間層,是希望客戶和用戶聚焦在上層的應用上。
可能在某一些場景上,deepseek還是比較不錯的,在另外一些場景下,智譜的能力是遠超其他的對手的,某一些場景上可能OpenAI還是老大??蛻艨梢酝ㄟ^上面的MaaS平臺,去選擇調用不同的模型的能力。所以我覺得還是會出現一些行業內較好的智能體公司。
陳果:補充一下,其實就是對模型的編排。所謂的智能體系統,指的是一個大智能體指揮一個小智能體,核心問題是,你做的是一個面向任務的智能體,還是面向流程的智能體?比如做一個客服的智能體,中間除了接電話,還有很多環節,會有一些綜合服務的技術跑道新機會。
吳瑋杰:智能體的出現,大大加快大模型tokens的調用量,但其實今天大部分國內的大模型廠商并沒有因此能獲得足夠的利潤。
陳果:不是國內的問題,全世界大模型公司都還沒找到怎么賺錢的方法,如果只談基礎模型的營業收入的話。全世界大模型真正產生的收入,70%被GPU廠商拿掉了,30%被算力的廠商拿掉了,目前可能沒有一家掙到錢。
吳瑋杰:智能體的商業化變現,對我們來說是多種商業化變現中的一種,比如我們還會幫其他國家訓練主權大模型。
主持人:那對于一些大模型廠商,是不是可以借著智能體這個機會去做一些轉型?
吳瑋杰:這個問題我有比較多的考慮過。2023、2024年的"幾條虎",在今天已經放棄基座模型的選擇,轉型全面做醫療,全面做教育。那是不是能夠在另一條路上能夠走得通?我覺得其實很有挑戰。
我們剛剛講了基礎模型是最下面那一層,當大家去切換一條賽道,其實就是去做上層更偏應用層的事。但這兩類公司對人才的畫像,對基礎能力的要求其實是不一樣的,當你在一條賽道做的很難的時候,你在另一條賽道會碰到同樣的問題,甚至會更難,因為在這個時刻你沒有行業的洞察。
所以我覺得可能今天一家模型廠商,轉型來做一個行業模型,不見得比一家曾經在這個賽道里面服務于醫療公司的SaaS公司,或者軟件公司更有優勢。
主持人:所以就和我們開始說的一樣,大模型廠家要么就成為第一梯隊,要么就被淘汰了?
吳瑋杰:這是一個比較悲傷的故事,但這就是現實的故事。
智能體重構企業系統與入口
主持人:但是好多巨頭現在都已經接入了MCP 協議,基本上應該是通行的標準了?
吳瑋杰:怎么說呢,我覺得這是個被動式的響應。
早期的一些平臺,心態上大多是自家的花園里種著自家的菜,自家的菜能讓自家來收割。
陳果:我舉個例子,大家都知道淘寶和微信沒有打通,鏈接沒辦法拷貝過去。
我覺得是不是聯通,還取決于上面的應用。MCP(Model Context Protocol)不是智能體的協議,是模型和周邊數據交換的協議。MCP更偏底層一些,A to A更偏應用層一些。MCP本身邏輯是個電話號碼簿,它有各種各樣的接口,比如一個復雜的企業軟件,有訂單、物料、客戶供應商、好多信息的接口,接10個還是100個,接的深還是淺,都有區別。
更底層的問題是企業的應用系統建設。在SaaS時代,有個說法是一個硅谷的公司大概會用一百多種SaaS,在每一個細小的環節都用一個,你的業務要跑起來,這些系統資源都要打通,自然而然就形成了生態,中國的情況是所有的廠商恨不得我把客戶生意全做完了。
另外一個原因是客戶本身的需求也有問題。一種是傾向于用大廠全弄完了,第二個情況是大型公司自己干,造成整個企業數字化的割裂和大廠的壟斷,企業和企業之間互相不接觸。
主持人:那現在不是正在二次起跑嗎?智能體不是企業系統互通的解法嗎?
陳果:應用系統之間是不是打通這個問題,跟是不是智能體系并沒有直接的關系。智能體只是一種新形態的軟件,軟件行業、企業的應用環境本來如此,不是因為有智能體就變了。
智能體要有工具、環境,才叫智能體。智能體只是腦子推理說我要去ERP里做個訂單、做個賬,做賬還是做賬,做訂單還是做訂單。智能體是在企業的核心信息系統里跑的,換句話說,智能體是車,ERP是車跑的那個路。你有了大腦后,就像有了車,但沒有路,車在哪里開?
企業如果連ERP都沒有用好,不可能用智能體的。
主持人:所以您的觀點是,在AI智能體這個時代,在中國依然是沒有通用的這種協議存在,不會有一個比較通行的標準讓A to A進行連接、智能體跟智能體之間調用,server和server之間還是割裂的?我相信吳總肯定不贊同。
吳瑋杰:我最近在一個峰會上,他們問了我類似的問題,我當時講了一句話,可能顯得不那么有情商,就是當某一天在座的這群45歲以上CTO都退休的時候,我覺得這個時代會來臨。
陳果:他們說的都對,但那是2050年的事情。
吳瑋杰:其實在這一點上我有不同的觀點。今天我們看到智能體,已經有一定的入口的形態。
第一類是像OpenAI的GPT,包括智譜的AutoGLM這樣的原生大模型作為入口,來做一些執行和操作。
第二類是互聯網大廠已有的super APP,比如微信、支付寶的嵌入式入口。
還有一個新的入口就是操作系統和智能終端的結合。有的在做耳機,有的在做眼鏡,有的在做手機,大家其實都是在做搶占入口的動作。
當智能體的能力更加前置,作為操作系統的一部分時,就能夠越過APP、跳過很多應用場景來做執行。舉個例子,我可以直接告訴我的操作系統,幫我訂一張從上海飛往北京的機票,對智能體本身而言,它不會關注背后你用到的是什么APP,而是從各個APP中去找一個最便宜的機票幫你跳轉過去。
這種情況下,現有的商業生態都會變化,開屏廣告怎么賣?競爭是否變成后端供應鏈的競爭,而不是一個前端的入口競爭了。
陳果:這個要回到信息系統的原理上來。剛剛說訂機票,但全世界的各個航司還是要有一個機票的信息系統。
今天所有企業級的系統和to C的系統有一個不同是,數據本身的合規性要求是非常高的,數據要持續存儲、信息要可追溯。
但今天的大模型是基于連接主義的,它是基于神經網絡的。所以它本身存在一個致命的問題就是永遠不可以解釋、不可預測。
所以企業如果要應用人工智能去做智能體的話,只能去解決那些對可預測性和可追溯性要求不那么高的活動。
從信息系統的原理上講,智能體是行動系統(System of Actions),在業務流程、人機交互這一層,它可能發生范式的變革,但是在底層的話——企業的核心數據,也就是記錄系統這一層,至少目前,我還看不到范式的變革。
吳瑋杰:我挑戰一下果總,我覺得這件事兒是有可能會被解決的。
類比十年前,全球制造業智能化時出現兩種技術路徑,一種是美國提出的"工業互聯網",不動原有系統,通過"外掛"方式增加智能,打個比方,就像是在老式水表上加一個攝像頭,遠程看到讀數。另一種是以歐洲為代表提出的"工業4.0",干脆把水表換成個智能的。
今天很多企業在用智能體時,還是"在老水表上加攝像頭"——讓智能體幫你去ERP系統里點一下下單按鈕,處理一下表格,像一個AI版的按鍵精靈,我知道下一步是什么,然后讓它去執行。
但在大模型時代,有可能會出現另一種范式——它不基于過往的規則引擎。
因為當我有越來越多的數據,大模型可能通過某種方式,甚至通過不斷的迭代找出一套不完全基于原來這套"我要先做1,再做2,再做3,再做4"的規則引擎。
這個過程中,很有可能大模型還是不可解釋,不可預測,但是它會越來越接近于這個事情的本質。
企業對AI的ROI誤區
主持人:陳總咨詢了很多企業,你也談到了企業需求并不是很強烈,他們是出于什么樣的考慮呢?是覺得沒效果嗎?
陳果:去年某個頭部的制造業,是中國自建GPU最大的公司之一,他們自己買了一千張GPU,投入好幾個億,自建算力平臺,部署了各種大模型。
可是那么大的算力都投下去了,他真正產生生產力的事情,就是畫廣告圖片、廣告文字。
我當時還問那個負責人,你們為什么不用智能體做客服,他說里面會有一些合規法律風險在里面,比如車壞了該怎么怎么修?消費者按照AI指令修了之后,萬一出事算誰的,但如果讓人去檢修,客服人員又一點沒減。
to B意味著要賺錢,但很不幸我們在企業價值論證這一塊,一直非常不明顯。
吳瑋杰:我覺得兩個維度會影響到客戶對這個事的判斷到底算成功還是失敗。
第一是這個客戶他有沒有找到今天基于模型能力和業務價值的最大公約數。
第二是相關的負責人是否有合理的預期。
舉個例子,國內一家知名企業用了我們最新的模型,再加了一些模型的微調,做一個行業垂直模型。但是大概運行了4到5個月,隨著我們的基座模型能力一提升,他發現微調過的這個模型還不如提升過的基模。于是企業主來問我說,是不是從這個視角上來說,這個項目就不成功了?
這是個很典型的話題,我覺得這還是個成功的項目。因為在這個過程中,由于我們的模型服務幫這個業務達到了5到6個月的領先窗口期。核心點是你需不需要這5到6個月的領先期。
主持人:兩位在服務企業的過程當中,去年跟今年相比有沒有感覺到明顯的變化?比如對AI的需求變得更強烈了?
吳瑋杰:能明顯感覺到,企業的需求快速收斂到了一個價值導向的時代。
從24年下半年至今,我們會發現客戶會越來越聚焦在你到底能產生多少的商業價值,也就是陳總講的,計算ROI。今天上市公司,它如果希望能夠提升市場對它的信心,不是對外宣稱我上了一個模型,而是要有明確的鏈路,想通過模型帶來怎么樣的價值,而且這個價值相對是有一個比較明確的路徑的,資本市場才會對它有一定認可。
主持人:那有沒有一種可能,因為企業對AI的這種緊迫性的需求,可以倒逼企業去重建數字化的系統?
吳瑋杰:我覺得現在企業的需求還是比較分散。一類是非常簡單直接的降本增效。明確需要在多少時間內收回投資成本、取代多少的人員編制。尤其是像智能客服這樣的場景中會比較明顯。
主持人:就是要有明確的ROI?
吳瑋杰:對,這是一類。第二類是打造一個新的產品。本來這件事做不了,由于大模型的出現,今天這件事可以干了。比如汽車企業里的智能座艙、多意圖識別的回答。
第三類我把它統一叫做POC,就是我有個美好的愿望,但是不知道模型能不能做。這類需求基本上有一個共同點,就是客戶的預算一定低于100萬。大家往往把它作為一個試驗田,目標定的特別高,但最后實際做下來,大多數和預期會有一定的偏差。
陳果:我跟一家公司聊,這家公司是中國市值最高的一家制造企業,他們曾經也去找國內最頭部的一些科技廠商去建工業視覺。
但僅僅做了POC之后,他們就開始自己干了,因為對他那個企業來講,技術是機密,他不會讓任何廠商去干,任何廠商去做它的機器學習,其實就等于把它的工藝給拿走了。
所以最初給他做的那個廠商,也只掙了個名而已,再來個一點點項目費,后面啥都沒有。這說明廠商創新不形成一種社會機制的話,它有可能就成先烈了。
主持人:那對企業來說,智能體在什么樣的應用場景下進行落地比較好一點?
吳瑋杰:一個企業在AI上的競爭力,有幾個參數可以參考。第一,他制作模型選擇了什么樣的基座模型。第二,他自己是一個什么樣的組織能力,比如像智譜這樣的公司,可能需要做很多預訓練,需要很多指令工程師,但有一些企業更多做應用,它更需要產品經理,不需要算法工程師。第三,它有哪些數據資產。第四,它有哪些應用場景。
拿數據資產來舉例,如果今天在這個訪談過程中,突然邊上放出音樂,我們會認為是個噪音,但是我如果一個人在家里躺在床上,聽著音樂就不是噪音了。所以數據資產始終是跟用戶場景強關聯的。你這個資產在這個場景上它是有價值的資產,那它就能夠服務于企業。所以今天我們會建議企業會更加聚焦在它的應用場景,無論數據資產是不是被清洗過的高質量數據資產,剩下的這一部分其實都是可以通過越來越多的技術把它提煉出來,做一些能力優化。所以回到您剛剛的這個問題,到底企業從什么場景開始最好,其實沒有這個答案。
主持人:所以沒有相對通用的場景?
吳瑋杰:至少我目前還沒有梳理出一個通用的法則來。但有個非常有意思的現象。
如果這個大模型的選擇,它是從一個IT團隊來發起的,那大部分都會從智能客服或者知識庫開始,因為這兩類場景失敗的可能性是最低的,差別無非是準確率是85、87還是91,從一個打工者的視角,它的安全系數最高。
但一個企業主往往不會從這個幾個點來做選擇,因為對他而言做一個行政問答知識庫,只是降本增效,帶來的價值是有限的,他會更加深入在業務本身。
所以您要問從哪個點上推薦,取決于他做大模型到底有沒有想清楚為什么做。
主持人:最后一個問題,兩位覺得智能體它會徹底顛覆哪些行業?
吳瑋杰:第一改變的還是軟件行業本身,尤其是以代碼模型為主體的、偏前端的工程化的公司。比如有工程師原本五天完成的工作,借助代碼模型三天就能搞定,另外兩天可以用來摸魚。
第二隨著推理模型的成熟,像陳總曾經所從事的咨詢行業也會受影響。
比如現在跟大模型說,幫我分析一下北京朝陽區和北京海淀區在過去一年大模型賽道所涌現的企業,它就可以生成一份1-2萬字的價值分析報告。
陳果:這兒有一個矛盾,我一直沒想清楚,大家有興趣也可以想一下。
我認為數據信息收集、分析工作會被替代,但是像我這樣的合伙人是不可以被替代的,為什么呢?因為咨詢本身不僅僅是寫文章,還有人與人之間面對面的溝通,會提供情緒價值。
我年紀比較大我也很有經驗,企業領導愿意跟我聊,這里矛盾在哪里呢?如果我們把小朋友全部用機器替代之后,他沒受到鍛煉,他怎么成為合伙人?我覺得人工智能從社會邏輯上來講有很多矛盾。
主持人:但人是不是可以跟機器人學習,以后機器人可以教人?
陳果:人跟機器學習好了之后,人就變老板了?機器不是把人都替代了嗎,我連工作都沒有,你怎么給我機會學習呢。
吳瑋杰:我覺得從人工智能的發展的過程,可能有一些啟發。人工智能最早干的一件事兒叫下棋。圖靈測試本身也是拿人跟機器去下,看你能不能感受到對面是一個機器。
下棋有一個東西叫棋譜,也就是它的規則引擎。學圍棋,學象棋,都是把幾千種幾萬種不同的棋譜學到,但是AlphaGo當時戰勝李世石的那一次,只有一手,我們后來把它定義叫神之一手,因為在所有的棋譜中都找不到這一手。
AlphaGo贏了李世石以后,AlphaGo自己跟自己對戰,三天以后出了一個Alpha Master,Alpha Master跟Alpha Master對戰,過了21天出了個Alpha Zero。
當機器的智商已經高于人類智商的時候,其實我們很難通過人類的規則引擎,去訓練這個模型。
但這個就比話題比較大了,變成了硅基能否戰勝碳基。