國產大模型,應該避免走入加拉帕戈斯時刻

在中國,大模型技術進化加速度的同時,淘汰也加速度。

短短兩年時間:大模型的戰爭,就從 GPT 一馬當先,到國產大模型百模大戰,再到行業格局固定,隻剩大模型五虎和幾個互聯網大廠。

在此期間,伴隨模型大小一同膨脹的,則是算力、人才、電力、數據中心無數基礎資源的不斷加碼。於是,全球范圍內,英偉達的股價一路披荊斬棘,一年暴漲 7 倍,市值超越蘋果;各大機構大模型團隊,從研究員到助理,從教授到學生,接到的獵頭電話,頻率甚至超過瞭來自移動聯通的套餐升級問候……

然而,參數的加碼是無限的,資源是有限的,熱潮當中,長期無限制的基礎模型競賽,真的是一個正確的方向嗎?

宏觀經濟中,作為借鑒過河的對象,日本早已成為全球范圍內一塊被摸圓的石頭:尤其在商業社會,昭和年代之後,圍繞日本為什麼失去半導體、傢電、電池等行業,一種名為「日本產業反思體」的文章迅速在全球走紅,其受眾群體之廣泛,堪比企業傢版《意林》。

對於歷史的錯過,有人將原因歸咎於資本,有人將原因歸咎於時代變化,但這始終解釋不瞭為什麼在電視、電腦、芯片、面板、互聯網、電池這些截然不同的產業裡,日本貢獻瞭最多的諾貝爾獎,但在商業中,卻總是陷入相似的加拉帕戈斯陷阱:

所謂加拉帕戈斯陷阱,指的是加拉帕戈斯群島由於千萬年來與世隔絕,產生瞭與大陸極為不同的穩定生態系統,可一旦面對來自外來物種入侵,就面臨被淘汰的危險。

而在日本的商業社會中,日本電裝最早在 1994 年發明二維碼,結果發揚光大的卻是中國的微信、支付寶;20 世紀日本人做出瞭全球保質期最久、最優秀的存儲芯片,全世界卻在韓國人的帶領下愛上瞭良率不高卻足夠便宜的三星存儲;再後來,新能源時代,日本人一步到位發展起瞭最清潔的燃料電池,但新能源汽車卻在特斯拉的帶領下,集體奔赴鋰電池的星辰大海。

為什麼明明技術遙遙領先,商業化卻仍舊顆粒無收?

這個困擾日本產業發展幾十年的問題,如今也值得被中國的大模型產業重視起來。

01如何避免 AI 走入加拉帕戈斯困境?

以百度創始人李彥宏為代表,中國的大模型產業,正逐漸建立起一個新的共識:

正如同日本的諾貝爾獎數量並不直接決定其產業的強勢與否,對於 AI 產業,隻卷基礎大模型,或許會是一段時間裡,行業最大的失誤。

一個最直接的原因就是,當所有資源全部被押註在基礎大模型的研發上時,直接帶來的,或許不是技術的突飛猛進,而是相同成果一遍遍的復現,反而帶來算力與研發資源的極大浪費。

百度創始人李彥宏|圖片來源:視覺中國

就拿算力來說,一般來說,訓練大模型的顯卡標準配置為 A100 與 H100。當前,一張 A100 售價大約 8 萬人民幣,一張 H100 大約 15 萬人民幣;而將他們組裝成服務器,一個 8 卡的 A100 服務器大約 130 萬人民幣,裝配瞭 8 張 H100 顯卡的服務器價格大約 200 萬元。

當然,這些全都有價無市。

而將其對應到模型側,訓練一個千億模型,大約需要用 1PB 數據,如果在 10 天內完成,需要至少一萬張 A100,對應購買服務器的起步費用,就是 17 億。

此外,據報道,OpenAI 訓練 GPT-5 需要數萬張英偉達 H100 芯片,也就是說,相應的服務器成本,將達到 30 億人民幣上下,如果再算上數據中心成本、人力成本、電力成本,以及無數次推到重來的可能,需要的成本,幾乎相當於國內頭部大模型獨角獸的融資總額之多。

相應的,隨著參數量的進一步暴增,基礎大模型將註定成為少數玩傢的遊戲。

參數量與玩傢數量的成反比之外,創投市場的悲觀,宏觀經濟的不確定,則又為這場基礎大模型的豪賭,添上瞭一抹不確定的色彩。

大模型研發要錢,而在沒有確定的營收之前,創投是核心的現金來源。但創投數據庫 IT 桔子的數據顯示,近兩年來,無論 AI 的融資規模還是數量,相比 2017 年前後的 CV 熱潮,都大有不足。但研發成本上,大模型卻是上個時代 CV 的數倍之多。

於是,AI 行業一個怪圈出現瞭:早期,每當 Open AI 有新版本的大模型發佈時,過不瞭三個月,國內一大批企業,就會引用第三方數據於開源數據集跑分,開始不斷論證自傢模型對各個版本 GPT 實現超越。

在這背後,為瞭迎合打榜需求,over-fitting(過擬合)也成為一個 AI 圈特有的現象,由於訓練過程中,模型對某一或者某幾個打榜用的開源數據集擬合過於精細,以至於模型記住瞭不少開源數據集特有的噪聲,從而打榜分數居高不下,但實際應用中,效果卻往往卻一言難盡。

用李彥宏的話來說,「百模大戰」讓我們建立起瞭追趕世界最先進玩傢的能力,但當前業界過分關註模型本身,造成瞭巨大算力浪費,忽視瞭 AI 真正的價值所在——應用。

02 降低創新的成本意味著什麼?

如果隻卷基礎大模型是一條錯路,那正確的方向在哪裡?

研究瞭無數日本的產業興衰之後,曾有專傢總結,日本企業最大的問題,從來不是在於點錯科技樹,而是因為技術遙遙領先之後,沒有帶動更多玩傢參與,讓整個產業鏈的成本一同降低,從而成為加拉帕戈斯群島中獨自演化的「怪物」。

比如,互聯網發明,萬維網是一切的基礎,但真正帶領產業蓬勃發展的,則需要搜索、電商、短視頻等萬億級下遊應用。

大模型同理:少數玩傢高端競技之外,如何讓大模型吸引更多生態玩傢一同參與擴充應用市場,或許是這場曠日持久的大模型戰爭中最關鍵的賽點。

如何解決這一問題,在不久前的世界人工智能大會上李彥宏明確指出瞭百度的思路:智能體代表著 AI 時代的未來趨勢,由於它門檻足夠低,可以「讓更多人進來。在此之後,整個社會的創新,就會像 90 年代中期時候的互聯網網站,誕生數以百萬計的網站大浪淘沙之後,指不定哪條路就跑通瞭,從而誕生 Google、Facebook 這樣的 Super APP。

近十年,百度 AI 相關的研發投入超 1400 億元,基於以上投入,百度同時也是全球為數不多的、有著應用、模型、框架、芯片四層全棧佈局的 AI 公司,其文心大模型的日均調用量更是已經突破 6 億次。以此為基礎,百度還先後上線知識庫、插件、自動追問、長期記憶、多尺寸模型,來完善智能體的生態。

目前,通過百度智能體,創建 AI 原生應用的開發將變得像拍短視頻一樣簡單,甚至一句話就能創建智能體。哪怕一些復雜的智能體創建需求,用戶也能像搭樂高一樣,靈活調用、組合各種工具。

文心智能體平臺截圖

這種極低的創新成本,換來的是洶湧而來的生態玩傢:截止目前,百度文心智能體平臺吸引瞭 10 萬傢企業、60 萬名開發者,覆蓋瞭上百個應用場景。

比如主業是做教育培訓的上海英孚教育,通過智能體打造瞭用戶的專屬英語顧問,不僅能「因材施教」為咨詢客戶推薦課程、外教,還能根據用戶地址、需求,提供就近的培訓地點,讓企業的線索有效率大幅提升。

當然,降低門檻隻是產業做大重要一環,但更重要的是,降低門檻之後,如何創造營收,讓雪球越滾越大,讓創新成為一個穩定自循環的生態。

03 為什麼超級市場,才是大模型生態的最後一環

日本為什麼總在發明,又總是在錯過?

曾有學者復盤,很多技術,日本人發明之後,往往被中國人與美國人接手,才正式發展壯大,比如寧德時代的很多技術脫身於日本的 ATL,二維碼在日本發展二十年,不如中國一場移動支付帶來的普及效果。

技術創新到形成產業,中間的催化劑是超級市場。隻有超級市場,才能讓所有的參與者賺到錢,也隻有賺到錢,才能越過技術一時的領先與否,決定技術長期的生命力。

圍繞這一目標,百度逐步打造瞭涵蓋智能體開發、分發、再到變現解決方案的全新生態。

「目前百度已跑通瞭智能體生態的閉環,不僅人人可用,還能人人可開發、人人可分發、人人可獲益」。9 月 12 日,百度集團資深副總裁、百度移動生態事業群組總經理何俊傑在 2024 年百度聯盟大會上表示。

百度集團資深副總裁、百度移動生態事業群組總經理何俊傑|圖片來源:百度

在分發環節,百度構建起瞭「1+N」的流量分發生態。這裡面,「1」代表搜索消費場景內的分發,「N」則是在多終端場景的覆蓋,開發者僅需一次開發,就能在百度搜索及文小言、小度、貼吧、網盤等百度的多樣化、多終端場景的終端生態中進行智能體部署分發。

其中,以百度搜索是天然智能體分發池,當前,百度搜索每天請求量幾十億次,其中很多需求都可以被智能體滿足。比如,百度針對高考開發的高考智能體「AI 志願助手」,通過智能分析,能為考生量身定制志願方案。高峰時每天有超 320 萬考生通過百度高考頁面,直接搜索「高考 xx 分能上什麼大學」,或進入「AI 志願助手」獲得針對性的分析和決策參考。

在變現環節,百度正逐漸把智能體引入到百度聯盟這個大生態,持續為聯盟夥伴提供商業化價值。

過去,PC 時代,百度聯盟結合百度搜索,一度搶占瞭絕大部份線上廣告份額;移動互聯網時代,百度聯盟則結合百度 APP、貼吧、地圖為核心的移動產品矩陣以及手機廠商等終端,進一步擴大線上廣告的市場規模,並催生出「內容+廣告」的新型商業模式。

根據官方數據,用戶側,百青藤 24 年 DAU 覆蓋已超 8 億、百青藤變現能力提升 30% 以上,通過不斷提升系統承接能力,保證優質流量承接,百青藤入口請求量年同比提升 27%。商傢側,目前已有超 2 萬個智能體使用瞭商業組件。截至 8 月底,每天有超 1.9 萬傢企業使用商傢智能體,覆蓋教育、房產、機械等 30 多個行業。

近日的百度聯盟大會上,百度還全新推出智能體聯盟解決方案,為企業帶來新場景新流量,及新的變現機會。

其中,在變現環節,百青藤攜手文心智能體平臺,推出瞭創新變現解決方案,通過創新廣告和服務直達廣告,可以實現與文心智能體平臺、智能體開發者之間的互利共贏局面。

此外,百度還推出瞭【分發+變現】一體化解決方案,通過「流量+能力」的雙變現通路,實現智能體開發者、百青藤、聯盟合作夥伴的三方共贏。

比如,用戶點擊播放《唐朝詭事錄 2》後,下方關聯內容會推送故事角色「裴喜君」的角色智能體,並以劇中熱點問題巧妙地將觀眾引導至智能體交互界面。通過數輪深入交流,適時推送高度匹配的廣告內容,進而實現內容與商業的無縫融合。

再比如中國供應商網,在接入百度智能體變現插件後,智能體能夠精準地把握買傢采購意向,積極高效地和平臺買傢溝通,並深度挖掘采購細節,比起原有的表單提交系統,信息完善率提升 87%,轉化率提升 31%。再加上智能體後臺的個性化配置,中國供應商網還可以根據自身需求不斷調整優化,挖掘和滿足 AI 時代更多的用戶訴求。

而在高三網,用戶則可以借助智能體組件,通過智能引導與關鍵詞提問,探索並查閱到更為廣泛且相關的內容,這讓高三網的資訊內容矩陣對於用戶搜索的目標信息能給出更多元的解答,為用戶提供瞭快捷、高效的搜索體驗。商業化層面,智能體在短短一周內就實現落地上線,相較於傳統廣告,為高三網帶來的整體收益提升數倍。

至此,技術為根基,智能體為手段,百度聯盟帶來廣闊的應用空間,百度正式跑通瞭大模型從研發到落地的生態閉環。

04 尾聲

做出全球領先的基礎大模型,還是一句話創建智能體,用大模型變現?

兩者相比,或許後者並不是一個如同奧特曼一樣能站在世界聚光燈舞臺上改變世界的炫酷行為,而是更像是商業社會中「低垂的果實」。

但事實上,隻有通過百度智能體,讓「人人可開發,人人可分發,人人可獲益」,讓整個行業上下遊的開發者、聯盟夥伴、廠商一同參與,一同受益,生態才會做大,大模型產業才能長久持續。

也隻有在前行的路上,不斷摘取「低垂的果實」,完成一個又一個從 0 到 1 的商業化落地,才是新興產業從技術突破到真正落地,從 1 到 100 改變世界的必經之路。