
“大模型最瘋狂時的一張照片。”日前出門問問CEO李志飛從極客公園創(chuàng)始人兼總裁張鵬的朋友圈“盜圖”,并寫下如上配文。那是2月12日,張鵬在他組的一個飯局上拍的。
短短兩個月時間過去,照片中的多位科技圈企業(yè)家,相繼涌入通用人工智能(AGI)的浪潮中,張鵬不禁在圖片配文中感慨,這是“最早一批AGI信徒的聚會”。
飯局時李志飛感慨自己“過度興奮和嚴重缺少睡眠”,用他自己的話說,“那時的我想不顧一切地學OpenAI搞法,去做大模型。”
然而,兩個月飛逝而過,李志飛想法變了,4月10日,他說,自己變成了“大模型勸退派”?;乜醋屗?ldquo;冷靜”下來的大背景:首先是當天,大模型領域不只“添丁”王小川,還有商湯科技發(fā)布了大模型體系,昆侖萬維提早宣布“天工”大模型也將啟動邀請測試;其次是在那之前,百度文心一言發(fā)布、阿里通義千問啟動測試,華為盤古大模型與京東“ChatJD”大模型也已經“猶抱琵琶半遮面”。4月14日,騰訊也加入競賽,推出新一代算力集群,用來訓練大模型。
在社交媒體上,不少人將大模型比擬為當前科技互聯(lián)網產業(yè),一個新的“造夢場”,不同于其它的是,這個領域中的逐夢人,需要的是協(xié)同大于競爭。
從新冠疫情黑天鵝突襲到經濟趨向復蘇,整整三年過去,沒想到在ChatGPT之后,一股競賽風乍起,將中國AI創(chuàng)業(yè)這一池春水吹皺,甚至涌起一波浪潮。
一批人,涌入浪潮
“這是一個確定性的機會,如果輸了,五年最高虧一百億美金,但要是成了,20年賺一萬億美金。要是你,怎么選?”某科技上市公司CTO告訴記者,一家公司即便數(shù)據(jù)不夠多,但有一定的資本、算力技術等資源,“是我,我也會選擇做大模型。”
4月13日,知乎創(chuàng)始人兼CEO周源走上“2023知乎發(fā)現(xiàn)大會”的舞臺,對外發(fā)布了聯(lián)合面壁智能開發(fā)的中文大模型“知海圖AI”。
兩天前,4月11日晚,李志飛在朋友圈發(fā)出一張對于“AGI本人”的邀請函,預告出門問問將在月底進行AIGC相關戰(zhàn)略發(fā)布。
周源、李志飛都曾在兩個月前參加了一個飯局。2月12日,張鵬在一家日料店組了個局,赴約者就有李志飛、周源、搜索引擎搜狗的創(chuàng)始人王小川以及松果出行創(chuàng)始人翟光龍。
彼時席間,張鵬拍照留念并預言,“這是個有歷史意義的照片。”當他4月10日將合影發(fā)在朋友圈時,坐在正中央、笑得燦爛的王小川官宣入局大模型創(chuàng)業(yè),產品命名為“百川智能”。
有意思的是,就在王小川現(xiàn)身的搜狐網絡大廈內,還有另外一個投身大模型創(chuàng)業(yè)的人,美團聯(lián)合創(chuàng)始人王慧文。
“新辦公室第一天,切個蛋糕。”4月6日下午,王慧文一則朋友圈發(fā)出,蛋糕上寫著他創(chuàng)立的公司名“光年之外”,而定位地址正是搜狐網絡大廈。記者了解到,王慧文一經宣布闖入AI大模型領域創(chuàng)業(yè),其項目就獲得VC認購高達2.3億美金,之后美團創(chuàng)始人王興還參與了公司A輪投資,出任董事。
資本青睞之外,王慧文的AI團隊還吸引了搜狗輸入法之父馬占凱加入,后者甚至表示要“與公司共赴AGI通用人工智能的偉大征程”。
在王慧文官宣要做中國版OpenAI的前一天,極客公園的創(chuàng)業(yè)者社區(qū)“前沿社”進行了一場關于通用大模型的線上交流會,張鵬拋出觀點稱,“OpenAI正在展現(xiàn)出一場革命的開篇,這將是互聯(lián)網和移動互聯(lián)網之后,同等量級的產業(yè)變革。”
在與會者中發(fā)起投票時,王小川是第一個投票認同的人,之后他在參加張鵬的組局小聚中,還表達了入局決心。
在參加那場“AGI信徒的聚會”時,李志飛已經投身大模型相關創(chuàng)新研發(fā)很長一段時間。
百度是國內大廠第一個吃螃蟹的角色。3月16日,李彥宏在百度大廈內發(fā)布了文心一言,他當時的表現(xiàn)被外界評價為“略顯緊張”。他說這是百度必須要去做的事。張勇?lián)伟⒗镌浦悄蹸EO后的首度公開亮相,便是迎接這股AI浪潮,4月11日,他對外宣布阿里巴巴的所有產品,在未來都將接入“通義千問”大模型,進行全面改造,同時千行百業(yè)也將基于這一大模型,開發(fā)具備自己行業(yè)能力的“專屬大模型”。
在百度、阿里之后,騰訊也有了大模型方面的動作。4月14日,騰訊發(fā)布面向大模型訓練的新一代HCC(High-PerformanceComputingCluster)高性能計算集群。騰訊稱,基于新一代集群,訓練萬億參數(shù)的AI大模型,時間將縮短至4天。上一代訓練時間為11天。
阿里在大模型方向上的動作,一度被稱之為“CEO工程”。聞風而動的企業(yè)非常多,其中抓起這一“競賽”項目的CEO中,軟件工程專業(yè)出身的周源,讓人多少有些意外。
在張鵬看來,“周源的思想很先進”,因為周源出現(xiàn)在那個“AGI信徒”的聚會中,外界對于知乎是否要闖入大模型領域倍加關注。周源的邏輯是,通過聯(lián)合研發(fā)與戰(zhàn)略投資的方式,與國內大模型團隊面壁智能達成深度合作,4月13日也正式發(fā)布了兩者合作推出的“知海圖AI”中文大模型。
大模型,各有路徑
并不是因為競爭危機,讓李志飛發(fā)出“勸退”論,在他看來,“OpenAI那種不看ROI(投資回報率)而去探索AI天花板的做法,在中國沒土壤,學不來。”甚至,他斷言,在中國聚焦落地的大模型“將會有幾十家而卷出天際,大概率跟上一代AI公司一樣,商業(yè)化異常艱難。”
被李志飛一針見血指出的產業(yè)現(xiàn)實,確實“卷”得厲害。除了大廠,越來越多的中廠也在大模型的垂直應用領域“投石問路”。
4月9日,360集團創(chuàng)始人周鴻祎對外展示了360版的GPT大語言模型,公布了基于這一大模型開發(fā)的人工智能產品矩陣“360智腦”,落地搜索場景并面向企業(yè)用戶開放內測。
周鴻祎稱,未來,360智腦會與瀏覽器、數(shù)字助理、智能營銷等場景應用結合。
4月10日,有贊推出了基于OpenAI的GPT-4大模型驅動開發(fā)的AI產品“加我智能”。
有贊創(chuàng)始人兼CEO白鴉透露,“加我智能”僅開發(fā)了一個月時間,目前只接入了一個廠商的大模型,未來會通過更多市場頭部廠商的大模型合作,訓練它的結果。
“不是所有企業(yè)都需要從頭開始訓練大模型。”阿里云智能CTO周靖人對記者表示,阿里云會為行業(yè)企業(yè)提供一個“一鍵生成”大模型的能力,在授權之下,去理解相關企業(yè)的各種模態(tài)數(shù)據(jù)。
周靖人告訴記者,阿里云希望進一步把技術門檻降低,能讓更多的開發(fā)者參與進來。談及技術路線,他觀察“參賽者們”,“都在取長補短,大家在嘗試不同的方向。”
創(chuàng)新奇智CTO張發(fā)恩最近就被多家制造工廠的負責人催促做研發(fā),“他們對大模型技術躍躍欲試。”4月13日,創(chuàng)新奇智推出了工業(yè)大模型產品“奇智孔明”,并在兩家制造業(yè)公司開啟試驗。
火熱氛圍下,伴隨加入者增多,大模型產品也越來越多。趣丸網絡副總裁莊明浩忍不住詢問:有沒有做國內大模型聚合站的?快記不過來了。隨后有人給他發(fā)來了一個AI工具導航網址,里面聚集了上百個大模型平臺和產品網址。
最近,李志飛總有一種“分裂”狀態(tài):既要思考大模型形而上學的“高貴”,又得接受其應用落地的“庸俗”。在他看來,一些大模型相關的學術問題至今沒有被解決,不過是被大家從實用主義角度規(guī)避或近似解決了,“短期看,確實也沒有更好的辦法了。”
這番話說出第二天,李志飛作為大模型參賽選手之一,也敲定了其AIGC戰(zhàn)略發(fā)布會的時間,4月20日,在這個被戲稱為“大模型月”的階段,他決定“讓行業(yè)更卷”。
不過,李志飛希望勸退那些“因為FOMA而匆忙下場的創(chuàng)業(yè)者(包括大佬)。”記者詢問獲悉,“FOMA”即“FearofMissingOut(錯過恐懼)”的縮寫,特指一種營銷策略,即通過制造“緊迫感”或“錯過”的感覺,來促使人們參與某件事情。
代表著人類先進技術演進的AI行業(yè)不應如此,李志飛認為,大模型領域更需要有決心、熱愛且擅長的人涌進來。
聚焦目前闖入的創(chuàng)業(yè)人,每個人都希望抓住機遇,成為其中的一個弄潮兒。
日前有入局者就國內大模型和OpenAI的差距發(fā)表言論而引發(fā)爭議,一時間,入局者之間打起了口水戰(zhàn)。
李志飛更希望未來同行,能夠和睦共處,“找到自己的定位,為人類實現(xiàn)AGI以及AGI落地的事業(yè),做出自己獨特的貢獻。”
道不同,亦可為謀
《ChatGPT:讀懂人工智能新紀元》一書的作者、前沿科技領域作家陳根用非標準答案,測試了ChatGPT、文心一言和通義千問。在他看來,后兩者相距前者,“還需要一段路要走,目前更不適合去談對標。”
如果一定要打分,陳根覺得,國內兩廠的大模型“在努力跨過及格線”,相較而言,國內已經發(fā)布的大模型都是在ChatGPT帶來的壓力下,快速推出的產品,“技術層面還不足以充分準備”,更大的差距是,ChatGPT已經公開銷售,實現(xiàn)商業(yè)化,反觀國內,陳根直言,“實驗室產品,區(qū)別不言而喻”。
體驗過多個國內產品后,互聯(lián)網觀察人士葛甲覺得,國內互聯(lián)網公司并沒有為此做好準備,都在匆匆上馬。百度就是一個最明顯的例子,文心一言上線已有月余,可產品依舊需要邀請碼才能體驗,未對公眾開放。
4月中旬,國內上線的一系列大模型產品,同樣都在內測,目前沒有一款向公眾開放。宣布接入大模型技術的國內大廠業(yè)務,同樣沒有對外開放。莊明浩認為,網信辦發(fā)布《生成式人工智能服務管理辦法(征求意見稿)》后,國內大模型產品的內測時間可能還會進一步延長。
莊明浩最近體驗了國外大廠嵌入大模型技術的產品,比如微軟的搜索引擎Bing,使用效果超出他的預期。除了傳統(tǒng)搜索界面外,Bing界面右邊有一個對話框,他打開一個英文報告,要求對話框總結報告要點。幾秒鐘后,一個詳實簡潔的中文總結完成了。
即便國內發(fā)展相對緩慢,大模型風潮并未受到影響,多位受訪者透露,6月底之前,國內或將有50種類ChatGPT的產品問世,到年底,國內AIGC戰(zhàn)局中的“參賽者”,甚至可能達到上百家。
一位AI上市公司技術負責人告訴記者,與2個月前相比,ChatGPT技術方面已經不是難題,當前包括GPT3.5在內的大模型技術都已經開源,這意味著創(chuàng)業(yè)公司不需從0起步,也能開發(fā)出自己的大模型。在這個賽道的技術層面,大廠和創(chuàng)業(yè)公司可以處在同一起跑線上。
“可能有的公司有一些技術儲備,但絕大多數(shù)都是想搭上概念股東風,股價漲一漲,就完事了。”葛甲對此也表示理解,因為近期ChatGPT概念股的確表現(xiàn)很好,今年2月至今,昆侖萬維公司漲了近2倍,360公司漲了1倍多,“資本市場上很久沒找到強而有力的題材了,突然來了這么一個,一定要抓住機會。”
在資本逐利性的驅動下,產業(yè)內會萌生一種尋找下一個技術熱點的沖動。陳根印象里,科技行業(yè)的大多數(shù)熱點,往往是從華爾街或硅谷先引發(fā),之后傳導至全球資本市場。
而今的大模型熱潮也不例外,硅谷的一只蝴蝶扇動了翅膀,ChatGPT一經發(fā)布,科技大佬、創(chuàng)業(yè)者爭相擁躉。
“這就如同互聯(lián)網技術的出現(xiàn)一樣,不主動,就會面臨被動淘汰的危機。”陳根表示,誰率先突圍成功,誰就有機會提前建立技術與應用的護城河與生態(tài)圈,進而被市場較早認可。
正因如此,在新技術、資本及企業(yè)求生欲,這三方力量驅動下,各廠涌入大模型,引發(fā)競賽潮。
量子位聯(lián)合創(chuàng)始人李根在AI產業(yè)深入觀察多年,他更認可創(chuàng)新工場董事長兼首席執(zhí)行官李開復對大模型的定位。
3月中旬,李開復也宣布親自籌辦新公司,成為眾多創(chuàng)業(yè)者之一,當時他將“大模型技術變革驅動的浪潮叫做AI2.0。”李根認為,這是準確且有邏輯的判斷,“這波浪潮就是AlphaGo為代表的AI1.0的延續(xù)。”
李根認為,區(qū)別于元宇宙等概念,大模型浪潮背后,會有關鍵技術對原有業(yè)態(tài)的顛覆式變革與創(chuàng)新。
人工智能產業(yè)是一個長坡厚雪的賽道,其中形成的大模型相關技術,既不是ChatGPT誕生時“一蹴而就”,也不是ChatGPT火爆后“一時興起”,李根告訴記者,在此之前,大模型早就已經有近10年左右的蓄力、研究,自2018年以來,業(yè)內包括商湯科技、阿里等有實力的玩家,都開始在這個方向上進行投入、研究。
“GhatGPT火爆后,就像是一把火炬點燃起來。”李根看到,伴隨更多的資源、人、關注度被投注到大模型領域,此前幕后的工作也推向臺前,各大廠也開始用最大的資源加速。
競逐賽,風險防范
在大模型領域,機遇會屬于誰?風險又該如何規(guī)避?“就像是一場千團大戰(zhàn)。”上述AI上市公司技術負責人以當年O2O領域的格局演變?yōu)槔鲝S集體參戰(zhàn),但最終留在市場上拼殺的只有兩極:美團和餓了么,基于此,他預判一年半時間之后,國內或會跑出三五家通用大模型平臺,其余大部分都將不復存在。
李彥宏說,現(xiàn)在國內大廠都看好AI大模型,創(chuàng)業(yè)公司的機會很少,沒有必要再重新發(fā)明一遍輪子。這一言論遭到了王小川的反駁,后者官宣入局大模型競賽后表示,“歷史上每次發(fā)生大的變化,都有創(chuàng)業(yè)公司的機會,并且創(chuàng)業(yè)公司會比大公司跑得快。”
技術不是本質差異化問題,最終考驗的還是商業(yè)化落地能力。莊明浩覺得,行業(yè)走到后期,會和云服務的市場越來越像。“不會一家獨大,而是每家都有自己擅長的領地和機會。”
李根把大模型比作發(fā)電廠,未來重要的是提供電能、輸出電能……對比各家,隨著時間推移,能體現(xiàn)各家特色的能力,完全取決于服務提供者的基因或背景。
中國社會科學院科學技術和社會研究中心主任段偉文認為,沒有一家企業(yè)愿意錯過顛覆式的技術浪潮,尤其是對中國企業(yè)而言,“錯過可能意味著落后、掉隊。”
機遇當頭背后,有一把風險的達摩克利斯之劍懸于頭頂。
在國內AIGC領域一片火熱時,海外對模型訓練的擔憂和反對聲音日漸加劇。
3月29日,特斯拉以及推特的CEO馬斯克,與1000多名人工智能專家及行業(yè)高管簽署聯(lián)名信,呼吁暫停訓練比GPT-4更強大的人工智能系統(tǒng)至少六個月,理由是這種系統(tǒng)對社會和人類構成潛在風險。
“中國一定要迎頭趕上。”在周鴻祎看來,馬斯克等人的請愿并不影響中國發(fā)展自己的大語言模型,一個現(xiàn)實是,“目前中國相關技術水平距離GPT-4至少還有兩年差距”,他認為,現(xiàn)在擔心風險為時尚早。
在大模型影響下,國內一些變化已經發(fā)生。4月12日,藍色光標發(fā)布郵件,決定無期限全面停止創(chuàng)意設計、方案撰寫、文案撰寫、短期雇員四類相關外包支出。此前,藍色光標曾宣布將接入百度文心一言的能力。
更早之前,游戲行業(yè)也有人受到影響。3月2日,心動游戲CEO黃一孟發(fā)文說,和兩個游戲團隊聊天,團隊一把原畫外包團隊給砍了,團隊二把翻譯外包公司給砍了,AI已經開始實際影響很多人的工作崗位了。
上述AI上市公司技術負責人表示,未來會有更多行業(yè)受到影響。ChatGPT面向兩類人,一類是學會使用它的,一類是被它替代的。伴隨ChatGPT的潘多拉魔盒開啟,AI大模型這條路已經不可逆轉。
段偉文認為,從技術上講,安全治理不必采取特別措施,但在技術發(fā)展、探索的過程中,行業(yè)正陷入一個治理的悖論中,尤其涉及內容安全,一旦追求“絕對性”,大模型領域的創(chuàng)新便有了監(jiān)管風險。
作為一種內容生成技術,“不能沒有數(shù)據(jù)作為原料。”段偉文認為,AIGC是一種全新的內容生成方式,目前法律上對內容的侵權界定,早于這種使用形式之前提出,在他看來,國內要大力發(fā)展AIGC,或需重新界定內容使用的邊界。
李根感慨,現(xiàn)在的信息技術文明,雖是人工智能浪潮里的一個小浪花,激起的卻是千行百業(yè)甚至普羅大眾對AI的新一輪認知。