文|鄭亦久
上半年還沒過去,第一個被大公司收購的國內(nèi)AI大模型創(chuàng)業(yè)公司就出現(xiàn)了——光年之外。
【資料圖】
創(chuàng)始人王慧文因為生病住院而無法繼續(xù)帶領(lǐng)創(chuàng)業(yè)公司繼續(xù)向前,無疑是一場不幸的意外。最終由早期投資人王興和美團全權(quán)接管這家原本的明星AI大模型創(chuàng)業(yè)公司,似乎又在意料之中。
美團官方給出的說法也非常直接:“收購有助于加強美團在AI行業(yè)的競爭力”。
不知道美團的本地生活業(yè)務(wù)有多少需要依靠尚未落地的AI大模型來提高效率,但對于互聯(lián)網(wǎng)巨頭而言,AI大模型業(yè)務(wù)在目前始終都是證明自己依然保持著科技敏感度與先進性的重要一環(huán),有好過無。
圖源:網(wǎng)絡(luò)
事實上,在光年之外啟動之后,國內(nèi)的AI大模型創(chuàng)業(yè)也一度成為了紅海。
除了巨頭扎堆入場之外,王小川、李開復(fù)、閆俊杰等知名企業(yè)家也都加入了這場競賽,根據(jù)騰訊科技的統(tǒng)計,超過十家AI大模型創(chuàng)業(yè)公司都已經(jīng)入場,既要爭奪人才,又要搶融資渠道,當然還要持續(xù)考慮算力的問題。
以上這些都還只是有著各種光環(huán)加持的明星創(chuàng)業(yè)公司,根據(jù)另一份統(tǒng)計,今年以來國內(nèi)官宣做大模型的公司數(shù)量已達到了70多家,其中不乏對標OpenAI的初創(chuàng)者和巨頭公司。
這種極致內(nèi)卷的環(huán)境顯然已經(jīng)許久未見。
01想好靠山了嗎?
不過一個很吊詭的事實是,光年之外作為這一波大模型浪潮融資金額最多、估值最高的公司之一,從2月高調(diào)宣布入局到現(xiàn)在,始終處在媒體關(guān)注的前沿,但直到目前也沒有官宣任何大模型或者應(yīng)用產(chǎn)品,外界更多的關(guān)注依然還在組局人王慧文身上。
反倒是四月才正式官宣起步的百川智能,在6月15日發(fā)布了首個70億參數(shù)量的中英文預(yù)訓(xùn)練大模型——baichuan-7B。
4月下旬,出門問問宣布推出AI大模型“序列猴子”后,緊接著就向港交所申請了上市,即便其大模型在招股書中并沒有任何商業(yè)化進展。縱觀上半年的國內(nèi)大模型賽道,一個非常典型的現(xiàn)象便是大公司依然具有相當巨大的身位優(yōu)勢。
不論是百度還是阿里,都在很快的時間里既拿出了訓(xùn)練參數(shù)不低的大模型,也在第一時間做出了面向消費市場的文心一言、通義千問等通用類產(chǎn)品。光是這一點其實就不難看出,在這個賽道上,從零開始的創(chuàng)業(yè)公司與手握大把資源巨頭們的差距。
OpenAI那個小而美團隊的成功,讓人看到了一種可能。但硬幣的另一面是,OpenAI背后其實有著微軟全方位的支持和協(xié)作,不論是數(shù)據(jù)、算力、云服務(wù),全世界都很難再找到比微軟實力更雄厚的提供方,更不用說動輒百億美元的資金支持。
因此,OpenAI絕非典型意義上的創(chuàng)業(yè)公司,更像是早早就被巨頭看中的技術(shù)孵化器。
當國內(nèi)的大模型創(chuàng)業(yè)公司表示自己要對標OpenAI時,它們是否確定自己已經(jīng)找到了一個能夠為其解決大量資源問題的靠山?
02無法實現(xiàn)算力競爭,那談什么?
除了人才和資金之外,一個更現(xiàn)實的問題則是訓(xùn)練算力,這幾乎直接決定了AI大模型的效果。
算力二字對應(yīng)到現(xiàn)實中等同于擁有的英偉達商用數(shù)據(jù)中心GPU的數(shù)量,在AI大模型的訓(xùn)練與參數(shù)調(diào)教上,現(xiàn)在英偉達旗下A100、H100及其中國定制減配版A800、H800幾乎沒有現(xiàn)成的替代品,不僅僅是國產(chǎn)替代沒有,即便是AMD、英特爾也拿不出同等檔次的硬件。
更不用說,還有英偉達在CUDA軟件生態(tài)上長期以來建立的護城河,都使得真正想要在短時間內(nèi)實現(xiàn)大模型訓(xùn)練的創(chuàng)業(yè)公司,無法選擇其他產(chǎn)品。這也是英偉達過去一個月里股價狂飆的原因,別無分店的“賣鏟子”實在太掙錢了。
問題在于,不論是A100、H100還是A800、H800,并不是有錢就能買到,在這波大模型浪潮開啟之后,GPU的爭奪早就白熱化。
根據(jù)《晚點 LatePost》之前的報道,今年春節(jié)后,擁有云計算業(yè)務(wù)的中國各互聯(lián)網(wǎng)大公司都向英偉達下了大單。
字節(jié)今年向英偉達訂購了超過10億美元的GPU。而一個真正能夠面向消費市場的AI大模型以及應(yīng)用,需要多少算力支持呢?
技術(shù)咨詢機構(gòu) TrendForce在6月發(fā)布報告稱,OpenAI需要約3萬塊A100來持續(xù)優(yōu)化和商業(yè)化ChatGPT,算力不夠也成為GPT-4遲遲無法大規(guī)模開放使用的瓶頸。
做一個簡單的計算不難看出,國內(nèi)大模型創(chuàng)業(yè)公司在第一輪融到的錢,甚至很難獲得太多算力層面的競爭力。
同時,最近的一則消息則讓情況雪上加霜,根據(jù)《華爾街日報》的消息,美國商務(wù)部正考慮的新限制將禁止在沒有許可證的情況下銷售A800芯片,相關(guān)規(guī)定可能在下個月出臺。
這意味著即便是性能閹割的A800、H800,以后可能也是有價無市。
向中國出售的A100(“閹割版”A800)與A800對比甚至包括直接向中國AI公司出租云服務(wù)進行大模型訓(xùn)練的規(guī)避方式也被納入了限制的范圍,這一局面只會讓國內(nèi)的AI大模型創(chuàng)業(yè)在本就收益不明的情況,額外增加大量成本。
不論是通過租用國內(nèi)現(xiàn)有算力維持,還是尋找更低效的國產(chǎn)替代,都將會直接影響大模型訓(xùn)練和通用產(chǎn)品進度,在幾乎以天進化的AI創(chuàng)業(yè)賽道里,時間不等人。
從這個角度來看,光年之外率先被美團收購或許不是什么壞事,畢竟國內(nèi)的互聯(lián)網(wǎng)巨頭就這么幾個,接下來等著被收購的AI大模型創(chuàng)業(yè)公司卻可能遍地都是,這條賽道留給小玩家的機會幾乎聊勝于無。
原文標題?:?大模型們別擠了,沒啥機會了
標簽:
Copyright @ 2008-2020 www.g888726.cn 華夏財富網(wǎng) 版權(quán)所有 聯(lián)系郵箱:3960 29142@qq.com