自美國OpenAI公司的ChatGPT引燃全球競賽熱潮后,人工智能大模型經歷了一年半“技術狂飆”。如今,大模型價格戰又帶來了商用競爭的提速。OpenAI公司近幾個月多次降價,字節、阿里、百度、騰訊等國內多家大模型廠商近一個月來也競相降價。
促進應用
5月21日,阿里云旗下9款大模型全面降價,其中,Qwen—Long API輸入價格從0.02元/千tokens降至0.0005元/千tokens,直降超97%。據估算,降價后1元錢約可買到300萬字符,相當于5本《新華字典》的文字量。
“阿里云大模型降價,是希望讓更多的使用者和中小企業用上大模型,加速AI應用市場的提前爆發。我們有底氣降價,主要得益于公共云技術紅利和規模效應帶來的成本和性能優勢。”阿里云資深專家朱迅垚告訴經濟日報記者。
目前,百度智能云千帆大模型平臺共計有7款模型免費開放。百度智能云AI與大模型平臺總經理忻舟表示:“大模型仍處于市場培育階段。企業只有在認識到大模型帶來的巨大價值后,才能將其應用于更大規模、更復雜的業務場景中。生態繁榮是大模型行業發展的前提。”
忻舟表示,百度有充分的資源和技術積累,在降價政策發布前內部已制定專項保障策略,以確保大量客戶涌入時的使用體驗。
從實際數據看,降價確實可以提高大模型獲客量。
百度的兩款主力大模型ERNIE Speed和ERNIE Lite于5月21日宣布免費開放后,兩周時間其日調用量就漲了10倍。阿里云宣布降價后,百煉平臺上通義千問調用大幅提升,表明很多企業應用大模型的意愿增強。
大浪淘沙
2023年國產大模型就已開啟“百模大戰”,如今國產大模型數量超過200個,其中10億參數規模以上的大模型超100個。業內專家普遍認為,本輪降價潮會加速大模型洗牌。
“國內通用大模型產品高度同質化,無法通過差異化功能來吸引更多消費者,最終造成了本次大范圍降價。”哈爾濱工業大學商學院院長馬濤教授認為,在大模型技術底層上,國內知名的幾個大模型產品均參考了經典的Transformer等架構,技術路線上存在部分重合;在大模型數據層面上,因為用于大模型訓練或推理的中文語料庫來源單一、動態更新頻率不高,導致各通用大模型的訓練數據高度相似。
經過2023年的“百模大戰”之后,全國在網信辦登記備案的生成式人工智能服務數量已連續多月保持在117家不變。馬濤估計,未來我國通用類大模型產品還將經歷一輪大浪淘沙,常見常用的知名大模型數量將最終穩定在10個左右。
誰能成為勝出者?儲備充足的中國互聯網巨頭們頗具信心。
迎難而上
當前,全球大模型技術競爭異常激烈,各國都在快速迭代技術。從全球已發布的大模型地域分布看,中國和美國大幅領先,超過全球總數的80%,中國已形成了緊跟世界前沿的大模型技術群。
與引領這輪潮流的美國相比,中國在大模型產品和服務上還有哪些不足?
馬濤表示,算力供給上的差距值得關注。近期,英偉達宣布搭載最新架構Blackwell的GPU芯片正式投產,這標志著目前在全球范圍內性能仍表現非常突出的H100計算芯片已經成為“上一代”,并與我國內地存量較多的英偉達A100芯片和華為昇騰910B拉開距離,形成了代際差距。
面對客戶的芯片焦慮,百度采取了“兼容”策略。忻舟表示,百度百舸·AI異構計算平臺可以實現一云多芯,對國內外主流AI芯片兼容,無需為每個芯片平臺重新設計和優化模型,幫助用戶擺脫單一芯片依賴,節省大量時間和資源。
“中國有超大市場規模和全產業鏈優勢,有巨大的訓練專業知識數據開發潛力,以及海量的大模型專業應用場景和垂直領域落地需求,這是其他國家很難具備的條件,為我國大模型加快技術迭代和實際應用提供了寶貴的發展機遇。”馬濤說。
朱迅垚表示,對大模型未來應用的增長非常有信心,同時也相信中國在人工智能領域,尤其是AI原生應用上,一定會走在世界前列。