大模型時代,算力是底座。北京市經信局黨組書記、局長姜廣智在日前舉辦的2023全球數(shù)字經濟大會人工智能高峰論壇(以下簡稱“人工智能論壇”)上表示,北京正籌劃出臺“算力券”,支持基于大模型落地應用場景的中小企業(yè)獲取多元化、低成本優(yōu)質算力。
眼下,大模型正推動智能算力需求爆發(fā)式增長。但智能算力很貴,除了互聯(lián)網大廠等極個別企業(yè)有能力自建智算平臺外,大多數(shù)中小企業(yè)目前還是依賴于購買或租用算力,其成本也并不低。這成為了中小企業(yè)狂奔大模型賽道的痛點和堵點。而北京“算力券”的推出,將有望打通這一堵點,為產業(yè)打開全新的想象空間。
算力有望打五折
(相關資料圖)
就北京籌劃出臺“算力券”政策,北京市經信局相關負責人在接受北京商報記者采訪時介紹,目前“算力券”政策正在研究中,具體細節(jié)還未敲定。不過,可以明確的是,“算力券”中算力的供應方來自北京經信局正在征集的“北京市通用人工智能產業(yè)創(chuàng)新伙伴計劃”成員。
北京商報記者在北京市經信局官網查詢發(fā)現(xiàn),7月3日,北京市經信局已經發(fā)布了第二批伙伴名單,63家伙伴企業(yè)中,算力伙伴10家,分別為北京百度網訊科技有限公司、北京世紀互聯(lián)寬帶數(shù)據(jù)中心有限公司、中國電信股份有限公司北京分公司、中國移動通信集團北京有限公司、北京昇騰創(chuàng)新人工智能科技中心有限公司、京東科技信息技術有限公司、北京紅山信息科技研究院有限公司、企商在線(北京)數(shù)據(jù)技術股份有限公司、北京神州數(shù)碼云科信息技術有限公司、北京金山云網絡技術有限公司。
此前發(fā)布的第一批伙伴成員中,共有算力伙伴2家,分別為阿里云計算有限公司和北京超級云計算中心。
關于算力券的具體價格,前述北京經信局相關負責人表示正在研究中。不過,他也指出,目前算力伙伴提供的算力價格尚未公布,但基本已經是市場價格的五、六折左右。
算力租賃的市場價格是怎樣的?提供算力服務的北京昇騰創(chuàng)新人工智能科技中心有限公司CTO楊光告訴北京商報記者,目前市場價格約為15-20元/卡/時,1P大約是3-4張卡?!啊ā竼涡酒?,目前算力價格確實也不是很統(tǒng)一。但這個價格對于中小企業(yè)來說還是比較昂貴的,所以急需有普惠算力支持企業(yè)發(fā)展?!?/p>
楊光舉例,一個常規(guī)的AIGC項目租用的算力規(guī)模涉及到的“點”比較多,費用并不太容易進行統(tǒng)一計算,“但是有公開數(shù)據(jù)顯示,訓練一個GPT-3需要花費460萬美元”。
此前有消息稱,國際算力設備龍頭企業(yè)英偉達也計劃開放DGX Cloud實例,企業(yè)可以“云租賃”的形式按月租用DGX Cloud集群,價格為每實例3.7萬美元/月起。DGX Cloud能為AI超級計算提供完整的解決方案,借助該集群,企業(yè)用戶可擴展大型多節(jié)點訓練工作負載的開發(fā),無須等待需求量通常很大的加速計算資源。
“出臺‘算力券’政策,主要是為了解決中小大模型企業(yè)算力成本問題,支持基于落地應用場景的中小企業(yè)獲取多元化、低成本優(yōu)質算力。”前述北京經信局相關負責人表示,“如果企業(yè)有需要,我們很愿意提供算力供需對接的平臺。”
需求暴增推高算力價格
本次北京經信局籌劃“算力券”的背后,是呈現(xiàn)爆發(fā)式增長的智能算力需求。
隨著ChatGPT在今年的爆火,各大科技企業(yè)都開始逐鹿細分行業(yè)大模型,包括但不限于交通、醫(yī)療、數(shù)字政務等細分領域。根據(jù)北京市經信局在人工智能論壇上披露的數(shù)據(jù),我國目前已有80余個大模型公開發(fā)布,其中北京約占一半?!暗舜笮突ヂ?lián)網企業(yè)、AI龍頭企業(yè)具有較多的GPU算力芯片儲備外,中小企業(yè)在發(fā)展AI模型、應用過程中,遭遇算力瓶頸?!?/p>
一家科技企業(yè)負責人王楠告訴北京商報記者,他們公司主要通過向大廠購買算力來解決算力需求,而ChatGPT在今年突然崛起,許多大廠的GPU算力芯片價格都漲了不少,一段時間里甚至高價也很難買到。
算力成本漲了多少,從英偉達GPU芯片的交付價格即可一窺。目前,AI算力中最關鍵的芯片GPU被英偉達壟斷,市場占有率達到90%以上。以英偉達GPU芯片A100為例,該芯片價格從去年12月開始上漲,截至今年4月上半月,其5個月價格累計漲幅達到37.5%;同期A800價格累計漲幅達20%。同時,英偉達GPU交貨周期也被拉長,之前拿貨周期大約為一個月,現(xiàn)在基本都需要三個月或更長。甚至,部分新訂單“可能要到12月才能交付”。
北京商報記者查詢后了解到,一張40G顯存的A100芯片,在電商平臺上所標售價達6.25萬元。因此,A100芯片也一直被廣大科技發(fā)燒友戲稱為“小金磚”。
這也導致了自建智能算力平臺成本極高。今年5月,上海張江一家數(shù)據(jù)公司的相關負責人在接受媒體采訪時曾表示,“一臺包含8張A800的DGX超算,現(xiàn)在市面上的價格可能要到230萬元到250萬元之間,價格還在持續(xù)上漲?!?/p>
而算力的需求究竟有多大?資料顯示,OpenAI為了訓練ChatGPT,構建了由近3萬張英偉達V100顯卡組成的龐大算力集群,GPT-4更是達到了100萬億的參數(shù)規(guī)模,其對應的算力需求同比大幅增加。如今國內多家企業(yè)宣布投身大模型的公司,如果再疊加計算上圍繞大模型的人工智能生態(tài)和由此產生的用于推理的算力需求,未來的算力缺口將更加驚人。
“總體上看,我國的算力需求從靜態(tài)來說目前‘基本’能夠實現(xiàn)算力供需之間的平衡,但是從動態(tài)角度來說,未來越來越多的行業(yè)、企業(yè)要運用大模型、運用人工智能多模態(tài),算力在未來存在非常大的缺口?!北本┥缈圃貉芯繂T、中國人民大學智能社會治理研究中心研究員王鵬在接受北京商報記者采訪時表示。
加大算力供給是根本
龐大的算力需求為AI算力產業(yè)帶來了廣闊的市場空間。來自IDC的數(shù)據(jù)與預測顯示,2021年中國智能算力規(guī)模達到155.2EFLOPS(每秒一百億億次的浮點運算)并在之后的幾年始終保持穩(wěn)健增長態(tài)勢,預計到2026年將突破進入每秒十萬億億次浮點計算級別,智能算力實現(xiàn)1271.4EFLOPS的龐大規(guī)模,2021-2026年期間,預計年復合增長率達到52.3%。
各科技巨頭在算力上的投入也十分明顯。在百度2023年Q1財報中,其AI的內容貫穿始終。騰訊發(fā)布的2023年Q1財報中,在數(shù)實經濟、廣告和游戲三大核心業(yè)務集體發(fā)力下,騰訊重回增長曲線。值得一提的是,關于算力和人工智能的部分,同樣占據(jù)了財報很大的篇幅。
但算力成本高,成為了制約企業(yè)的一道坎,特別是對中小企業(yè)而言。而算力租賃或許可以成為目前解題的突破口。在楊光看來,企業(yè)采用租賃方式使用算力能夠彈性提供算力,滿足不同模型訓練所需要的算力需求。
“由企業(yè)自身建設、運維算力設備所需的投入非常高,并不是一般企業(yè)所能承受的??梢詤⒖嫉慕鉀Q辦法,首先是統(tǒng)一建設集中化的算力中心,統(tǒng)一分配,部分頭部企業(yè)已經開始了這方面的布局。其次便是算力租賃,通過政府搭線,給企業(yè)提供優(yōu)質的、相對廉價的算力,降低企業(yè)成本?!蓖貔i說道。
天使投資人、資深人工智能專家郭濤從通用算力和智能算力的細分角度進行了分析,他表示,當前部分地區(qū)已出現(xiàn)通用算力過剩現(xiàn)象,算力租賃可以有效解決算力供需對接問題。不過,當前大模型建設所更需要的是智能算力,智能算力受到智能計算中心建設滯后和高端芯片難以獲取等方面影響,市場供給不足,對人工智能相關產業(yè)的規(guī)模化、普惠化落地產生負面影響。
“算力租賃雖然可以在一定程度上平衡算力需求,但并不能從根本上解決算力稀缺問題。未來,隨著大批智能計算中心項目建設運營,有望從根本上解決智能算力瓶頸問題?!惫鶟f。
“過去幾年以通用算力為主,智能時代尤其ChatGPT時代則以智能算力為主?!睏罟庵赋?,解決大模型企業(yè)的成本還是要加大智能算力基礎設施建設,“北京也正在先行先試建設多個公共智算平臺,除了我們位于門頭溝的北京昇騰人工智能計算中心外,海淀正在規(guī)劃北京人工智能公共算力平臺,朝陽也在規(guī)劃北京經濟算力中心等。”
(文章來源:北京商報)
關鍵詞: