大模型時代,算力是底座。北京市經(jīng)信局黨組書記、局長姜廣智在日前舉辦的2023全球數(shù)字經(jīng)濟大會人工智能高峰論壇(以下簡稱“人工智能論壇”)上表示,北京正籌劃出臺“算力券”,支持基于大模型落地應(yīng)用場景的中小企業(yè)獲取多元化、低成本的優(yōu)質(zhì)算力。眼下,大模型正推動智能算力需求爆發(fā)式增長。但智能算力很貴,大多數(shù)中小企業(yè)目前還是依賴于購買或租用算力,其成本也并不低。這成為了中小企業(yè)狂奔大模型賽道的痛點和堵點。而北京“算力券”的推出,將有望打通這一堵點,為產(chǎn)業(yè)打開全新的想象空間。
市場價格的5、6折左右
就北京籌劃出臺“算力券”政策,北京市經(jīng)信局相關(guān)負責(zé)人在接受北京商報記者采訪時介紹,目前“算力券”政策正在研究中,具體細節(jié)還未敲定。不過,可以明確的是,“算力券”中算力的供應(yīng)方來自北京經(jīng)信局正在征集的“北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計劃”成員。
【資料圖】
北京商報記者在北京市經(jīng)信局官網(wǎng)查詢發(fā)現(xiàn),7月3日,北京市經(jīng)信局已經(jīng)發(fā)布了第二批伙伴名單,63家伙伴企業(yè)中,算力伙伴10家,分別為北京百度網(wǎng)訊科技有限公司、北京世紀互聯(lián)寬帶數(shù)據(jù)中心有限公司、中國電信股份有限公司北京分公司、中國移動通信集團北京有限公司、北京昇騰創(chuàng)新人工智能科技中心有限公司、京東科技信息技術(shù)有限公司、北京紅山信息科技研究院有限公司、企商在線(北京)數(shù)據(jù)技術(shù)股份有限公司、北京神州數(shù)碼云科信息技術(shù)有限公司、北京金山云網(wǎng)絡(luò)技術(shù)有限公司。
此前發(fā)布的第一批伙伴成員中,共有算力伙伴2家,分別為阿里云計算有限公司和北京超級云計算中心。
關(guān)于算力券的具體價格,前述北京經(jīng)信局相關(guān)負責(zé)人表示正在研究中。不過,他也指出,目前算力伙伴提供的算力價格尚未公布,但基本已經(jīng)是市場價格的5、6折左右。
算力租賃的市場價格是怎樣的?提供算力服務(wù)的北京昇騰創(chuàng)新人工智能科技中心有限公司CTO楊光告訴北京商報記者,目前市場價格約為15-20元/卡/時,1P大約是3-4張卡。
“‘卡’指單芯片,目前算力價格確實也不是很統(tǒng)一。但這個價格對于中小企業(yè)來說還是比較昂貴的,所以急需有普惠算力支持企業(yè)自身發(fā)展。”楊光舉例,一個常規(guī)的AIGC項目租用的算力規(guī)模涉及到的“點”比較多,租用算力的費用并不太容易計算。“但是有公開數(shù)據(jù)顯示,訓(xùn)練一個GPT-3需要花費460萬美元”。
北京商報記者經(jīng)查詢了解到,國際算力設(shè)備龍頭企業(yè)英偉達也計劃開放DGX Cloud實例,企業(yè)可以“云租賃”的形式按月租用DGX Cloud集群,價格為每實例3.7萬美元/月起。DGX Cloud能為AI超級計算提供完整的解決方案,借助該集群,企業(yè)用戶可擴展大型多節(jié)點訓(xùn)練工作負載的開發(fā),無須等待需求量通常很大的加速計算資源。
“出臺‘算力券’政策,主要是為了解決中小大模型企業(yè)算力成本問題,支持基于落地應(yīng)用場景的中小企業(yè)獲取多元化、低成本的優(yōu)質(zhì)算力?!鼻笆霰本┙?jīng)信局相關(guān)負責(zé)人表示,“如果企業(yè)有需要,我們很愿意提供算力供需對接的平臺?!?/p>
需求暴增推高算力價格
本次北京經(jīng)信局籌劃“算力券”的背后,是呈現(xiàn)爆發(fā)式增長的智能算力需求。
隨著ChatGPT在今年的爆火,各大科技企業(yè)都開始逐鹿細分行業(yè)大模型,包括但不限于交通、醫(yī)療、數(shù)字政務(wù)等細分領(lǐng)域。根據(jù)北京市經(jīng)信局在人工智能論壇上披露的數(shù)據(jù),我國目前已有80余個大模型公開發(fā)布,其中北京約占一半。“但除了大型互聯(lián)網(wǎng)企業(yè)、AI龍頭企業(yè)具有較多的GPU算力芯片儲備外,中小企業(yè)在發(fā)展AI模型、應(yīng)用過程中,遭遇算力瓶頸?!?/p>
一家科技企業(yè)負責(zé)人王楠告訴北京商報記者,他們公司主要通過向大廠購買算力來解決算力需求,而ChatGPT在今年突然崛起,許多大廠的GPU算力芯片價格都漲了不少,一段時間里甚至高價也很難買到。
算力價格漲了多少,從英偉達GPU芯片的交付價格即可一窺。以英偉達GPU芯片A100為例,該芯片價格從去年12月開始上漲,截至今年4月上半月,其5個月價格累計漲幅達到37.5%;同期A800價格累計漲幅達20%。同時,英偉達GPU交貨周期也被拉長,之前拿貨周期大約為一個月,現(xiàn)在基本都需要三個月或更長。甚至,部分新訂單“可能要到12月才能交付”。
而算力的需求究竟有多大?資料顯示,OpenAI為了訓(xùn)練ChatGPT,構(gòu)建了由近3萬張英偉達V100顯卡組成的龐大算力集群,GPT-4更是達到了100萬億的參數(shù)規(guī)模,其對應(yīng)的算力需求同比大幅增加。如今國內(nèi)多家企業(yè)宣布投身大模型的公司,如果再疊加計算上圍繞大模型的人工智能生態(tài)和由此產(chǎn)生的用于推理的算力需求,未來的算力缺口將更加驚人。
“總體上看,我國的算力需求從靜態(tài)來說目前‘基本’能夠?qū)崿F(xiàn)算力供需之間的平衡,但是從動態(tài)角度來說,未來越來越多的行業(yè)、企業(yè)要運用大模型、運用人工智能多模態(tài),算力在未來存在非常大的缺口。”北京社科院研究員、中國人民大學(xué)智能社會治理研究中心研究員王鵬在接受北京商報記者采訪時表示。
加大算力供給是根本
龐大的算力需求為AI算力產(chǎn)業(yè)帶來了廣闊的市場空間。來自IDC的數(shù)據(jù)與預(yù)測顯示,2021年中國智能算力規(guī)模達到155.2EFLOPS(每秒一百億億次的浮點運算),并在之后的幾年始終保持穩(wěn)健增長態(tài)勢,預(yù)計到2026年將突破進入每秒十萬億億次浮點計算級別,智能算力實現(xiàn)1271.4EFLOPS的龐大規(guī)模,2021-2026年期間,預(yù)計年復(fù)合增長率達到52.3%。
各科技巨頭在算力上的投入也十分明顯。在百度2023年Q1財報中,其AI的內(nèi)容貫穿始終。騰訊發(fā)布的2023年Q1財報中,在數(shù)實經(jīng)濟、廣告和游戲三大核心業(yè)務(wù)集體發(fā)力下,騰訊重回增長曲線。值得一提的是,關(guān)于算力和人工智能的部分,同樣占據(jù)了財報很大的篇幅。
然而擺在國內(nèi)廠商面前的另一道難題則是,最關(guān)鍵的AI芯片GPU被英偉達壟斷,市場占有率達到90%以上。而一張40G顯存的A100芯片,在京東平臺上所標售價就達6.25萬元。因此,A100芯片也一直被廣大科技發(fā)燒友戲稱為“小金磚”。
這也導(dǎo)致了自建智能算力平臺成本極高。今5月,上海張江一家數(shù)據(jù)公司的相關(guān)負責(zé)人在接受媒體采訪時曾表示,“一臺包含8張A800的DGX超算,現(xiàn)在市面上的價格可能要到230萬元到250萬元之間,價格還在持續(xù)上漲”。
算力成本高,成為了制約中小企業(yè)的一道坎,而算力租賃或許可以成為目前解題的突破口。在楊光看來,采用租賃方式使用算力能夠彈性提供算力,滿足不同模型訓(xùn)練所需要的算力需求。
“由企業(yè)自身建設(shè)、運維算力設(shè)備所需的投入非常高,并不是一般企業(yè)所能承受的??梢詤⒖嫉慕鉀Q辦法,首先是統(tǒng)一建設(shè)集中化的算力中心,統(tǒng)一分配,部分頭部企業(yè)已經(jīng)開始了這方面的布局。其次便是算力租賃,通過政府搭線,給企業(yè)提供優(yōu)質(zhì)的、相對廉價的算力,降低企業(yè)成本。”王鵬說道。
天使投資人、資深人工智能專家郭濤從通用算力和智能算力的細分角度進行了分析,他表示,當前部分地區(qū)已出現(xiàn)通用算力過?,F(xiàn)象,算力租賃可以有效解決算力供需對接問題。不過,當前大模型建設(shè)更需要的是智能算力,智能算力受到智能計算中心建設(shè)滯后和高端芯片難以獲取等方面影響,市場供給不足,對人工智能相關(guān)產(chǎn)業(yè)的規(guī)?;⑵栈莼涞禺a(chǎn)生負面影響。
“算力租賃雖然可以在一定程度上平衡算力需求,但并不能從根本上解決算力稀缺問題。未來,隨著大批智能計算中心項目建設(shè)運營,有望從根本上解決智能算力瓶頸問題。”郭濤說。
“過去幾年以通用算力為主,智能時代尤其ChatGPT時代則以智能算力為主?!睏罟庵赋觯鉀Q大模型企業(yè)的成本還是要加大智能算力基礎(chǔ)設(shè)施建設(shè),“北京也正在先行先試建設(shè)多個公共智算平臺,除了我們位于門頭溝的北京昇騰人工智能計算中心外,海淀正在規(guī)劃北京人工智能公共算力平臺,朝陽也在規(guī)劃北京經(jīng)濟算力中心等?!?/p>
關(guān)鍵詞:
責(zé)任編輯:Rex_05