米樂 M6米樂 M6激烈的“百模大戰(zhàn)”伴隨著科技同行對GPU算力的哄搶,大模型競爭的焦點竟不在大模型本身,而在算力。
積極建設算力基礎設施確是一條看得見也做得到的突破路徑,這引爆了從資本對算力概念股的熱情。算力服務“第一股”北京并行科技股份有限公司(證券簡稱:并行科技,證券代碼:839493.BJ) 去年11月于北交所上市,作為國內領先的超算云服務和算力運營服務提供商,并行科技對算力這一路徑看得更早、更清晰。
算力短缺的解法是什么?算力調度的難點在哪?AI大模型的計算成本如此高,有哪些方法能夠降低成本?國產算力如何加速國產替代?
算力豹邀請并行科技董事長、總經理陳健博士接受專訪,在近一個小時的交談中,細致拆解上述問題。
為獲得AI大模型算力的“及時雨”,人們竭力榨干了GPU的每一滴算力,事實上,超級計算機也可以用于支持大模型訓練。本(4)月初,微軟和OpenAI的“Stargate(星際之門)”秘密計劃被The Information曝光,雙方準備花費1000億美金建設超級計算機,在陳健博士看來,這一舉動是在向全世界宣布:大模型訓練的底層是超級計算機。
誠然,大模型從訓練到推理的技術鏈條都依賴于云計算中心,國內外不少科技巨頭都橫跨了云基礎設施與大模型,盡可能地騰挪手中算力資源以滿足大模型訓練剛需。在陳健博士看來,超大規(guī)模的訓練必須使用超級計算機,他還指出一個現(xiàn)象,云計算及其服務商正在積極學習超級計算機的邏輯、超算業(yè)務的運營方式,對計算中心在進行改造。
“大模型訓練需要的是一個明確的超級計算機,它的調度也是有利于推理的。”陳健博士說道。具體來說,超級計算的服務器之間的計算帶寬配比更大,是云計算的計算網絡帶寬的數(shù)十倍,數(shù)據傳輸效率要求更高。在應對計算挑戰(zhàn)方面,超算架構通過高速互聯(lián)網絡把GPU服務器緊耦合在一起,以并行計算技術實現(xiàn)單一大模型訓練應用的高性能計算(HPC);而云計算架構主要對海量并發(fā)任務實現(xiàn)高通量計算(HTC),并不適合處理單一大規(guī)模計算任務。
伴隨著我國超算的穩(wěn)健發(fā)展,并行科技深耕超算算力服務十余年,并在大模型到來的這一刻交互出新的弧光。并行科技從2015年開始從事超級計算機大集群調度,從超算算力開始展開算力服務的版圖,目前旗下超算云已成為中國科研用戶首選的計算資源平臺。根據弗若斯特沙利文,從收入規(guī)模角度,2021年并行科技通用超算云收入約1.3億元,對應市場份額為20.3%,行業(yè)排名第一。
算力服務是一種經營,陳健博士談道,算力服務即將算力資源整包下來再尋找用戶進行匹配。他透露,公司算力服務當前在總業(yè)務所占比例越來越大,去年公司收入接近5億。
以“算力網絡”為依托,以利用率為核心,并行科技的主要服務包括并行通用超算云、并行行業(yè)云、并行AI云以及設計仿真云等。根據用戶需求,并行科技如今業(yè)務主要朝兩個方向著力,一是聚集已采購的算力資源來服務用戶,據了解,并行科技現(xiàn)已與廣州、無錫、長沙、濟南和深圳等地的各類超算中心建立穩(wěn)定合作關系;二是在當前國產智算算力陸續(xù)上線的背景下,服務國產GPU所需的智算算力。
目前,并行科技擁有約65萬個超算云計算核心,具備成熟且強大的技術服務能力,與阿里云、華為云等頭部企業(yè)處在同一梯隊。陳健博士強調,此處提到的“云計算”指得是超算/智算的算力云服務,其底層架構是超級計算機,而不是傳統(tǒng)認識中的云計算虛擬機。
大模型的加速迭代與應用落地,推動了智能算力需求的激增,大模型的鏈式反應也傳導到智算中心。
對于智算中心,計算能力是大模型對其的基本要求,運行穩(wěn)定和高性能是核心需求。陳健博士分析說,超算算力和智算算力的基礎架構一致,涉及的超級計算只需從使用CPU轉變成使用GPU。無論是計算架構的相似性,還是大模型對于計算過程的性能要求,都契合了并行科技于2020年左右開啟的AI云業(yè)務。
米樂M6 M6米樂
陳健博士提到“性能(Performance)是一切的根源”,這一主旨貫穿著并行科技的發(fā)展歷程。并行科技起家于性能優(yōu)化業(yè)務,在2012年推出應用運行特征分析軟件,解決超級計算機跑大型程序時的核心性能問題。彼時,并行科技在行業(yè)里的形象總是和“技術高端”、“大規(guī)模的超級計算機”等詞條關聯(lián)著。而對于更廣大的普通用戶,并行科技推出在線運維業(yè)務,幫助他們完成了全自動性能分析程序故障。
目光看向業(yè)界,2024年以來,一批大型智算中心項目建成運營,如此快的建設速度不禁讓人擔憂“智算中心想好怎么賺錢了嗎”?陳健博士認為,“好用”的智算算力平臺才能給智算中心帶來實際價值,而關鍵不僅在產品端,也在用戶端。具體來說,市場上專注于算力基礎設施建設的主要為IDC數(shù)據中心供應商和云服務供應商,他們對維護軟硬件工具和數(shù)據、優(yōu)化國產GPU芯片等工作相對陌生,對于并行科技來說,完成這些任務僅需將原有的業(yè)務平移。
陳健博士透露,大模型市場給并行科技的響應非常好,去年公司的AI云業(yè)務增長2.6倍,在成本被原有CPU業(yè)務覆蓋的情況下,公司提供給用戶更有性價比的產品。以國內某知名大模型企業(yè)為例,該企業(yè)在2023年因英偉達GPU嚴重缺貨, 使用500余張英偉達A100 SXM版GPU卡 ,但在跑程序時故障率很高。并行科技通過兩步,一是自動化運維程序,二是使訓練任務提升40%,保證了并行程序長期穩(wěn)定且高性能地運行,幫助用戶解決了問題。
值得提醒的是,根據云計算行業(yè)發(fā)展的經驗,智算中心是一個投入巨大,回報周期長的基礎設施類項目,期待看到公司在智算市場的發(fā)展。
近年來,算力建設如火如荼地在中國大地上進行著,新建設施將隨著全國算力網絡體系的完善而融入算力網絡,為全國產業(yè)提供算力調度及服務。陳健博士分析說,“算力網絡”的概念參考了電網,但算力的“力”以芯片的形式表現(xiàn),無法像電一樣被調度,能調度數(shù)據和算力需求,因此算力網絡調度最核心的一環(huán)是將海量用戶的需求理清楚。
算力建設“局中人”在狀態(tài)高亢的同時更需要一份冷靜。“沒有用戶需要算力,用戶需要的是解決自己的問題。”陳健博士坦言。用戶希望將應用軟件的問題解決好,但他們不知道哪里有好用的算力。陳健博士擔憂說,當前新建的算力中心并不研究客源、用戶需求和應用運行。“國家投10個億下去,一棟棟樓起來了,用戶在哪里?很多用戶起初提出需要多少卡,但建好后他表示‘真不好意思,我沒錢了’,這種情況很普遍?!标惤〔┦空J為,降低算力使用者的投入算力資源的成本和門檻,才能提振算力服務市場需求。
通過多年來在運維服務與運維軟件方面的拓展,并行科技積累了大量超算中心合作伙伴、應用軟件開發(fā)商和超算用戶資源。據介紹,在市場推廣方面,公司并行科技有100+位銷售,專注于將算力服務推廣給需要的用戶,在客源方面有較強的優(yōu)勢。記者獲悉,公司已累計為超過兩萬來自于科研教育、航空航天、智能制造、人工智能等各應用領域的終端用戶提供超算云服務,用戶包括清華大學、北京大學、三一汽車制造有限公司等。
2023年,國內AI算力緊缺,國產算力企業(yè)尋找突圍的多種途徑,多家A股上市公司在AI芯片國產替代上下了功夫。國產GPU與英偉達的差距還有多大?具體可行的提升路徑是什么?
陳健博士評價說,目前國產GPU平臺達到了可用的程度,但還需優(yōu)化性能、提高性價比,三年后則有望與英偉達各占半壁江山。陳健博士分析說,由于芯片出貨量、工程打磨時間等因素,國產芯片相較于英偉達等的部件失效比率偏高,所以在大規(guī)模訓練時,用國產芯片建設的超級計算機需要竭力延長無故障時間和提高加速比。由阿姆達爾定律可知,加速比到了天花板之后,無論增加多少CPU核都無濟于事。但NVLink可以達到更高的加速比,這時國產芯片由于節(jié)點之間硬件軟件適配的問題,拉開了和英偉達的差距。
在國產替代的征途上,并行科技“真槍實彈”上陣,以最精裝的團隊支撐最前沿的國產GPU。據陳健博士介紹,并行科技的應用部凝聚百余位技術與研發(fā)人員,同時設立了國產算力事業(yè)部,為國產算力服務,支持國產算力上在原有CPU(英特爾AMD)和GPU(英偉達)上的程序移植測試優(yōu)化,所支持的國產GPU平臺目前已基本趨于成熟。
組建出在國內數(shù)一數(shù)二的國產算力事業(yè)團隊,并行科技靠得是多年來在產學研融合方面的努力和探索。在超算這條細分跑道上,并行科技從2013年開始承擔超算人才培養(yǎng)和選撥的責任,舉辦多個超算人才競賽。以并行科技承辦的全國并行應用挑戰(zhàn)賽(PAC)為例,這是一項基于Intel處理器平臺以及融合加速器等多種運行環(huán)境而舉辦的超算大賽?!皩τ谖磥淼某闳瞬艁碚f,今年競賽將是一個在學生時期接觸最新平臺和技術的難得機會;從行業(yè)全局來看,這有利于中國人工智能大模型發(fā)展,有利于更早完成國產芯片替代?!标惤〔┦吭u價說。(特別提醒:全國并行應用挑戰(zhàn)賽報名組隊時間從即日起至7月24日。)
綜合來看,并行科技公司在業(yè)務規(guī)模、技術能力、行業(yè)人才培養(yǎng)等方面均保持較高水平。據報道,并行科技在2023年上市之際談道,公司將提供包括超算中心選型配置、超算中心運營、超算云服務等在內的全鏈路算力資源運營服務。
無論是下游百?!按鬅掍撹F”,還是上游搶建智算中心,都顯露出行業(yè)在日新月異的AI競賽里“算力焦慮”。在采訪過程中,陳健博士妙語連珠、深入淺出地從技術、應用和市場方面洞悉問題本質,給出算力租賃和國產替代等多種路徑,展示了并行科技的算力資源整合與調度能力優(yōu)勢,以及其作為一家算力服務商在行業(yè)中的實踐示范。
從行業(yè)發(fā)展的宏觀層面來看,國產大模型卡位中,但落地的過程任然充滿“猜忌”和“內耗”。陳健博士談道,國產GPU芯片已經可以上大模型戰(zhàn)場了,但在執(zhí)行高端重要任務方面還需要磨練。我們還需創(chuàng)造一個更高性能、更高效率的基礎架構和系統(tǒng),以及相對應的算力服務系統(tǒng),推動下一代人工智能的發(fā)展。并行科技的使命是讓計算更簡單,在支持國產算力發(fā)展的這條路上做出貢獻,伴隨國產算力發(fā)展趨穩(wěn),早日進入主戰(zhàn)場。
電話:13644723777
傳 真:+86-173-4169
手 機:13644723777
郵 箱:mile@nmgdp.net
地 址:內蒙古包頭市昆區(qū)昆工路光彩商業(yè)街99號