成在人线av无码免费,,,

米樂M6

公司新聞

【算力先鋒】并行科技董事長陳?。捍竽P捅剡x超算架構(gòu)算力調(diào)度在于用M6 米樂戶需求

  激烈的“百模大戰(zhàn)”伴隨著科技同行對(duì)GPU算力的哄搶,大模型競(jìng)爭(zhēng)的焦點(diǎn)竟不在大模型本身,而在算力。

  積極建設(shè)算力基礎(chǔ)設(shè)施確是一條看得見也做得到的突破路徑,這引爆了從資本對(duì)算力概念股的熱情。算力服務(wù)“第一股”北京并行科技股份有限公司(證券簡(jiǎn)稱:并行科技,證券代碼:839493.BJ) 去年11月于北交所上市,作為國內(nèi)領(lǐng)先的超算云服務(wù)和算力運(yùn)營服務(wù)提供商,并行科技對(duì)算力這一路徑看得更早、更清晰。

  算力短缺的解法是什么?算力調(diào)度的難點(diǎn)在哪?AI大模型的計(jì)算成本如此高,有哪些方法能夠降低成本?國產(chǎn)算力如何加速國產(chǎn)替代?

  算力豹邀請(qǐng)并行科技董事長、總經(jīng)理陳健博士接受專訪,在近一個(gè)小時(shí)的交談中,細(xì)致拆解上述問題。

【算力先鋒】并行科技董事長陳健:大模型必選超算架構(gòu)算力調(diào)度在于用M6 米樂戶需求(圖1)

  為獲得AI大模型算力的“及時(shí)雨”,人們竭力榨干了GPU的每一滴算力,事實(shí)上,超級(jí)計(jì)算機(jī)也可以用于支持大模型訓(xùn)練。本(4)月初,微軟和OpenAI的“Stargate(星際之門)”秘密計(jì)劃被The Information曝光,雙方準(zhǔn)備花費(fèi)1000億美金建設(shè)超級(jí)計(jì)算機(jī),在陳健博士看來,這一舉動(dòng)是在向全世界宣布:大模型訓(xùn)練的底層是超級(jí)計(jì)算機(jī)。

【算力先鋒】并行科技董事長陳健:大模型必選超算架構(gòu)算力調(diào)度在于用M6 米樂戶需求(圖2)

  誠然,大模型從訓(xùn)練到推理的技術(shù)鏈條都依賴于云計(jì)算中心,國內(nèi)外不少科技巨頭都橫跨了云基礎(chǔ)設(shè)施與大模型,盡可能地騰挪手中算力資源以滿足大模型訓(xùn)練剛需。在陳健博士看來,超大規(guī)模的訓(xùn)練必須使用超級(jí)計(jì)算機(jī),他還指出一個(gè)現(xiàn)象,云計(jì)算及其服務(wù)商正在積極學(xué)習(xí)超級(jí)計(jì)算機(jī)的邏輯、超算業(yè)務(wù)的運(yùn)營方式,對(duì)計(jì)算中心在進(jìn)行改造。

  “大模型訓(xùn)練需要的是一個(gè)明確的超級(jí)計(jì)算機(jī),它的調(diào)度也是有利于推理的?!标惤〔┦空f道。具體來說,超級(jí)計(jì)算的服務(wù)器之間的計(jì)算帶寬配比更大,是云計(jì)算的計(jì)算網(wǎng)絡(luò)帶寬的數(shù)十倍,數(shù)據(jù)傳輸效率要求更高。在應(yīng)對(duì)計(jì)算挑戰(zhàn)方面,超算架構(gòu)通過高速互聯(lián)網(wǎng)絡(luò)把GPU服務(wù)器緊耦合在一起,以并行計(jì)算技術(shù)實(shí)現(xiàn)單一大模型訓(xùn)練應(yīng)用的高性能計(jì)算(HPC);而云計(jì)算架構(gòu)主要對(duì)海量并發(fā)任務(wù)實(shí)現(xiàn)高通量計(jì)算(HTC),并不適合處理單一大規(guī)模計(jì)算任務(wù)。

  伴隨著我國超算的穩(wěn)健發(fā)展,并行科技深耕超算算力服務(wù)十余年,并在大模型到來的這一刻交互出新的弧光。并行科技從2015年開始從事超級(jí)計(jì)算機(jī)大集群調(diào)度,從超算算力開始展開算力服務(wù)的版圖,目前旗下超算云已成為中國科研用戶首選的計(jì)算資源平臺(tái)。根據(jù)弗若斯特沙利文,從收入規(guī)模角度,2021年并行科技通用超算云收入約1.3億元,對(duì)應(yīng)市場(chǎng)份額為20.3%,行業(yè)排名第一。

【算力先鋒】并行科技董事長陳?。捍竽P捅剡x超算架構(gòu)算力調(diào)度在于用M6 米樂戶需求(圖3)

  算力服務(wù)是一種經(jīng)營,陳健博士談道,算力服務(wù)即將算力資源整包下來再尋找用戶進(jìn)行匹配。他透露,公司算力服務(wù)當(dāng)前在總業(yè)務(wù)所占比例越來越大,去年公司收入接近5億。

  以“算力網(wǎng)絡(luò)”為依托,以利用率為核心,并行科技的主要服務(wù)包括并行通用超算云、并行行業(yè)云、并行AI云以及設(shè)計(jì)仿真云等。根據(jù)用戶需求,并行科技如今業(yè)務(wù)主要朝兩個(gè)方向著力,一是聚集已采購的算力資源來服務(wù)用戶,據(jù)了解,并行科技現(xiàn)已與廣州、無錫、長沙、濟(jì)南和深圳等地的各類超算中心建立穩(wěn)定合作關(guān)系;二是在當(dāng)前國產(chǎn)智算算力陸續(xù)上線的背景下,服務(wù)國產(chǎn)GPU所需的智算算力。

【算力先鋒】并行科技董事長陳?。捍竽P捅剡x超算架構(gòu)算力調(diào)度在于用M6 米樂戶需求(圖4)

【算力先鋒】并行科技董事長陳?。捍竽P捅剡x超算架構(gòu)算力調(diào)度在于用M6 米樂戶需求(圖5)

  目前,并行科技擁有約65萬個(gè)超算云計(jì)算核心,具備成熟且強(qiáng)大的技術(shù)服務(wù)能力,與阿里云、華為云等頭部企業(yè)處在同一梯隊(duì)。陳健博士強(qiáng)調(diào),此處提到的“云計(jì)算”指得是超算/智算的算力云服務(wù),其底層架構(gòu)是超級(jí)計(jì)算機(jī),而不是傳統(tǒng)認(rèn)識(shí)中的云計(jì)算虛擬機(jī)。

  大模型的加速迭代與應(yīng)用落地,推動(dòng)了智能算力需求的激增,大模型的鏈?zhǔn)椒磻?yīng)也傳導(dǎo)到智算中心。

【算力先鋒】并行科技董事長陳?。捍竽P捅剡x超算架構(gòu)算力調(diào)度在于用M6 米樂戶需求(圖6)

  對(duì)于智算中心,計(jì)算能力是大模型對(duì)其的基本要求,運(yùn)行穩(wěn)定和高性能是核心需求。陳健博士分析說,超算算力和智算算力的基礎(chǔ)架構(gòu)一致,涉及的超級(jí)計(jì)算只需從使用CPU轉(zhuǎn)變成使用GPU。無論是計(jì)算架構(gòu)的相似性,還是大模型對(duì)于計(jì)算過程的性能要求,都契合了并行科技于2020年左右開啟的AI云業(yè)務(wù)。

  陳健博士提到“性能(Performance)是一切的根源”,這一主旨貫穿著并行科技的發(fā)展歷程。并行科技起家于性能優(yōu)化業(yè)務(wù),在2012年推出應(yīng)用運(yùn)行特征分析軟件,解決超級(jí)計(jì)算機(jī)跑大型程序時(shí)的核心性能問題。彼時(shí),并行科技在行業(yè)里的形象總是和“技術(shù)高端”、“大規(guī)模的超級(jí)計(jì)算機(jī)”等詞條關(guān)聯(lián)著。而對(duì)于更廣大的普通用戶,并行科技推出在線運(yùn)維業(yè)務(wù),幫助他們完成了全自動(dòng)性能分析程序故障。

  目光看向業(yè)界,2024年以來,一批大型智算中心項(xiàng)目建成運(yùn)營,如此快的建設(shè)速度不禁讓人擔(dān)憂“智算中心想好怎么賺錢了嗎”?陳健博士認(rèn)為,“好用”的智算算力平臺(tái)才能給智算中心帶來實(shí)際價(jià)值,而關(guān)鍵不僅在產(chǎn)品端,也在用戶端。具體來說,市場(chǎng)上專注于算力基礎(chǔ)設(shè)施建設(shè)的主要為IDC數(shù)據(jù)中心供應(yīng)商和云服務(wù)供應(yīng)商,他們對(duì)維護(hù)軟硬件工具和數(shù)據(jù)、優(yōu)化國產(chǎn)GPU芯片等工作相對(duì)陌生,對(duì)于并行科技來說,完成這些任務(wù)僅需將原有的業(yè)務(wù)平移。

  陳健博士透露,大模型市場(chǎng)給并行科技的響應(yīng)非常好,去年公司的AI云業(yè)務(wù)增長2.6倍,在成本被原有CPU業(yè)務(wù)覆蓋的情況下,公司提供給用戶更有性價(jià)比的產(chǎn)品。以國內(nèi)某知名大模型企業(yè)為例,該企業(yè)在2023年因英偉達(dá)GPU嚴(yán)重缺貨, 使用500余張英偉達(dá)米樂M6 M6米樂A100 SXM版GPU卡 ,但在跑程序時(shí)故障率很高。并行科技通過兩步,一是自動(dòng)化運(yùn)維程序,二是使訓(xùn)練任務(wù)提升40%,保證了并行程序長期穩(wěn)定且高性能地運(yùn)行,幫助用戶解決了問題。

  值得提醒的是,根據(jù)云計(jì)算行業(yè)發(fā)展的經(jīng)驗(yàn),智算中心是一個(gè)投入巨大,回報(bào)周期長的基礎(chǔ)設(shè)施類項(xiàng)目,期待看到公司在智算市場(chǎng)的發(fā)展。

  近年來,算力建設(shè)如火如荼地在中國大地上進(jìn)行著,新建設(shè)施將隨著全國算力網(wǎng)絡(luò)體系的完善而融入算力網(wǎng)絡(luò),為全國產(chǎn)業(yè)提供算力調(diào)度及服務(wù)。陳健博士分析說,“算力網(wǎng)絡(luò)”的概念參考了電網(wǎng),但算力的“力”以芯片的形式表現(xiàn),無法像電一樣被調(diào)度,能調(diào)度數(shù)據(jù)和算力需求,因此算力網(wǎng)絡(luò)調(diào)度最核心的一環(huán)是將海量用戶的需求理清楚。

  算力建設(shè)“局中人”在狀態(tài)高亢的同時(shí)更需要一份冷靜?!皼]有用戶需要算力,用戶需要的是解決自己的問題?!标惤〔┦刻寡?。用戶希望將應(yīng)用軟件的問題解決好,但他們不知道哪里有好用的算力。陳健博士擔(dān)憂說,當(dāng)前新建的算力中心并不研究客源、用戶需求和應(yīng)用運(yùn)行。“國家投10個(gè)億下去,一棟棟樓起來了,用戶在哪里?很多用戶起初提出需要多少卡,但建好后他表示‘真不好意思,我沒錢了’,這種情況很普遍。”陳健博士認(rèn)為,降低算力使用者的投入算力資源的成本和門檻,才能提振算力服務(wù)市場(chǎng)需求。

  通過多年來在運(yùn)維服務(wù)與運(yùn)維軟件方面的拓展,并行科技積累了大量超算中心合作伙伴、應(yīng)用軟件開發(fā)商和超算用戶資源。據(jù)介紹,在市場(chǎng)推廣方面,公司并行科技有100+位銷售,專注于將算力服務(wù)推廣給需要的用戶,在客源方面有較強(qiáng)的優(yōu)勢(shì)。記者獲悉,公司已累計(jì)為超過兩萬來自于科研教育、航空航天、智能制造、人工智能等各應(yīng)用領(lǐng)域的終端用戶提供超算云服務(wù),用戶包括清華大學(xué)、北京大學(xué)、三一汽車制造有限公司等。

  2023年,國內(nèi)AI算力緊缺,國產(chǎn)算力企業(yè)尋找突圍的多種途徑,多家A股上市公司在AI芯片國產(chǎn)替代上下了功夫。國產(chǎn)GPU與英偉達(dá)的差距還有多大?具體可行的提升路徑是什么?

  陳健博士評(píng)價(jià)說,目前國產(chǎn)GPU平臺(tái)達(dá)到了可用的程度,但還需優(yōu)化性能、提高性價(jià)比,三年后則有望與英偉達(dá)各占半壁江山。陳健博士分析說,由于芯片出貨量、工程打磨時(shí)間等因素,國產(chǎn)芯片相較于英偉達(dá)等的部件失效比率偏高,所以在大規(guī)模訓(xùn)練時(shí),用國產(chǎn)芯片建設(shè)的超級(jí)計(jì)算機(jī)需要竭力延長無故障時(shí)間和提高加速比。由阿姆達(dá)爾定律可知,加速比到了天花板之后,無論增加多少CPU核都無濟(jì)于事。但NVLink可以達(dá)到更高的加速比,這時(shí)國產(chǎn)芯片由于節(jié)點(diǎn)之間硬件軟件適配的問題,拉開了和英偉達(dá)的差距。

【算力先鋒】并行科技董事長陳?。捍竽P捅剡x超算架構(gòu)算力調(diào)度在于用M6 米樂戶需求(圖7)

  在國產(chǎn)替代的征途上,并行科技“真槍實(shí)彈”上陣,以最精裝的團(tuán)隊(duì)支撐最前沿的國產(chǎn)GPU。據(jù)陳健博士介紹,并行科技的應(yīng)用部凝聚百余位技術(shù)與研發(fā)人員,同時(shí)設(shè)立了國產(chǎn)算力事業(yè)部,為國產(chǎn)算力服務(wù),支持國產(chǎn)算力上在原有CPU(英特爾、AMD)和GPU(英偉達(dá))上的程序移植測(cè)試優(yōu)化,所支持的國產(chǎn)GPU平臺(tái)目前已基本趨于成熟。

  組建出在國內(nèi)數(shù)一數(shù)二的國產(chǎn)算力事業(yè)團(tuán)隊(duì),并行科技靠得是多年來在產(chǎn)學(xué)研融合方面的努力和探索。在超算這條細(xì)分跑道上,并行科技從2013年開始承擔(dān)超算人才培養(yǎng)和選撥的責(zé)任,舉辦多個(gè)超算人才競(jìng)賽。以并行科技承辦的全國并行應(yīng)用挑戰(zhàn)賽(PAC)為例,這是一項(xiàng)基于Intel處理器平臺(tái)以及融合加速器等多種運(yùn)行環(huán)境而舉辦的超算大賽?!皩?duì)于未來的超算人才來說,今年競(jìng)賽將是一個(gè)在學(xué)生時(shí)期接觸最新平臺(tái)和技術(shù)的難得機(jī)會(huì);從行業(yè)全局來看,這有利于中國人工智能大模型發(fā)展,有利于更早完成國產(chǎn)芯片替代?!标惤〔┦吭u(píng)價(jià)說。(特別提醒:全國并行應(yīng)用挑戰(zhàn)賽報(bào)名組隊(duì)時(shí)間從即日起至7月24日。)

【算力先鋒】并行科技董事長陳?。捍竽P捅剡x超算架構(gòu)算力調(diào)度在于用M6 米樂戶需求(圖8)

  綜合來看,并行科技公司在業(yè)務(wù)規(guī)模、技術(shù)能力、行業(yè)人才培養(yǎng)等方面均保持較高水平。據(jù)報(bào)道,并行科技在2023年上市之際談道,公司將提供包括超算中心選型配置、超算中心運(yùn)營、超算云服務(wù)等在內(nèi)的全鏈路算力資源運(yùn)營服務(wù)。

  無論是下游百?!按鬅掍撹F”,還是上游搶建智算中心,都顯露出行業(yè)在日新月異的AI競(jìng)賽里“算力焦慮”。在采訪過程中,陳健博士妙語連珠、深入淺出地從技術(shù)、應(yīng)用和市場(chǎng)方面洞悉問題本質(zhì),給出算力租賃和國產(chǎn)替代等多種路徑,展示了并行科技的算力資源整合與調(diào)度能力優(yōu)勢(shì),以及其作為一家算力服務(wù)商在行業(yè)中的實(shí)踐示范。

  從行業(yè)發(fā)展的宏觀層面來看,國產(chǎn)大模型卡位中,但落地的過程任然充滿“猜忌”和“內(nèi)耗”。陳健博士談道,國產(chǎn)GPU芯片已經(jīng)可以上大模型戰(zhàn)場(chǎng)了,但在執(zhí)行高端重要任務(wù)方面還需要磨練。我們還需創(chuàng)造一個(gè)更高性能、更高效率的基米樂M6 M6米樂礎(chǔ)架構(gòu)和系統(tǒng),以及相對(duì)應(yīng)的算力服務(wù)系統(tǒng),推動(dòng)下一代人工智能的發(fā)展。并行科技的使命是讓計(jì)算更簡(jiǎn)單,在支持國產(chǎn)算力發(fā)展的這條路上做出貢獻(xiàn),伴隨國產(chǎn)算力發(fā)展趨穩(wěn),早日進(jìn)入主戰(zhàn)場(chǎng)。M6 米樂