掃碼登錄
2025 世界智能產(chǎn)業(yè)博覽會(huì)上,國(guó)內(nèi)智能計(jì)算領(lǐng)域迎來(lái)里程碑式進(jìn)展 —— 中科曙光聯(lián)合 20 余家產(chǎn)業(yè)鏈企業(yè),正式發(fā)布國(guó)內(nèi)首個(gè) AI 計(jì)算開放架構(gòu),并推出配套的曙光 AI 超集群系統(tǒng)。這一創(chuàng)新不僅標(biāo)志著中國(guó)智能計(jì)算產(chǎn)業(yè)邁入 “全面開放協(xié)作” 新階段,更被業(yè)界視為構(gòu)建 “中國(guó)版安卓生態(tài)”、破解算力發(fā)展瓶頸的關(guān)鍵一步。
當(dāng)前,中國(guó)算力規(guī)模已躋身全球第二梯隊(duì)。截至 2024 年底,全國(guó)算力總規(guī)模達(dá) 280 EFLOPS,其中智能算力占比 32%;IDC 更預(yù)測(cè),2025 年中國(guó)算力規(guī)模將突破 1000 EFLOPS。但繁榮背后,產(chǎn)業(yè)仍面臨多重挑戰(zhàn):高端算力供給不足、國(guó)產(chǎn)加速卡性能存在差距、算力成本居高不下、生態(tài)體系尚未成熟,這些問(wèn)題共同制約著算力從 “規(guī)模增長(zhǎng)” 向 “好用易用” 升級(jí)。行業(yè)普遍共識(shí)是,單一環(huán)節(jié)的技術(shù)突破已無(wú)法滿足需求,唯有通過(guò)全產(chǎn)業(yè)鏈集群創(chuàng)新,才能實(shí)現(xiàn)降本增效、突破瓶頸。
“大模型迭代速度已從每年 3-4 次縮短至每周一次,但 AI 芯片研發(fā)周期仍需兩年,性能提升的邊際效應(yīng)還在遞減?!?中科曙光高級(jí)副總裁李斌點(diǎn)出當(dāng)前行業(yè)核心矛盾。他認(rèn)為,破解 “算力空轉(zhuǎn)” 困局的關(guān)鍵,在于打破產(chǎn)業(yè)鏈上下游壁壘,推動(dòng)跨層級(jí)深度協(xié)作?!斑^(guò)去 IT 時(shí)代是‘蘋果模式’,各環(huán)節(jié)獨(dú)立優(yōu)化;現(xiàn)在智能計(jì)算時(shí)代需要‘安卓模式’,靠開放協(xié)作應(yīng)對(duì)技術(shù)融合的復(fù)雜挑戰(zhàn)?!?/p>
作為國(guó)家先進(jìn)計(jì)算產(chǎn)業(yè)創(chuàng)新中心的牽頭單位,中科曙光此次發(fā)布的 AI 計(jì)算開放架構(gòu),以 GPU 為核心構(gòu)建高效緊耦合系統(tǒng),全面覆蓋 “算、存、網(wǎng)、電、冷、管、軟” 全鏈條,而曙光 AI 超集群系統(tǒng)正是這一架構(gòu)的核心載體。該系統(tǒng)單機(jī)柜可支持 96 張加速卡、提供百 P 級(jí)算力,最大可擴(kuò)展至百萬(wàn)卡規(guī)模;通過(guò) “超級(jí)隧道” 存儲(chǔ)優(yōu)化、軟硬協(xié)同設(shè)計(jì)等技術(shù),其千卡集群的訓(xùn)推性能達(dá)到業(yè)界主流水平的 2.3 倍,模型開發(fā)效率提升 4 倍,GPU 算效增加 55%,故障修復(fù)時(shí)間更縮短 47%,多維度實(shí)現(xiàn)性能與效率突破。
與傳統(tǒng)封閉算力系統(tǒng)不同,曙光 AI 超集群系統(tǒng)的核心優(yōu)勢(shì)在于 “開放兼容”—— 既支持多品牌 GPU 加速卡,也適配 CUDA 等主流生態(tài),既為用戶提供硬件選擇的自由度,也大幅降低軟件開發(fā)的適配成本。“這不僅是一款產(chǎn)品,更是一個(gè)開放創(chuàng)新平臺(tái)。” 中科曙光總裁助理杜夏威強(qiáng)調(diào),“通過(guò)適配不同品牌 GPU,用戶能保護(hù)前期設(shè)備投資,避免被單一技術(shù)路線綁定,真正實(shí)現(xiàn)‘按需選擇、靈活部署’?!?/p>
為進(jìn)一步推動(dòng)生態(tài)共建,中科曙光同步宣布開放三項(xiàng)核心技術(shù)能力:AI 存儲(chǔ)優(yōu)化技術(shù)、液冷基礎(chǔ)設(shè)施設(shè)計(jì)規(guī)范、DeepAI 基礎(chǔ)軟件棧。其中,液冷技術(shù)是 AI 大集群穩(wěn)定運(yùn)行的關(guān)鍵支撐 —— 曙光數(shù)創(chuàng)副總裁張鵬透露,公司已完成從冷板式、浸沒(méi)相變式到浸沒(méi)式液冷的技術(shù)迭代,當(dāng)前在浸沒(méi)式液冷市場(chǎng)的占有率超 50%,此次發(fā)布的多層級(jí)液冷方案,能在保障散熱效率的同時(shí),顯著提升系統(tǒng)交付性價(jià)比。
針對(duì)跨廠商技術(shù)對(duì)齊難、重復(fù)研發(fā)成本高的問(wèn)題,中科曙光還聯(lián)合芯片、整機(jī)等領(lǐng)域企業(yè),依托國(guó)家先進(jìn)計(jì)算產(chǎn)業(yè)創(chuàng)新中心成立 “AI 計(jì)算開放架構(gòu)聯(lián)合實(shí)驗(yàn)室”。該實(shí)驗(yàn)室將聚焦部件級(jí)、系統(tǒng)層、基礎(chǔ)設(shè)施層等五類技術(shù)的開放與標(biāo)準(zhǔn)化,減少行業(yè)內(nèi)的重復(fù)研發(fā)投入,降低中小企業(yè)的創(chuàng)新門檻?!皬?2018 年?duì)款^成立創(chuàng)新中心起,我們就一直在推動(dòng)上下游資源的拉通?!?杜夏威表示,“此次構(gòu)建開放架構(gòu),核心是打破‘技術(shù)墻’與‘生態(tài)墻’,讓不同規(guī)模、不同領(lǐng)域的企業(yè)都能參與進(jìn)來(lái),形成良性循環(huán)的協(xié)作生態(tài)。