北京2024年1月24日 /美通社/ -- 業(yè)界首部《全液冷冷板系統(tǒng)參考設(shè)計(jì)及驗(yàn)證白皮書》現(xiàn)已正式開(kāi)放下載,該白皮書由浪潮信息、英特爾、OCTC開(kāi)放計(jì)算標(biāo)準(zhǔn)工作委員會(huì)、全國(guó)信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會(huì)算力標(biāo)準(zhǔn)工作組、中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院聯(lián)合撰寫,詳細(xì)解讀了液冷技術(shù)的背景、技術(shù)優(yōu)化方向以及全液冷冷板系統(tǒng)的設(shè)計(jì)、驗(yàn)證和展望,為全液冷冷板服務(wù)器設(shè)計(jì)和規(guī)模應(yīng)用中面臨的主要難點(diǎn)提供了創(chuàng)新設(shè)計(jì)參考,對(duì)全液冷冷板技術(shù)在通用架構(gòu)上實(shí)現(xiàn)快速導(dǎo)入和推廣具有重要指導(dǎo)意義。
主流中的前沿——全液冷冷板技術(shù)
目前,冷板式液冷由于在產(chǎn)業(yè)鏈成熟度、改造成本、可維護(hù)性、兼容性等方面的優(yōu)勢(shì),已經(jīng)成為液冷數(shù)據(jù)中心主流。IDC數(shù)據(jù)顯示,2023上半年中國(guó)液冷服務(wù)器市場(chǎng)中,冷板式占比高達(dá)90%。但現(xiàn)有的冷板式液冷技術(shù)依然有持續(xù)優(yōu)化的空間,最主要的問(wèn)題在于冷板一般僅覆蓋CPU、GPU等高功耗發(fā)熱部件,數(shù)據(jù)中心需要配置CDU和空調(diào)兩套冷卻系統(tǒng),PUE值無(wú)法達(dá)到接近于1的理想狀態(tài)。同時(shí),傳統(tǒng)冷板式服務(wù)器是高度定制化產(chǎn)品,冷板的材質(zhì)選擇、結(jié)構(gòu)設(shè)計(jì)、加工工藝以及部件規(guī)格等不一致,規(guī)?;瘧?yīng)用受限。因此,冷板式液冷需要從系統(tǒng)級(jí)解決方案出發(fā),以模塊化解耦設(shè)計(jì)思維,創(chuàng)新出一種高能效、易運(yùn)維、使用更安全,兼容性更出色、液冷覆蓋率更高的全液冷冷板結(jié)構(gòu)設(shè)計(jì)。
作為目前液冷產(chǎn)業(yè)技術(shù)創(chuàng)新的前沿領(lǐng)域,全液冷冷板技術(shù)可實(shí)現(xiàn)"服務(wù)器內(nèi)去風(fēng)扇、數(shù)據(jù)中心去空調(diào)化"運(yùn)行,更加高效節(jié)能與靜音,并以高集成度節(jié)省30%左右的數(shù)據(jù)中心空間,單機(jī)柜支持100KW的高密度部署。
浪潮信息基于自身在液冷技術(shù)創(chuàng)新、產(chǎn)業(yè)化推進(jìn)及國(guó)標(biāo)團(tuán)標(biāo)等產(chǎn)業(yè)標(biāo)準(zhǔn)化方面的長(zhǎng)期實(shí)踐,與英特爾、OCTC開(kāi)放計(jì)算標(biāo)準(zhǔn)工作委員會(huì)、全國(guó)信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會(huì)算力標(biāo)準(zhǔn)工作組、中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院聯(lián)合編寫了《全液冷冷板系統(tǒng)參考設(shè)計(jì)及驗(yàn)證白皮書》,旨在為全液冷冷板服務(wù)器設(shè)計(jì)和規(guī)模應(yīng)用中面臨的主要難點(diǎn)提供創(chuàng)新設(shè)計(jì)參考,以模塊化解耦的先進(jìn)設(shè)計(jì)理念,推動(dòng)基于通用服務(wù)器架構(gòu)的全液冷冷板技術(shù)快速普及。
白皮書指出,冷板液冷服務(wù)器設(shè)計(jì)技術(shù)優(yōu)化方向主要圍繞通過(guò)技術(shù)創(chuàng)新進(jìn)一步提高能效,降低初期投資成本,減少漏液安全隱患及提高運(yùn)維便利性展開(kāi),一是持續(xù)完善部件液冷方案,提高液冷覆蓋率;二是提高通用化及可維護(hù)性;三是拓展冷板液冷材料范圍,減輕重量,降低成本;四是提升液冷系統(tǒng)長(zhǎng)期使用的安全性,降低漏液風(fēng)險(xiǎn)。
創(chuàng)新實(shí)踐——全液冷冷板服務(wù)器,打通規(guī)?;瘧?yīng)用的"最后一公里"
白皮書詳細(xì)介紹了浪潮信息在全液冷冷板技術(shù)上的創(chuàng)新實(shí)踐成果——全液冷冷板服務(wù)器,實(shí)現(xiàn)了對(duì)CPU、高功耗內(nèi)存、NVMe硬盤、OCP網(wǎng)卡、電源、PCIe轉(zhuǎn)接卡和光模塊等服務(wù)器主要發(fā)熱部件的冷板全液冷覆蓋,并針對(duì)不同部件的結(jié)構(gòu)、材質(zhì)、工作溫度等差異化需求,創(chuàng)新設(shè)計(jì)了諸多系統(tǒng)部件級(jí)液冷解決方案,實(shí)現(xiàn)了液冷模塊解耦,為全球液冷產(chǎn)業(yè)鏈上下游提供極具價(jià)值的參考樣板,推動(dòng)先進(jìn)全液冷冷板解決方案在全球數(shù)據(jù)中心的大規(guī)模部署應(yīng)用,實(shí)現(xiàn)數(shù)據(jù)中心更加綠色低碳可持續(xù)發(fā)展。
全液冷冷板服務(wù)器的CPU冷板模組基于英特爾第五代至強(qiáng)平臺(tái)可擴(kuò)展處理器冷板的設(shè)計(jì)要求,綜合考慮散熱,結(jié)構(gòu)性能,成品率,價(jià)格及不同材質(zhì)冷板設(shè)計(jì)兼容性等因素優(yōu)化而成的一款CPU冷板參考設(shè)計(jì),主要由CPU冷板鋁支架,CPU冷板及冷板接頭等部件組成。
內(nèi)存液冷設(shè)計(jì)采用創(chuàng)新型的枕木散熱器液冷方案,因內(nèi)存插滿如鐵軌上的枕木而得名。它將傳統(tǒng)風(fēng)冷散熱和冷板散熱相結(jié)合,通過(guò)內(nèi)置熱管的散熱器(或純鋁/銅板、Vaper Chamber等)把內(nèi)存上的熱量傳遞至兩端,與冷板通過(guò)選定的導(dǎo)熱墊片接觸,最終通過(guò)冷板內(nèi)的冷卻液把熱量帶走實(shí)現(xiàn)內(nèi)存散熱。相比現(xiàn)有的管路(Tubing)內(nèi)存液冷方案,枕木散熱器液冷方案采用模塊化設(shè)計(jì),具有易于組裝和維護(hù)、通用性好、性價(jià)比高等優(yōu)勢(shì)。
固態(tài)硬盤液冷方案同樣采用創(chuàng)新設(shè)計(jì),通過(guò)內(nèi)置熱管的散熱器把硬盤區(qū)域的熱量導(dǎo)出與硬盤區(qū)域外的冷板通過(guò)導(dǎo)熱墊片垂直接觸實(shí)現(xiàn)換熱。此固態(tài)硬盤液冷方案主要由裝有散熱器的固態(tài)硬盤模組,固態(tài)硬盤冷板,硬盤模組鎖緊機(jī)構(gòu),及硬盤支架組成。硬盤模組鎖緊機(jī)構(gòu)固定在硬盤支架上提供合適的預(yù)緊力來(lái)保證固態(tài)硬盤模組和固態(tài)硬盤冷板的長(zhǎng)期接觸可靠性。為了方便硬盤冷板環(huán)路在狹小空間內(nèi)的安裝,硬盤支架在服務(wù)器深度方向采用了抽屜式的安裝方式設(shè)計(jì)。相比業(yè)界已有的硬盤液冷嘗試,此方案可支持 30 次以上系統(tǒng)不斷電熱插拔,可靠性高,對(duì)加工工藝要求低,漏液風(fēng)險(xiǎn)低,同時(shí)可靈活適配不同厚度和數(shù)量的固態(tài)硬盤系統(tǒng)。
此外,浪潮信息對(duì)PCIe卡、OCP網(wǎng)卡和電源等部件均進(jìn)行了創(chuàng)新的冷板設(shè)計(jì),在冷板材質(zhì)方面也進(jìn)行了探索實(shí)踐,分別基于銅材質(zhì)和鋁合金材質(zhì)冷板,從換熱性能、可靠性、成本、重量等多方面進(jìn)行對(duì)比及優(yōu)化,同時(shí)對(duì)與鋁質(zhì)冷板液冷循環(huán)回路相匹配的液冷工質(zhì),進(jìn)行了選型和相應(yīng)的腐蝕性測(cè)試驗(yàn)證,為進(jìn)一步降低冷板液冷成本提供了豐富的實(shí)踐數(shù)據(jù)支持。
在測(cè)試驗(yàn)證部分,全液冷冷板服務(wù)器進(jìn)行了散熱性能測(cè)試、液冷熱捕獲效率(HCR)測(cè)試、流阻測(cè)試等多項(xiàng)測(cè)試。在散熱性能測(cè)試中,銅冷板系統(tǒng)(冷卻工質(zhì)PG25)在目標(biāo)最差邊界條件下所有的零部件溫度都滿足溫度要求,并且還有一定安全溫度裕量;在液冷熱捕獲效率(HCR)測(cè)試中,在典型的液冷系統(tǒng)工作邊界條件下—系統(tǒng)進(jìn)水溫度38?C(W32),空氣環(huán)境溫度35?C,全液冷冷板服務(wù)器液冷熱捕獲效率(HCR)在93%左右,整機(jī)柜測(cè)試HCR值更高,可接近98%;在流阻測(cè)試中,冷卻工質(zhì)PG25在相同溫度和流量下比純水流阻高20%左右,同一工質(zhì)溫度越高流阻越低,PG25的流阻相比純水對(duì)溫度更為敏感。在51?C進(jìn)水溫度1.3LPM流量條件下,采用冷卻工質(zhì)PG25和純水的系統(tǒng)流阻分別是118kPa和99.6kPa。
全面測(cè)試結(jié)果表明,浪潮信息全液冷冷板服務(wù)器可實(shí)現(xiàn)接近100%液冷散熱,系統(tǒng)無(wú)風(fēng)扇運(yùn)行,可達(dá)到PUE接近于1的極限水平,并通過(guò)"去空調(diào)化"節(jié)省 30%以上的數(shù)據(jù)中心空間,充分滿足數(shù)據(jù)中心的高密度部署需求。