本技術(shù)涉及散熱控制,更具體地說,本技術(shù)涉及一種多核服務(wù)器散熱控制方法、系統(tǒng)、設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、散熱控制在計算機(jī)領(lǐng)域至關(guān)重要,其主要目的是在高負(fù)荷運(yùn)行時有效管理和排放熱量,以保障設(shè)備的性能和壽命,包括風(fēng)冷、液冷、和熱管等,風(fēng)冷利用散熱片和風(fēng)扇的組合,通過空氣對流帶走熱量,結(jié)構(gòu)簡單但在高性能設(shè)備中效果有限,液冷系統(tǒng)通過冷卻液循環(huán)帶走熱量,具有較好的散熱效率,適用于高端設(shè)備,熱管技術(shù)利用液體蒸發(fā)和冷凝相變傳導(dǎo)熱量,隨著計算能力的不斷提高,散熱技術(shù)朝向更高效、低噪聲和節(jié)能的方向發(fā)展,如液冷與風(fēng)冷的混合系統(tǒng)、先進(jìn)的人工智能算法控制,以及用于極端環(huán)境中的冷板技術(shù),這些技術(shù)共同作用,為現(xiàn)代計算設(shè)備提供了全面的散熱解決方案。
2、液冷多核服務(wù)器散熱控制通過循環(huán)冷卻液來吸收并傳導(dǎo)熱量,主要依賴?yán)鋮s塊、泵、冷排和風(fēng)扇組合實現(xiàn),冷卻液經(jīng)過冷卻塊吸收熱源熱量,通過泵推動流經(jīng)冷排散熱,再循環(huán)回冷卻塊持續(xù)冷卻,然而,由于液冷多核服務(wù)器內(nèi)部不同中央處理器的功率消耗不同,尤其是在高性能計算任務(wù)中,會在液冷多核服務(wù)器中某些中央處理器所在區(qū)域集中產(chǎn)生過高的熱量,從而產(chǎn)生熱不對稱現(xiàn)象,其中,熱不對稱現(xiàn)象是指液冷多核服務(wù)器內(nèi)部由于各個中央處理器的熱負(fù)載不同造成散熱不均勻,導(dǎo)致中央處理器所在區(qū)域形成局部熱點(diǎn)引發(fā)熱積聚,進(jìn)一步加劇該區(qū)域的溫度上升,因此,如何降低熱不對稱現(xiàn)象對液冷多核服務(wù)器散熱效果的影響,從而提高冷卻系統(tǒng)的效率成為了業(yè)界面臨的難題。
技術(shù)實現(xiàn)思路
1、本技術(shù)提供一種多核服務(wù)器散熱控制方法、系統(tǒng)、設(shè)備及存儲介質(zhì),可降低熱不對稱現(xiàn)象對液冷多核服務(wù)器散熱效果的影響,從而提高冷卻系統(tǒng)的效率。
2、第一方面,本技術(shù)提供一種多核服務(wù)器散熱控制方法,包括如下步驟:
3、采集目標(biāo)多核服務(wù)器中冷卻塊的冷卻液在不同環(huán)境溫度下的流動信息;
4、從所有的流動信息中提取出所述冷卻液在不同環(huán)境溫度下的擾流波動特征,根據(jù)所有的擾流波動特征和目標(biāo)多核服務(wù)器內(nèi)各個中央處理器在散熱過程中的溫度變化趨勢確定所述冷卻液在不同環(huán)境溫度下的冷能損失;
5、確定所述冷卻塊中冷卻液進(jìn)口和冷卻液出口之間液體流速的差異熵,根據(jù)所述差異熵和所有的冷能損失確定目標(biāo)多核服務(wù)器在散熱過程中的冷負(fù)荷量;
6、獲取所述冷卻塊與目標(biāo)多核服務(wù)器中各個中央處理器之間的熱交換信息,進(jìn)而根據(jù)所有的熱交換信息確定所述冷卻塊和各個中央處理器之間的換熱系數(shù),通過所有的換熱系數(shù)和各個中央處理器的溫度梯度確定各個中央處理器在散熱過程中的熱傳遞強(qiáng)度;
7、根據(jù)所有的熱傳遞強(qiáng)度和所述冷負(fù)荷量確定各個中央處理器在散熱過程中的冷卻代價,基于所有的冷卻代價對目標(biāo)多核服務(wù)器中的冷卻液進(jìn)行動態(tài)冷卻調(diào)控。
8、在一些實施例中,從所有的流動信息中提取出所述冷卻液在不同環(huán)境溫度下的擾流波動特征具體包括:
9、根據(jù)所有的流動信息確定目標(biāo)多核服務(wù)器中冷卻液的進(jìn)口動態(tài)流速區(qū)間和出口動態(tài)流速區(qū)間;
10、對每個流動信息進(jìn)行差分處理,得到所述冷卻液在不同環(huán)境溫度下的流速波動組;
11、根據(jù)所述進(jìn)口動態(tài)流速區(qū)間、所述出口動態(tài)流速區(qū)間和所有的流速波動組確定所述冷卻液在不同環(huán)境溫度下的擾流波動特征。
12、在一些實施例中,根據(jù)所有的擾流波動特征和目標(biāo)多核服務(wù)器內(nèi)各個中央處理器在散熱過程中的溫度變化趨勢確定所述冷卻液在不同環(huán)境溫度下的冷能損失具體包括:
13、對所有的擾流波動特征進(jìn)行線性擬合,得到擾流波動擬合曲線;
14、根據(jù)所述擾流波動擬合曲線確定所述冷卻液在不同環(huán)境溫度下的冷凝換熱度;
15、通過所有的冷凝換熱度和目標(biāo)多核服務(wù)器內(nèi)各個中央處理器在散熱過程中的溫度變化趨勢確定所述冷卻液在不同環(huán)境溫度下的冷能損失。
16、在一些實施例中,根據(jù)所述差異熵和所有的冷能損失確定目標(biāo)多核服務(wù)器在散熱過程中的冷負(fù)荷量具體包括:
17、根據(jù)預(yù)設(shè)的滑動窗口和所有的冷能損失確定目標(biāo)多核服務(wù)器在散熱過程中的全局冷損失量;
18、根據(jù)所述差異熵和所述全局冷損失量確定目標(biāo)多核服務(wù)器在散熱過程中的冷負(fù)荷量。
19、在一些實施例中,根據(jù)所有的熱交換信息確定所述冷卻塊和各個中央處理器之間的換熱系數(shù)具體包括:
20、根據(jù)所有的熱交換信息確定所述冷卻塊和各個中央處理器之間的熱擴(kuò)散特征序列和熱邊界偏移量;
21、通過所有的熱擴(kuò)散特征序列和所有的熱邊界偏移量確定所述冷卻塊和各個中央處理器之間的換熱系數(shù)。
22、在一些實施例中,通過所有的換熱系數(shù)和各個中央處理器的溫度梯度確定各個中央處理器在散熱過程中的熱傳遞強(qiáng)度具體包括:
23、根據(jù)所有的換熱系數(shù)確定目標(biāo)多核服務(wù)器在散熱過程中的熱衰減度;
24、通過所述熱衰減度和各個中央處理器的溫度梯度確定各個中央處理器在散熱過程中的熱傳遞強(qiáng)度。
25、在一些實施例中,根據(jù)所有的熱傳遞強(qiáng)度和所述冷負(fù)荷量確定各個中央處理器在散熱過程中的冷卻代價具體包括:
26、將所有的熱傳遞強(qiáng)度轉(zhuǎn)換成熱傳遞強(qiáng)度序列;
27、根據(jù)所述熱傳遞強(qiáng)度序列和所述冷負(fù)荷量確定各個中央處理器的散熱代價;
28、獲取冷卻液在不同環(huán)境溫度下的冷能損失;
29、通過所有的散熱代價和冷卻液在不同環(huán)境溫度下的冷能損失確定各個中央處理器在散熱過程中的冷卻代價。
30、第二方面,本技術(shù)提供一種多核服務(wù)器散熱控制系統(tǒng),包括:
31、采集模塊,用于采集目標(biāo)多核服務(wù)器中冷卻塊的冷卻液在不同環(huán)境溫度下的流動信息;
32、處理模塊,用于從所有的流動信息中提取出所述冷卻液在不同環(huán)境溫度下的擾流波動特征,根據(jù)所有的擾流波動特征和目標(biāo)多核服務(wù)器內(nèi)各個中央處理器在散熱過程中的溫度變化趨勢確定所述冷卻液在不同環(huán)境溫度下的冷能損失;
33、所述處理模塊,還用于確定所述冷卻塊中冷卻液進(jìn)口和冷卻液出口之間液體流速的差異熵,根據(jù)所述差異熵和所有的冷能損失確定目標(biāo)多核服務(wù)器在散熱過程中的冷負(fù)荷量;
34、所述處理模塊,還用于獲取所述冷卻塊與目標(biāo)多核服務(wù)器中各個中央處理器之間的熱交換信息,進(jìn)而根據(jù)所有的熱交換信息確定所述冷卻塊和各個中央處理器之間的換熱系數(shù),通過所有的換熱系數(shù)和各個中央處理器的溫度梯度確定各個中央處理器在散熱過程中的熱傳遞強(qiáng)度;
35、執(zhí)行模塊,用于根據(jù)所有的熱傳遞強(qiáng)度和所述冷負(fù)荷量確定各個中央處理器在散熱過程中的冷卻代價,基于所有的冷卻代價對目標(biāo)多核服務(wù)器中的冷卻液進(jìn)行動態(tài)冷卻調(diào)控。
36、第三方面,本技術(shù)提供一種計算機(jī)設(shè)備,所述計算機(jī)設(shè)備包括存儲器和處理器,所述存儲器存儲有代碼,所述處理器被配置為獲取所述代碼,并執(zhí)行上述的多核服務(wù)器散熱控制方法。
37、第四方面,本技術(shù)提供一種計算機(jī)可讀存儲介質(zhì),所述計算機(jī)可讀存儲介質(zhì)存儲有計算機(jī)程序,所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)上述的多核服務(wù)器散熱控制方法。
38、本技術(shù)公開的實施例提供的技術(shù)方案具有以下有益效果:
39、本技術(shù)提供的多核服務(wù)器散熱控制方法、系統(tǒng)、設(shè)備及存儲介質(zhì)中,首先采集目標(biāo)多核服務(wù)器中冷卻塊的冷卻液在不同環(huán)境溫度下的流動信息;從所有的流動信息中提取出所述冷卻液在不同環(huán)境溫度下的擾流波動特征,根據(jù)所有的擾流波動特征和目標(biāo)多核服務(wù)器內(nèi)各個中央處理器在散熱過程中的溫度變化趨勢確定所述冷卻液在不同環(huán)境溫度下的冷能損失;確定所述冷卻塊中冷卻液進(jìn)口和冷卻液出口之間液體流速的差異熵,根據(jù)所述差異熵和所有的冷能損失確定目標(biāo)多核服務(wù)器在散熱過程中的冷負(fù)荷量;獲取所述冷卻塊與目標(biāo)多核服務(wù)器中各個中央處理器之間的熱交換信息,進(jìn)而根據(jù)所有的熱交換信息確定所述冷卻塊和各個中央處理器之間的換熱系數(shù),通過所有的換熱系數(shù)和各個中央處理器的溫度梯度確定各個中央處理器在散熱過程中的熱傳遞強(qiáng)度;根據(jù)所有的熱傳遞強(qiáng)度和所述冷負(fù)荷量確定各個中央處理器在散熱過程中的冷卻代價,基于所有的冷卻代價對目標(biāo)多核服務(wù)器中的冷卻液進(jìn)行動態(tài)冷卻調(diào)控。
40、由此可見,本技術(shù)中可以根據(jù)所有的熱傳遞強(qiáng)度和所述冷負(fù)荷量確定各個中央處理器在散熱過程中的冷卻代價;其中,首先,從所有的流動信息中提取出所述冷卻液在不同環(huán)境溫度下的擾流波動特征,通過擾流波動特征可以幫助實時調(diào)整冷卻液在多核服務(wù)器中的流動路徑和流量分配,確保高熱負(fù)載區(qū)域得到足夠的冷卻,同時避免低熱負(fù)載區(qū)域的過度冷卻,進(jìn)而對所有的擾流波動特征進(jìn)行擬合,并對擬合得到的結(jié)果與多核服務(wù)器內(nèi)各個中央處理器在散熱過程中的溫度變化趨勢進(jìn)行量化,得到冷卻液在不同環(huán)境溫度下的冷能損失,其中
41、所述冷能損失表示冷卻系統(tǒng)中的冷卻液通過中央處理器時消耗的能量中未能有效減少中央處理器熱負(fù)荷所損失的能量,通過減少冷能損失,可以提高冷卻系統(tǒng)的整體性能,確保冷卻液能有效地帶走處理器產(chǎn)生的熱量,其次,使用冷卻液進(jìn)口和冷卻液出口之間液體流速的差異熵從所有的冷能損失中提取出用于衡量液冷系統(tǒng)在冷卻多核服務(wù)器內(nèi)各個中央處理器時由于熱不對稱現(xiàn)象導(dǎo)致額外積累的總熱量,冷負(fù)荷量有助于評估和優(yōu)化冷卻系統(tǒng)的能力,以應(yīng)對熱不對稱現(xiàn)象,通過有效的冷卻控制,可以減少局部熱點(diǎn)的形成,避免由于熱積聚導(dǎo)致的溫度過高,然后,確定冷卻塊和各個中央處理器之間的換熱系數(shù),其中,換熱系數(shù)反映了中央處理器處的冷卻塊的散熱效率,再對所有的換熱系數(shù)和各個中央處理器的溫度梯度進(jìn)行量化,得到衡量中央處理器在散熱過程中熱量傳遞的熱傳遞強(qiáng)度,再次,從所有的熱傳遞強(qiáng)度中提取出各個中央處理器在散熱過程中的冷卻代價,其中,散熱代價是指多核服務(wù)器在不同環(huán)境溫度下,為實現(xiàn)有效散熱所需投入的能量和資源,包括冷卻液的能耗、流量調(diào)節(jié)開銷,以及散熱過程中克服系統(tǒng)熱不對稱現(xiàn)象所需的額外代價,通過冷卻代價可以識別出需要額外關(guān)注的熱不對稱區(qū)域,從而通過技術(shù)手段減少局部過熱,進(jìn)而通過所有的散熱代價和冷卻液在不同環(huán)境溫度下的冷能損失確定各個中央處理器在散熱過程中的冷卻代價,其中,所述冷卻代價是指在不同的環(huán)境溫度下使得多核服務(wù)器中各個中央處理器達(dá)到最佳冷卻效果所需要付出的代價,通過所述冷卻代價可評估各個中央處理器的冷卻需求,動態(tài)調(diào)整冷卻液的流量和分布,從而有效減少熱不對稱現(xiàn)象對整體散熱效果的影響,最后,基于所有的冷卻代價對目標(biāo)多核服務(wù)器中的冷卻液進(jìn)行動態(tài)冷卻調(diào)控;綜上所述,本技術(shù)的方案可降低熱不對稱現(xiàn)象對液冷多核服務(wù)器散熱效果的影響,從而提高冷卻系統(tǒng)的效率。