北京2024年8月15日 /美通社/ -- 目前數據中心運維人員部署服務(wù)器時(shí),經(jīng)常會(huì )遇到服務(wù)器開(kāi)機噪音極大,開(kāi)機聲浪仿佛"飛機起飛",明明剛開(kāi)機,服務(wù)器內部各個(gè)部件還未完全上電,風(fēng)扇轉速為什么要拉滿(mǎn)?而且,伴隨著(zhù)風(fēng)扇的呼嘯聲,服務(wù)器啟動(dòng)"龜速",開(kāi)機時(shí)間要3、5分鐘甚至更久,嚴重影響了服務(wù)器運維部署效率。
通過(guò)BMC Linux/RTOS異構雙系統并行管理技術(shù),浪潮信息首創(chuàng )「開(kāi)機3秒智能控溫技術(shù)」,能夠在服務(wù)器上電后,BMC的Linux系統啟動(dòng)之前,3秒內即時(shí)接管風(fēng)扇轉速調控策略,通過(guò)實(shí)時(shí)感知環(huán)境溫度,實(shí)現對溫度與散熱的動(dòng)態(tài)把控,噪音比優(yōu)化前最大下降30.4%,提升數據中心運維體驗,開(kāi)機功耗相比傳統風(fēng)扇轉速拉滿(mǎn)策略也可降低一半以上。同時(shí),通過(guò)BMC RTOS系統與Linux系統的同時(shí)啟動(dòng),及BIOS系統優(yōu)化,可實(shí)現上電即開(kāi)機,開(kāi)機時(shí)間縮短一半以上,減少時(shí)間敏感型業(yè)務(wù)部署上線(xiàn)時(shí)間,有效降低因為運維重啟服務(wù)器對于業(yè)務(wù)的不良影響。
浪潮信息首創(chuàng )服務(wù)器開(kāi)機3秒智能控溫技術(shù)
服務(wù)器啟動(dòng)時(shí)間過(guò)長(cháng)且風(fēng)扇噪音過(guò)高的癥結在于,服務(wù)器傳統控溫策略中為了盡可能滿(mǎn)足散熱安全性要求,上電之后會(huì )以覆蓋最大配置的方式來(lái)進(jìn)行風(fēng)扇速度調節,而此時(shí)BMC Linux系統尚未啟動(dòng),熱量傳感器數據無(wú)法采集,導致風(fēng)扇滿(mǎn)載狀態(tài)會(huì )持續較長(cháng)時(shí)間,帶來(lái)能耗、噪音的攀升和穩定性的降低。而且為了避免開(kāi)機過(guò)程中散熱風(fēng)險一般會(huì )設置等待BMC Linux 系統啟動(dòng)完成后再啟動(dòng) POST 過(guò)程,導致服務(wù)器從 AC 上電到進(jìn)入 OS 的時(shí)間被拉長(cháng)。
除了啟動(dòng)過(guò)程中服務(wù)器風(fēng)扇滿(mǎn)轉,噪音過(guò)高,在BMC的Linux故障情況下,由于沒(méi)有合理機制能夠保證風(fēng)扇的可靠接管,也會(huì )造成風(fēng)扇滿(mǎn)轉噪音瞬間達到峰值,服務(wù)器始終在功耗峰值運行,運維環(huán)境惡劣,不僅不符合節能降碳趨勢,還會(huì )影響系統穩定性和風(fēng)扇壽命。
為了化解服務(wù)器啟動(dòng)等過(guò)程中的風(fēng)扇控制難題,浪潮信息首創(chuàng )開(kāi)機3秒智能控溫技術(shù)。該技術(shù)通過(guò)解決BMC異構雙系統核間通信的難題,實(shí)現BMC內部RTOS 3秒智能控溫技術(shù)和Linux管理技術(shù)的雙系統并行,有效利用RTOS實(shí)時(shí)操作系統采集傳感器數據,實(shí)現毫秒級的信號采集控制,確保風(fēng)扇控制的高效、精準,同時(shí)也優(yōu)化了服務(wù)器開(kāi)機管理流程。
創(chuàng )新一:創(chuàng )新RTOS系統 精準控制風(fēng)扇轉速
浪潮信息充分利用BMC芯片算力資源,創(chuàng )新性開(kāi)發(fā)RTOS實(shí)時(shí)操作系統,通過(guò)PECI總線(xiàn)對環(huán)境溫度以及部分核心部件溫度進(jìn)行采集,開(kāi)機即可實(shí)現毫秒級的信號采集控制,隨后通過(guò)閉環(huán)反饋實(shí)現對溫度與散熱的動(dòng)態(tài)把控,從而精確掌控散熱資源,以滿(mǎn)足散熱需求的最小化資源,降低無(wú)效功耗。
在通過(guò)RTOS系統實(shí)時(shí)獲取傳感器溫度數據的基礎上,浪潮信息獨家提出BMC Linux/RTOS異構雙系統并行技術(shù),成功攻克多核多系統之間數據交換難題,構建了開(kāi)機期間,全新的風(fēng)扇控制策略:
BMC Linux系統啟動(dòng)前,RTOS進(jìn)行系統溫度收集及控制;
在BMC Linux系統啟動(dòng)階段,由Linux收集傳感器溫度信息,之后通過(guò)共享內存傳遞給RTOS,由RTOS進(jìn)行風(fēng)扇調控
當BMC Linux系統完全啟動(dòng)后,由Linux系統收集傳感器溫度并親自實(shí)現溫度調控。同時(shí)在BMC Linux系統故障或重啟時(shí)RTOS能迅速接管散熱系統并精確控制風(fēng)扇轉速。
創(chuàng )新二:階梯性散熱策略 散熱需求實(shí)時(shí)動(dòng)態(tài)響應
開(kāi)機過(guò)程中,一般服務(wù)器內部各部件會(huì )相繼啟動(dòng),帶來(lái)的散熱需求應該是階梯式增長(cháng)的。但此時(shí)BMC Linux系統尚未啟動(dòng),無(wú)法控制風(fēng)扇轉速,為保障服務(wù)器高可用性,風(fēng)扇只能按照極端環(huán)境下的極限負載高轉速運行,造成能耗、噪音的提升和穩定性的降低。
浪潮信息基于深耕多年的服務(wù)器行業(yè)經(jīng)驗,結合電子設備在上電后熱量逐漸累積并向外傳遞的散熱數據,構建服務(wù)器散熱策略專(zhuān)家庫,與業(yè)界開(kāi)機即風(fēng)扇拉滿(mǎn)的策略不同,創(chuàng )造性的提出基于服務(wù)器溫度感知的階梯性風(fēng)量提升控制技術(shù)。
借助毫秒級的信號檢測和梯度散熱模型,浪潮信息了實(shí)現對散熱需求的動(dòng)態(tài)響應,使風(fēng)扇轉速能夠階梯式上升,不僅更符合硬件散熱規律,也使得開(kāi)機過(guò)程中的噪音得到有效控制。實(shí)測數據證實(shí),在環(huán)境溫度為20°時(shí),浪潮信息的解決方案可將風(fēng)扇轉速值控制在25%,開(kāi)機噪聲值降低至44.7dBA,噪音下降30.4%。在BMC重啟或掛死情況下,其能夠將風(fēng)扇轉速值優(yōu)化40%,噪聲由71.8dBA降低至57.2dBA。
創(chuàng )新三:上電即開(kāi)機 開(kāi)機時(shí)間縮短一半以上
RTOS作為輕量級實(shí)時(shí)系統,任務(wù)負載量小,可先于BMC Linux啟動(dòng),同時(shí)搭配浪潮信息獨有的BMC Linux與服務(wù)器BIOS系統同步啟動(dòng)技術(shù),可實(shí)現上電即開(kāi)機,從而大幅度提升開(kāi)機速度。
測試數據顯示,部署RTOS實(shí)時(shí)操作系統和BIOS快速啟動(dòng)技術(shù)的服務(wù)器,進(jìn)入操作系統時(shí)間可較業(yè)界縮短一半以上,不但可以快速執行時(shí)間敏感型任務(wù),還能有效加快常規業(yè)務(wù)部署上線(xiàn),并減少因為運維重啟服務(wù)器對于業(yè)務(wù)時(shí)效的影響。
開(kāi)機智能控溫,大規模數據中心高效綠色發(fā)展利器
浪潮信息服務(wù)器開(kāi)機3秒智能控溫技術(shù),為數據中心運維人員解決了"服務(wù)器部署時(shí)啟動(dòng)時(shí)間過(guò)長(cháng),且風(fēng)扇轉速一次性拉升過(guò)高"的問(wèn)題,實(shí)現上電即開(kāi)機,開(kāi)機速度較業(yè)界平均速度最大提升1.2倍,助力業(yè)務(wù)快速上線(xiàn),減少因為運維和維護造成的業(yè)務(wù)擱淺時(shí)間。
同時(shí),在階梯式轉速控制模型和閉環(huán)反饋控制的精確調節下,實(shí)現了根據環(huán)境溫度和散熱需求的動(dòng)態(tài)響應,大幅改善啟動(dòng)過(guò)程中的噪音,噪音比優(yōu)化前最大下降30.4%,能夠為運維人員提供更舒適的機房環(huán)境,并實(shí)現風(fēng)扇轉速的全周期速率可控,延長(cháng)風(fēng)扇壽命,降低運維成本。在BMC Linux故障的情況下,RTOS還可以迅速接管設備散熱管理,對風(fēng)扇進(jìn)行有效管控,防止設備過(guò)熱損壞,提升系統可靠性。