Correct Power Institute 的公司開發(fā)出了一套計算機(jī)中心監(jiān)控方法,可快速跟蹤供電故障以盡可能延長IT 系統(tǒng)的正常運(yùn)行時間。
其中,萬可控制器可檢測所有電流和環(huán)境數(shù)據(jù),并利用云技術(shù)進(jìn)行分析。其強(qiáng)化版Linux? 操作系統(tǒng)和Correct Power 的高級安全架構(gòu),可確保最高等級的數(shù)據(jù)安全。不妨設(shè)想斯圖加特一家汽車制造商的情景:早班進(jìn)行的過程中,生產(chǎn)突然停止。傳送帶停止運(yùn)行、零件加工機(jī)器人的敏捷動作突然暫停、生產(chǎn)工程師所用的觸摸屏幕變黑。稍后問題清楚了,網(wǎng)絡(luò)罪犯攻擊了該制造商的計算中心,并切斷了服務(wù)器的電源。
如果黑客或某種技術(shù)故障造成企業(yè)服務(wù)器癱瘓,可能會造成數(shù)以百萬計的損失。一家名為Correct Power Institute的公司開發(fā)出了一套計算機(jī)中心監(jiān)控方法,可快速跟蹤供電故障以盡可能延長IT系統(tǒng)的正常運(yùn)行時間。
其中,WAGO萬可控制器可檢測所有電流和環(huán)境數(shù)據(jù),并利用云技術(shù)進(jìn)行分析。其強(qiáng)化版Linux操作系統(tǒng)和Correct Power的高級安全架構(gòu),可確保最高等級的數(shù)據(jù)安全。
不妨設(shè)想斯圖加特一家汽車制造商的情景:早班進(jìn)行的過程中,生產(chǎn)突然停止。傳送帶停止運(yùn)行、零件加工機(jī)器人的敏捷動作突然暫停、生產(chǎn)工程師所用的觸摸屏幕變黑。稍后問題清楚了,網(wǎng)絡(luò)罪犯攻擊了該制造商的計算中心,并切斷了服務(wù)器的電源。在已部署的工業(yè)4.0,最重要的過程都是通過IT控制的地方,這種經(jīng)歷代價不菲:據(jù)估計,該公司此次停產(chǎn)導(dǎo)致的損失高達(dá)2000萬歐元。
雖然這個案例是虛構(gòu)的,但它又非常真實(shí),因?yàn)閹缀跛械拇笮推髽I(yè)、銀行和保險集團(tuán)都將其IT業(yè)務(wù)外包給計算中心。此類不間斷的數(shù)據(jù)處理、分析和存儲通常都在云端完成,從而大幅提升IT能力。
但難點(diǎn)在于:如果服務(wù)器群的IT安全性不夠強(qiáng)大,就會很容易遭到互聯(lián)網(wǎng)攻擊。黑客會變本加厲地利用這些弱點(diǎn)將病毒植入代碼,竊取數(shù)據(jù)或是破壞電源。
“電源是服務(wù)器的致命要害,”Correct Power Institute GmbH的CEO Bernd Steinkühler解釋說。該公司是德國波鴻一家專門從事服務(wù)器群構(gòu)建與監(jiān)控的公司。問題在于盡管供電須服從相關(guān)監(jiān)管標(biāo)準(zhǔn)和要求,但這些標(biāo)準(zhǔn)和要求往往難以貫徹。“規(guī)章制度太多,操作人員很難記住。另外,還往往缺少監(jiān)控,有問題又不能及早發(fā)現(xiàn),”Steinkühler表示。 而這些可能會對一家公司造成致命影響。如果IT部門不能夜以繼日地工作,生產(chǎn)和競爭力就會受到負(fù)面影響。
利用Azure實(shí)現(xiàn)云分析
Correct Power可提供補(bǔ)救措施:該公司已開發(fā)出一套旨在實(shí)現(xiàn)供電能力最大化的服務(wù)器群監(jiān)控理念。“為滿足對于現(xiàn)代化計算中心的可用性與安全性要求,我們必須更加明確地完成電力檢查,從而更細(xì)致地完成剩余電流的檢測和評估。我們會針對電流進(jìn)行大量測試,”Correct Power銷售與營銷部門負(fù)責(zé)人Marcel Steinkühler解釋說。
WAGO萬可控制器在其中扮演著關(guān)鍵的角色。它們會從每個服務(wù)器群的多達(dá)15000個數(shù)據(jù)點(diǎn)采集電流與環(huán)境數(shù)據(jù),并將其發(fā)送給Microsoft的Azure平臺進(jìn)行分析和存檔,而該平臺則由Telekom的子公司T-system進(jìn)行管理。
“這就為我們提供了集中的大數(shù)據(jù)情報。此外,由于T-system承擔(dān)德國受托人職能,對訪問權(quán)限進(jìn)行控制,因此Azure能夠提供高級別的數(shù)據(jù)監(jiān)控,”首席執(zhí)行官Bernd Steinkühler表示。
Correct Power的分析基于計算中心服務(wù)器機(jī)架中檢測到的差動電流值。根據(jù)定義,差動電流即電氣系統(tǒng)某個特定點(diǎn)處,所有有效導(dǎo)體電流的矢量和。由于流進(jìn)流出機(jī)架的電流必須平衡,所以此值應(yīng)等于零。“如果出現(xiàn)偏差,則很可能存在故障,我們的系統(tǒng)會拉響報警,”Steinkühler解釋說。
“安全始于設(shè)計”—— IT安全從一開始就在基于層級的安全架構(gòu)中集成,確保數(shù)據(jù)竊取者在面對這些控制器時束手無策。“我們十分鐘愛這套強(qiáng)化版Linux操作系統(tǒng), ”Steinkühler 表示。
安全鏈的核心
如果沒有PFC200,這家波鴻公司設(shè)計師的理念也就無從談起。PFC200會按定義的時間間隔自動將選定值發(fā)送給Palo Alto Network(一家安全公司)的防火墻。通信安全可通過成熟的MQTT協(xié)議,利用加密的VPN連接來保障。Palo Alto會評估信息、探測入侵者并擋住來自IT的攻擊。之后再將“干凈”數(shù)值通過互聯(lián)網(wǎng)傳達(dá)給Azure,以供進(jìn)一步云處理。
“正是由于這個中間步驟,我們的監(jiān)控解決方案已成為數(shù)據(jù)安全的‘諾克斯堡’,我們十分鐘愛PFC200中的這套強(qiáng)化版Linux操作系統(tǒng)。”Steinkühler說。
由WAGO萬可子公司M&M開發(fā)的“資產(chǎn)管理云”可通過Azure接收數(shù)據(jù)。將Web門戶用作用戶界面,可進(jìn)行相應(yīng)設(shè)置,例如,最終將什么信息存儲于云端,或者哪些測量值可以觸發(fā)報警。這些信息可以圖表的方式清晰地顯示在儀表板和由Correct Power提供支持的數(shù)據(jù)倉儲數(shù)據(jù)庫中。
“該解決方案的優(yōu)勢在于,無論我們身在何處,都可訪問當(dāng)前和歷史數(shù)據(jù),”Steinkühler解釋說。
Correct Power監(jiān)控系統(tǒng)已經(jīng)吸引到了工業(yè)企業(yè)、銀行和保險公司的注意。IT專家已在遍布?xì)W洲、亞洲和澳洲的幾十個服務(wù)器群完成了這些系統(tǒng)的部署。Correct Power計劃在下個項(xiàng)目中使用Azure進(jìn)行故障預(yù)測,并制定提升服務(wù)器可用性的新型運(yùn)營策略。“問題通常來自于不利關(guān)聯(lián)。我們要利用人工智能 ( 即所謂的機(jī)器學(xué)習(xí) ) 來檢測并預(yù)防錯誤,”Steinkühler說道。
專家們已在機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)中看到了未來的發(fā)展大勢,因?yàn)樵谒鼈兊膸椭拢纯衫媚芎呐c過程數(shù)據(jù)進(jìn)行預(yù)測性維護(hù)。生產(chǎn)系統(tǒng)將不再是故障后維修,而是發(fā)生故障前進(jìn)行維護(hù)。如此可避免長時間的閑置以及相應(yīng)的成本。
WAGO萬可還可推動企業(yè)向工業(yè)4.0再邁一步,因?yàn)槠淇刂破骺捎米髂M與數(shù)字信息的中央數(shù)據(jù)管理器,與云端的鏈接也十分安全,更多價值的創(chuàng)造盡在萬可。
該公司還會監(jiān)測濕度、溫度和壓力等環(huán)境值。如果服務(wù)器機(jī)房內(nèi)過熱,則敏感型服務(wù)器就會以低輸出、高功耗的方式運(yùn)行。這種情況下,氣候控制系統(tǒng)就會自動管理溫度,并由云端發(fā)出一則警報消息。
這些聽起來都很簡單,但實(shí)際都是以一套十分復(fù)雜的系統(tǒng)為基礎(chǔ)的。Correct Power的專家會在設(shè)計中充分考慮到數(shù)據(jù)安全性。
“市面上的許多控制器根本無法滿足我們在這方面的需求,”Steinkühler表示。 此類控制器均基于Windows,因此需要定期安全更新。“這會帶來大筆支出,而且并不符合我們的高標(biāo)準(zhǔn)安全要求。” 因此,Correct Power選擇了WAGO萬可的PFC200 Linux控制器。