機(jī)房管理為網(wǎng)強(qiáng)IT綜合管理系統(tǒng)/網(wǎng)絡(luò)管理系統(tǒng)的增值(可選)功能模塊,已有網(wǎng)強(qiáng)IT綜合管理系統(tǒng)/網(wǎng)絡(luò)管理系統(tǒng)的用戶,可在原有系統(tǒng)基礎(chǔ)上直接升級(jí)即可。
機(jī)房監(jiān)控的必要性
隨著社會(huì)信息化程度的不斷提高,機(jī)房建設(shè)規(guī)模日益擴(kuò)大,其設(shè)備數(shù)量也日益增多,機(jī)房環(huán)境設(shè)備(如供配電系統(tǒng)、UPS電源、空調(diào)、消防系統(tǒng)、安防系統(tǒng)等)必須時(shí)時(shí)刻刻為業(yè)務(wù)系統(tǒng)提供正常的運(yùn)行環(huán)境。任何影響整個(gè)業(yè)務(wù)系統(tǒng)的隱患,將對(duì)數(shù)據(jù)傳輸、存儲(chǔ)及系統(tǒng)運(yùn)行的可靠性構(gòu)成一定的威脅,若出現(xiàn)故障又不能及時(shí)處理就可能造成嚴(yán)重后果。對(duì)于金融、運(yùn)營(yíng)商、政府、互聯(lián)網(wǎng)等需要實(shí)時(shí)交換數(shù)據(jù)的信息機(jī)房,其機(jī)房管理尤為重要,一旦系統(tǒng)發(fā)生故障,造成的經(jīng)濟(jì)損失將不可估量。
為了保證機(jī)房能給設(shè)備提供一個(gè)良好的運(yùn)行環(huán)境,從而保障業(yè)務(wù)系統(tǒng)的正常運(yùn)行,就有必要對(duì)機(jī)房環(huán)境的運(yùn)行狀態(tài)變量,進(jìn)行24小時(shí)實(shí)時(shí)監(jiān)測(cè)與智能化調(diào)節(jié)控制。而各行業(yè)用戶對(duì)于機(jī)房監(jiān)控的管理力度和方法也不盡相同,很多單位甚至仍然采用傳統(tǒng)的24小時(shí)專人值班的方式定時(shí)巡查機(jī)房環(huán)境。
機(jī)房與網(wǎng)管系統(tǒng)有效集成,6招擺脫機(jī)房監(jiān)控現(xiàn)狀
網(wǎng)強(qiáng)機(jī)房管理系統(tǒng)(簡(jiǎn)稱:Environment Manager)通過與網(wǎng)強(qiáng)IT綜合管理系統(tǒng)實(shí)時(shí)聯(lián)動(dòng),利用智能分析和影響度關(guān)聯(lián)技術(shù),將機(jī)房環(huán)境中的溫濕度、漏水、電源、UPS、煙霧、視頻監(jiān)控、消防及門禁等與用戶的網(wǎng)絡(luò)設(shè)備、應(yīng)用、服務(wù)等IT資源關(guān)聯(lián)在一起,并完整集成到業(yè)務(wù)模型。通過智能業(yè)務(wù)模型,系統(tǒng)將自動(dòng)對(duì)各項(xiàng)業(yè)務(wù)以及承載業(yè)務(wù)的各個(gè)設(shè)備、服務(wù)器、應(yīng)用等資源進(jìn)行整體全面分析,同時(shí)在業(yè)務(wù)結(jié)構(gòu)中清晰的反映機(jī)房環(huán)境對(duì)整體業(yè)務(wù)的影響程度。任何一個(gè)業(yè)務(wù)中的細(xì)小變化和端倪,都能通過系統(tǒng)實(shí)時(shí)組合成及展現(xiàn)出各個(gè)符合個(gè)人所關(guān)注的性能數(shù)據(jù)或信息,并進(jìn)行實(shí)時(shí)直觀展現(xiàn),如整體業(yè)務(wù)健康度、可用率等。當(dāng)機(jī)房環(huán)境出現(xiàn)異常時(shí),系統(tǒng)則會(huì)可根據(jù)不同的異常等級(jí)進(jìn)行告警,并通過多種告警方式及時(shí)通知運(yùn)維人員,從而保障各設(shè)備、業(yè)務(wù)系統(tǒng)的高效運(yùn)行,大大降低了業(yè)務(wù)系統(tǒng)運(yùn)行中產(chǎn)生的風(fēng)險(xiǎn)。
現(xiàn)狀一:機(jī)房的環(huán)境和動(dòng)力設(shè)備如供電源、UPS、空調(diào)、煙感、消防等必須時(shí)時(shí)刻刻為計(jì)算機(jī)信息系統(tǒng)提供正常的運(yùn)行環(huán)境。一旦它們出現(xiàn)異常或故障,后果將不堪設(shè)想。為此很多單位已經(jīng)重視并對(duì)機(jī)房環(huán)境進(jìn)行監(jiān)控與管理。但傳統(tǒng)的機(jī)房監(jiān)控軟件只能對(duì)機(jī)房動(dòng)力環(huán)境進(jìn)行監(jiān)控,而這些環(huán)境的變化對(duì)單位關(guān)鍵業(yè)務(wù)的影響度為多少,運(yùn)維人員卻無從得知。
機(jī)房管理系統(tǒng)與網(wǎng)管集成,使機(jī)房環(huán)境與業(yè)務(wù)系統(tǒng)相關(guān)聯(lián)
網(wǎng)強(qiáng)機(jī)房管理系統(tǒng)通過與網(wǎng)強(qiáng)IT綜合管理系統(tǒng)的有效集成,利用智能分析和影響度關(guān)聯(lián)技術(shù),將機(jī)房環(huán)境中的溫濕度、消防設(shè)施(煙霧、漏水)、UPS電源設(shè)備、供配電系統(tǒng)(電流、電壓、空氣開關(guān))、機(jī)房空調(diào)、安防系統(tǒng)(視頻、門禁、紅外)等與業(yè)務(wù)系統(tǒng)及承載業(yè)務(wù)系統(tǒng)的各種下屬網(wǎng)絡(luò)設(shè)備、應(yīng)用系統(tǒng)、服務(wù)器等IT資源關(guān)聯(lián)在一起,自動(dòng)進(jìn)行整體全面的分析,實(shí)現(xiàn)統(tǒng)一的資源管理。同時(shí)在業(yè)務(wù)結(jié)構(gòu)中清晰的反映機(jī)房環(huán)境對(duì)整體業(yè)務(wù)的影響程度,任何一個(gè)業(yè)務(wù)系統(tǒng)中的細(xì)小變化和端倪,都能通過系統(tǒng)實(shí)時(shí)組合成及展現(xiàn)出各個(gè)符合個(gè)人所關(guān)注的性能數(shù)據(jù)或信息,并進(jìn)行實(shí)時(shí)直觀展現(xiàn),從而有效反映影響業(yè)務(wù)系統(tǒng)健康度、利用率的關(guān)鍵因素,幫助運(yùn)維人員盡快找到相關(guān)瓶頸或隱患。
現(xiàn)狀二:通常機(jī)房環(huán)境監(jiān)控?cái)?shù)據(jù)的采集都是通過特定的硬件監(jiān)控設(shè)備協(xié)助完成的,每一套機(jī)房管理軟件都需要部署硬件設(shè)備,對(duì)于采集的數(shù)據(jù)都有對(duì)應(yīng)的指標(biāo)。一般十幾個(gè)指標(biāo),運(yùn)維人員基本能應(yīng)付查看,但對(duì)于幾十個(gè)甚至上百個(gè)指標(biāo),如果無法通過數(shù)據(jù)或圖形形式對(duì)機(jī)房的運(yùn)行情況進(jìn)行直觀展現(xiàn),運(yùn)維人員了解起來也就有點(diǎn)力不從心了。
機(jī)房變量數(shù)據(jù)實(shí)時(shí)采集,指標(biāo)一覽、示意拓?fù)鋱D直觀展現(xiàn)
系統(tǒng)通過對(duì)機(jī)房環(huán)境中的各個(gè)硬件設(shè)備進(jìn)行數(shù)據(jù)采集,并將采集的數(shù)據(jù)在IT綜合管理系統(tǒng)的監(jiān)控指標(biāo)列表中集中展示。通過指標(biāo)一覽,可以直觀了解到各個(gè)指標(biāo)的類型、當(dāng)前值、當(dāng)前狀態(tài)、異常規(guī)則、監(jiān)控頻度等。不僅如此,用戶還可以通過增加示意圖元、示意鏈路的方式建立示意拓?fù)鋱D來模擬機(jī)房實(shí)際物理環(huán)境的擺設(shè)與布局等,將機(jī)房環(huán)境實(shí)時(shí)的在示意拓?fù)鋱D中直觀的展現(xiàn)出來。通過機(jī)房示意拓?fù)鋱D,可以了解到機(jī)房環(huán)境中的溫度、漏水、煙霧探測(cè)、視頻、消防設(shè)備、空調(diào)與門禁等設(shè)備的運(yùn)行情況和分布情況。另外,還可以根據(jù)每個(gè)示意圖元的顏色狀態(tài)來判斷該設(shè)備的異常等級(jí)情況。當(dāng)設(shè)備發(fā)生故障時(shí),在機(jī)房示意拓?fù)鋱D上可以直觀看到相關(guān)設(shè)備的異常提示,直接點(diǎn)擊異常設(shè)備則可以自動(dòng)關(guān)聯(lián)到該異常設(shè)備的詳細(xì)信息。
現(xiàn)狀三:一般情況下機(jī)房環(huán)境出現(xiàn)的問題不會(huì)直接影響業(yè)務(wù)系統(tǒng)運(yùn)行的,都是在異常變化出現(xiàn)后,問題無法及時(shí)發(fā)現(xiàn)并處理,使環(huán)境不斷的惡化致使業(yè)務(wù)系統(tǒng)的運(yùn)行受到影響;為了保證機(jī)房能給設(shè)備提供一個(gè)良好的運(yùn)行環(huán)境,保障業(yè)務(wù)系統(tǒng)的正常運(yùn)行,企業(yè)不得不采用24小時(shí)專人值班的方式定時(shí)巡查機(jī)房環(huán)境。即便如此,當(dāng)業(yè)務(wù)系統(tǒng)不能正常運(yùn)行時(shí),運(yùn)維人員才發(fā)現(xiàn)是機(jī)房環(huán)境運(yùn)行情況出現(xiàn)異常所致。
機(jī)房環(huán)境出現(xiàn)異常實(shí)時(shí)告警,及時(shí)通知運(yùn)維人員恢復(fù)故障
結(jié)合IT綜合管理系統(tǒng)的告警敏感度、告警合并、告警過濾以及異常依賴、根源分析等多種高端技術(shù)手段,能夠避免大量的無謂重復(fù)告警信息,防止告警泛濫。并能在眾多的告警信息中,屏蔽不重要的告警信息,幫助運(yùn)維人員將精力集中在關(guān)鍵問題上,準(zhǔn)確定位可能的故障根源,真正做到事先運(yùn)維、整體運(yùn)維,將影響業(yè)務(wù)系統(tǒng)健康度和可用率的一切因素事先排除。當(dāng)機(jī)房環(huán)境產(chǎn)生異常時(shí),例如當(dāng)前機(jī)房煙霧漏水積水、門禁開關(guān)量狀態(tài)不符合規(guī)范等,將通過配置的告警功能自動(dòng)觸發(fā)IT綜合管理系統(tǒng)進(jìn)行告警。系統(tǒng)可以根據(jù)不同的異常等級(jí),通過聲音、消息框、電話、手機(jī)短信、電子郵件、廣播及燈光警鈴等多種告警方式及時(shí)通知運(yùn)維人員,將影響業(yè)務(wù)系統(tǒng)健康度一切因素事先排除,真正做到事先運(yùn)維。運(yùn)維人員還可以由異常直接關(guān)聯(lián)到系統(tǒng)的知識(shí)庫,并從知識(shí)庫中找到故障的解決方案,從而及時(shí)恢復(fù)故障,滿足24 小時(shí)機(jī)房管理要求,最大限度保證了業(yè)務(wù)的服務(wù)水平。
現(xiàn)狀四:當(dāng)機(jī)房環(huán)境出現(xiàn)異常時(shí),運(yùn)維人員可以通過相關(guān)告警方式得知異常信息并及時(shí)排查。在排查故障時(shí),如果只是單點(diǎn)的報(bào)警,運(yùn)維人員的排查與故障恢復(fù)的效率通常都會(huì)比較高。但有多點(diǎn)頻繁發(fā)生異常并告警時(shí),運(yùn)維人員由于無法有效判斷故障的輕重緩急,常常沒有針對(duì)性的排查而拖延了故障恢復(fù)的時(shí)間。
詳細(xì)的異常信息一覽便于直觀判斷輕重緩急,使排查更有針對(duì)性
系統(tǒng)對(duì)機(jī)房環(huán)境進(jìn)行全盤監(jiān)控,當(dāng)產(chǎn)生不同等級(jí)的異常時(shí),并自動(dòng)記錄異常信息,如異常的指標(biāo)名稱、異常來源、異常等級(jí)、時(shí)間、恢復(fù)狀態(tài)、異常總數(shù)及確認(rèn)人等。運(yùn)維人員只需查看異常列表即可了解到具體異常情況,點(diǎn)擊異常列表中的任意指標(biāo)異??赡苓M(jìn)一步了解該異常指標(biāo)的詳細(xì)信息,如異常來源、指標(biāo)名稱、最新異常等級(jí)、異常時(shí)間段、異??倲?shù),是否已恢復(fù)及事件合并記錄描述信息等。以便于進(jìn)一步確定異常的輕重緩急,以及異常的根源,從而使運(yùn)維人員能更快更有效的解決故障。
現(xiàn)狀五:任何一個(gè)有經(jīng)驗(yàn)的運(yùn)維人員都可以在發(fā)生異常接到告警后及時(shí)的解決故障,但每天圍著機(jī)房環(huán)境出現(xiàn)的異?,F(xiàn)象日復(fù)一日已是司空見慣,運(yùn)維人員疲于奔命并且仍無法根除問題。當(dāng)機(jī)房某個(gè)設(shè)備或環(huán)境出現(xiàn)異常,運(yùn)維人員也由于缺少關(guān)于該設(shè)備或環(huán)境的一些歷史數(shù)據(jù)來進(jìn)行判斷和分析,從而無法從根本上確定該異常問題是偶然性的還是由于該設(shè)備或機(jī)房環(huán)境已經(jīng)長(zhǎng)時(shí)間負(fù)荷過高所致使的。
機(jī)房環(huán)境運(yùn)行情況實(shí)時(shí)和統(tǒng)計(jì)分析,全面了解以及預(yù)測(cè)變化趨勢(shì)
系統(tǒng)支持當(dāng)日性能分析、指標(biāo)時(shí)段分析(實(shí)時(shí)分析和統(tǒng)計(jì)分析)、資源對(duì)比分析及時(shí)段對(duì)比分析,運(yùn)維人員可以通過相關(guān)統(tǒng)計(jì)分析數(shù)據(jù),來詳細(xì)查看機(jī)房異常情況的出現(xiàn)頻率和變化規(guī)律。例如、通過多指標(biāo)分析圖可以直觀了解到個(gè)人所關(guān)注的某幾個(gè)指標(biāo)于不同時(shí)間段的對(duì)比分析情況。根據(jù)指標(biāo)的性能分析來確定機(jī)房出現(xiàn)的問題和存在的潛在威脅,以便于給出更準(zhǔn)確、更徹底的解決方案。
現(xiàn)狀六:企業(yè)目前諸多的IT管理工具由于功能層次不齊、管理范圍受限,相互不能兼容,從而造成信息孤島,很難協(xié)同辦公建立最大價(jià)值。面對(duì)再次的網(wǎng)絡(luò)擴(kuò)展和升級(jí),原有的監(jiān)控工具和維護(hù)人員都將面臨著再投入與再集成的困境。另外,傳統(tǒng)IT管理系統(tǒng)對(duì)于IT設(shè)備的僅僅具有最基礎(chǔ)的監(jiān)控項(xiàng),對(duì)于用戶而言如果需要保證IT管理質(zhì)量,這些基本監(jiān)控指標(biāo)是必須實(shí)時(shí)監(jiān)控的,但是這樣不可避免就會(huì)增加新的額外軟件開發(fā)資金和大量的人力工作量投入。
開放的系統(tǒng)兼容性與自定義指標(biāo),有效應(yīng)對(duì)各種網(wǎng)絡(luò)變更與擴(kuò)展
基于IT綜合管理系統(tǒng)所支持的WEB Service 、CORBA及RMI 等服務(wù)接口還能供第三方調(diào)用,全面保證系統(tǒng)的兼容性,大大滿足了用戶在實(shí)際的網(wǎng)絡(luò)管理中,與其它多種應(yīng)用和業(yè)務(wù)系統(tǒng)能夠高效整合的需要。同時(shí),系統(tǒng)在對(duì)具體的資源監(jiān)控上,不僅有內(nèi)建的監(jiān)控指標(biāo)、擴(kuò)展的監(jiān)控指標(biāo),還有自定義的監(jiān)控指標(biāo),用戶可以把一個(gè)資源本身的指標(biāo),將若干個(gè)個(gè)人所關(guān)注的內(nèi)建指標(biāo)與擴(kuò)展指標(biāo)組建成一個(gè)新的指標(biāo)。并可以對(duì)此新的指標(biāo)設(shè)置閾值、異常類型、異常過濾等,有效滿足運(yùn)維人員對(duì)IT設(shè)備指標(biāo)的靈活監(jiān)控需求,省去了傳統(tǒng)網(wǎng)管系統(tǒng)高昂的二次開發(fā)費(fèi)用的同時(shí),真正幫助運(yùn)維人員應(yīng)對(duì)各種網(wǎng)絡(luò)的變更、調(diào)整與擴(kuò)展等,以不變應(yīng)萬變維護(hù)好整個(gè)網(wǎng)絡(luò)。
來源:機(jī)房監(jiān)控 http://qdlanhai.cn/ 本文采集于網(wǎng)絡(luò),如有問題有聯(lián)系刪除
北京金恒智能系統(tǒng)工程技術(shù)有限責(zé)任公司 版權(quán)所有 Copyright 2007-2020 by Create-china.com.cn Inc. All rights reserved.
法律聲明:未經(jīng)許可,任何模仿本站模板、轉(zhuǎn)載本站內(nèi)容等行為者,本站保留追究其法律責(zé)任的權(quán)利!
電話:86+10-62104277/2248/4249 傳真:86+10-62104193-819 京ICP備10010038號(hào)-2網(wǎng)站XML
智慧機(jī)房
在線體驗(yàn)