中国足彩网14选9|中国足彩网比分直播网

由蕭何出名想到的……數據中心運維思考

關注公眾號【運維派】,及時獲取最新運維動態 | 運維派[2019]贊助商計劃已啟動,歡迎洽談!

“蕭何是誰?”單純的問我們一般老百姓,還真不知道。但是說到俗語“成也蕭何,敗也蕭何。”“蕭何月下追韓信”等等,似乎一下子清楚了:他呀,推薦給劉邦打敗西楚霸王項羽的那個韓信的人啊。至于蕭何其他事跡,則是知之甚少了。《史記·高祖本紀》中高祖曰:“……鎮國家,撫百姓,給饋餉,不絕糧道,吾不如蕭何……。連百萬之軍,戰必勝,攻必取,吾不如韓信……”從高祖的結論來看,蕭何本身的工作很大一部分就是劉邦的后勤部長。看歷史得知蕭何尤其是在楚漢戰爭期間,使劉邦在關中站穩腳跟,為劉邦屢敗屢戰,最后打敗項羽提供了源源不斷的物質和兵力支持。

為IT系統設備提供穩定運行平臺的數據中心,好比是為戰場前線提供支持的大后方,相關的運維人員的工作和蕭何的本職工作何其相似。古今中外,赫赫有名的將帥不可勝數,太多了。而在戰爭期間,對于負責“兵馬未動,糧草先行”的后勤部隊而言,他們的長官的名字在史書的記載中,可是鳳毛麟角。而蕭何作為大后勤部長,似乎也沒有做出什么出名的成績,假如他為了突出自己的成績,這樣寫自己的總結:“······本年度為前線提供糧草X萬石,提供兵源十萬······”;前方將領看到后一定罵死他:“你的意思是我們損兵折將起碼十萬了?······”劉邦為了全局出發,也會斥責蕭何的。在《三國演義》中出了一個有名的“后勤部長”—王垕:在曹操和袁紹的官渡之戰中,曹操缺糧,為了穩定軍心,爭取時間的主動性,殺了運糧官王垕,使王垕成為替罪羊,為整個戰爭的勝利提供了一定的保障。在戰爭期間,一線最重要,所有的工作都是為戰勝敵人服務的,以大局為重。我們一般認為蕭何的出名很大程度沾了前線名將韓信的光,畢竟在以后的傳承中似乎蕭何沒有韓信的名氣大。雖然如此,西漢建立后,劉邦在分封大臣時,蕭何位列眾卿之首,被稱為“開國第一侯”;“漢初三杰”之首。

一般而言,每個人都想在自己的工作中做出成績,受到表揚,揚名立萬,但是由于每個人所從事的工作不同,有的工作正常來說是很難出名的,比如數據中心運維相關工作:數據中心基礎設施的運維工作,從來沒有走到前臺,一般人們看不到他們的身影,甚至不知道他們的存在,相關的設施設備的巡檢、檢修、維護等都是在立足于影響最小的情況下完成。隨時當前信息技術(IT)的發展,使得對整個系統運行安全、運行效率的要求也越來越高,這就對為信息系統平穩運行提供平臺的數據中心機房等基礎設備的穩定性、安全性、可靠性等提出了更高的要求。相應的其安全性等也越發的重要。所以一旦基礎設施出了問題,大到甚至或者影響到了相關業務的正常,無論從經濟效益,還是社會影響等各方面,負面影響都是巨大的。這樣的出名后果是可想而知的。這其中最大的出名就是火災。

看到上面的圖片,許多人都會嗤之以鼻:這不是PS的嗎,這是假的等等類似的評論:確實,這圖片不是真的。試想一下,真要是機房失火,相關人員不是忙著逃生,就是忙著滅火,誰還有工夫或者時間去找相機、調試焦距等認真的拍攝失火的現場呢?一般人總認為數據中心都配有完善的消防器材、設施,并備有溫感、煙感等報警器。防火純粹是小題大做。殊不知,一旦數據中心失火,到了滅火的程度,意味著事發地點的所有的設備都要受到牽連,后面的影響將是巨大的。下圖為例(這個絕對不是PS的!)

這可是真實的火災后的現場照片,觸目驚心。

防火貫穿數據中心整個生命周期。為此對于數據中心的火災一定要有“隱患險于明火,防范勝于救災,責任重于泰山。”的思想意識,時刻牢記“安全第一”這根弦。在數據中心的生命周期中,測試驗證是數據中心運維的起點,如果沒有意識到測試驗證的重要性,可能因為各種緣由把這個重要的步驟省略掉,這樣疏漏很容易導致后期運維的重大隱患,魏徵在《諫太宗十思疏》中的首句“臣聞求木之長者,必固其根本”就是這個道理。數據中心主要服務的對象是IT系統。在其幾十年的生命周期中,IT系統的變動卻非常大。IT技術的變革同時也帶動了關鍵基礎設施技術的不斷變化,所以還要關注一些關鍵基礎設施的生命周期。這些關鍵基礎設施的生命周期由多方面的因素所決定的。其中新技術的發展是數據中心關鍵基礎設施更新換代、周期縮短的主要原因。這就要求運維人員也要緊跟時代潮流,不斷了解、學習業界最新的動態、技術,與時俱進。在保證安全的前提下,采用新的技術來處理和解決問題,以減少處理的時間和風險。為相關設施的更新換代提供參考或者技術支持。安全性、可靠性是數據中心運維最基本的要求,因此日常的檢查、維護、保養計劃等一定做精做細做全,做到可預防性維護。同時根據各類設備的特點還要“具體問題具體分析”,如IT設備上架,要提前查看空開的容量等;夏季多關注空調的冷凝系統,防止高壓報警等;冬季多關注空調加濕系統,防止加濕故障報警等。雖然各種新的綠色的或者先進的技術層出不窮,但是采用相關技術或者設備一定要采用成熟、穩定的—安全第一

總之,數據中心基礎設施的運維是一項非常關鍵的、又是一項枯燥的、重復性很高的工作,其工作的特性就是運維正常是應當的、必須的,出現問題絕對是禁止的;數據中心基礎設施推行的是風險管理和預防性維護策略,風險一定要及早控制或消除,因此必須做到:

一、建立完善的巡查和維護、保養、應急處理等機制。

二、采用與時俱進的動環監控、報警系統。以減少誤報、漏報的發生。

三、相關人員的責任心、行動力至關重要。畢竟人才是最重要的因素:才是解決、處理問題的關鍵。扁鵲大哥擅長的是“事前控制”、“治未病”、防患于未然、無為而治才是解決問題的最好方式或者最高境界。借用一位老運維人士的話:寧可默默無聞,不當救災英雄。

網友評論comments

發表評論

電子郵件地址不會被公開。 必填項已用*標注

暫無評論

Copyright ? 2012-2019 YUNWEIPAI.COM - 運維派 - 粵ICP備14090526號-3
掃二維碼
掃二維碼
返回頂部
中国足彩网14选9