了解最新公司動態(tài)及行業(yè)資訊
運維工作經(jīng)驗總結(jié) 運維工作直接關(guān)系到應(yīng)用系統(tǒng)的正常穩(wěn)定運行,但運維工作復(fù)雜,形式化、系統(tǒng)化相對薄弱。如何改變這種狀況?從眾多運維人員的成敗經(jīng)驗中總結(jié)并升級為運維規(guī)則,是提高運維水平、保障應(yīng)用系統(tǒng)正常穩(wěn)定運行的有效途徑。通過我多年的運維經(jīng)驗,筆者總結(jié)了以下必須遵守的基本運維規(guī)則,可以大大降低沒有經(jīng)驗的運維人員由于自己的失誤導(dǎo)致系統(tǒng)故障的可能性。 一、系統(tǒng)變更和升級要先在同一個環(huán)境下測試,實施前要有經(jīng)過驗證的計劃。運維是一門經(jīng)驗學(xué)科,也是一門試錯的學(xué)科。沒有做的事情總會給你帶來意想不到的問題,所以在進行更改之前,你必須在相同或相似的運行環(huán)境中對其進行測試,并且只有通過測試后才能在正式環(huán)境中實施更改。同時,應(yīng)該為失敗的更改準備一個后備計劃。比如系統(tǒng)備份、數(shù)據(jù)庫備份、配置備份等都要做好準備,把變更前的操作站點固化下來,讓變更有機會回去。 二、破壞性操作必須按照預(yù)定計劃確認,然后謹慎執(zhí)行。什么是破壞性操作?例如:是的,執(zhí)行操作,因為它們不是必需的,它們很容易被忽略和危險it運維,更不用說drop之類的操作了。就: , , drop 而言,這些語句執(zhí)行起來既簡單又舒適,但請記??!即使數(shù)據(jù)可以回滾,成本也是非常高的!對于 Linux,rm 將刪除所有當前數(shù)據(jù)及其所有子目錄。
經(jīng)歷過這種失敗的人大多會給rm一個別名=′rm mv 也可以有同樣的選項: 比如不備份直接修改文件等三、備份并驗證備份的有效性,遇到硬件或軟件總是意外死機怎么辦?備份! ! !備份知識非常豐富,可以分為不同的維度:冷備份和熱備份、實時和非實時、物理和邏輯、全量和增量備份。有了備份,你能無后顧之憂嗎?不!備份的有效性還有待驗證。備份總是有很多次無法保證100%恢復(fù)。簡單的驗證就是找到一個空的數(shù)據(jù)庫來恢復(fù)它。 四、 永遠敬畏生產(chǎn)環(huán)境 這是避免應(yīng)用系統(tǒng)故障的鐵律,也容易被開發(fā)人員和運維人員忽視。我們必須堅決杜絕直接在生產(chǎn)環(huán)境中進行開發(fā)、測試和bug修復(fù)。這些操作只能在開發(fā)和測試環(huán)境中進行。否則,如果出現(xiàn)問題,我們將哭無淚。 五、 交接和休假是最容易失敗的。接手別人的工作需要反復(fù)確認變更計劃。向人們征求意見并不一定是無能的表現(xiàn);最好準備一份文件,說明在什么情況下如何操作以及與誰聯(lián)系;在別人放假的時候接手,“可以延遲”,確實需要執(zhí)行:一定要不厭其煩的跟原系統(tǒng)管理員確認每一個操作的細節(jié)。
六、要有監(jiān)控方法和報警措施。運維人員生存的工具是報警和監(jiān)控。報警可以讓您及時了解系統(tǒng)發(fā)生了什么異常,從而及時跟進,扼殺搖籃中的故障;報警與監(jiān)控是衣與水的好兄弟,相得益彰,相得益彰。 七、使用自動切換技術(shù)時要小心為了保證數(shù)據(jù)庫安全,經(jīng)常會用到HA或者RAC等技術(shù),但是這些技術(shù)在關(guān)鍵時刻能否真正發(fā)揮作用,還需要反復(fù)驗證和確認。僅僅按照文件的要求做好是不夠的。許多意想不到的因素或系統(tǒng)因素會導(dǎo)致自動切換技術(shù)無法按預(yù)期工作。如果你以后發(fā)現(xiàn)這一點,那就太晚了。 八、有偏執(zhí)的精神,計劃要檢查,檢查,再檢查。有這樣一個人:在測試機上寫一個腳本,叫大家操作步驟和腳本,和相關(guān)人員重新確認操作、順序、時間。檢查可能的影響和回滾是否準備好。最后,在后臺運行腳本并同時登錄另一個窗口。在ps和查看結(jié)果輸出過程中,姿勢端正,呼吸急促均勻it運維,眼神凝重。操作的人不覺得累,但是看的人累了。 九、簡單就是美我們總是面臨著各種各樣的誘惑:新的系統(tǒng)架構(gòu)、新的更智能的命令和工具、最新的硬件平臺、更全功能的HA軟件……你可以離線安裝、測試等等。但是,如果您想在生產(chǎn)環(huán)境中使用它,請三思而后行! ! Linux本身自帶的字符界面比那些復(fù)雜的圖形界面更簡單方便。如果你能堅持這九大鐵律,你的應(yīng)用系統(tǒng)就能長期穩(wěn)定運行。