了解最新公司動態(tài)及行業(yè)資訊
我們處在信息爆炸的時代,每天都有很多新的事情發(fā)生,形成了有價值的數(shù)據(jù)。 因此,時代需要一批維護數(shù)據(jù)的專業(yè)人員,主要包括SA和DBA; 有朋友告訴我,未來運維會是最熱門的行業(yè)。 我仍然不這么認為! 2008年到現(xiàn)在,我還在從事運維工作。 以前覺得運維就是簡單的運維,所以自己在運維方面成長的很慢,因為在意識方面我的認識還不夠!
現(xiàn)在,當我向別人介紹自己時,我通常說我是一名雜工。 可能是自己理解不夠,或者好像自己的水平不夠,但我真的都是雜工。 說說我知道的運維吧!
一:企業(yè)運維職責
1:運維的主要職責是參與確定公司整體IT架構。 其實這不完全是運維的問題; 框架這個詞本身就比較寬泛。 框架大致包括服務器系統(tǒng),程序使用什么語言,使用什么數(shù)據(jù)庫,使用什么容器發(fā)布內(nèi)容,需要多少臺服務器,如何分配資源等等。
決定使用哪種操作系統(tǒng)也很重要。 不管是linux還是aix,未來如何升級,都會對企業(yè)的運維產(chǎn)生深遠的影響。 一般來說,運維人員會推薦管理層使用自己精通的運維系統(tǒng),筆者還是努力打造RHEL。 程序使用的語言與企業(yè)本身的業(yè)務密切相關。 比如建行率先推廣java,平時的門戶網(wǎng)站和峰會用php等,編程語言對使用的數(shù)據(jù)庫和web容器起著決定性的作用。 如果是php,一般是lamp、lnmp等經(jīng)典模型,如果是java,那么選擇面比較廣,容器部分可以選擇,jboss等; 數(shù)據(jù)庫可以選擇,db2等,這個時候侯,企業(yè)的經(jīng)濟實力也起著至關重要的作用!
2:確保應用程序能夠在服務器上正常運行
坦白說,這個標準越來越寬泛,怎么能算正常運行呢? 筆者在工作中,經(jīng)常會遇到用戶抱怨登頂卡住,服務器慢,網(wǎng)站打不開。 如果對方ping服務器,4個包中有3個丟包。 這個過程中的問題可能是服務端、客戶端或者中間的網(wǎng)絡傳輸問題。 中國最典型的問題就是南北互通問題。 有一個笑話:世界上最遠的距離是中國聯(lián)通到中國電信的距離! 由于這些問題難以確定,管理者通常要求運維的年故障時間不能超過一定的值。 說7*24*365服務不間斷運行是扯淡! 總會有各種各樣的問題。 無論您使用何種負載平衡和故障轉(zhuǎn)移技術,都無法避免暫時的服務中斷。 運維的價值在于縮短服務中斷后的MTTR時間。 可見運維壓力之大!
3:根據(jù)業(yè)務需要,及時調(diào)整服務器的設置
這部作品是作者作品中的重頭戲。 明天要部署程序,今天要英文動詞系統(tǒng)it運維技術,明天還要加虛擬主機……這種事情通常是做不到的,只能做同樣的事情。 . 但是這些工作最能提升你的運維水平。 運維人員在做這類工作的時候,不能一邊處理任務一邊問清關,否則時間一長,服務器就會意外堆積。運維人員在處理這類工作的時候,應該進行標準化和記錄。 如果常年如此,不僅運維的專業(yè)水平會有所提高,而且對后期的維護也起到良性循環(huán)的作用。
4:備份關鍵數(shù)據(jù),及時處理各種故障,保障服務器安全
備份是為了恢復。 通常在想到或使用備份的時候,總會遇到麻煩,所以在日常工作中一定要對備份給予足夠的重視,尤其是數(shù)據(jù)庫。 在某些情況下,看起來像 N 年前的備份可能會給你的恢復工作帶來意想不到的效果; 服務器的安全部分是一個模糊的概念,因為安全本身是相對的,安全和性能與用戶體驗成正比。 很多時候薇薇都是犧牲安全來換取性能和更好的用戶體驗,等以后出現(xiàn)安全問題的時候再進行調(diào)整,比如關閉服務器,關閉服務器外網(wǎng)之間的防火墻,允許任何IP到 FTP 連接等
5:記錄服務器維護日志和技術文檔
這一點都在處理問題后的雜項記錄中,方便以后處理類似問題的速度和效率; 至于技術文檔,作為運維人員,一定要認真編寫,寫得不好的文檔會騙人。 這樣的文章很多,IT行業(yè)本身就很浮躁。 如果不能靜下心來整理知識,三天就會被淘汰; 您必須定期檢查您過去編制的文件,并及時更正錯誤。 所謂溫故而知新,還是要聽孔子的教誨,不然哪天你在搜索引擎上搜到自己的文章,怎么想都不會明白自己當年為什么這么做。作者一直提倡把自己的知識分享給其他同學,有利于自己和他人的共同進步。
二:企業(yè)運維的主要困境
1:選擇IDC服務商
服務器多了,自然要找個好的IDC運營商; 這個很重要,一個差的IDC會錯誤的安裝你的服務器,無故取消你的域名白名單,很難實時監(jiān)控機柜的帶寬流量,CDN效果不好賈,問題服務器不是先想想怎么解決問題,而是找各種借口,哪個機房網(wǎng)絡被攻擊,電源開關被打開等等,各種悲??! 唯一的優(yōu)點可能就是收費比較實惠吧,呵呵!
2:服務器提供商和型號的選擇
這也很重要。 筆者原來遇到了一批的固件問題。 每當服務器流量大時,服務器網(wǎng)卡會手動斷流,需要自動重啟網(wǎng)卡。 這個問題悲劇了很久it運維技術,最終也無法徹底解決; 我遇到過顯存、顯卡故障等問題。 一旦服務器硬件出現(xiàn)問題,就意味著要停機維護,服務自然會中斷。因此,我們在選擇服務器的時候也要慎重,不要只考慮價格問題
3:負載均衡和故障轉(zhuǎn)移
如果流量大,或者業(yè)務重要性高,需要盡可能提供服務器的高可用和數(shù)據(jù)容災。 自然需要部署負載均衡和故障轉(zhuǎn)移; 是硬件F5、cisco還是軟件lvs、、、nginx的形式實現(xiàn),療效如何?需要考察
4:運維團隊和人才的培養(yǎng)
千金易得,將軍難求。 對于企業(yè)來說,運維人才的流失是一種遺憾。 如何留住一批優(yōu)秀的運維人才也是企業(yè)需要考慮的問題。 雖然不僅僅是運維,但企業(yè)要想有長遠的發(fā)展,就應該想方設法留住人才,控制公司的離職率,讓員工有歸屬感和榮譽感,而不僅僅是一個職位赤裸裸的雇傭關系; 企業(yè)要重點培養(yǎng)一支高素質(zhì)、高凝聚力的運維團隊,不能只把運維看成夾在業(yè)務部門和程序部門之間。 里外無人。 這樣的環(huán)境和團隊留不住人才。
三:運維人員的職業(yè)發(fā)展與出路
運維是年輕人的行業(yè)。 做運維需要夢想和激情。 隨著時間的減少和通宵學習能力的下降,留宿能力下降。 面對變更問題,運維人員通??梢赃x擇轉(zhuǎn)向管理或者架構,或者想專攻DBA,或者自己創(chuàng)業(yè),寫書,或者在培訓中心當老師,有選擇還是很多的。 離開運維崗位,是每個運維人員遲早會面臨的問題。 如何在有限的運維時間內(nèi),為自己和企業(yè)創(chuàng)造更多的價值,是運維工作者需要考慮的問題。 是有限的,在更短的時間內(nèi)取得更高的效率,就是一種成功。 成功來得太晚,幸福感就會消失,一切問題都是遲早的事!
廢話一大堆,也快寫完了,洗漱完就睡了!
謹以此文送給原運維組成員:陳東海、徐洪虎、胡雙峰。 祝他們工作順利,生活愉快!