了解最新公司動態(tài)及行業(yè)資訊
一個擁有4萬臺服務器的公司,整個運維團隊至少有50人
如果是自建IDC,50人中有10人會專門做機房、網絡、服務器、存儲等底層架構,也就是IaaS層
如果你使用公共云服務,你可以拯救這 10 個人
物理架構的 IaaS 層有 PaaS服務器運維技術,這 50 人中可能有 10 人專門從事自動化平臺、發(fā)布、監(jiān)控、DB 管理、容器化、虛擬化等。
上到業(yè)務層負責業(yè)務運維??赡苊?、3個人負責一個比較大的垂直業(yè)務,比如微信支付、淘寶訂單管理等。
那么在這2、 3個業(yè)務操作中,我通常在簡歷中這樣描述自己
xxx業(yè)務核心運維負責人,最高并發(fā)QPS xx萬,獨立維護4萬多臺機器服務器運維技術,年可用率99%以上
那么問題來了:“這里所謂的人真的是人嗎?”
借用騰訊藍鯨的架構圖說一下這個問題
從下到上,它們是 IaaS、PaaS 和 SaaS 層。一般來說,大公司的每次運維只負責其中的一小部分。有的專門做虛擬化和容器化,有的專門做監(jiān)控告警,有的專門做后續(xù)業(yè)務運維業(yè)務生命周期服務
負責采購、上架、調試、拉光纖和網線的這群人,這里不算。
就像蓋一座摩天大樓,大家只看到臺前的建筑師,卻看不到臺后的施工主管
在《SRE》一書中,每個IDC都需要有專門的團隊負責硬件設施和基礎設施
像谷歌這樣強大,擁有百萬級的服務器規(guī)模,以及大量的技術專家,也需要有人做一些體力活。
現在有各種公有云,導致很多技術人員做業(yè)務應用(包括開發(fā)、運維),不需要自己做一些硬件設備相關的工作,但那是站出來的結果巨人的肩膀。太浮了
我的專業(yè)經驗有限,沒有親自接觸過幾萬臺規(guī)模的項目,但也接觸過上千臺的熱門游戲項目。
當時我是游戲業(yè)務的運維,服務器不需要我安裝和配置linux系統(tǒng)。專門的IDC運維團隊拿到服務器root權限后,我負責業(yè)務應用的部署和維護,同時也利用其他同事進行開發(fā)。各種CMDB、監(jiān)控、發(fā)布系統(tǒng)等
但是,我有自知之明,不敢聲稱獨立維護數千臺服務器的大規(guī)模集群