首頁 >國際 >

沒有不宕機的大廠 世界速遞


(資料圖片僅供參考)

沒有100%的穩(wěn)妥,但大廠的宕機來得還是如此頻繁。5月11日,蘋果iCloud賬戶與登錄、iCloud郵件等功能在15:27-16:10發(fā)生超過40分鐘服務(wù)故障,雖然只是部分用戶,但影響范圍遍及全球。

蘋果不是第一個被用戶質(zhì)問的大廠。與蘋果同為海外科技巨頭的Facebook,過去幾年也屢出事故,2021年10月4日和8日,F(xiàn)acebook連續(xù)兩次出現(xiàn)全球性宕機,合計時長超過9個小時。在國內(nèi),最近半年時間,阿里云、微信等大廠先后發(fā)生產(chǎn)品故障。2022年12月中旬阿里云香港機房宕機超過10個小時;2023年3月底,微信、QQ等業(yè)務(wù)出現(xiàn)大面積功能異常。

由于產(chǎn)業(yè)鏈縱深關(guān)聯(lián),大廠宕機帶來的影響是實打?qū)嵉?。這就難怪今年4月12日,工信部信息通信管理局聽取騰訊關(guān)于“3·29”微信業(yè)務(wù)異常情況匯報,要求騰訊堅決避免發(fā)生重大安全生產(chǎn)事故,切實提升公眾業(yè)務(wù)安全穩(wěn)定運行水平。

宕機引發(fā)用戶關(guān)注,考驗大廠的態(tài)度,更考驗大廠的能力。以往外界想當然或者大廠自我標榜的安全水平,在現(xiàn)實面前不堪一擊。

宕機,一方面沖擊用戶對企業(yè)的信任度:如騰訊、蘋果這般數(shù)千億上萬億美元的企業(yè),有人才有資金有技術(shù),何至于還會發(fā)生這些技術(shù)故障?如果態(tài)度沒問題,能力就無法自圓其說;另一方面,科技大廠代表的不只是自己,還是新技術(shù)新趨勢的引領(lǐng)者。阿里云香港機房的長時間故障,嚇壞了自家客戶,也給云計算“是否真的那么好”蒙上了一層不確定。

宕機真的不可避免嗎?以現(xiàn)階段的主流技術(shù)方案,答案是殘酷的,宕機真的無法避免。原因多種多樣,最核心的一點無法避開:不管本地計算還是云計算,互聯(lián)網(wǎng)服務(wù)最終指向的都是數(shù)據(jù)中心。而全球多數(shù)數(shù)據(jù)中心仍以中心化數(shù)據(jù)儲存機制為主,批量計算機和服務(wù)器組成中心節(jié)點,這種物理屬性決定了數(shù)據(jù)中心無法規(guī)避外界因素,也就無法做到永不宕機。

對宕機無法容忍,卻無法做到永不宕機,企業(yè)能努力的就是災備,上述大廠的宕機事故,恰恰是災備能力沒有達到預想中的狀態(tài)。

某種意義上,企業(yè)越大,產(chǎn)品(功能)越多,技術(shù)越新,發(fā)生技術(shù)BUG的可能性反而越大。因此,大廠之“大”在產(chǎn)品和數(shù)據(jù)安全層面是把雙刃劍,好的一面是,在與競爭對手的PK中,能夠提供更順滑的用戶體驗和信任層面的安全加持;但壞的一面是,新功能新技術(shù)的試水,數(shù)據(jù)指數(shù)級的起伏,都會帶來安全事故的概率增大。

有些合乎邏輯的“失誤”能夠理解,比如某個熱搜發(fā)酵之時微博的宕機,“雙11”搶購潮中的付款擁堵……企業(yè)沒能準確預料流量峰值,多加幾組服務(wù)器就能解決。而有些事故之所以成為事故,如開篇所列例子,關(guān)鍵還是大廠的災備能力遠沒有所言得那么強大。

關(guān)鍵詞:

責任編輯:Rex_12