文/陽淼(山寨發(fā)布會成員)
昨天是微信的黑色星期一,一大早,小伙伴們就發(fā)現(xiàn)微信一直處于連接狀態(tài),于是在它的表兄QQ群里互相打聽出了啥事。后來微信官方團(tuán)隊在新浪微博上更新了幾條動態(tài),讓大家了解到了原因。直到下午兩點半,用戶們才陸續(xù)爬上微信,正常刷新朋友圈。整個中斷時長達(dá)六個半小時。
山寨發(fā)布會里有記者從官方問到更詳細(xì)的原因:上海市政施工時挖斷了兩路光纜,導(dǎo)致微信華東數(shù)據(jù)中心處理能力受到嚴(yán)重影響,只能將各類請求分流到華南、華北的數(shù)據(jù)中心,超出了后兩者的處理能力,最終導(dǎo)致全國的數(shù)據(jù)中心都負(fù)擔(dān)過重,大家一起掉線。所以說,這可以說是一次多米諾事故,上海幾個工人的挖掘機(jī)一抖,全國四億用戶都從線上掉下來。
兩條光纜挖斷導(dǎo)致這么嚴(yán)重的故障,記者們討論下來,大多數(shù)覺得微信的設(shè)備備份和冗余工作做得不大到位。
山寨發(fā)布會里都是TMT記者,既有偏重互聯(lián)網(wǎng)口的,也有偏重通信口的。說實在的通信行業(yè)這兩年被互聯(lián)網(wǎng)欺負(fù)得挺厲害,大家都說OTT業(yè)務(wù),要隔著運營商的腦袋過頂傳球;微信取代運營商的呼聲也不絕于耳,雅安地震時“短信不通微信通”都被某些人拿來做痛斥運營商、呼喚互聯(lián)網(wǎng)革命的由頭。
這次微信出的故障,就讓通信記者找到了說句心里話的機(jī)會。而且作為通信專業(yè)的畢業(yè)生,淼叔還得說,人家說得有道理。單說一個斷網(wǎng)時間吧,在任何通信運營商那里,哪怕是服務(wù)爛得跟一攤狗屎一樣的中國聯(lián)通,全網(wǎng)中斷都幾乎沒有過;即使有局部地區(qū)短信中斷或話路中斷,基本也很少超過一小時。汶川地震那種震驚世界的規(guī)模,移動運營商基本上也在五個小時內(nèi)恢復(fù)了通信。而因為那次地震吸取了教訓(xùn),到雅安地震時,運營商已經(jīng)做到了一小時捏恢復(fù)通信(想了解詳細(xì)過程的,可以去買本期《財經(jīng)國家周刊》看一下)。
而且,在故障處理方面,通信運營商積累了很多經(jīng)驗值得互聯(lián)網(wǎng)企業(yè)學(xué)習(xí)。通信搶修工程不太好說多久能完全恢復(fù),因為各地的施工條件、設(shè)施都不同。不過通信故障處理中有個概念叫“搶通”,就是先用應(yīng)急方案保證鏈路暢通,能基本傳輸話音和數(shù)據(jù)。這個搶通的要求時間一般在一小時之內(nèi),超過了就算重大事故了。
通信企業(yè)如此重視服務(wù)連續(xù)性保障,大概跟電話網(wǎng)絡(luò)建立了上百年、有了很成熟的運營體制和客服規(guī)范有關(guān)。而說到互聯(lián)網(wǎng)服務(wù),在中國最長的也沒到20年;億級以上用戶的互聯(lián)網(wǎng)服務(wù)一共出現(xiàn)了不到十五年,這種數(shù)億用戶同時在線的服務(wù)更是幾乎可以說中國特色(人多。。所以,在為數(shù)億用戶同時提供有保障的服務(wù)方面,互聯(lián)網(wǎng)企業(yè)還有很多課要從通信企業(yè)那兒學(xué)。
另一個方面,從技術(shù)上來說,互聯(lián)網(wǎng)跟通信網(wǎng)的發(fā)明初衷是不同的。撇開兩者早期一個模擬、一個數(shù)字不提,電話網(wǎng)要做的就是實時傳送語音,然后慢慢在清晰度上下功夫;互聯(lián)網(wǎng)的早期框架是為了應(yīng)付核戰(zhàn)爭下的數(shù)據(jù)可靠傳輸,是一開始就要求清晰度(數(shù)據(jù)不失真),然后才兼顧速度。所以互聯(lián)網(wǎng)一開始的訴求并不是實時傳輸,更不是大規(guī)模并發(fā)實時訪問。從它的基礎(chǔ)協(xié)議TCP/IP協(xié)議也能看出這一點。前兩天有幾個程序員在微博上開玩笑,說TCP/IP協(xié)議像老太太一樣啰嗦,甲乙雙方正式通信前首先要握手確認(rèn):甲說我現(xiàn)在要發(fā)信了握個手,乙說我收到了甲的握手信號;甲說我收到了乙說收到了甲的握手信號的信號;乙說我收到了甲說收到了我說甲的握手信號的信號的信號。雙方確認(rèn)老半天,才開始發(fā)信。每個信息還要帶一個糾錯碼,對方接到了信息發(fā)現(xiàn)糾錯碼不符,這個信息就得重發(fā)。
從上面這個過程看,TCP/IP其實是非常占網(wǎng)絡(luò)資源的一個協(xié)議,而且容錯率很低,一有錯誤就要重發(fā);如果哪兒斷了一條光纜,成千上萬個甲和乙在光纜兩端拼命喊握手啊握手啊,收不到對方的回信他們又會去尋找一切可用鏈路去跟對方握個手(這是互聯(lián)網(wǎng)的另一個特點,路由多樣),逐漸就把正常鏈路也搞癱了(當(dāng)然,微信不確定用的就是TCP/IP協(xié)議,起碼它表哥QQ用的就是簡單得多的UDP協(xié)議)。
所以,在微信等類電信服務(wù)越來越發(fā)達(dá)的時候,互聯(lián)網(wǎng)在協(xié)議和硬件層面相對于通信網(wǎng)絡(luò)的不同就會越來越受到考驗,因為它本來就不是干這個用的。而中國的互聯(lián)網(wǎng)用戶又對斷網(wǎng)特別寬容——這都是給Google、Facebook和Twitter等網(wǎng)站鍛煉出來的——反過來會導(dǎo)致互聯(lián)網(wǎng)服務(wù)提供商不像通信運營商那么在乎斷網(wǎng)。馬可•扎克伯格初創(chuàng)Facebook時因為好友沒及時給服務(wù)器續(xù)費差點翻臉,因為他的追求就是永不宕機(jī),否則用戶會離他而去。擱在中國,估計他跟這個好朋友就一直要好下去了。
這可能是很多擁有巨大用戶的互聯(lián)網(wǎng)服務(wù)下一步面臨的問題——他們越來越被要求像通信運營商一樣提供不中斷的可靠服務(wù)了,而看起來無論在技術(shù)上還是制度上,他們都有很長的路要走。
喜歡這篇文章,可以點擊右上角的三個點圖標(biāo),將文章分享給朋友或朋友圈,或告訴朋友使用shanzhaiclub在微信中搜索公眾賬號訂閱,讓大家的共同話題再多一個。
========掌握不被印刷的資訊========
山寨發(fā)布會是匯聚了中文世界最多數(shù)量IT互聯(lián)網(wǎng)記者的行業(yè)交流組織。本微信公眾號由陽淼維護(hù),所有成員記者自由投稿。在這里經(jīng)常會有見解獨到的評論、流傳業(yè)界的八卦和不宜被公開印刷的秘聞。如果你關(guān)注這個行業(yè),可以點擊右上角那個按鈕,點擊查看公眾賬號,再點擊關(guān)注。這樣就可以第一時間接受到最新的熱點、觀點或槽點。
========Wemedia聯(lián)盟介紹========
Wemedia聯(lián)盟是微信自媒體最大的聯(lián)盟,精準(zhǔn)覆蓋100萬受眾。訂閱公眾號“Wemedia”可以了解詳情。