這幾天最有趣的消息莫過(guò)于Uber相關(guān)關(guān)鍵字被微信屏蔽的事。騰訊的回應說(shuō)“系統抖動(dòng)”造成的這次屏蔽,結果引起了更多爭議,有人表示相信,有人表示不信。馮大輝在小道消息里面說(shuō)他相信這個(gè)解釋?zhuān)遥瑒t是半信半疑,我相信這件事一定有技術(shù)因素,但我同樣相信背后有非技術(shù)因素影響,故為半信。
虎嗅有一篇文章大概是從百度百科抄來(lái)一個(gè)“系統抖動(dòng)”定義,那個(gè)解釋跟這件事完全沒(méi)關(guān)系。所以,我們先猜測下系統抖動(dòng)到底是什么,會(huì )造成什么影響。
在互聯(lián)網(wǎng)以及計算機行業(yè),系統抖動(dòng)本來(lái)也不是一個(gè)嚴謹的工程名詞,不同的系統設計和架構,會(huì )出現完全不同的狀況。如果非要概括一下,微信所指的應該是指因為分布式系統數據同步的差異,從而造成的系統表現出來(lái)的不一致?tīng)顟B(tài)。中國用戶(hù)比較容易體會(huì )到類(lèi)似的系統抖動(dòng),大概有兩個(gè)案例,其一是所謂的Google Dance,就是在Google上時(shí)而搜不到一個(gè)網(wǎng)站,過(guò)幾天又可以搜到了。這是因為Google在更新巨大的網(wǎng)頁(yè)索引庫的時(shí)候,不同節點(diǎn)的索引版本不一樣,導致排序算法暫時(shí)混亂。而過(guò)了一段時(shí)間,數據同步了,自然也就好了。如果你從來(lái)沒(méi)注意過(guò)這件事,可能是因為在中國一會(huì )能訪(fǎng)問(wèn)Google,一會(huì )又不能訪(fǎng)問(wèn)。這就是其二,偉大的GFW系統封網(wǎng)站的時(shí)候出現了類(lèi)似問(wèn)題,大多數情況下會(huì )封掉Google,但某些時(shí)候因為數據同步和更新的問(wèn)題,又導致Google被解封,用戶(hù)就感覺(jué)偶爾能訪(fǎng)問(wèn)一下,但大部分時(shí)間不行。
這兩個(gè)例子說(shuō)明這類(lèi)技術(shù)問(wèn)題確實(shí)很常見(jiàn),最終用戶(hù)也很容易會(huì )感知到它的存在。但這種技術(shù)問(wèn)題的特征應該是偶然發(fā)生,持續時(shí)間不長(cháng),并且分布平均。比如Google Dance不可能只針對一個(gè)網(wǎng)站出現,而是機會(huì )平均被各種網(wǎng)站遇到,如果每次都是騰訊域名下所以頁(yè)面都搜索不到,那就不是系統抖動(dòng)了。而GFW抖動(dòng)造成被封網(wǎng)站突然能用,也不僅僅限于Google,其他網(wǎng)站,比如Facebook、Twitter也時(shí)而會(huì )出現突然能訪(fǎng)問(wèn)的狀況,如果這些都不熟悉,順便說(shuō)一聲,著(zhù)名的1024網(wǎng)今天突然能訪(fǎng)問(wèn)了…按照這個(gè)特征對照一下Uber遇到的情況,就會(huì )覺(jué)得這不是常規意義的“系統抖動(dòng)“。
我自己寫(xiě)不少Uber相關(guān)的文章,對Uber非常關(guān)注,微信上也有不少在Uber工作的朋友。時(shí)而會(huì )遇到他們說(shuō)自己的官方帳號不能訪(fǎng)問(wèn)了,或者貼個(gè)圖問(wèn)大家能不能看到。對Uber的屏蔽一直是逐步升級的,而且也確實(shí)持續了三個(gè)月。系統如何抖動(dòng),和架構設計和原理有很大關(guān)系,但既然叫做抖動(dòng)了,它必須得是在抖才合理。想想抖動(dòng)這個(gè)詞在現實(shí)世界本來(lái)的含義是什么?抖,應該是忽然向上、忽然向下,一會(huì )兒正常、一會(huì )兒不正常,這樣才叫抖。Uber是持續遇到問(wèn)題,一邊倒,這怎么能叫做抖呢?我覺(jué)得叫做“系統傾翻”更符合這種一邊倒情況。
微信的反垃圾攔截系統具體設計和算法不得而知,但所有反垃圾系統使用的數學(xué)方法萬(wàn)變不離其宗。它肯定是一種基于概率的過(guò)濾器算法。我并不打算在這解釋數學(xué)原理,霍金說(shuō):“一本書(shū)中多一個(gè)數學(xué)公式就會(huì )減少一半讀者”,所以我就一個(gè)公式也不寫(xiě),只解釋一下大致原理。以比較常用的貝葉斯過(guò)濾器當例子,貝葉斯概率是從一個(gè)主觀(guān)假設開(kāi)始,通過(guò)逐漸補充的數據計算來(lái)修正最初假設的過(guò)程。在這個(gè)過(guò)程中,主觀(guān)假設是可以隨便設置的,比如:假設公眾帳號發(fā)表的文章中,有30%是違反規則的垃圾文章。然后用事實(shí)去修正它。所謂修正,就是持續告訴系統這一篇不是垃圾,那一篇是垃圾的過(guò)程。在這個(gè)模式里面,最早的猜想叫做先驗概率,通過(guò)一系列的事實(shí)修正,最終得到的結果叫做后驗概率,后驗概率就可以用來(lái)判斷一篇文章是不是違規了。實(shí)際應用系統會(huì )比這個(gè)復雜的多,但原理應該差不多,總是根據一個(gè)假設和事實(shí)修正逐漸接近事實(shí)情況的優(yōu)化過(guò)程。在這個(gè)過(guò)程中,四處是可以調整的參數,并且會(huì )直接影響最終效果。在這類(lèi)系統中,如果不是專(zhuān)門(mén)為Uber調整了某些參數,我實(shí)在沒(méi)法從技術(shù)角度理解這種所謂的系統抖動(dòng)是如何發(fā)生的。
退一步說(shuō),就算真是系統自發(fā)的錯誤行為,相關(guān)團隊也應該早就應該通過(guò)優(yōu)化的方式解決這一問(wèn)題,而不至于等到大眾媒體都開(kāi)始關(guān)注才發(fā)現。就說(shuō)誘導分享這件事,整個(gè)微信世界還有比滴滴紅包更頻繁,更廣泛的誘導分享嗎?恐怕找不出第二個(gè)案例來(lái)。但滴滴這樣做就是沒(méi)事,這如果也不是人工優(yōu)化參數的結果,我只能認為騰訊已經(jīng)孕育出了超越人類(lèi)智能的人工智能了。據Uber的官方說(shuō)明,他們此前已經(jīng)多次和騰訊聯(lián)系試圖解決問(wèn)題,結果就是解決不了。另外一方面,Uber中國團隊也有不少曾經(jīng)在騰訊工作過(guò)的人。無(wú)論是私下渠道還是公開(kāi)渠道,騰訊應該都不會(huì )是這幾天才知道這件事存在吧。這些情況放在一起,就更不是單一技術(shù)問(wèn)題能夠解釋的。
另外,我時(shí)而會(huì )舉報一些確實(shí)是”誘導分享“的文章,以試圖測試微信的行為模式。不過(guò)到目前為止無(wú)一成功,都被系統回復了舉報失敗。可見(jiàn)這個(gè)誘導分享的判斷門(mén)檻并不低,對比前一段常見(jiàn)的Uber相關(guān)文章被“多人舉報”的情況,我不禁對這位”多人“同學(xué)非常佩服,一舉報一個(gè)準。我時(shí)而感嘆世界上最強大的情報機關(guān)中,中國擁有兩個(gè),一個(gè)是”多人“,一個(gè)是”朝陽(yáng)群眾“。
我的“半信半疑“的半疑就來(lái)源于此。到現在為止,技術(shù)上的解釋沒(méi)法讓我相信。當然了,技術(shù)上的解釋合理不合理并不重要,從阿里到騰訊,技術(shù)在關(guān)鍵時(shí)刻總是被拿出來(lái)“獨擋一面“,重要的是將來(lái)會(huì )怎么樣。
所以所謂半信,除了相信存在一些技術(shù)因素,即,確實(shí)和算法有一些關(guān)系,而不是直接屏蔽一個(gè)關(guān)鍵詞之外。我更愿意相信微信把事情做好的愿望。在中國普遍的職權不分的情況下,微信能回應此事,并且確實(shí)在解決,已經(jīng)不容易了。對于未來(lái)我就保持一個(gè)半信的態(tài)度。對于大企業(yè)內部利益的平衡方式,是中國企業(yè)和美國企業(yè)最大的區別,當然也可以認為是中國社會(huì )和美國社會(huì )最大的區別。每次大家說(shuō)起來(lái)Google的某些團隊竟然要招聘SEO(搜索引擎優(yōu)化)人員,就覺(jué)得是個(gè)笑話(huà),但這恰恰說(shuō)明了Google內部有防火墻,可以隔絕各部門(mén)利益。這是成為一個(gè)公平平臺的關(guān)鍵。這種公平,正是平臺型公司獲得信賴(lài)的關(guān)鍵。在中國,恐怕還沒(méi)有哪家互聯(lián)網(wǎng)公司能做好這件事。
另外,這件事由Uber引發(fā)并不奇怪。Uber是罕見(jiàn)的大規模沖擊現實(shí)世界的公司,在之前,互聯(lián)網(wǎng)公司里面只有電商企業(yè)真正沖擊了現實(shí)世界。別說(shuō)騰訊這樣一家企業(yè),就算是各國政府不也正在Uber引發(fā)的浪潮中顛三倒四,做出各種怪事來(lái)嗎?
這里在順便說(shuō)一個(gè)這幾天發(fā)生的好玩事。此前我寫(xiě)過(guò)我們這個(gè)加拿大城市發(fā)生的Uber和市政府對抗的故事(文末有鏈接),最近這故事又有了新升級。本市出租車(chē)聯(lián)盟主席責怪市長(cháng),說(shuō)應該讓警方來(lái)按照《安省高速法案》嚴格執法,打擊Uber。我們的市長(cháng)竟然真的致電警方,要求警方嚴格執法。對于一個(gè)三權分立的國家,這簡(jiǎn)直是天大的笑話(huà)。市民簡(jiǎn)直被震驚了,人們紛紛評論說(shuō)市長(cháng)你是Peace offer,有什么權利去要求Police Offer按照你的要求執法啊?果不其然,幾天之后警方發(fā)言人得體的回復:“夏天是我們最忙的時(shí)候,我們最重要的職責是保護市民安全,打擊犯罪,保證交通暢通,其他不重要事務(wù)暫時(shí)沒(méi)人手專(zhuān)門(mén)處理。”一個(gè)三權分立了上百年的國家,其首都都被攪和到這樣顛三倒四,恨不得和中國一樣設立政法委組織聯(lián)合辦公,騰訊做為一家公司稍微有點(diǎn)混亂也不算什么奇怪的事。
對于Uber這樣一家公司,并不需要給予他們特別的同情,只要給他們不要太不公平的環(huán)境即可。必須要說(shuō),微信在維護秩序和尊重用戶(hù)方面,做的已經(jīng)比其他中國互聯(lián)網(wǎng)公司好很多了,希望如這樣的抖動(dòng)只是偶然現象。畢竟,用戶(hù)還是需要Uber的,這是強大而真實(shí)的需求,任何阻力都很難阻擋它。順便求不要把這篇文章也抖沒(méi)了…