場(chǎng)景三 “ 慢動(dòng)作 ” 的游戲
“ 老板,過(guò)去一周有 100 多個(gè)核心玩家說(shuō)咱的游戲體驗不好,經(jīng)常卡頓,沒(méi)法玩下去了。”
“ 什么 ?這可不行。小王,你告訴我到底是哪里出問(wèn)題了?”
沒(méi)有 ThousandEyes 的情況下…
“ 我們不僅有自建數據中心,也已經(jīng)盡力買(mǎi)了各個(gè)地方最好的 CDN 和公有云服務(wù)了,阿里云,Azure ,Google 云和 AWS 都上了。涉及這么多家,很難查啊?”
“ 那怎么辦?”
“ 要不我們再擴一擴帶寬?或者買(mǎi)IOPS更好的服務(wù)器資源?”
“ 那不是又要提高成本嘛 ”
“ 這也是沒(méi)有辦法的辦法…”
有 ThousandEyes 的情況下…
“ 老板等一下。ThousandsEyes 控制面板里說(shuō),海外玩家受到***供應商DNS故障的影響 ;國內南方城市的玩家受多處線(xiàn)路影響,估計跟洪水險情有關(guān)系。”
“ 有明確的故障信息嗎?”
“ 我們已經(jīng)和這些服務(wù)商分享了 ThousandsEyes 提供的故障報告,正在電話(huà)聯(lián)系他們盡快處理。”
“ 要等多長(cháng)時(shí)間?我們需要第一時(shí)間發(fā)布游戲服務(wù)的故障公告!”
五分鐘后……
“ 老板,這幾家供應商已郵件確認我們的故障反饋,可以發(fā)游戲公告了 ”
ThousandEyes 是如何做到的呢?
ThousandsEyes 的 Cloud Agent ( 預安裝的云上代理 ) 是可以在各運營(yíng)商、公有云里預部署的診斷組件。ThousandsEyes目前已在全球部署了191個(gè) IPv4 Cloud Agent、76 個(gè) IPv6 Cloud Agent,與全球 Tier1/2/3 ISP 直接相連,比如國內的電信、聯(lián)通等。此外,全球微軟 Azure 云 25 個(gè) Region、Google 云的 17 個(gè) Region、AWS的15 個(gè) Region、阿里云的 19 個(gè) Region 上均部署了Cloud Agent。這些 Agent 數量、位置,還在持續增加(見(jiàn)下圖)。

如果您的企業(yè)對外提供服務(wù),不管是基于私有云還是混合云部署,都可以在全球不同位置通過(guò) Enterprise Agent 、 Cloud Agent ,監控這些服務(wù)對于全球不同位置訪(fǎng)客的訪(fǎng)問(wèn)體驗。
如果您的企業(yè)為員工購買(mǎi)第三方公有云服務(wù),包括 SaaS 服務(wù),可以基于 Endpoint Agent (安裝在 PC 機上的代理)監控員工的訪(fǎng)問(wèn)體驗,也可以基于 Enterprise Agent、Cloud Agent 監控各自區域訪(fǎng)問(wèn)這些服務(wù)的體驗 ;
可供配置的監控任務(wù)多種多樣:
- 監控 BGP ,幫助分析路由故障根因,檢查全路徑節點(diǎn)和線(xiàn)路質(zhì)量,包括節點(diǎn)間多路徑情況。官網(wǎng)也有多個(gè) Internet BGP 大網(wǎng)故障事件的監控、分析報告,大家可以參考。
- 網(wǎng)絡(luò )監控: Network 類(lèi)型里可以監控 Agent 到服務(wù)的情況,這在前面的事例里面已經(jīng)看到效果;也可以監控 Agent 到 Agent 的雙向情況,這允許您充分發(fā)揮想象力以實(shí)現多種多樣的監控效果。
- DNS 監控 :可以創(chuàng )建啟用所有 Agent 對 DNS 做豐富的檢測。
- Web 監控:以在線(xiàn)購物為例,可以模擬賬戶(hù)登錄后的操作以實(shí)現對 Transaction ( 交易 ) 類(lèi)型的監控。
- 語(yǔ)音監控:針對語(yǔ)音部分,也提供多種監控方式,可以針對SIP Server、RTP 流、VOIP 呼叫,包括“ Skype for Business ”。
場(chǎng)景四 故障復盤(pán)愁死人
企業(yè) A 最近剛開(kāi)始上 SD-WAN ,但吃不準廠(chǎng)商的解決方案是不是最優(yōu)的。
“小王啊,我們最近上了 SD-WAN 效果怎么樣啊?錢(qián)是省了,網(wǎng)絡(luò )速度降低的多不多?不知道是不是要換一家試試?”
沒(méi)有 ThousandEyes 的情況下
“ 感覺(jué)還可以,沒(méi)有明顯問(wèn)題 ”
“ 什么叫感覺(jué)還可以?你有數據嘛?”
“我可以找個(gè)測試軟件找找時(shí)間切面上的速度情況…”
“ 那能有多準確??而且發(fā)現性能不好能定位故障嗎?”
有 ThousandEyes 的情況下…
“ 老板放心,準得很。ThousandsEyes 能同時(shí)看到底層網(wǎng)絡(luò )和 SD-WAN 的性能表現 。不僅能知其然,還能知其所以然。”
ThousandEyes 是如何做到的呢?
SD -WAN 是一個(gè) “ 網(wǎng)絡(luò )上面創(chuàng )建網(wǎng)絡(luò ) ” 的場(chǎng)景, 前者是運營(yíng)商的專(zhuān)線(xiàn) /internet 線(xiàn)路等,后者是企業(yè)互聯(lián)各分支的“ 虛擬的網(wǎng)絡(luò ) ”,前者是底層 /underlay 而后者是虛擬隧道 /overlay,這樣復雜的網(wǎng)絡(luò )模型,ThousandEyes 是如何做到性能監控的呢?
如下是一個(gè)真實(shí)的客戶(hù)案例 : 該客戶(hù)基于運營(yíng)商 MPLS 的線(xiàn)路搭建企業(yè) SD-WAN 網(wǎng)絡(luò )。
此圖是基于不同類(lèi)型 Agent 通過(guò) ThousandEyes 平臺創(chuàng )建不同類(lèi)型的 Test (測試):比如基于 Cloud 或 Enterprise Agent 測試 underlay MPLS 線(xiàn)路網(wǎng)絡(luò )質(zhì)量、比如安裝在 SD-WAN 內的 Enterprise Agent 之間可以互測以便提供Overlay 虛擬通道的網(wǎng)絡(luò )質(zhì)量和網(wǎng)絡(luò )吞吐 (比如分支與總部各部署一個(gè) Agent ) ;


創(chuàng )建種類(lèi)豐富的 Test (測試) 后,即可按需制作各種類(lèi)型的Dashboard (監控大屏),比如私有云服務(wù)、SaaS 應用服務(wù)、Web 服務(wù)、不同區域、網(wǎng)絡(luò )性能、不同運營(yíng)商線(xiàn)路等等;這在 SD-WAN 整體運營(yíng)中非常重要。

在該案例中,10 月 12~ 18號期間,芝加哥分支不管訪(fǎng)問(wèn)哪一個(gè) SaaS 服務(wù),都出現持續高延時(shí) ;

而芝加哥地區的運營(yíng)商線(xiàn)路監控顯示,AT & T線(xiàn)路存在高時(shí)延 :

點(diǎn)開(kāi)路徑可視化即可發(fā)現此時(shí)的 AT & T與 Microsoft 的 Ingress節點(diǎn)之間 ( BGP Peering ) 可能出現了某類(lèi)故障。整個(gè)路徑上,延遲超過(guò) 60 毫秒的為紅色 MPLS tunnel ,貢獻了 105 毫秒的高延時(shí) ;

這就是從上到下的整體復盤(pán)能力,該案例中可以將運維畫(huà)面 ( 監控畫(huà)面的網(wǎng)址 ) 分享給對應的服務(wù)商,快速定位故障點(diǎn)!

ThousandEyes 這一綜合運維的能力,幫助企業(yè)提供底層 Underlay、上層 SDWAN overlay 及企業(yè)應用的全面而可視化的綜合體驗,幫助企業(yè)IT提供全面可視化的精細運維提升企業(yè)生產(chǎn)力!
總結
ThousandEyes基于代理工作機制,通過(guò)Endpoint、Enterprise 、Cloud三大 Agent 類(lèi)型,針對企業(yè)內外應用 ( 包括 SaaS 服務(wù) ) 的多運營(yíng)商全旅程,提供精細可視化健康監控。
除了 ThousandsEyes 之外,思科圍繞 Application-First (關(guān)注應用為先)正在不斷推出適合多云環(huán)境的 AIOps 平臺,包括網(wǎng)絡(luò )、服務(wù)器、容器和應用;比如 ACI/NAE 針對多云網(wǎng)絡(luò )環(huán)境,比如 AppDynamics 針對多云應用自身,從應用支撐的產(chǎn)品交易運營(yíng)到應用的代碼級排錯,還與思科多云網(wǎng)絡(luò )集成;再比如 Tetration 針對多云應用安全,顆粒度精細到每一個(gè)操作系統包括容器,提供給企業(yè)零信任安全架構。
通過(guò)全棧式 ( Fullstack ) 視角和架構產(chǎn)品,思科正在幫助企業(yè)不斷提升 AIOps 水平,形成真正的基于數據驅動(dòng)的BizDevOps ( 業(yè)務(wù)/開(kāi)發(fā)/運營(yíng) ) 閉環(huán)運營(yíng)能力,努力幫助企業(yè)擁抱云計算時(shí)代,推進(jìn)數字化轉型進(jìn)程。