數據中心架構的一個(gè)重點(diǎn)就是提高效率,以便獲得最佳資本回報并在有限的空間和電力下最大程度提高數據中心的輸出。處理器在數據中心優(yōu)化中起著(zhù)根本性作用,處理器架構的選擇對可擴展性和效率有著(zhù)巨大的影響。要想在這些因素之間達到理想的平衡,就需要遠見(jiàn)、創(chuàng )造性和創(chuàng )新,而這些并不能一蹴而就。
英特爾廣泛的產(chǎn)品組合中體現了其數十年設計專(zhuān)用數據中心CPU和平臺的豐富經(jīng)驗。一代又一代,英特爾不斷創(chuàng )新核心計算功能,以期提高處理器性能。但是我們的工作并未止步于此。所有內核的連接和可擴展性的改進(jìn)、對內存層次結構進(jìn)行微調、增強I/O也同樣重要,這些因素將確保組成數據中心主要構建模塊的計算、網(wǎng)絡(luò )和存儲系統的可擴展性和效率。
成長(cháng)的煩惱:規模所帶來(lái)的挑戰
添加更多內核并將其連接,以便創(chuàng )建一個(gè)多核數據中心處理器,這個(gè)任務(wù)聽(tīng)上去可能很簡(jiǎn)單,但是CPU內核、內存層次結構和I/O子系統在這些需要周密架構子系統的連接提供了關(guān)鍵路徑。這些互聯(lián)就像一個(gè)精心設計的高速公路一樣,在關(guān)鍵位置設有合適數量的車(chē)道和坡道,以便讓交通一路暢通,而不是讓人們和貨物閑坐在路上浪費時(shí)間。
增加處理器內核的數量并提高內存和每個(gè)處理器的I/O帶寬,以滿(mǎn)足大量數據中心負載的需求 -- 這構成了一些必須通過(guò)創(chuàng )造性架構技術(shù)才能解決的挑戰。這些挑戰包括:
- 提高內存、片上緩存層級架構、內存控制器和I/O控制器之間的帶寬。如果可用互聯(lián)帶寬并不能隨處理器上的其它資源適當擴展,那么互聯(lián)就會(huì )像令人沮喪的高峰期交通擁堵一樣,成為限制系統效率的瓶頸。
- 降低訪(fǎng)問(wèn)來(lái)自芯片緩存、主內存或其它內核數據時(shí)的延遲。訪(fǎng)問(wèn)延遲取決于芯片實(shí)體之間的距離、發(fā)送請求和響應的路徑,以及互聯(lián)操作的速度。這相當于在擴張型城市vs緊湊型城市的通勤時(shí)間、可用路徑的數量,以及高速公路上的限速。
- 創(chuàng )造高能效的方式,把數據從芯片緩存和內存提供到內核和I/O。由于每個(gè)組件之間更遠的距離和更高的帶寬,當添加更多內核時(shí),完成相同任務(wù)的數據遷移所需的能量就會(huì )相應地增加。以交通為例,隨著(zhù)城市成長(cháng)和通勤距離的增加,通勤期間所浪費的時(shí)間和能量會(huì )讓用于生產(chǎn)工作的可用資源變得更少。
英特爾致力于創(chuàng )新架構解決方案,以便在創(chuàng )建更強大、高效的處理器時(shí)走在挑戰的前面,從而滿(mǎn)足現有和新興工作負載 -- 例如人工智能和深度學(xué)習的需求。
架構未來(lái)的數據中心處理器
英特爾運用其經(jīng)驗和創(chuàng )新技術(shù),為即將推出的英特爾 至強 可擴展處理器開(kāi)發(fā)了新架構,以便為現代數據中心奠定可擴展的基礎。這些新架構提供一種新的方式來(lái)互聯(lián)片上組件,以便提高多核處理器的效率和擴展性。
英特爾 至強 可擴展處理器采用一個(gè)創(chuàng )新的“網(wǎng)格”片上互聯(lián)拓撲結構(Mesh),可在內核、內存和I/O控制器之間提供低延遲和高帶寬。下圖顯示了該網(wǎng)格架構的示意圖,內核、芯片緩存庫、內存控制器和I/O控制器是按照行和列而組織的,在每個(gè)交叉口通過(guò)線(xiàn)和交換機而把它們連接在一起,以便允許轉彎。通過(guò)提供一個(gè)比之前環(huán)形架構更加直接的路徑,以及更多通道來(lái)盡量減少瓶頸,網(wǎng)格可在更低的頻率和電壓下工作,并仍能實(shí)現非常高的帶寬和低延遲。這使性能得以提高、能效得以增強,就像一個(gè)精心設計的高速公路系統,讓交通能夠在不擁堵的前提下以最佳速度流通。

Mesh architecture conceptual representation 網(wǎng)格結構概念示意圖
除了改進(jìn)片上互聯(lián)的連接和拓撲,英特爾 至強 可擴展處理器還采用一個(gè)帶有可擴展資源的模塊化架構,以便訪(fǎng)問(wèn)片上緩存、內存、IO和遠程CPU。這些資源分布在整個(gè)芯片上,這樣就能最大程度減少“熱點(diǎn)”或其它子系統的資源限制。該架構的模塊化和分布式特性讓可用資源能夠隨處理器內核數量的增加而擴展。
這些可擴展和低延遲的片上互聯(lián)框架也對共享的最后一級緩存架構非常重要。這些大型共享緩存對于復雜的多線(xiàn)程服務(wù)器應用,例如數據庫、復雜的物理模擬、高吞吐量網(wǎng)絡(luò )應用,以及托管多個(gè)虛擬機 -- 非常寶貴。訪(fǎng)問(wèn)不同緩存庫時(shí)可忽略的延遲差異讓軟件能夠把分布式緩存庫當作一個(gè)大型、統一的最后一級緩存。因此,應用開(kāi)發(fā)者不必擔心訪(fǎng)問(wèn)不同緩存庫時(shí)不同的延遲,他們也不需要優(yōu)化或重新編譯代碼即可使其應用的性能得到大幅提升。統一低延遲訪(fǎng)問(wèn)的好處也能惠及內存和IO訪(fǎng)問(wèn),多線(xiàn)程或分布式應用(涉及不同內核上的執行之間的互動(dòng),以及來(lái)自IO設備的數據)不需要仔細映射一個(gè)插槽內的內核上的協(xié)作線(xiàn)程即可獲得最佳性能。因此,這種應用可充分利用大量?jì)群耍⑶胰阅軐?shí)現良好的可擴展性。
總結
采用Mesh的片上互聯(lián)的新架構提供非常強大的框架來(lái)集成英特爾 至強 可擴展處理器的各種組件 -- 內核、緩存、內存和I/O子系統。這種創(chuàng )新架構能夠在最廣泛的使用場(chǎng)景中提高性能和效率,并為英特爾及其無(wú)與倫比的全球生態(tài)系統所帶來(lái)的持續改進(jìn)奠定基礎,從而交付可提供數據中心客戶(hù)所期待的計算能力和效率的解決方案。
關(guān)于英特爾
英特爾致力于拓展科技疆界,讓最佳精彩體驗成為可能。如需了解更多信息,如需了解更多信息,請訪(fǎng)問(wèn)英特爾中國新聞中心newsroom.intel.cn 以及官方網(wǎng)站intel.cn。
英特爾、Intel、至強、Xeon、傲騰、Optane標識是英特爾公司在美國和其他國家(地區)的商標。
*文中涉及的其它名稱(chēng)及商標屬于各自所有者資產(chǎn)。