建構高可靠度(High Availability, HA)的CompactPCI系統
Jeff Munch 2003/04/04
高可靠度(High Availability, HA)是現今市場(chǎng)中被過(guò)度使用的詞匯,廠(chǎng)商沿用此詞匯可定義從最簡(jiǎn)單的備援電源(power supply)一直到復雜度高的全復聯(lián)系統(redundant system),然而這卻產(chǎn)生了「'什么是高可靠度?」的問(wèn)題,把高可靠度想成是系統使用率的提高或是當機時(shí)間的減少,可能比較簡(jiǎn)單。現今許多電訊系統要求5個(gè)9(5 NINES)的可靠度、亦或一般通稱(chēng)的99.999%運作時(shí)間,每年可允許這些系統的總當機時(shí)間是5.26分鐘(525,600分鐘/年 x 99.999%), 5分鐘的當機尚包括既定的系統維護及任何因系統之部分故障所造成的當機時(shí)間。設計一個(gè)符合5個(gè)9(5 NINES)使用率的高可靠度系統通常會(huì )需要系統的每項功能都有備援設計,也就是不允許單點(diǎn)的故障。在邁向高可靠度系統之路一般包括備援電源、備援風(fēng)扇架與備援硬盤(pán)槽,這些備援零組件的加入將可以降低零組件故障而導致系統當機的或然率,因此,添加備援零組件增加了系統的可靠度。如各位所看到的,備援電源、風(fēng)扇與硬盤(pán)是增加可靠度最直接的方式,然在系統中添加備援運算組件則是一件相當復雜的挑戰。將CompactPCI應用于高可靠度的系統應用上
多年來(lái)系統開(kāi)發(fā)者已將PICMG 2.0 CompactPCI 規格應用于各種可與高可靠度應用兼容的系統上,隨著(zhù)市場(chǎng)上對高可靠度的要求提高,CompactPCI系統便隨之改進(jìn)以因應新的挑戰,而不再是原本簡(jiǎn)單的總線(xiàn)架構。圖1顯示第一代典型的CompactPCI 架構。
PICMG 2.0 CompactPCI系統是由一組或多組CompactPCI 總線(xiàn)所組成,每個(gè)總線(xiàn)最多可達8個(gè)CompactPCI板卡插槽,其中包含一個(gè)系統插槽(system slot)與最多達7個(gè)外圍插槽(peripheral slot)。PCI總線(xiàn)是作為該總線(xiàn)內插槽之間的主要通訊途徑,在這個(gè)架構下,PCI總線(xiàn)與系統插槽是一個(gè)可能的故障單點(diǎn),故障的周邊插槽會(huì )讓整個(gè)PCI總線(xiàn)停止作用而阻礙了其它任一插槽之間的通訊。這種故障單點(diǎn)成為CompactPCI采用高可靠度應用的一個(gè)主要障礙,早期的CompactPCI 高可靠度系統架構必須克服PCI總線(xiàn)單點(diǎn)故障的限制,典型的解決方法則是添加第二個(gè)CompactPCI 總線(xiàn)且讓此二個(gè)總線(xiàn)的功能相同。圖2顯示雙CompactPCI 總線(xiàn)架構的范例。
在圖2中,雙總線(xiàn)與雙系統插槽是現行標準CompactPCI架構中被用以提供單點(diǎn)故障備援的解決方案。在雙總線(xiàn)架構(Dual Segment)中,每個(gè)系統插槽都可控制PCI總線(xiàn)1與PCI總線(xiàn)2,透過(guò)備援系統插槽的提供,就可允許其中一個(gè)系統插槽的故障;同樣的道理亦可應用在PCI總線(xiàn)的故障上,若故障發(fā)生于PCI總線(xiàn)1,則PCI總線(xiàn)2可以繼續處理作業(yè)。這種架構的工程挑戰是很復雜的,系統插槽提供服務(wù)總線(xiàn)的時(shí)序(clock)、仲裁(arbitration)與阻斷(interrupt),其中一個(gè)系統插槽故障時(shí)會(huì )將該系統插槽的時(shí)序驅動(dòng)器、仲裁及阻斷控制器功能一并轉移到仍可作用中的另一系統插槽,然而,要得知總線(xiàn)的故障時(shí)間并在不阻礙整個(gè)系統的使用率之下,將系統工作移轉至另一備援系統是相當困難的。在1999年,PICMG協(xié)會(huì )組了一個(gè)小組委員會(huì ),任務(wù)是將備援系統插槽的執行標準化,然PICMG
2.13備援系統插槽規格卻在三年后被廢棄不用,PICMG 2.13是唯一未完成規格就被解散的小組委員會(huì ),其主要是因為問(wèn)題的復雜性與相對應的解決方案因素。毫無(wú)疑問(wèn)地,CompactPCI中的備援系統插槽可以用來(lái)增加系統的可靠度,但卻受限于高昂的成本與高度復雜性而阻礙其發(fā)展,此外,提供這種架構的廠(chǎng)商其所銷(xiāo)售的產(chǎn)品皆屬專(zhuān)屬性方案(proprietary
solutions),而非基于開(kāi)放架構(open architecture)的產(chǎn)品。
在CompactPCI 加入IP數據的傳輸
在2001年9月,PICMG協(xié)會(huì )核準PICMG 2.16 封包交換背板(Packet Switched Backplane)規格,本規格對于在一個(gè)CompactPCI架構里外圍插槽(peripheral slots)與光纖插槽(fabric slots)之間10/100/1000Mbit Ethernet的互聯(lián)做了詳細定義。光纖插槽是相互備援的,PICMG2.16兼容系統已被廣泛應用于多種用途上,Ethernet互聯(lián)與IP數據傳輸需求的普遍特性促使系統提供者廣泛采用此規格。圖3顯示典型的PICMG2.0與2.16架構。
在 PICMG 2.16 兼容系統中,IP數據傳輸可以作為系統內的主要通訊頻道,這種通訊途徑皆有備援聯(lián)機到備援光纖插槽,PICMG 2.16規格可避免系統工作一起使用CompactPCI
總線(xiàn),并在不增加系統成本的情況下增加系統可靠度。PICMG2.16兼容系統是自動(dòng)備援的,不會(huì )產(chǎn)生單點(diǎn)故障。Ethernet光纖(Ethernet
fabric)是下一代電信應用里處理封包數據傳輸的一種便利方法。
高可靠度CompactPCI 系統的下一步發(fā)展將是去除系統插槽(system slot);因為應用程序利用現今系統的IP互聯(lián),PCI總線(xiàn)逐漸成為派不上用場(chǎng)的費用。PICMG協(xié)會(huì )現正進(jìn)行CompactTCA的規格制訂,CompactTCA規格可望結合AdvancedTCA(PICMG
3.0)所定義的系統管理能力、PICMG 2.0所定義的標準機箱(Form Factor)及PICMG 2.16所定義的數據傳輸。這種架構將不包含PCI總線(xiàn),在此架構下的系統將能夠支持24個(gè)外圍插槽與2個(gè)光纖插槽。摒除PCI總線(xiàn)將可降低CompactPCI
系統所使用的電路板成本、降低提供備援系統插槽(system slot)的復雜性,以及增加插槽總數。圖4顯示可能的CompactTCA系統范例。
總結
PICMG 2.16封包交換背板(Packet Switched Backplane)規格是改善現今系統可靠度的可行方案之一法,排除第一代CompactPCI系統的單點(diǎn)故障與增加數據傳輸的備援,以提供5個(gè)9
(5 NINES,也就是99.999%)可靠度所需的基礎。系統設計師需注意到很多廠(chǎng)商提供的產(chǎn)品是專(zhuān)屬性(proprietary)的外圍備援系統架構,這些封閉式的架構系統無(wú)法受益于目前的CompactPCI
開(kāi)放式經(jīng)濟效益,可以確定的是使用PICMG 2.16 封包交換背板(Packet Switched Backplane)規格的CompactPCI
系統不但可提供5個(gè)9(5 NINES)可靠度要求所需的點(diǎn)對點(diǎn)數據傳輸與備援,更可提供邁向未來(lái)技術(shù)之路。
凌華科技供稿 CTI論壇編輯
凌華科技發(fā)布PICMG 1.0寬溫計算機NuPRO-730 2009-08-18 |
凌華科技推出6U CompactPCI單板電腦 2009-08-11 |
凌華發(fā)布PICMG 1.3 SHB規格工業(yè)電腦NuPRO-E320 2009-06-09 |
凌華科技最新ETX嵌入式模塊計算機ETX-AT 2009-04-22 |
凌華科技發(fā)布3U與6U CompactPCI單板計算機 2009-04-20 |