穎科HTML2XML白皮書(shū)
InfOnCall HTML2XML
2001/12/05
1.術(shù)語(yǔ)
HTML2XML 模板生成器
HTML2XML 解析引擎
2.簡(jiǎn)介
Infoncall提供了一套HTML2XML工具,用以將HTML文檔自動(dòng)轉換為XML文檔。目前主要針對以表格數據為核心(data-centric)的HTML格式文件。這是由于XML標準主要是用以精確標識所包含的數據,而有進(jìn)一步應用需求的HTML文件多以含有Table的 Data-Centric文件為主。目前該工具功能主要包括:
3.背景
Internet的廣泛應用和飛速發(fā)展使得以HTML表達的Web成為了信息的主要發(fā)布渠道之一。人們可以通過(guò)WWW瀏覽豐富的信息資源。而Web越是普及,就越迫切地要求信息內容不僅容易表現,而且能被應用方便地獲取,以提供服務(wù)之間的自動(dòng)化和互操作。人們要求來(lái)自Web的信息以結構化的方式來(lái)訪(fǎng)問(wèn)。W3C制定的可擴展標記語(yǔ)言(XML)以及其數據模型和查詢(xún)語(yǔ)言提供了解決之道。可是如今的Web仍然是由許多雜亂的HTML網(wǎng)頁(yè)組成,而不是組織良好的XML文檔。因為需要把現有的HTML網(wǎng)頁(yè)轉換成更靈活應用和處理的XML數據。為了解決這個(gè)實(shí)際的問(wèn)題,InfonCall提供了HTML2XML的開(kāi)發(fā)工具,可以來(lái)將基于Web資源包裝成產(chǎn)生所需要的XML文檔。
4.系統架構
HTML2XML1.0中包括了兩個(gè)工具:HTML2XML模板生成器和HTML2XML解析引擎。通過(guò)該HTML2XML模板生成器的GUI界面和HTML2XML解析引擎,將HTML文件中的<Table>標記中的數據,根據指導性文件,轉換成XML格式數據,供其他應用程序進(jìn)行進(jìn)一步處理。
Infoncall的 HTML2XML 模板生成器提供方便的用戶(hù)界面。HTML網(wǎng)頁(yè)內容編輯人員,選定所需要的HTML內容后,以可視化的圖形方式,用鼠標進(jìn)行拖拉操作即可完成對HTML內容的獲取。用戶(hù)不必了解所編輯HTML文件的源代碼。當保存編輯結果后,即可生成針對該類(lèi)HTML文件的解析模板和DEMO解析結果。
HTML2XML解析引擎支持兩種用戶(hù)界面:Service和API。Service界面不需要用戶(hù)有較深的編程經(jīng)驗;API界面為開(kāi)發(fā)人員提供更靈活的編程接口。模板使用人員在開(kāi)發(fā)具體應用時(shí),通過(guò)parser 解析引擎裝載不同模板,解析得到相應的結果。解析結果返回XML格式的字符串和保存為指定文件,以供進(jìn)一步處理。若模板裝載發(fā)生錯誤或開(kāi)發(fā)人員未指定模板,解析引擎則按無(wú)模板的方式進(jìn)行處理。此時(shí),解析引擎解析所有Table中的數據到XML文件中。
5. 產(chǎn)品功能和特點(diǎn)
5.1 產(chǎn)品功能
Infoncall的HTML2XML工具,提供以下功能:
5.2 產(chǎn)品特點(diǎn)
Infoncall的HTML2XML開(kāi)發(fā)工具將給您帶來(lái)如下的優(yōu)勢:
6.應用前景
Infoncall HTML2XML工具可以應用的情景的有:
1)網(wǎng)站與增值服務(wù)提供商的數據交換。
一般的情形,網(wǎng)站已經(jīng)通過(guò)Internet發(fā)布其信息內容(比如匯率、證券信息、氣象信息等),這樣的信息通常是通過(guò)其服務(wù)系統不同的格式和渠道進(jìn)行發(fā)布(比如提供給WAP手機)。在進(jìn)行實(shí)施過(guò)程中,要直接開(kāi)放其原來(lái)的后臺數據庫可能對數據來(lái)源的安全性造成影響;或者有可能不同的頻道信息來(lái)自不同的網(wǎng)站,也就可能來(lái)自不同的平臺和數據庫。這就需要直接針對HTML,通過(guò)調用應用服務(wù)器而不是訪(fǎng)問(wèn)后臺數據庫的方式來(lái)獲取網(wǎng)頁(yè)信息,并且轉換成為統一的基于XML格式。XML具有獨立于平臺和發(fā)布渠道的特點(diǎn),可以很好地用于各種不同方式的發(fā)布。
2)網(wǎng)站的重新設計。
目前HTML的固有缺點(diǎn)已經(jīng)使得原來(lái)的網(wǎng)站模式很難符合新的需求,特別是在商務(wù)之間相互通信的場(chǎng)合,XML的產(chǎn)生和相關(guān)技術(shù)的成熟,特別是基于XML的XHTML逐漸更新HTML,使得越來(lái)越多的網(wǎng)站逐漸升級到基于XML設計的網(wǎng)站。在這個(gè)過(guò)程中既要將新的內容以XML的方式存儲和發(fā)布,同時(shí)也要考慮到兼容原來(lái)的數據。這就需要將原來(lái)的數據進(jìn)行組織和轉換。對于數據庫,可以通過(guò)數據庫到XML的轉化來(lái)實(shí)現(Infoncall也提供了通用的數據庫轉換到XML的工具DB2XML)。同時(shí)許多靜態(tài)的HTML網(wǎng)頁(yè)也需要轉換,其中攙雜了許多重要的信息。Infoncall HTML2XML也提供了這樣機制,既可以將HTML轉換成的XHTML,也可以將其轉換為獨立于應用的XML通用格式,然后通過(guò)XSL進(jìn)行網(wǎng)站的發(fā)布。這將是新一代網(wǎng)站發(fā)展中的重要環(huán)節。
穎科公司供稿 CTI論壇編輯
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 西吉县| 天镇县| 岱山县| 阿拉善盟| 闻喜县| 台东市| 崇义县| 普定县| 阿合奇县| 庐江县| 即墨市| 长顺县| 龙陵县| 拜城县| 长沙市| 商河县| 全州县| 泊头市| 宣威市| 金湖县| 克什克腾旗| 长顺县| 罗山县| 五大连池市| 林州市| 延吉市| 海南省| 德清县| 长葛市| 五峰| 龙泉市| 西峡县| 咸阳市| 宝坻区| 栾川县| 防城港市| 石嘴山市| 巍山| 抚远县| 高州市| 英山县| http://444 http://444 http://444 http://444 http://444 http://444