• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁(yè) > 資訊 > 國內 >
     首頁(yè) > 資訊 > 國內 >

    打造智慧運維平臺 財政廳IT治理服務(wù)的升級之路

    2019-04-09 15:35:36   作者:   來(lái)源:CTI論壇   評論:0  點(diǎn)擊:


      信息化技術(shù)越來(lái)越深入的融入財政管理工作的方方面面,財政廳的信息化建設在向更深層次發(fā)展,不僅要保障日常業(yè)務(wù)工作的正常運轉,更重要的是要做好信息化運維管理工作,從網(wǎng)絡(luò )、服務(wù)器、應用系統、維護等方面需要加強運維管理,從而提升信息化管理水平。
      隨著(zhù)IT運維管理需求的不斷進(jìn)階,新一代智慧運維軟件孕育而生,它將是具備自動(dòng)分析、自動(dòng)學(xué)習和自動(dòng)運維能力的智能系統,更像專(zhuān)屬私人醫生、健康顧問(wèn)一樣可建立健康標準,并自動(dòng)采集、統計、處理相關(guān)數據(即看病和定期體檢),使“體檢報告”累積成健康檔案,分析運維變化趨勢,實(shí)現無(wú)人工干預的自動(dòng)化,真正做到省時(shí)、省力、省心的高效運維。
      近年來(lái),黑龍江全省財政廳為了適應財政信息化工作的新要求、新挑戰,參照財政部提出的總體思路:
    • 以統一標準規范和財政信息化建設核心要素為重心
    • 以信息系統統建統管為手段
    • 以業(yè)務(wù)系統一體化整合與開(kāi)展財政大數據創(chuàng )新應用為著(zhù)力點(diǎn)
    • 以加強信息安全和IT運維服務(wù)為保障
      形成了橫向一體化、縱向集中化、全省系統化的財政信息化發(fā)展新格局。
      在此背景下,黑龍江省財稅信息中心作為黑龍江省政府主管全省財政收支、財稅政策、國有資本金基礎工作的綜合經(jīng)濟部門(mén),其網(wǎng)絡(luò )管理范圍覆蓋了一個(gè)省廳,以及十三個(gè)市局構成的二級網(wǎng)絡(luò )管理架構。
      為了解決IT運維管理的基礎問(wèn)題,目前黑龍江省財政廳已建立了以監控為核心的運維框架。實(shí)現了對各主機系統和多種數據庫的監控和管理。
      隨著(zhù)各類(lèi)財務(wù)管理應用系統逐步上線(xiàn),而且對IT依賴(lài)程度與日提升,單位內部業(yè)務(wù)部門(mén)對IT 部門(mén)所提供信息的實(shí)用性要求也越來(lái)越高,對業(yè)務(wù)的載體(整個(gè)信息基礎平臺)也提出了更高水平、更加精細的服務(wù)要求。也對現行的運維能力提出了更多挑戰:
      1、運維工具與運維習慣難以兼容
      隨著(zhù)IT運維工作要求的提升,IT運維部門(mén)也在不斷的摸索最佳運維方式,逐漸形成了一些具有財政網(wǎng)絡(luò )管理特色的運維經(jīng)驗和問(wèn)題分析方式,而業(yè)界的運維軟件往往無(wú)法實(shí)現對于運維習慣的兼容,導致IT部門(mén)無(wú)法將管理理論轉化成最佳生產(chǎn)力。
      2、需要向基于大數據分析智能運維轉變
      與主要依靠 “經(jīng)驗”的傳統管理方式相比,實(shí)現智能運維并不是把原來(lái)手工操作變成程序化操做。智能運維是一種全新交付能力,追求交付的質(zhì)量,交付的效率,而這種交付能力的來(lái)源就是基于大數據的分析。
      3、與不同角色相匹配的交付能力
      針對不同業(yè)務(wù)部門(mén),需要不同種類(lèi)服務(wù)的要求,IT 運行維護人員需要有新的運行維護管理工具以滿(mǎn)足單位內部客戶(hù)、單位外部客戶(hù)對高質(zhì)量服務(wù)的期待。
      黑龍江省財稅信息中心在使用運維管理系統方面,分為兩部分人員使用,分別為網(wǎng)絡(luò )科和應用科:
      網(wǎng)絡(luò )科負責省廳網(wǎng)絡(luò )管理,包含到各地市的鏈路情況、到各銀行的鏈路情況、視頻會(huì )議鏈路情況、重要服務(wù)器的鏈路情況
      應用科負責財政廳所有業(yè)務(wù)系統的運行情況。
      因此,智慧運維需要有持續交付的全局思考能力,把交付能力按照角色,場(chǎng)景,IT成熟度來(lái)構造不同的交付能力,這樣的產(chǎn)品才能把被消耗的徹底人力解放出來(lái)。
      4、其它挑戰
    • 需要滿(mǎn)足對于基本狀態(tài)和性能的無(wú)人值守
    • 實(shí)時(shí)展示運維數據,智能抓取關(guān)鍵性能數據,根據預置策略進(jìn)行數據分析和聯(lián)動(dòng)處置
    • 可提供強大的平臺能力和后臺開(kāi)發(fā)能力,能將個(gè)性化的分析方式和處置方式快速實(shí)現策略化
    • ……
      良好的運維事件記錄和流程,以及之前運維建設積累下的大量數據,為實(shí)現智能運維提供了先決條件。經(jīng)過(guò)北塔軟件的綜合評估,黑龍江省財稅信息中心在運維第一階段已經(jīng)建立了比較完整的數據采集和處理能力,可以以接口方式為下一階段分析提供運維數據,且具備大數據采集和存儲能力,為實(shí)現場(chǎng)景化管理定制提供技術(shù)了可能。
      黑龍江省財政廳目前的運維需求:
    • 提供強大的擴展能力,支持管理能力的自由擴展
    • 支持用戶(hù)個(gè)性化采集程序的快速兼容,實(shí)現管理指標的快速擴展
    • 采集服務(wù)器支持無(wú)縫擴展,支持多個(gè)采集器同時(shí)部署
    • 支持管理策略的快速擴展,實(shí)現故障處理和巡檢管理方式的落地
    • 支持用戶(hù)個(gè)性化報表的快速擴展,實(shí)現各種具備企業(yè)特征的報表數據和展現方式
      基于北塔BTSO智慧運維平臺,北塔軟件為黑龍江省財稅信息中心以業(yè)務(wù)為核心提供了相應解決方案,以自動(dòng)學(xué)習、自動(dòng)分析、自動(dòng)運維和全景展示,將智能聯(lián)動(dòng)的運維項目落地,并實(shí)現以下具體功能:
      1、自動(dòng)學(xué)習
      實(shí)現用戶(hù)環(huán)境數據的學(xué)習,結合內置檢測指標體系,建立具有用戶(hù)特征的常態(tài)健康標準
      2、自動(dòng)分析
      實(shí)時(shí)監控用戶(hù)各項運維指標,結合指標變化特征,通過(guò)諸如單指標越界比例、多指標組合判斷、歷史趨勢變化等方法自動(dòng)判斷數據異常情況,主動(dòng)提醒
      3、自動(dòng)運維
      提供處置方案的提醒,用戶(hù)處置程序的調用等多種方案,實(shí)現異常問(wèn)題的及時(shí)處理和運維
      4、業(yè)務(wù)可視化
      以動(dòng)態(tài)圖形的方式實(shí)現業(yè)務(wù)關(guān)系和業(yè)務(wù)狀態(tài)的信息可視性
      5、數據可視化
      提供靈活定制的界面,多種大數據結果展現界面,滿(mǎn)足運維管理的個(gè)性化展示要求
      黑龍江省財稅信息中心通過(guò)數據中心實(shí)時(shí)收集處理運維數據,為運維團隊提供實(shí)時(shí)決策數據支持。平臺將應用進(jìn)程、數據庫、主機、開(kāi)源組件等對象的巡檢指標定義為規則并進(jìn)行固化。系統建設完成后,實(shí)現了實(shí)時(shí)、全方位掌握系統健康狀態(tài),提升了運維團隊對故障預判斷能力和決策能力。
      自主學(xué)習基線(xiàn)實(shí)現業(yè)務(wù)異常監控
      在日常運維管理中,業(yè)務(wù)管理的復雜性要遠高于設備管理的復雜性,它不是簡(jiǎn)單的表現為好壞、通斷,而是更復雜為可用性問(wèn)題,可用性判斷也是由一批關(guān)鍵指標構成的,但指標的正常與否,不能簡(jiǎn)單地以固定閾值來(lái)對比,要結合真實(shí)業(yè)務(wù)情況的波動(dòng)來(lái)判斷。
      智慧平臺提供智能基線(xiàn)監控方式,支持智能基線(xiàn)的自動(dòng)學(xué)習,通過(guò)對正常狀態(tài)下指標的“歷史表現”,加以調整后作為基準線(xiàn),與以后同樣時(shí)段的實(shí)時(shí)指標做對比,如果誤差在允許范圍內,那么判定為正常,否則為越界,越界次數越多,會(huì )導致系統的可用性嚴重下降,極端情況下導致系統不可正常使用;以此作為業(yè)務(wù)異常的監控;
      另外,系統還提供日、周兩種基線(xiàn)方式,周基線(xiàn)可以基準周 周一數據和實(shí)際監控周一的,相同時(shí)間點(diǎn)進(jìn)行比對,實(shí)現以最相近的基準實(shí)現比對,是匹配周一和周末的區別、上午8點(diǎn)和下午4點(diǎn)的業(yè)務(wù)區別。
      定期智能巡檢實(shí)現無(wú)人值守
    • 當管理對象被納入到平臺系統后,系統將自行啟用符合其管理預案的管理規則,涉及后臺采集,海量存儲、智能分析;
    • 系統按照管理要求實(shí)現不同頻度的設備數據采集,并且依據自主學(xué)習的業(yè)務(wù)基線(xiàn)以及業(yè)界規范基準值,進(jìn)行定期巡檢;
    • 將巡檢異常以實(shí)時(shí)狀態(tài)、越界統計、智能策略方式進(jìn)行反應;
    • 智能巡檢對于不符合內置檢測閾值的事件定義為越界事件,由于智維事件的閾值風(fēng)險系數較低,所以不能從單個(gè)事件的產(chǎn)生去判斷這個(gè)對象的運維好壞;
    • 平臺還推薦以越界事件出現規律為主的分析手段,比如一段時(shí)間內的越界比例、日越界增長(cháng)的角度進(jìn)行數據判斷;
      同時(shí),系統也提供了完善的分析統計系統,包通過(guò)等級、時(shí)間、指標、IP范圍查詢(xún)的越界比例TOPN分析、周越界比率增長(cháng)TOPN、月越界比率增長(cháng)TOPN
      為了了解實(shí)時(shí)管理情況,根據不同業(yè)務(wù)類(lèi)型整理成一張抽樣數據報表也是必要運維手段,系統提供日、周巡檢報表,可將影響業(yè)務(wù)健康度的各個(gè)關(guān)鍵指標,按照固定時(shí)間點(diǎn)得巡檢數據判斷、組成一張巡檢報表,系統會(huì )定期生成并主動(dòng)發(fā)送運維人員。
      對于短期內出現越界過(guò)多的指標,系統會(huì )需要明確及時(shí)告知管理員,并且為管理員提供大量的問(wèn)題處理分析數據和處置建議;
      當出現越界異常后,系統會(huì )提示具體該指標的管理意義和影響范圍,并且業(yè)界一般的處理方案;同時(shí)給出該指標最近72小時(shí)的運行情況,幫助運維團隊進(jìn)一步定位分析問(wèn)題。
      智能策略實(shí)現管理策略落地
      信息中心的管理實(shí)例應用包含了2種管理場(chǎng)景:
    • 一種是在條件完全滿(mǎn)足的情況下,自動(dòng)分析和識別問(wèn)題異常的,并能根據事先預定的規則進(jìn)行運維操作落地
    • 還有一種觸發(fā)分析的事件不完全滿(mǎn)足,需要分析試探性的排除和定位問(wèn)題,為了區別入口,前者定義為智能策略,后者定義為分析方案,分析方案可以升級成智能策略
      利用智維策略和原有運維經(jīng)驗的組合,系統對于所有管理指標均可實(shí)現基礎分析方法,當發(fā)現異常后,及時(shí)了解該異常指標的管理意義和影響范圍,以及歷史情況,這樣將原本專(zhuān)業(yè)性過(guò)強的指標,直接解釋為可以輕松理解和應對話(huà)術(shù)。
      通用指標越界策略,以及對于歷史數據的分析回顧,智能分析出指標與歷史基準(具體風(fēng)險閾值的差異),主動(dòng)提示運維人員異常風(fēng)險,并同時(shí)告知該指標的意義以及異常的處理建議;該策略可覆蓋所有類(lèi)型的指標,包括主機、網(wǎng)絡(luò )、數據庫等,各市級網(wǎng)絡(luò )用戶(hù)也可通過(guò)該策略關(guān)注業(yè)務(wù)相關(guān)的特殊指標,以完成策略的本地化應用。
      系統對于主機類(lèi)兩個(gè)重要問(wèn)題“負載過(guò)高”“內存泄露”進(jìn)行了專(zhuān)項分析,針對這兩個(gè)問(wèn)題特征,聯(lián)合進(jìn)程分析,進(jìn)一步定位造成這兩個(gè)問(wèn)題的具體業(yè)務(wù)進(jìn)程,為用戶(hù)解決系統問(wèn)題提供有數據、有結論的原因定位。
      傳統運維中出現網(wǎng)絡(luò )流量增長(cháng)過(guò)快時(shí),往往只能在閾值點(diǎn)被監控到,而在智能運維領(lǐng)域可以識別數據變化率并可自動(dòng)通過(guò)線(xiàn)路邏輯關(guān)系以及IP關(guān)聯(lián)設備自動(dòng)找出造成此次線(xiàn)路流量陡增的具體IP,實(shí)現具象的根原因分析;經(jīng)過(guò)人工判斷后,可以對該端口進(jìn)行快速處置,比如關(guān)閉該端口使用;
      在數據庫管理領(lǐng)域,由于所有性能數據都是動(dòng)態(tài)變化的,往往是否進(jìn)行異常分析需要多次翻查分散在各個(gè)指標的歷史記錄,極為不便。智能系統通過(guò)對故障現場(chǎng)關(guān)鍵指標做數據快照,以異常時(shí)刻進(jìn)行時(shí)間切片,將該現場(chǎng)數據進(jìn)行整體保留,實(shí)現了問(wèn)題現場(chǎng)分析的快捷方式。
      專(zhuān)項智維方案快速實(shí)現問(wèn)題排查
      系統提供場(chǎng)景化工具用于對專(zhuān)項問(wèn)題的分析,從而復雜問(wèn)題的簡(jiǎn)單化排查,系統在常見(jiàn)操作界面提供快速操作入口,便于管理員能快速調用并解決故障。系統預置多個(gè)智維分析方案,并支持快速開(kāi)發(fā),插件化導入,實(shí)現現有業(yè)務(wù)場(chǎng)景分析的快速集成。
      智能分析模塊通過(guò)固化運維人員經(jīng)驗及自定義分析關(guān)聯(lián)規則,形成特定分析場(chǎng)景,由場(chǎng)景代替人工經(jīng)驗進(jìn)行作業(yè)分析,降低人工分析的不完整性及經(jīng)驗缺乏的影響,通過(guò)保證分析的完整性和及時(shí)性,提升故障分析的準確性。
      新一代智慧平臺上線(xiàn)后,系統可以根據要求自動(dòng)檢測設備、線(xiàn)路、應用等IT設施的運行狀態(tài):
    • 首先,對于重要的服務(wù)器,通過(guò)資源分析查看是否存在運行異常的問(wèn)題
    • 其次,對于視頻會(huì )議還可通過(guò)歷史流量記錄查看到帶寬使用率,方便對未來(lái)視頻鏈路的擴容
    • 最后,對于網(wǎng)絡(luò )設備還避免了設置CPU和內存告警閾值過(guò)高異常不告警的問(wèn)題,大大的節省了運維人員的時(shí)間,提升了工作效率

    相關(guān)閱讀:

    專(zhuān)題

    CTI論壇會(huì )員企業(yè)

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 五华县| 台南县| 环江| 海城市| 长乐市| 阜阳市| 阿拉尔市| 黑河市| 黔西县| 电白县| 衢州市| 慈溪市| 永靖县| 四川省| 四平市| 湟中县| 双辽市| 饶平县| 逊克县| 扬州市| 德庆县| 灌阳县| 武鸣县| 宜宾县| 康马县| 安溪县| 安徽省| 闵行区| 新干县| 西吉县| 蒲城县| 开江县| 西平县| 安陆市| 明水县| 大荔县| 松原市| 辰溪县| 五原县| 九龙县| 陕西省| http://444 http://444 http://444 http://444 http://444 http://444