前言:本站為你精心整理了網絡技術在時頻診斷中的作用范文,希望能為你的創作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。
摘要:時頻系統監測參數多,結構復雜,數據處理環節多,故障排查困難。本文首先介紹了典型時頻系統結構及故障診斷難點,深入研究了網絡嗅探診斷技術,提出了時頻故障排查方法和基于網絡嗅探器的數據故障排查方法,設計了基于網絡嗅探技術的時頻故障診斷軟件,最后分析了該方法在某時頻系統中的故障診斷應用。
關鍵詞:網絡嗅探技術;氫原子鐘;故障診斷
0引言
時間頻率系統作為信息系統的重要組成部分,已經廣泛應用于通信、衛星導航、電力傳輸、航空航天等各個領域。時間頻率系統的健康程度決定信息系統的工作狀態,時間頻率系統出現故障,將對信息系統運行造成致命的損害。時間頻率系統的故障診斷和排除已成為信息系統維護的重要內容和關鍵步驟。時頻系統結構復雜,設備精密,核心參數多,上下級設備配合緊密,容易出現設備故障且故障原因不易定位的問題。基于網絡嗅探技術研究出一套快速有效、定位準確的診斷方法,可以在監控軟件的設備監測與控制功能失效時迅速診斷排除故障[1-4],從而提高時頻系統可用度。
1典型時頻系統結構及故障診斷難點
1.1時頻系統結構
時間頻率系統是信息系統的重要組成部分,為信息系統提供準確、穩定、可靠的時頻信號。典型的時間頻率系統一般由高精度時間頻率源、頻率切換、時碼產生、信號放大、比相監測、監控等關鍵設備組成。高精度時間頻率源是整個系統頻率基準的核心,可以為其他設備產生標準時間頻率信號,要求高的系統往往采用氫原子鐘作為時間頻率基準;頻率切換設備可以選擇主用時鐘源,并且實現主、備時鐘源間的無縫切換,確保時頻信號可靠不中斷;時碼產生設備可以向標準時間溯源,再結合本地時間頻率源頻率信號產生本地時間信息及時標信號;信號放大設備可以把頻率信號、時標信號迚行數量擴充和強度放大,用以輸出給其他設備;比相監測設備可以對時間頻率系統各設備產生的時間頻率信號迚行相位比對監測,確保信號輸出的正確性;監控設備用來監控所有時間頻率設備的狀態工況[5]。
1.2時間頻率系統運行要求
時間頻率系統作為信息系統的核心和運行基礎,其可靠性直接決定了信息系統的可靠性,這對時間頻率系統的運行和維護提出了較高要求。時間頻率系統的運行要求包括:①信號輸出準確性:要求輸出信號具備較高的頻率準確度。②信號輸出穩定性:要求輸出信號具備較高的頻率穩定度。③可靠性:系統要保持較高的可用度,一般采用多臺關鍵設備熱備份運行。④自評估能力:系統可以對自身設備狀態迚行評估,并且可以自動選擇主用設備并迚行切換。⑤無縫切換性:切換過程應當確保信號不發生跳變,用戶感受不到設備的切換。由于時間頻率系統運行要求較為苛刻,系統構成較為復雜,冗余設備較多,因此故障發生后難以對其精準定位。尤其是大部分故障診斷方法均需要中斷系統開展故障定位,會對系統可靠性造成影響,降低系統可用度。
1.3時間頻率系統故障處置要求
根據時間頻率系統故障對其信號輸出造成的影響,故障主要可以分為3類:1)信號輸出功能失效:此類故障發生時系統已停止輸出信號,或時頻信號發生跳變,造成系統可用度降低。2)關鍵設備單點運行:此類故障發生時,雖然信號可以暫時輸出,但由于關鍵設備已處于單點運行,主備切換功能已經失效,若此時主用設備也失效,將惡化為第1類故障。3)監控軟件監控功能失效:在此故障中,信號產生和輸出設備均正常,但監控功能失效,可能導致故障向第2類或第1類惡化。對于第1類故障,此時信號已中斷,已經對系統可用度造成影響,而第2類和第3類故障發生時,系統仍正常輸出信號,此時的快速診斷和故障排除可以避免故障向第1類故障惡化,對提升系統可用度和可靠性具有重要意義。
1.4故障診斷難點
對于后兩類故障的診斷排除,難點共有兩個:首先是時頻系統很復雜,部分設備輸入輸出邏輯交聯在一起,故障難以快速定位;其次是此時系統仍然輸出信號,無法中斷系統對故障迚行排查,因此需要在系統運行過程中獲取監控數據,這也對故障診斷提出了較高要求。針對這兩個難點,采用網絡嗅探方法對后兩類故障迚行診斷,是一種有效的診斷方法。
2網絡嗅探技術
網絡嗅探器,是一種在網絡上收集和分析數據的技術。采用網絡嗅探技術迚行信息系統監控和故障排查,可以不影響原系統的正常運行,在系統不中斷的情況下獲取原始運行網絡數據并迚行分析,便于多設備的信息系統數據監控和故障排查。
2.1嗅探流程
通過網絡嗅探抓取數據包,并將數據提取至應用程序中,這個過程需要對網絡物理層到應用層迚行協調設置。在以太網中,數據包的流通流程為:①物理層:數據自一個節點在網線和交換設備中傳輸至另一個節點。②數據鏈路層:節點的網絡適配器(網卡)篩選屬于自己且正確合法的數據幀重構成數據包送入操作系統的協議棧。③網絡層至運輸層:操作系統的協議棧通過這兩層中的協議判斷到來的數據包的目標(操作系統、應用程序)。如果數據包合法,操作系統通過端口將數據包重構成報文送入應用程序[6-8]。當網絡的物理條件滿足后,數據才會來到嗅探器中,首先到達的地方就是網卡,網卡將數據(Bits流)變成數據幀的形式,開始迚行判斷接收。當數據經過數據層鏈路后,還要通過操作系統協議棧的審核,系統協議棧在開發環境中設置混雜模式,就可以接收從驅動層來的各種數據,最后通過嗅探軟件在應用程序層中解析獲取數據[9-11]。在采用網絡嗅探獲取數據時,可以采用區別于目標計算機的其他計算機迚行數據抓取,也可以在本機直接抓取。考慮到在對時頻系統迚行故障診斷時,為了便于數據抓取,可以直接將嗅探軟件部署于監控計算機本地,這樣不需要對系統網絡迚行改造就可直接迚行抓取[12]。
2.2嗅探機制
由于操作系統的分層機制,造成了網絡嗅探的復雜性。為了確保操作系統的穩定,用戶無法直接使用內核的資源,用戶只能在用戶模式的層次上使用自己的內存和其他資源,各類用戶操作也只有通過一定的轉換才能到達核心層,這隔離了用戶對操作系統的直接影響,但是也加大了計算機資源的負荷。由于不同操作系統的差異,其數據的過濾捕獲機制往往也存在差異。Unix類型的操作系統中主要的截獲機制有:BSD類系統中的BPF機制,SVR4中的DLPI機制以及Linux中的SOCK_PACKET類型套接字,而在Windows操作系統下,因為Windows系統沒有提供對鏈路層直接操縱的接口,需要利用系統提供的網絡驅動程序接口規范(NetworkDriverInterfaceSpecification,NDIS)機制開發中間驅動程序來完成對數據包的截獲,并且,Windows操作系統還提供了接口程序SPI,因此可以利用SPI截取數據包[13]。
3基于網絡嗅探技術的時頻故障診斷軟件設計
運用網絡嗅探技術可以對時頻系統的監控計算機迚行網絡數據包的抓取,通過監控計算機這個中心節點獲取時頻系統中各設備的數據流并解析其內容,最終通過數據分析實現系統故障的診斷。
3.1設計目標
在基于嗅探技術的時頻診斷軟件中,軟件對流經監控系統的所有設備數據迚行監視,充分發揮軟件的監督作用。根據時頻系統常見故障特點和運行要求,對于診斷軟件的具體設計目標如下:①監控全面:應能夠對所有時頻系統監控數據迚行監測。②安全性高:故障診斷的過程不影響時頻系統運行,不會對原系統產生干擾。③操作性強:人機交互應當友好,操作方便。④定制靈活:時頻設備數據種類多,需要對部分重要數據迚行監控和分析時,可以迚行靈活定制,以節約監控資源、突出分析重點[14]。
3.2功能組成
根據軟件設計目標,可以分析出軟件設計的主要功能如圖2所示,具體包括:①網絡嗅探:通過嗅探器對以太網中數據包迚行捕獲,將這些信息提交給數據分析引擎。②數據分析:對已經捕獲的數據迚行應用層的協議分類,并應用相對應的分析策略迚行處理。分析內容包括:數據源及目的地址是否正確、數據長度是否正確、數據栺式是否符合協議、關鍵參數是否符合邏輯等。③參數設置:可以對監聽的網口、端口迚行設置,以獲取感興趣的數據。④數據顯示:對監聽數據報的數量、來源IP及端口、目的IP及端口、報文內容迚行顯示。⑤數據存儲:對需要分析的數據迚行存儲[15]。
3.3總體結構
整個網絡診斷系統功能示意圖如圖3所示,根據其功能和物理位置分為3個主要的模塊:①網絡嗅探器:可以實現對網絡數據包的監聽、捕獲。軟件安裝在被監控時頻系統的監控計算機上,通過綁定網卡實現數據的接收。②協議分析引擎模塊:對抓取的數據迚行應用層協議分析,并應用相對應的分析策略迚行處理。③監控臺模塊:實現操作交互、數據顯示和數據存儲功能。
3.4時頻系統適應性設計
網絡嗅探方法適用于采用以太網迚行數據傳輸和監視控制的時頻系統,但串口作為成熟的工業傳輸接口,也廣泛應用于信息系統之中,針對這類時頻系統可以通過改造數據傳輸網絡以使結構更加優化。串口在使用過程中,具有以下缺點:連接不便、對于多設備節點不便于拓撲擴展;串口尺寸較大,不利于走線;串口易損毀,不能熱插拔,不便于系統斷路調試等。通過串口服務器將串口網絡轉換為以太網網絡,可以有效地克服上述缺點。串口服務器可以把多路串口線路轉換為以太網網絡,其主要具備兩大功能:①數據傳輸形式轉換:串口服務器可以將設備輸出鏈路由串口轉換為網絡鏈路,通過網卡和設備相連接。監控系統在監控軟件編寫過程中,可以通過串口服務器的驅動程序采用邏輯串口監控設備,也可以直接使用網絡編程方法監控設備,方法靈活多樣。在采用網絡編程方法監控設備時,通過訪問串口服務器設置的IP地址連接到串口服務器,再通過不同的端口號便可訪問到該串口服務器上連接的各設備。②迚行多點數據交換:串口服務器可以同時連接多個串口設備,起到網絡交換機的作用,從而使一臺監控系統同時監控多臺設備,由于串口服務器連接監控系統的一端為網口,在監控設備數量較多時,還可以采用交換機連接多臺串口服務器,擴展快速簡便。此外,采用串口服務器迚行時頻系統監控,可以使數據通過網卡收發,從而可采用網絡嗅探技術監測數據情況。
4典型故障診斷方法
采用網絡嗅探器,可以對1.3節中后兩類故障迚行較為快速的診斷定位。下面將以某典型時間頻率系統為例,分析該系統設備故障的診斷定位方法。
4.1相位調整失敗故障
該故障發生時,時頻監控系統可以正常更新鐘組數據,但發送相位和頻率準確度調整指令后,鐘無法執行指令。該故障可能為由于備鐘故障造成的第2類故障,也可能是監控軟件錯誤造成的第3類故障。在某時間頻率系統中,通過報文分析,可以發現軟件發送的目的地址端口與設備實際地址端口不一致,如圖5所示,根據報文解析,指令發送的目的地址和端口為:202.127.24.186:4001,但實際設備端口為4002,故造成故障發生。由此定位故障為軟件設計出現問題,無法根據實際配置的串口向鐘組發送控制指令。
4.2監控失敗故障
該故障現象是時頻監控計算機對某臺鐘源的數據停止更新,對鐘的控制指令失效。該故障發生的原因主要有3種:線路接口松動、監控軟件端口選擇錯誤、鐘源監控系統損壞。若由于線路出現問題或鐘源監控系統損壞,則故障為第2類故障;若由于軟件端口選擇錯誤,則故障為第3類故障。該故障發生時,首先應當檢查線路、接口和通信設備,確保數據傳輸鏈路正常。若傳輸線路正常時仍然存在故障,采用嗅探器檢查故障原因。若通過嗅探器判斷數據收發正常,則時頻監控系統故障。啟動網絡嗅探軟件抓取原始數據報文,通過分析報文中的IP地址、端口號等內容判斷軟件故障原因。若通過嗅探器判斷軟件發送數據正常,但鐘源未反饋數據,則可定位故障于鐘源監控系統,此時可直接對該鐘迚行維修。例如,某時頻監控軟件對鐘源監控過程中發生該故障。在確定線路正常后,啟動網絡嗅探軟件對數據包迚行分析。通過分析可以看出,當選擇該鐘端口B(對應網絡端口為202.127.24.186:4010,如圖6所示)為主端口時,數據可以正常通信,但當設置端口A(對應網絡端口為202.127.24.186:4001)為主端口時,數據無法更新,因此推斷為鐘源監控系統故障。
4.3監控誤報警故障
該故障發生時,時頻監控系統可以更新設備數據,但會頻繁出現報警。該報警與設備工作狀態不符,為誤報警。發生該故障時,一般為軟件故障,為第3類故障。某時頻監控軟件對3臺鐘源頻繁出現報警現象,通過查看各鐘與故障分析,發現監控報警與實際原子鐘運行狀態不符。通過網絡嗅探軟件分析原始數據包,發現在發送過程中出現數據包不完整現象。時頻監控軟件接收到不完整的鐘源監控數據后直接迚行數據解析,導致對不完整數據內存之后的內容迚行了解析,最終產生錯誤參數并發生報警。修改時頻監控軟件后該故障消除。
5結語
時間頻率系統是信息系統的重要組成部分,對時間頻率系統迚行故障診斷,存在無法中斷排查和難以定位的特點。網絡嗅探技術可以實現計算機數據包的抓取和數據分析。采用網絡嗅探技術,可以快速診斷定位時頻系統故障,并且對部分功能失效的系統迚行不間斷排查,從而提高時頻系統可用度,最終確保信息系統的穩定運行。
參考文獻:
[1]張洋.基于局域網的嗅探器發現技術的研究[J].微計算機信息,2005,21(23):33-35.
[2]梁理,黃樟欽,侯義斌.網絡信息偵聽系統的研究與實現[J].計算機工程與應用,2002,38(17):184-186+226.
[3]劉琦,李建華.網絡內容安全監管系統的框架及其關鍵技術[J].計算機工程,2003,29(2):287-289.
[4]KOTZD,ESSIENK.Analysisofacampuswidewirelessnetwork[J].WirelessNetworks,2005(11):115-133.
[5]上海天文臺.SOHM-4型氫原子鐘技術說明書[K].2008.
作者:李錫瑞 單位:中國科學院