前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇神經網絡算法的優點范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。
引言
在現代化的工業生產中,隨著生產率的不斷提高,對產品質量品種提出了越來越高的要求,使得生產過程變得日益復雜,要在越來越復雜的動態系統及過程與環境高度不確定的情況下獲得更好的的控制效果,這就使得控制面臨新的挑戰。
1、BP神經網絡及其改進算法
1.1BP神經網絡及傳統BP算法存在的問題
BP神經網絡是基于誤差反向傳播算法(BP算法)的多層前向神經網絡,BP算法也已成為目前應用最為廣泛的神經網絡學習算法,其三層前饋神經網絡拓撲結構如圖1所示。
其中,網絡響應函數為:(1)
BP算法按梯度下降的原則多次修改輸入層至隱含層,隱含層至輸出層的相應權值,直到滿足精度要求或網絡不收斂。眾所周知,BP網絡的學習過程是對一個高度非線性函數求全局最優問題,網絡訓練中存在兩個比較典型的問題。一是收斂速度慢,二是容易陷入局部極小。對此已有很多學者提出了各種解決方案和修正算法,如累計誤差校正算法、S函數輸出限幅算法、結合遺傳算法的優化權值算法等。
1.2傳統BP算法的改進
BP算法存在的上述兩個問題,其原因在本質上是相同的,都是由于網絡的響應函數造成的。BP算法中每次調節網絡權值的幅度均按與響應函數導數成正比進行,這樣,在誤差曲線平面較平坦處,網絡誤差大,偏導數值小,權值參數的調節幅度也較小,致使需多次調整才能降低誤差曲面;而在誤差曲面曲率較高處偏導數數值較大,權值參數調節的幅度也較大,致使在誤差函數最小點附近發生過沖現象,產生振蕩,難以收斂到最小點。現通過慣性校正方法及重新構造響應函數法來克服這兩個問題。
1.2.1慣性校正法
分別對這些情況進行仿真,得到圖3和圖4所示的仿真結果,圖3是基于傳統的BP神經網絡作為控制器而得出的波形圖對比,圖4是基于改進型BP神經網絡作為控制器得出的波形圖對比。
圖3中的曲線為參考模型輸出和改變參考模型參數時的波形輸出對比.其中,波形幅值最小的是參考模型輸出結果,改變系統模型的參數,輸出基本上能夠跟隨系統輸出,改變參數過大時,結果也可以在接受的范圍之內.實驗結果表明,當系統的數學模型和參考模型有較大差異時,采用傳統BP神經網絡而建立的自適應控制器,盡管利用這種控制策略可以獲得比較滿意的結果,但是,系統的穩定性較差,收斂性也比較慢些。
圖4中的曲線也是參考模型輸出和改變參考模型參數時的波形輸出對比,其中,波形幅值最小的是參考模型輸出結果,改變系統模型的參數,輸出基本上跟隨系統輸出,改變參數過大時,結果仍然在接受的范圍之內.實驗結果表明,當系統的數學模型和參考模型有較大差異時,采用改進型BP神經網絡而建立的自適應控制器,要比傳統的BP神經網絡而建立的自適應控制器具有更好的穩定性和更好的跟蹤效果。
4、結論
借助BP神經網絡的優點而建立的自適應控制器策略,不需被控對象的數學模型,只需對神經網絡進行訓練,然后利用訓練結果進行控制系統設計。仿真結果可以看出,改進型BP網絡結合自適應控制設計出的控制器,比傳統的BP網絡結合自適應控制設計出的控制器能夠更好的跟蹤被控對象.
參考文獻
關鍵詞:RBF神經網絡;數據挖掘;遺傳算法
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2016)07-0151-03
Research on Data Mining Method Based on RBF Neural Network
CAO Jia-jie, YANG Meng, XU Xin-yu
(Beijing Satellite Manufacturing Plant, Beijing 100000, China)
Abstract: The rapid development of Internet technology and database technology is widely used at the same time, human through information technology to collect data is more and more strong, and how to from a lot of data mining valuable information and knowledge has become particularly urgent. In order to solve the above problems, data mining technology arises at the historic moment. It is found that the data mining the data for the nonlinear, messy and the presence of noise data, neural network is by virtue of the degree of fault tolerance, distributed storage, parallel processing, adaptive and robust feature is widely used to deal with some of the data mining problems. Accordingly, in this case, the author first introduces the data mining and RBF neural network of the relevant theoretical knowledge, and then focus on the RBF neural network based on the data mining method for peer reference.
Key words: RBF neural network; data mining; genetic algorithm
數據挖掘是從大量數據中挖掘有價值的信息和知識,以便為管理決策和戰略部署提供數據支撐。數據挖掘作為信息技術發展的結果,其應用前景相當廣泛。數據庫技術主要研究數據的組織、存儲、獲取和處理,而信息技術主要經歷以下發展歷程:數據的簡單收集和數據庫的初期建設數據的存儲與檢索、數據庫的事務處理數據的分析與理解,此時便出現數據挖掘技術。基于上述研究背景,下文首先分別介紹數據挖掘與RBF神經網絡的相關理論知識,并在此基礎上,討論基于RBF神經網絡的數據挖掘方法,目的是為了研究數據挖掘所用到的分類算法。關于神經網絡,作為一種人工智能技術,其一方面可以省去繁瑣的數學建模和數學推理,另一方面在處理含噪聲的非線性數據時表現出無與倫比的優越性。
1 數據挖掘
數據挖掘是非平凡的數據處理過程,即識別數據集中具有潛在價值、新穎有效且最終可被理解的模式,其中潛在價值指的是挖掘出的知識具有實際效用;新穎是指識別出的模式新穎;有效是指識別出的模式在一定程度上是正確的;最終可被理解是指識別出的數據可被用戶理解。圖1所示為數據挖掘的工作流程。
如圖1所示,數據挖掘主要經歷數據準備、模式提取、結果解釋與評估等階段,其中數據準備的步驟為:數據清洗數據選取數據預處理數據表示;數據提取階段又稱數據挖掘階段,其實現步驟為:確定數據挖掘的目標或任務選取適宜的數據挖掘工具或算法進行數據挖掘操作;結果解釋與評估階段主要對所識別的數據進行評估、篩除。一般來講,數據挖掘質量主要與以下影響因素有關:數據挖掘技術的可靠性與有效性;目標數據的數量與質量。總之,數據挖掘是一個反復反饋的過程,而可視化貫穿在數據挖掘的全過程。
數據挖掘的方法一般分為統計型、機械學習型兩大類,而較為常用的算法包括遺傳算法、神經網絡等。遺傳算法是一種以生物進化理論為基礎的優化空間搜尋法,其在數據挖掘中,通常以搜索問題的形式來表述具體的任務,并通過選擇、交叉、變異遺傳等操作尋得最優解。神經網絡是一種與人類大腦重復學習類似的方法,即通過學習和訓練一些事先給出的樣本,產生與樣品有所區別的特征和模式,其中樣本集應具有代表性。研究表明,神經網絡具有準確預測復雜的問題、有效處理存在噪聲的數據等優點。神經網絡一般分為自組織、反饋式和前饋式神經網絡,目前正被廣泛應用于商業領域。
2 RBF神經網絡
RBF網絡結構是一種由輸入層、隱含層和輸出層組成的三層前向網絡,其中輸入層包含信號源結點;隱含層主要由節點數目描述的具體問題而定;輸出層主要響應輸入模式的具體作用。圖2所示為RBF神經網絡的拓撲結構模型。
如圖2所示,RBF網絡由輸入層向隱含層變換的過程具有非線性的特征,而由隱含層向輸入層變化的過程具有線性的特征。據此可知,RBF神經網絡是一種基于前饋網絡的拓撲結構。研究發現,RBF神經網絡拓撲結構會對自身的性能產生影響,而以下因素又會對RBF網絡拓撲結構產生影響:RBF的隱節點數目、中心矢量、徑向基函數寬度和隱含層與輸出層的權值矩陣。
RBF網絡具有較強的非線性逼近性能。得益于此,其目前主要用來實現非線性系統的建模與數據挖掘、貝葉斯規則和連續輸入/出數據對的映射建模。與其他前向神經網絡相比,RBF神經網絡具有以下優點:
1)RBF神經網絡能逼近任意非線性映射,也能處理系統內部的規律性問題。就無噪聲數據而言,RBF神經網絡模型的預測精度高且擬合能力強;而就存在噪聲的數據來講,RBF神經網絡模型的預測誤差和擬合誤差均偏低,且收斂速度相當快。得益于此,RBF神經網絡在時序建模和分析中的應用十分廣泛。
2)RBF神經網絡的拓撲結構加快了學習速度和規避了局部極小的問題。RBF神經網絡采用核函數,特別是高斯函數的使用使得核函數的優點更為突出:表示簡單、光滑性好和解釋性好等。
3)RBF神經網絡的可解釋性好。目前,以下理論均可用于RBF網絡參數和拓撲結構的解釋中:RBF網絡能夠對輸入層轉向輸出層進行映射;核回歸能夠逼近存在噪聲的函數噪聲數據插值能夠逼近輸入缺少函數;規則化可以通過在一般化與精確匹配中尋求平衡;貝葉斯規則可以根據前概率計算出后概率。
3 基于RBF神經網絡的分類數據挖掘
關于RBF神經網絡的研究,其主要表現在以下兩個方面: RBF網絡結構模型; RBF神經網絡學習算法。
3.1 RBF網絡結構模型
在實際應用中,RBF模型的應用范圍更廣,其核函數使用的是高斯函數。但研究發現,在上述結構模型中,訓練算法的優劣會對模型的應用效果和RBF網絡性能的高低產生決定作用。鑒于此,研究人員提出一些具有新特點和新性能的網絡模型,具體包括:
1)高斯型核函數一般化。當隱含層RBF采用以下高斯條函數時,將大大改善RBFN的綜合性能:[Φ?x)=exp-(x-cj?T(x-cj)]/2σ2j]。對于普通高斯函數,其擁有半徑相同的變量軸和超球面狀的函數曲面。但與此相比,高斯條核函數擁有超橢球面狀的函數曲面和半徑不同的變量軸,因此它具有更強的樣本點逼近能力和更大的網絡訓練工作量。
2)WNN(小波神經網絡)。WNN是一種基于小波函數的函數連接型網絡,因此在一定程度上應被看作RBFN的推廣形式。WNN的激活函數為小波函數,具體以仿射變換的方式創建網絡參數與小波變換之間的聯系,因此所表現出的特點與RBFN有所差異。此外,WNN具有極佳的時頻特征,因此被廣泛應用于圖像處理和模式識別等領域。
3)RBPNN(徑向基概率神經網絡)。RBPNN作為RBFNN與PNN綜合發展的結果,其學習收斂速度比RBFN更快,同時也將模式之間的交錯影響考慮其中。關于RBPNN,其結構主要由2個隱含層、1個輸入層、2個輸出層組成,其中第一個隱含層為非線處理層,具體包括隱中心矢量,此乃網絡結構優化的核心對象;在輸出層得出輸入樣本概率密度的估算值,可降低計算的復雜度。
4)GRNN(廣義回歸網絡)。GRNN使用的也是高斯型徑向基函數,一般被看作RBFN的變換形式。GRNN的結構主要由模式層、輸入層、加和層、輸出層組成,其中核函數所包含的平滑因子需采用優化或經驗方法來選定。
3.2 RBF神經網絡學習算法
在RBF網絡設計中,最為核心的問題是如何合理確定中心點的位置、數目和訓練網絡權值。通常情況下,中心點的確定與權值的訓練既可分開實現,又可同時進行。鑒于此,RBF網絡可以采用以下兩類學習算法:
3.2.1 靜態學習算法
靜態學習算法是一種離線學習算法,即在離線設計RBF網絡時,中心點的確定與權值的訓練分開進行。
1)隨機確定RBF中心點,即隨機從訓練數據集中選取RBF中心點。當RBF選取以下高斯函數:[G(X-Cj2=exp(-m/d2maxX-Cj)j=1,2,...,m],其中,[Cj]――RBF的中心點;[m]――中心數;[dmax]――相鄰中心點最大的間隔距離,因此高斯徑向基函數的寬度[σ=dmax/2m]。利用上述算法,可以避免RBF的形狀出現過平或過陡兩種極端現象。如此一來,便可通過計算線性方程組的方式來確定輸出層與隱含層的連接權值。
2)自組織學習確定RBF中心點。混合學習過程主要包括自組織學習階段、監督學習階段,其中自組織學習階段的任務是采用聚類算法來估計隱含層RBF的中心點;監督學習階段主要通過對輸出層線性權重進行估計來設計網絡,具體采用最小二乘法。輸出層節點的LMS算法與隱含層節點的K-均值聚類同時進行,以加速學習過程。
3)有監督學習確定RBF中心點,即通過有監督學習解得RBF的中心點和自有參數,具體使用牛頓法或梯度下降法等。如果使用梯度下降法,則應從參數空間的某一有效區域開始進行搜索,即先利用RBF網絡得到高斯分類算法,再以分類結果為搜索點,以免學習程收斂至局部極小。
3.2.2 動態學習算法
動態學習算法是一種在線學習算法,其主要在在線數據挖掘環境中使用。由于在在線數據挖掘環境中,通常不會全部給定訓練樣本,因此如果隱含層中心點與單元數目的確定采用靜態學習算法,則解算結果不一定最優,而在線學習算法支持動態刪除或加入隱含層節點,且隱含層中心點的確定和權值的訓練同時進行,因此可以動態構造網絡。
1)以分組優化策略為基礎的在線學習法。訓練神經網絡是約束優化的過程,則需對特定的神經網絡類型進行深入探討。以下內容為在線隱含層單元的確定策略:當輸入的訓練樣本同時滿足以下條件時,則為之分配相應的隱含層但愿你:網絡輸出誤差比誤差的設定閥值大;輸入樣本與隱層中心點之間的距離比距離的設計閥值大。如果在RBF神經網絡在線訓練方式中引入分組優化策略,則網絡輸出與網絡權值之間存在線性關系,同時與隱含層單元的寬度、中心點之間存在非線性關系,表明盡量采取不同的優化方法來處理兩部分的參數。
2)最近鄰聚類算法。最近鄰居類算法作為動態自適應聚類學習算法,由其聚類得出的RBF網絡不僅最優,且支持在線學習。最近鄰聚類算法的實現過程為:
① 設定高斯函數寬度為r,定義矢量A(l)存放輸出矢量的總和,定義計數器B(l)統計樣本數量,其中類別數目為l。
② 對于數據對[(x1,y1)],于[x1]上創建1個聚類中心,并令[x1=c1],[y1=A(1)],[B(1)=1],那么在RBF網絡中便僅存在1個中心為[c1]的隱含層單元,且隱含層單元與輸出層的權矢量[w1=A(1)/B(1)]。
③ 對于數據對[(x2,y2)],解得[x2]與[c1]之間的距離[x2-c1]。假設[x2-c1≤r],那么[x2]的最近鄰聚類為[c1],假設[A(1)=y1+y2],[B(1)=B(1)+1],[w1=A(1)/B(1)];假設[x2-c1>r],那么以[x2]為新的聚類中心,同時假設[c2=x2],[A(2)=y2],[B(2)=1]。根據上述要求創建的RBF網絡,再在其中加入一個隱含層單元,其與輸出層之間的權矢量[w2=A(2)/B(2)]。
④ 假設第k個數據對[(xk,yk)(k=3,4,...,n)]的聚類中心數為M,相應的中心點為[c1,c2,...,cm],則由此創建的RBF網絡中便存在M個隱含層單元。據此,解得[xk]與M個聚類中心的間距為[xk-ci,i=1,2,...,M],假設兩者的減小間距為[xk-ci],那么[xk]的最近鄰聚類為[ci]。根據第一、二數據對的計算步驟,解得當[xk-ci>r]時,第M個隱含層單元與輸出層之間的權矢量[wM=A(M)/B(M)];當[xk-ci≤r]時,隱含層單元與輸出層之間的權矢量[wi=A(i)/B(i),i=1,2,...,M]。研究發現,動態自適應RBF網絡的難易程度由r所決定,即聚類數目與r呈負相關,即r越小,聚類數目越多,則計算量越大和精度越高,反之亦然。總之,最近鄰聚類法具有性能優點、計算量小河學習時間短等優點,不僅可以通過確定隱含層來建立RBF神經網絡,還可以在動態輸入模式在線學習中得到有效應用。
綜上,RBF網絡是一種具有最佳擬合和全局逼近性能的前向型神經網絡,其無疑具有廣闊的應用前景,但在實際應用中,應當考慮到局部極小問題的存在,進而保障其應用效果。
參考文獻:
[1] 儲兵,吳陳,楊習貝,等.基于RBF神經網絡與粗糙集的數據挖掘算法[J].計算機技術與發展,2013,23(7):87-91.
[2] 宮曉曼,滕榮華.基于神經網絡的數據挖掘在煤礦選煤中的應用[J].煤炭技術,2013(9):127-128.
[3] 魏文軒.改進型RBF神經網絡在股票市場預測中的應用[J].統計與決策,2013(15):70-72.
[4] 曹東方,王玉恒.數據挖掘在員工考評管理信息系統中的應用[J].河北工業科技,2012,29(5):323-326.
[5] 姚應水,葉明全.RBF神經網絡與logistic回歸模型的對比研究[J].中國衛生統計,2011,28(4):397-399.
[6] 張會敏,葉明全,羅永錢等.基于RBF神經網絡的老年癡呆癥智能診斷研究[J].中國數字醫學,2015(6):38-41.
[7] 習勤,米帥軍.指標篩選技術在神經網絡數據挖掘模型中的應用[J].統計與決策,2011(10):163-165.
[8] 林濤,葛玉敏,安玳寧等.基于 RBF 神經網絡的鋼構件質量追溯系統研究[J].計算技術與自動化,2015(1):20-24.
摘要:常規PID控制器以其算法簡單、可靠性高等優點,在工業生產得到了廣泛應用。但是,PID控制器存在控制參數不易在線實時整定、難于對復雜對象進行有效控制等不足。利用神經網絡自學習、自適應和非線性映射等特點,將神經網絡和PID控制相結合,形成一種PID神經網絡控制系統,可對工業中使用的具有大時滯、慢時變、非線性特點的電爐系統進行有效辨識與控制。
關鍵詞:PID神經網絡;智能控制器;滯后系統;時變系統;電爐控制系統
中圖分類號:TP18文獻標識碼:A文章編號:1009-3044(2009)28-8028-03
Application of PID Neural Network in Electric Cooker Controlling Systems
REN Hui, WANG Wei-zhi
(Institute of Automation, Fuzhou University,Fuzhou 350002, China)
Abstract: General PID controller, because its algorithm is simple and high reliability,so has been widely used in industrial production. However, PID controller, there is not easy to line real-time control parameter tuning, is difficult for complex objects such as lack of effective control. Using neural network self-learning, adaptive and nonlinear mapping characteristics of neural network and PID control combined to form a PID neural network control system can be used in industry with a large time lag, slow time-varying, nonlinear characteristics of electric systems for effective identification and control.
Key words: PID neural network;intelligent controller;time lag system;time-varying system;electric cooker systems
近年來,隨著神經網絡理論的發展,將控制中應用最廣泛的PID的控制器與具有自學習功能的神經網絡相結合,已成為智能控制研究的一個新方向。并且,在這個方向上已取得了一些研究成果 。其主要的結合方式是在常規PID控制器的基礎上增加一個神經網絡模塊,利用神經網絡來在線調節 PID參數,但缺點是結構較復雜。本文介紹的PID神經網絡是將PID控制規律融進神經網絡之中構成的,實現了神經網絡和PID控制規律的本質結合。它屬于多層前向網絡,但是它與一般的多層前向網絡又不完全相同,一般的多層前向網絡中的全部神經元的輸入輸出特性都是相同的,而PID-NN的隱含層是由比例、積分、微分三個單元組成,是一種動態前向網絡,更適合于控制系統。各層神經元個數、連接方式、連接權值是按控制規律的基本原則和已有的經驗確定的,保證了系統穩定和快速收斂。由于PID神經網絡控制器是將神經網絡和PID控制規律融為一體,所以其既具有常規PID控制器結構簡單、參數物理意義明確之優點,同時又具有神經網絡自學習、自適應的功能,可將PID神經網絡應用于對工業控制領域的復雜非線性對象的控制。
本文提出一種基于PID神經網絡的控制方案,用來對大時滯、慢時變、非線性的電爐系統進行辨識與控制。
1 PID神經網絡控制系統
1.1 PID神經網絡的結構
PID神經網絡是一個 3層的前向網絡,包括輸入層、隱含層和輸出層,其結構如圖1所示。網絡的輸入層有2個神經元,分別對應系統的輸人和輸出;隱含層有3個神經元,各神經元的輸出函數互不相同,分別對應比例(P)、積分(I)、微分(D)3個部分;網絡的輸出層完成PID-NN控制規律的綜合。網絡的前向計算實現PID神經網絡的控制規律,網絡的反向算法實現PID神經網絡參數的自適應調整。
1.2 控制系統結構及其工作原理
PID神經網絡控制系統結構如圖2所示。控制系統包含PID神經網絡辨識器(PID-NNI )和PID神經網絡控制器((PID-NNC )。其中r(k)為系統的設定輸入,y(k)為被控對象的實際輸出,y~(k)為PID-NNI的輸出,u(k)為PID-NNC的輸出。系統的工作原理是:利用神經網絡的非線性函數逼近能力和學習記憶功能,由PID-NNI在線對被控對象模型進行辨識。它利用輸出偏差(e1(k)=y(k)-y~(k) ),修正網絡權值,使之逐步適應被辨識對象的特性。當它學習到與被控對象基本一致時,PID-NNC利用系統偏差 (e2(k)=r(k)-y~(k)),通過反傳算法實時調整自身權值,以跟上系統的變化,達到有效控制的目的。
2 PID神經網絡學習算法
關鍵詞:神經網絡;遺傳算法;優化理論
一、引言
在人類的歷史上,通過學習與模擬來增強自身適應能力的例子不勝枚舉。模擬飛禽,人類可以翱游天空;模擬游魚,人類可以橫渡海洋;模擬昆蟲,人類可以縱觀千里;模擬大腦,人類創造了影響世界發展的計算機。人類的模擬能力并不僅僅局限于自然現象和其它生命體。自從20世紀后半葉以來,人類正在將其模擬的范圍延伸向人類自身。
神經網絡是人類對其大腦信息處理機制的模擬,早期的自動機理論假設機器是由類似于神經元的基本元素組成,從而向人們展示了第一個自復制機模型。近年來諸如機器能否思維、基于規則的專家系統是否能勝任人類的工作、以及神經網絡能否使機器具有生物功能已成為人工智能關注的焦點。
遺傳算法是一種更為宏觀意義下的仿生算法,它模仿的機制是一切生命與智能的產生與進化過程。人類之所以能夠向其自身的演化學習以增強決策問題的能力,是因為自然演化過程本質就是一個學習與優化的過程。
神經網絡和遺傳算法都是仿效生物處理模式以獲得智能信息處理功能的理論,二者雖然實施方法各異,但目標相近,有很多特點相同,功能類似,對二者進行深入地對比研究,并取長補短,將二者綜合運用是非常有意義的課題。
二、神經網絡與遺傳算法概述
自1943年第一個神經網絡模型MP模型提出至今,神經網絡的發展非常迅速,特別是1982年提出的Hopfield網絡模型和1985年提出的8P算法。使神經網絡逐步發展成為用途廣泛的系統。神經網絡是由大量神經元廣泛互連。形成大規模并行處理和分布式的信息存儲的復雜網絡系統。單一神經元可以有許多輸入、輸出。神經元之間的相互作用通過連接的權重體現。神經元的輸出是其輸入的函數。雖然每個神經元的結構和功能極其簡單和有限,但大量神經元構成的網絡系統的行為則是豐富多彩的。神經網絡計算的基本特征是大規模并行處理、容錯性、自適應性和自組織性。大規模并行處理指能同時處理與決策有關的因素,雖然單個神經元的動作速度不快。但網絡的總體并行處理速度極快。容錯性指由于神經網絡包含的信息是分布存儲的,即使網絡某些單元和連接有缺陷,仍可以通過聯想得到全部或大部分信息。自適應性和自組織性指它可以通過學習,不斷適應環境,增加知識的容量。
遺傳算法最早由美國密執安大學的Holland教授在1975年發表的論文“自然和人工系統的適配”一文中提出。它是一種借鑒生物界自然選擇思想和遺傳機制的全局隨機搜索算法,其實現方法是,從一個初始種群出發,不斷重復執行選擇、雜交和變異的過程,使種群進化越來越接近某一目標。它的基本特征是大規模并行處理、通用性、魯棒性。大規模并行處理指遺傳算法的操作對象是一組可行解而非單個解。搜索路徑有多條而非單條,因而具有良好的并行性。通用性指只需利用目標的取值信息,而無需梯度等高價值信息,因而適用于任何大規模、高度非線性的不連續多峰函數的優化以及無解析表達式的目標函數的優化,具有很強的通用性。魯棒性指算法的擇優機制是一種軟選擇,再加上其良好的并行性,使它具有很好的全局優化性和穩定性。
三、神經網絡與遺傳算法在優點上的相似性
(一)二者都可對問題進行大規模的并行處理。整體上極大提高了運算速度。這是神經網絡和遺傳算法優于傳統算法的最重要的特征。
對于神經網絡來說,雖然每個神經元都要計算連接函數和傳遞函數(也稱作用函數),但神經元的計算可以分布式地并行進行。對于遺傳算法來說,每一個個體都需要根據適應值函數計算適應值,每一代都有很多個體,表面看來也有很大的計算量,但可同時對多個可行解進行操作,所以整體上與傳統的計算方法相比,運算時間很短。從這一點來看,神經網絡和遺傳算法都需要發展分布式并行計算系統來替代傳統的計算機,這種計算系統不再是傳統計算機順序執行命令的運行過程,而是希望對輸入進行平行處理;這種計算系統不再是只包含一個或幾個復雜的計算設備,而是由眾多簡單設備有機組成在一起共同執行相同的計算功能;一旦適合這種要求的硬件系統得到發展,神經網絡和遺傳算法將能得到更加廣泛地應用,更有效地解決更大規模的實際問題。
(二)二者都具有高度的適應性和容錯性
人工神經網絡在解決某個具體問題時,可以反復用示例來訓練它,在訓練的過程中自組織自學習來適應新的情況。而且,由于神經網絡中信息的分布式存貯,即使個別神經元出錯,也不會導致網絡運行的癱瘓,所以總體上具有較強的可靠性;而遺傳算法通過每一代的選擇過程來淘汰適應值較小的個體,保留適應值較大的個體,從而使收斂的結果趨于適應目標值,通過變異算子將每一代的種群空間擴大到個體空間,使每一個個體都有被選進種群的機會,每一個解都有機會參與計算。
(三)二者都通過對有限個可行解進行操作來獲取對整個解空間的求解,實踐證明對于其中已經相對成熟的算法,二者具有較好的魯棒性。
神經網絡,如BP算法,通過對有限個模式的訓練和學習來實現對所有模式的識別;事實證明效果很好。遺傳算法通過在個體空間中選擇有限數目的個體作為種群進行代代操作來實現對個體空間中最優解的搜索。兩種方法都選擇了較少的操作數目,但由于算法本身的優越性,仍能取得較好的穩定性和收斂性。
四、神經網絡與遺傳算法在缺點上的相似性
(一)二者優越性的理論分析有待完善。
神經網絡與遺傳算法各自的種類繁多,神經網絡主要有前饋(BP)神經網絡、Hopfield網絡、自組織特征映射網絡、波爾茲曼機等,其中最有影響的是BP網絡和Hopfleld網絡;遺傳算法主要有簡單遺傳算法、統計遺傳算法、共同進化遺傳算法及其它改進后的遺傳算法;針對要解決問題的性質可以選擇合適的網絡或算法。這些網絡或算法已經被諸多實踐證明其優越性。
目前神經網絡和遺傳算法已經在語音識別、模式識別、圖像處理和工業控制等領域取得了顯著成效。雖然實踐已證明了其無比的優越性,但在理論分析上,兩者都略有不足。BP算法和Hopfield網絡雖然給出了算法的執行原理及過程,但其優越性的理論仍不嚴格,即并未對不同情況定量說明,為什么這種算法能夠快速收斂或快速求解。對遺傳算法來說,早在Holland提出遺傳算法之初就提出了著名的模式定理和穩并行性分析來定量說明遺傳算法的優越性,并長期以來被人們所接受。但是模式定理只對簡單遺傳算法有效,因為其證明過程依賴于二進制編碼,對非二進制編碼收斂性的分析至今也未得出。除此之外,近年來,有很多著名學者也對模式定理的證明過程提出了質疑。所以,找到神經網絡和遺傳算法優越性的理論基礎仍是一項艱巨的科研任務和課題。
(二)在算法的執行過程中參數的確定都需要依賴于人的經驗。
建立一個神經網絡需要首先確定它的基本結構、學習規則以及工作方式(前饋式還是演化式),網絡結構包括網絡的拓撲結構即網絡中神經元的連接方式和節點轉換函數兩部分。結構的優劣對網絡的處理能力有很大影響,一個好的結構應能圓滿解決問題,同時不出現冗余節點和冗余連接,但不幸的是,神經網絡結構的設計基本上還依賴于人的經驗,尚沒有一個系統的方法來設計一個適當的網絡結構。目前,人們在設計網絡結構時,只能或者預先指定。或者采用遞增或遞減的探測方法。
對遺傳算法來說,需要針對待解決的問題而設計出編碼方案、三個算子(選擇、雜交、變異)、進化機制以及各個概率參數,如雜交概率、變異概率等。參數的確定也沒有理論支持,只是人為地認為雜交概率的值確定在(0.65,0,9)范圍內,變異概率的值確定在(0.001.0.01)比較好,目前,在遺傳算法的實際執行過程中一般需要預先指定這兩個參數,近來有學者提出在遺傳算法的執行過程中動態地改變這些參數的方法也取得了較好的效果。
隨著4G時代的到來,電信行業的得到了空前的發展,用戶數量快速增長,同時,電信各運營企業之間的競爭也日益激烈。面對激烈的電信市場競爭環境,以及日趨飽和的電信市場,獲取新客戶的成本比保持在網客戶要昂貴得多。加之電信技術、法律法規、攜號轉網以及競爭對手等動態市場的變化,使客戶流失到對手運營企業也更加容易。數據挖掘,作為一種新興技術手段,可以高效、低成本的實現客戶的流失預測,現已在電信、金融等行業得到了廣泛應用。
【關鍵詞】
數據挖掘;客戶流失;算法
1、引言
流失客戶,即是不想或不再使用其服務的企業原有客戶。根據流失程度可分為兩類:離網流失和業務流失,或稱為顯性流失和隱性流失。在我國,電信行業競爭日益激烈,市場容量逐漸飽和,在終端產品以及通信資費相對平穩的情況下,用戶成為電信運營商激烈競爭的焦點。如何有效地防止用戶流失、降低流失率成為各個運營商急需解決的難題。客戶流失給運營商帶來了巨大損失,而成功挽留一個即將流失的客戶比重新發展一個客戶節約大量成本。因此,利用數據挖掘技術,預測客戶流失、減少客戶流失的發生成為當下電信行業研究的重點。
2、客戶流失預測常用算法及比較
客戶流失預測常用算法。目前,常用的挖掘算法有很多,但客戶流失分析較為常用的有三種算法,分別是決策樹算法、支持向量機算法、神經網絡算法。
(1)決策樹算法當前最有影響的決策樹算法是Quinlan于1986年提出的ID3和1993年提出的C4.5。ID3只能處理離散型屬性,它選擇信息增益最大的屬性對訓練樣本進行劃分,目的是進行分枝時,使系統的熵最小,從而提高算法的精確度。C4.5是ID3算法的改進算法,不僅可處理離散型屬性,還能處理連續性屬性。C4.5采用信息增益比作為選擇分枝屬性的標準,彌補了ID3算法的不足。決策樹的優點在于,它可以生成可以理解的規則,計算量相對較小,可以處理連續和種類字段,并且可以清晰地顯示哪些字段比較重要。但決策樹對連續性的字段比較難預測,這是決策樹的一個不足。
(2)支持向量機算法支持向量機(SupportVectorMachine,SVM)由Vapnik領導的AT&TBell實驗室研究小組于1963年提出,當時的研究尚不十分完善。直到90年代,統計學習理論的實現和由于神經網絡等較新的機器學習方法的研究在如何確定網絡結構、過學習與欠學習、局部極小點等問題時遇到一些重要困難,這個階段SVM的理論技術得到迅速發展與完善,它在解決小樣本、非線性以及高維模式識別中表現出許多特有的優勢,并能夠推廣應用到函數擬合等問題中,是一項有潛力的分類與回歸技術。SVM也存在自身不足,SVM算法對大規模訓練樣本難以實施,同時,對于多分類問題存在困難。
(3)神經網絡算法人工神經網絡(ArtificialNeuralNetworks,ANN),也簡稱神經網絡,它是由大量簡單處理單元以某種方式互相連接而成,通過調整內部這些大量處理單元之間相互連接的關系,從而達到處理信息的目的。神經網絡中,神經元處理單元可表示為特征、字母、概念或某些有意義的抽象模式等不同的對象。神經網絡中處理單元類型可以分為三類:輸入層單元、輸出層單元和隱藏層單元。輸入層單元負責接受外部世界的數據或信號;輸出層單元實現網絡處理結果的輸出;隱藏層單元處于輸入層和輸出層單元之間,不能由系統外部觀察的單元。神經元間的連接權值反映單元間的連接強度,信息的表示和處理體現在網絡處理單元的連接關系中,可對連續的或非連續的輸入做出狀態相應,能實現復雜的邏輯操作和非線性關系信息的動態處理,因而神經網絡具有很強的邏輯運算和數值運算能力。神經元網絡的優點在于有無指導的情況下都能夠進行學習;缺點是神經網絡很難解釋而且會學習過度,另外神經網絡建模通常較費時,需要的準備工作量很大。神經網絡的著名算法是基于誤差學習的后向傳播算法,即BP算法。
3、電信客戶流失預測研究展望
以下幾方面在未來的研究中值得考慮:(1)對現有指標體系還需要進一步研究與完善,尤其是隨著4G業務的發展,指標應該進一步調整。(2)現在國內的流失預測分析,大都以“月”為單位,如果能以“周”或者“日”為單位,可以更加及時的發現流失客戶。(3)用于流失預測的算法各有利弊,找出一個在各方面性能都很好的分類算法仍然需要進一步研究。
【參考文獻】
[1]肖水清.基于CRM探討電信業的客戶流失問題[J].現代計算機,2006(1)
[2]陳晉蘇,鄭惠莉.電信行業流失客戶挽留價值綜合評價研究[D].南京郵電大學,2005
[3]仲繼.電信企業客戶流失預測模型研究[D].西安科技大學,2014