最近中文字幕2018免费版2019,久久国产劲暴∨内射新川,久久久午夜精品福利内容,日韩视频 中文字幕 视频一区

首頁 > 文章中心 > 正文

電子商務數據挖掘

前言:本站為你精心整理了電子商務數據挖掘范文,希望能為你的創作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。

[摘要]本文介紹了Web數據挖掘的概念及其分類,探討了電子商務中Web數據挖掘的過程,重點研究了Web數據挖掘方法,從而有效提高電子商務企業的競爭力。

[關鍵詞]電子商務數據挖掘Web挖掘

Internet是一個巨大、分布廣泛、全球性的信息資源儲備庫。隨著上網人數的急劇增加,電子商務的蓬勃發展,各種基于互聯網的商業Web站點也面臨越來越激烈的競爭。Web包含了豐富和動態的超鏈接信息,以及Web頁面的訪問和使用信息,這為數據挖掘提供了大量豐富的資源。

一、電子商務與Web數據挖掘

電子商務(E-Commerce)是以網絡為平臺,以現代信息技術為手段,以經濟效益為中心的現代化商業運轉模式,其最終目標是實現商務活動的網絡化、自動化與智能化。無論EC企業采用B2B、B2C還是B2G電子商務模式,商品的采購者都需要通過Web方式與商品的供應商及其合作者之間建立信息流的交互,那么,一方面通過Web方式與購買者主動、方便、快捷的獲得期望主題的信息;另一方面供應商與合作伙伴們如何通過他們的集成信息系統,運用知識把訪問者、網上購買者的訪問數據從潛在的、隱含的、事先不知的狀態,經過提取、洗滌、加工變為潛力巨大的價值信息,從而提高企業的核心競爭力。

Web數據挖掘(WebDataMining)是利用數據挖掘從Web文檔及Web服務中自動發現并提取用戶感興趣的、潛在的、有用的模式和隱藏信息。Web數據挖掘的主要目標就是從Web的訪問記錄中抽取用戶感興趣的模式,WWW服務器中的訪問日志,記錄了關于用戶訪問和交互的信息,通過Web數據挖掘,就可以根據用戶的訪問興趣、訪問頻度、訪問時間動態地調整頁面結構,改進服務,開展有針對性的電子商務活動,以更好地滿足客戶的需求。

二、Web挖掘的分類

Web挖掘是從WWW上抽取知識的過程。它是從與WWW相關的資源和行為中抽取感興趣的有用的模式和隱含信息。

1.Web內容挖掘

Web內容挖掘是對Web頁面內容進行挖掘,是從大量的Web數據中發現信息、抽取知識的過程。Web挖掘的數據源有:服務器數據、查詢數據、在線市場數據、Web頁面、Web頁面的超級鏈接關系、客戶登記信息等。

2.Web結構挖掘

Web結構挖掘是從WWW上的組織結構和鏈接關系中推導知識。由于超文本文檔間的關聯關系使得WWW不僅僅可以揭示文檔中所包含的信息,同時也可以揭示文檔間的關聯關系所代表的信息。利用這些信息可以對頁面進行排序,發現重要的頁面。挖掘Web結構的目的是發現頁面的結構和Web結構,在此基礎上對頁面進行分類和聚類,從而找到權威頁面。

3.Web使用記錄挖掘

Web使用記錄挖掘的主要目標是從Web的訪問記錄中抽取感興趣的模式。WWW中的每個服務器都保留了訪問日志(Webaccesslog),記錄了關于用戶訪問和交互的信息。分析這些數據可以幫助理解用戶的行為,從而改進站點的結構,或為用戶提供個性化的服務。

三、Web挖掘的過程和方法

1.Web挖掘的過程

電子商務中的Web挖掘過程一般由3個主要階段組成:數據準備、挖掘操作、結果表達和解釋。

(1)數據準備:這個階段又可分成3個子步驟:數據集成、數據選擇、數據預處理。數據集成將多文件或多數據庫運行環境中的數據進行合并處理,解決語義模糊準備,這個階段又可分成為處理數據中的遺漏等。數據選擇的目的是辨別出需要分析的數據集合,縮小處理范圍,提高數據挖掘的質量。預處理是為了克服數據挖掘工具的局限性。

(2)數據挖掘:這個階段進行實際的挖掘操作,包括的要點有:決定如何產生假設;選擇合適的工具;發掘知識的操作;證實發現的知識。

(3)結果表述和解釋:根據最終用戶的決策目的對提取的信息進行分析,把最有價值的信息區分開來,并且通過決策支持工具提交給決策者。因此,這一步驟的任務不僅是把結果表達出來,還要對信息進行過濾處理,如果不能令決策者滿意,需要重復上述過程。

2.Web數據挖掘的方法

(1)協同過濾:協同過濾技術采用最近鄰技術,利用客戶的歷史、喜好信息計算用戶之間的距離,目標客戶對特點商品的喜好程度由最近鄰居對商品的評價的加權平均值來計算。

(2)關聯規則:關聯規則是尋找在同一個事件中出現的不同項的相關性,用數學模型來描述關聯規則發現的問題:x=>y的蘊含式,其中x,y為屬性——值對集(或稱為項目集),且X∩Y空集。在數據庫中若S%的包含屬性——值對集X的事務也包含屬性——值集Y,則關聯規則X=>Y的置信度為C%。

(3)Web日志的聚類算法:聚類分析是把具有相似特征的用戶或數據項歸類,在網站管理中通過聚類具有相似瀏覽行為的用戶?;谀:碚摰腤eb頁面聚類算法與客戶群體聚類算法的模糊聚類定義相同,客戶訪問情況可用URL(Uj)表示。有Suj={(Ci,fSuj(Ci))|Ci∈C},其中fSuj(Ci)→[0,1]是客戶Ci和URL(Uj)間的關聯度:式中m為客戶的數量,hits(Ci)表示客戶Ci訪問URL(Uj)的次數。利用Suj和模糊理論中的相似度度量Sfij定義建立模糊相似矩陣,再根據相似類[Xi]R的定義構造相似類,合并相似類中的公共元素得到的等價類即為相關Web頁面。

(4)序列分析:序列模式分析和關聯分析類似,其目的也是為了挖掘數據之間的聯系,但序列模式分析的側重點在于分析數據間的前后序關系。它能發現數據庫中如“在某一段時間內,客戶購買商品A,接著會購買商品B,爾后又購買商品C,即序列A→B→C出現的頻率高”之類的信息。序列模式描述的問題是:在給定的交易序列數據庫中,每個序列按照交易的時間排列的一組交易集,挖掘序列函數作用是返回該數據庫中高頻率出現有序列。

四、結束語

電子商務是現代化技術發展的必然結果,也是未來商業運作模式的必然選擇,但還需進一步鍵全電子商務的安全立法和完善物流配送體系。為了給電子商務營造一個良好的環境,通過選擇較好的數據挖掘方法,真正發揮數據挖掘的作用,才能使企業在激烈的市場競爭中做出正確的決策,保持有力的競爭優勢。

參考文獻:

[1]毛國君段立娟:數據挖掘原理與算法[M].清華大學出版社,2005.7

[2]王嵐張鵬祥:基于Web的數據挖掘研究.長春師范學院學報,2005,24(3):59-61

主站蜘蛛池模板: 湖北省| 阿合奇县| 屏东县| 定结县| 襄樊市| 聂拉木县| 南京市| 江川县| 台中县| 桦南县| 莱芜市| 北安市| 通辽市| 新河县| 三明市| 东宁县| 铜川市| 水城县| 井冈山市| 乐清市| 印江| 石门县| 上犹县| 富蕴县| 南昌县| 康马县| 武乡县| 广丰县| 新晃| 虎林市| 老河口市| 盐城市| 云安县| 安宁市| 改则县| 南投县| 班玛县| 青河县| 聂拉木县| 乌鲁木齐市| 安远县|