資源描述:
《基于ilp的多關系關聯規(guī)則數據挖掘(mrdm)算法研究》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、重慶大學碩士學位論文基于ILP的多關系關聯規(guī)則數據挖掘(MRDM)算法研究姓名:孫江林申請學位級別:碩士專業(yè):計算機軟件與理論指導教師:邢永康2010-04重慶大學碩士學位論文中文摘要摘要基于屬性-值的學習方法的命題化算法是關聯規(guī)則挖掘算法的的傳統(tǒng)方法,即,每一個事實都以的(屬性,值)元組形式表示。這種表示形式中,屬性種類是固定的,每個屬性有一個給定的值與之對應,所以數據集可以被看做關系數據庫中的一個表或關系。表中的每一行對應于一個樣例,而每一列對應于一個屬性。實際情況是,關系數據庫為了有效地組織和訪問數據,數據表結
2、構復雜,且以多關系的形式組織。關系數據庫中的結構表達了位于不同關系中的元組間的聯系,而這種聯系體現了問題域中某些重要的背景知識和樣例信息的結構內容。屬性-值學習方法只適應單表無法直接利用這類聯系及其蘊涵的信息內容,因而無法發(fā)現數據庫中隱藏的復雜模式。雖然在理論上多個關系表可以轉化到一個單表中,但事實上有許多實際問題無法避免。歸納邏輯程序設計(InductiveLogicProgramming,簡記為ILP)是機器學習與邏輯程序設計的交叉領域,以ILP為基礎的多關系數據挖掘,致力于發(fā)現關系數據庫中涉及多個關系的復雜模式
3、。多關系數據挖掘可以直接在多個關系表上分析數據而無需向單一數據表的轉換。由于其模式表示語言采用了一階謂詞邏輯語言,與命題邏輯語言相比表達力更強,能夠表達更復雜的模式并方便的利用背景(領域)知識,應用也更為廣泛,基于ILP的多關系數據挖掘成為目前研究的熱點。本文比較系統(tǒng)和完整的介紹和分析了多關系關聯規(guī)則挖掘的理論基礎和相關研究,主要工作如下:①綜合前人的工作,根據相關的文獻,綜述了多關系關聯規(guī)則相關概念、性質、挖掘方法、面臨的主要問題;②研究了數據挖掘的經典算法Apriori和FP-增長、并根據相關文獻,結合自身研究,
4、分析了算法的提出、特點和算法步驟,并對的功能進行了分析。③研究了ILP技術的定義、形式化描述以及PROLOG語言的理論基礎及運行機制。④分析了多關系關聯規(guī)則代表性算法WARMR和FARMER,并分析其優(yōu)缺點,并簡單介紹了WARMR的拓展算法WARMeR。⑤通過實驗平臺,對經典算法Apriori進行了實現,并提出了改進措施,同時通過PROLOG實現了事實和規(guī)則的推理,分析了FARMER算法的實現基礎,實現了WARMR算法,并挖掘出關聯規(guī)則。關鍵詞:多關系數據挖掘,ILP,多關系關聯規(guī)則I重慶大學碩士學位論文英文摘要AB
5、STRACTLearningmethodintraditionaldataminingalgorithms,whichispropositionalgorithm,isattribute-valuealgorithm,eachsampleisexpressedintheformofattribute-valuegroup.Withthisrepresentation,theattributetypeisfixed,eachattributehasacorrespondingvaluegiven,sothedatase
6、tcanbeseenasarelationaldatabasetableorarelation.Eachtablerowcorrespondstoasample,andeachcolumncorrespondstoaattribute.Thefactis,therelationaldatabaseinordertoeffectivelyorganizeandaccessdata,thedatastructureinacomplexform,andformrelationshipswithmanyrelations.T
7、hestructureofrelationaldatabasesexpressedindifferentrelationslinkbetweentuples,andthislinkshowstheproblemdomainandsomeimportantbackgroundinformationonthestructureofthesamplecontent.Attribute-valueoflearningmethodtoadaptonlyasingletablecannotbedirectlylinkedandt
8、heimplieduseofsuchcontent,andcannotfindthehiddenforminthedatabase.Althoughintheorymorerelationaltablescanbeturnedintoasingletable,butinfacttherearemanypracticalproblemscanno