資源描述:
《淺議關聯(lián)規(guī)則挖掘在盲文軟件中的應用研究》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、西安科技大學碩士學位論文關聯(lián)規(guī)則挖掘在盲文軟件中的應用研究姓名:李重周申請學位級別:碩士專業(yè):計算機應用技術指導教師:楊君銳20080108論文題目:專業(yè):碩士生:指導教師:關聯(lián)規(guī)則挖掘在盲文軟件中的應用研究計算機應用技術李重周楊君銳摘要(簽名)數(shù)據(jù)挖掘是致力于數(shù)據(jù)分析和理解、揭示數(shù)據(jù)內部蘊涵知識的技術,它是未來信息技術應用的重要方法之一。關聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘中一個很重要的研究領域。關聯(lián)規(guī)則挖掘算法是關聯(lián)規(guī)則數(shù)據(jù)挖掘研究中的主要內容,迄今為止已提出了許多高效的關聯(lián)規(guī)則挖掘算法。本文首先對數(shù)據(jù)挖掘的基本概念、數(shù)據(jù)挖掘的基本過程和數(shù)據(jù)挖掘的研究
2、熱點等方面進行了探討,并對關聯(lián)規(guī)則數(shù)據(jù)挖掘的經典算法Apriori進行了較詳細的分析和研究,在此基礎上,提出了一種新的不產生候選項集及少量掃描數(shù)據(jù)庫來挖掘頻繁項集的超集樹算法SITree。該算法通過搜索數(shù)據(jù)庫,一次性的找出當前項的所有超集從而獲得頻繁項集,經實驗驗證,產生了較好的效果。然后,通過對盲文軟件系統(tǒng)的研究,針對傳統(tǒng)盲文軟件系統(tǒng)中存在的問題,并在充分考慮關聯(lián)規(guī)則挖掘算法特性的基礎上,再采取不斷掃描挖掘對象,組成一個Web信息元數(shù)據(jù)庫,找出其中相互關聯(lián)的部分,并對其進行分類等方法和手段,將超集樹關聯(lián)規(guī)則挖掘方法應用到盲文軟件系統(tǒng)中,從而
3、使盲文軟件在網站訪問時,達到快速訪問相關內容的目的。最后,針對關聯(lián)規(guī)則挖掘中可能產生許多無效規(guī)則的問題,在對興趣度度量方法進行研究的基礎上,提出了一種旨在反映項目集之間緊密性、稀有性和簡潔性的新的度量方法一緊密度(性),并利用該度量方法給出了一個基于緊密性的興趣度挖掘算法,同時將這種挖掘方法應用到盲文軟件的網站訪問中。經實驗驗證,在盲文軟件的網站訪問中應用基于緊密性的興趣規(guī)則挖掘方法的訪問效率要優(yōu)于基于超集樹的關聯(lián)規(guī)則挖掘方法。關鍵詞:數(shù)據(jù)挖掘;關聯(lián)規(guī)則;興趣度;緊密度;盲文軟件研究類型:應用研究Subject:ResearchonAssoc
4、iationRulesMiningAppliedintoBrailleSoftwareSpecialty:ComputerApplicationTechnologyName:LiChongzhouInstructor:YangJunrui(signature)壘魚生!墜旦蘭塑望絲(Signature)ABSTRACTDataminingisatechniquethataimstoanalyzeandunderstandlargesourcedataandrevealknowledgehiddeninthedata.Ithasbeenviewe
5、dasoneofimportantwaysininformationprocessing.Associationruleminingisaveryimportantresearchfieldindatamining.Theresearchonthealgorithmsofassociationruleminingisakeytaskindataminingofassociationrule.Manyhighlyefficientalgorithmsinthefieldhavebeenputforwardforminingassociation
6、rulesSOfar.Atfirst,theproblemsonthefundamentalconceptsofdatamining,themainprocessofdatamining,thekeyresearchofdataminingandSOonwereinquiredinthethesis.TheclassicalalgorithmAprioriindataminingofassociationruleWasanalysedandstudiedmorethorough.ThenanewSuper-ItemsTree(SI_Tree)
7、algorithmwithoutcandiddteitemsandinminingfrequentitemsetsbasedondatabasescanedfewWasputforward.Itminesfrequentitemsetsthroughallsuperitemsofthecurrentitemsfoundonlyonebyscaningdatabase.Theexperimentalresultsshowthatthealgorithmhasbetterperformance.Then,theproblemsinthetradi
8、tionalBraillesoftwaresystemwereslovedthatbasedfullyonthecharacteristicofassociatio