資源描述:
《因素空間理論在文本挖掘中的應(yīng)用》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、.?^.戶‘;.V心巧<、■-一一木>、^,.:‘奇類號:;.一;學(xué)枚制酵A,——y思J――.:、_''‘、■郵C級X■:。.密么;學(xué)號<.fiB:2111315028'-'.-’…—.■一-'-.,,^-—V-.^.?■.--?’*,'?’^*、一??.^’...-、.戶1.'八一..*一.,^.y.?.."'’=-二:、-、-?-、-、',?、、>?V;_夏*-攻?^-.■?--...?:.r.,.式
2、7^,、.?y-人苦"y一.;—、?皆-聲義警y州大學(xué).碩女學(xué)位論文種—‘、"■;■、.:、;興冷堿.::難、、.--.^‘.片々v.為.占詩屯、:^;一女'一丈、-、'.冷\::、沸護(hù)顫目/因素空間理論在女本挖掘中的應(yīng)用: ̄、,^品占、_褲*、'^-A_一:*一'?■?^.??y.六一i心廣一'’'.':、.:;...八皆聲、知禾女、.^—、.乂.心.一:、聲安香V:巧八,"'^■.—一一f二.-心六汽
3、:.*-??'?‘■一r一?.一一’、‘A1‘*?’'-.;V生類:國學(xué)型雙證學(xué)術(shù)學(xué)位研究生戶\’.-?’-'<□雙證學(xué)位研生.、專業(yè)巧;、^V?、.:、'一*巧、■-;'、證業(yè).□生. ̄單專學(xué)位研究難\.’.’.巧...為.癸儉請人氣、:學(xué)申李兆鉤,—.I':'.'.‘'H^,吵、/;.和>—二‘,‘興;:鐘育彬教授\y導(dǎo)姓名及職稱T:師步):數(shù)學(xué)與信息科學(xué)學(xué)曉;(所華糕研究二\()灶宙數(shù)筆—學(xué)專業(yè)領(lǐng)域__,
4、記科Vi‘■^一'?■^■>-.—:;;,J‘''2016S>:.又論文年月琴提交日期.;一——.店.又<?^--..子;山J.兵、、--’.、''換/v.;:;]、f/終共苦句,廣州大學(xué)學(xué)位論文原創(chuàng)性聲明本人鄭重聲明,所呈交的學(xué)位論文,是本人在導(dǎo)師的指導(dǎo)下,獨立進(jìn)行研究工作所取得的成果。除文中已經(jīng)注明引用的內(nèi)容外,本論文不包含任何其他個人或集體已經(jīng)發(fā)表或撰寫過的作品成果。對本文的研究作出重要貢獻(xiàn)的個人和集體,均已在文中明確方式標(biāo)明。本人完全意識到本聲明
5、的法律結(jié)果由本人承擔(dān)。學(xué)位論文作者簽名-;考瓜令日期;年S月23日廣州大學(xué)學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解廣州大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī)定,即;研究生在校攻讀學(xué)位期間論文工作的知識產(chǎn)權(quán)單位屬廣州大學(xué)。學(xué)校有權(quán)保留并向國家主管部口或其指定機構(gòu)送交論文的電子版和紙質(zhì)版,允許學(xué)位論文被檢索、查閥和借閱;學(xué)??晒紝W(xué)位論文的全部或部分內(nèi)容,可允許采用影響印、縮印、數(shù)字化或其他手段保存、匯編學(xué)位論文。(保密論文保密期滿后,適用本聲明)本人電子文檔的內(nèi)容和紙質(zhì)論文的內(nèi)容相一致。本學(xué)位
6、論文屬于’:口保密,在年解密后適用本授權(quán)書^。口不保密。""(請在W上相應(yīng)方框內(nèi)打V)學(xué)位論文作者簽名:丟典八日期:W《年^月^日■導(dǎo)師簽名日撕10/《年5^月日-Q7K分裝號學(xué)?;a:11UDC密級學(xué)號:1315028廣州大學(xué)學(xué)位論文(終稿)的應(yīng)用因素空間理論在文本挖掘中李兆鉤學(xué)科專業(yè)C領(lǐng)域):計銘?zhàn)亴W(xué)能信、分析與處理總硏究方向:智65.23201.論文笞辯口期:Vflr^):指導(dǎo)教帥(簽名_(名):答辯委員會主席籍雖
7、):答辯委(裳名—員員/々會委在\呵平摘要摘要隨著大數(shù)據(jù)時代的到來,基于因素空間的知識表示及其應(yīng)用也引起人們的關(guān)注。目前,基于因素空間理論的文本挖掘應(yīng)用是一個熱點的研究方向,其中文本分類與文本聚類作為文本挖掘的最熱門課題得到了廣泛的應(yīng)用,本文著重研究基于因素空間理論的文本分類算法與文本聚類算法的構(gòu)建與應(yīng)用問題,取得的主要結(jié)果如下:本文首先利用因素空間及其知識表示的理論,分別建立基于因素空間的文本分類算法與基于因素空間的文本聚類算法。對于基于因素空間理論的文本分類算法,從基于因素分析表的文本表示開始,使用基于遺傳算法優(yōu)化的因素
8、特征提取算法進(jìn)行文本特征選擇,使用因素分析法進(jìn)行文本分類規(guī)則的學(xué)習(xí),最后使用改進(jìn)的因素分析法推理模型進(jìn)行文本分類,并以搜狗實驗室新聞分類語料庫和互聯(lián)網(wǎng)電商平臺評論數(shù)據(jù)進(jìn)行文本分類實驗,其中本文的文本分類算法的準(zhǔn)確率達(dá)到82.33%,而