資源描述:
《共現(xiàn)分析在文本知識挖掘中應(yīng)用的研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、摘要隨著各種文本數(shù)據(jù)源的激增和用戶對知識內(nèi)容深層挖掘的需求,文本知識挖掘的研究正在興起。由于文本具有區(qū)別于一般數(shù)據(jù)庫信息資源的半結(jié)構(gòu)化特性,計算機(jī)很難理解和處理,必須利用與傳統(tǒng)數(shù)據(jù)挖掘方法相異、有針對性的分析方法以獲得對文獻(xiàn)內(nèi)容的全面而深入的理解。因此,探討共現(xiàn)分析的理論及其在文本知識挖掘中的具體應(yīng)用有著極其重要的理論和實踐意義。首先,本文論述了文本知識挖掘的定義、一般過程、主要任務(wù)、基本方法和主要研究課題。并從理論上深入探討了共現(xiàn)分析方法,系統(tǒng)地總結(jié)了該方法的定義、類型、方法論基礎(chǔ)及一般研究流程。
2、在此基礎(chǔ)上,提出了共現(xiàn)分析將對文本知識挖掘所起的三方面作用:為文本知識挖掘的一般處理過程提供語義支持、從詞匯關(guān)聯(lián)角度發(fā)現(xiàn)有趣的知識模式、作為挖掘文本知識的有效手段;然后,從作為文本知識挖掘有效手段的角度出發(fā),本文研究了共現(xiàn)分析在基于空間分布、時間分布和內(nèi)外關(guān)聯(lián)映射的文本知識挖掘中應(yīng)用的思路和典型案例;提出了利用共現(xiàn)分析挖掘文本知識的適用范圍及一般操作流程,并對操作流程中影響分析結(jié)果的主要問題進(jìn)行了深入分析;再次,以上述研究成果為方法論,以中國期刊全文數(shù)掘庫中“航空發(fā)動機(jī)”(2001--2005年)類
3、目下的1273篇學(xué)術(shù)期刊為實例,進(jìn)行了文本知識挖掘的應(yīng)用探索。經(jīng)研究發(fā)現(xiàn):在空間分布上,航空發(fā)動機(jī)領(lǐng)域的研究主要集中在燃燒系統(tǒng)、控制、壓氣機(jī)、噴管、渦輪幾大知識熱點,其中燃燒系統(tǒng)始終處于該領(lǐng)域的核心:在時問分布上,通過五年的分析數(shù)據(jù)比較得知,除燃燒系統(tǒng)之外的其它研究問題通過拓寬研究范疇、增強(qiáng)研究深度,都有向領(lǐng)域中心靠近的趨勢。另外,航空發(fā)動機(jī)領(lǐng)域的知識結(jié)構(gòu)相對固定,在短期時間內(nèi)不太可能發(fā)生太大的變化,可能出現(xiàn)的是研究側(cè)重點的微調(diào);最后,本文總結(jié)了利用共現(xiàn)分析挖掘文本知識的新趨勢,并指出了發(fā)展的方向。
4、關(guān)鍵詞:文本挖掘共現(xiàn)分析知識挖掘共詞分析研究流程Abstractwiththedramaticincreaseofdatapresentedintextformatandusers’needofminingknowledgewithiniLthestudyoftext-knowledgeispoppingup.Duetothedifferencesbetweentextandordinaryrecordsfromdatabase,it'sdi伍culttousecomputertodealwitll
5、it.inordertoobtainacomprehensiveandembeddedunderstandingofcontents,WehavetofmdamethodwhichisdifferemfromtraditionaldataminingmethodandpertinenttothecharacteristicoftexLTherefore,it’sofvitalimportancetodiscussthetheoryofCo-occurrenceanalysisanditsconcre
6、teapplicationintext-knowledgemining.Firstofall,thispaperdiscussedthedefinition,ordiIlaryprocedure,basicmethodandmajorissueoftext-knowledgemining.AndthentheauthordiscussedthetheoryofCo-occurrenceanalysis,includingitsdefinition,category,methodologyandthe
7、commonannalisticprocedure.Onthebasisofallabove,thefunctionofutilizingCo-occurrenceanalysisintext-knowledgeminingwasproposed:itprovidedthecoursesoftext-knowledgeminingwithsemanticsupport,itdiscoveredinterestingknowledgepatternsfromtheassociationofterms,
8、andit.鯽fvesasaneffectivemethodtodiscovertext-knowledge。Then,baseduponthethirdfunction,theauthorbroughtforwardthewayitwasusedintext-knowledgeminingresearchfromthreeperspectives--basedonspatialdistribution,basedontemporaldistributionandba