資源描述:
《淺談突發(fā)事件新聞文本層次聚類方法研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、萬方數(shù)據(jù)山西大學(xué)2009屆碩士研究生學(xué)位論文突發(fā)事件新聞文本層次聚類方法研究作者姓名指導(dǎo)教師學(xué)科專業(yè)研究方向培養(yǎng)單位學(xué)習(xí)年限任曉東張永奎教授計算機軟件與理論中文信息處理計算機與信息技術(shù)學(xué)院2006年9月一2009年6月二oo九年六月萬方數(shù)據(jù)Thesisforthe2009Master’sDegreeofShanxiUniVersityResearchonEmergencyNewsTextHierarchyClusteringMethodPostgraduateRenXiao—dongSuper、risorP
2、rofZhangYong—kuiMajorComputerSoRware&Theo巧FieldofR電seaI℃hChineseInforInationProcessingDepartmentSchoolofComputerandInfomlationTechnologyResearchDuration2006.9—2009.6June2009萬方數(shù)據(jù)目錄第一章引言?????????????????????????????l1.1研究的背景及意義????????????????????????.11.2研究
3、現(xiàn)狀????????????????????????????.11.2.1文本聚類概念及應(yīng)用?????????????????????11.2.2文本層次聚類相關(guān)知識介紹??????????????????21.3本文的主要工作及組織結(jié)構(gòu)安排??????????????????.31.3.1本文主要工作????????????????????????31.3.2論文的組織結(jié)構(gòu)安排?????????????????????4第二章突發(fā)事件新聞文本分析??????????????????????52.1突發(fā)事件
4、新聞的定義、分類及特點?????????????????.52.1.1突發(fā)事件新聞的定義????????????????????一52.1.2突發(fā)事件新聞具體分類標準??????????????????52.2突發(fā)事件新聞文本特點分析????????????????????.62.3突發(fā)事件新聞文本命名實體分析??????????????????.72.4本章小結(jié)????????????????????????????.8第三章文本聚類方法概述????????????????????????93.1常用的文
5、本聚類方法???????????????????????.93.1.1劃分聚類算法????????????????????????93.1.2基于密度的聚類算法????????????????????.103.1.3基于網(wǎng)格的聚類算法????????????????????.103.1.4基于模型的聚類算法????????????????????.103.1.5層次聚類算法???????????????????????.103.2文本模型表示??????????????????????????123.3文本
6、相似度計算方法???????????????????????133.3.1文本與文本之間的相似度計算????????????????.133.3.2文本與文本集合之間的相似度計算??????????????.133.4特征選擇????????????????????????????143.5文本聚類效果評價指標??????????????????????153.6本章小結(jié)????????????????????????????16萬方數(shù)據(jù)突發(fā)事件新聞文本層次聚類方法研究第四章突發(fā)事件新聞文本自適應(yīng)層次聚類方
7、法??????????????..174.1突發(fā)事件新聞文本自適應(yīng)層次聚類流程???????????????174.2突發(fā)事件新聞文本模型表示方法??????????????????184.2.1突發(fā)事件新聞文本預(yù)處理??????????????????。184.2.2命名實體向量空間模型表示?????????????????.184.3突發(fā)事件新聞文本自適應(yīng)層次聚類算法???????????????2l4.3.1突發(fā)事件新聞文本自適應(yīng)層次聚類基本思想??????????.2l4.3.2傳統(tǒng)文本層次聚類算法
8、分析?????????????????.224.3.3文本自適應(yīng)聚類算法分析??????????????????.224.3.4文本特征集選擇??????????????????????.234.3.5文本相似度計算??????????????????????.234.3.6文本特征集的更新算法???????????????????.254.3.7突發(fā)事件新聞文本自適應(yīng)層次聚類算法的實現(xiàn)?????????.274