基于情緒詞典擴(kuò)展技術(shù)的中文微博情緒分析

基于情緒詞典擴(kuò)展技術(shù)的中文微博情緒分析

ID:34018208

大?。?.02 MB

頁數(shù):73頁

時間:2019-03-03

基于情緒詞典擴(kuò)展技術(shù)的中文微博情緒分析_第1頁
基于情緒詞典擴(kuò)展技術(shù)的中文微博情緒分析_第2頁
基于情緒詞典擴(kuò)展技術(shù)的中文微博情緒分析_第3頁
基于情緒詞典擴(kuò)展技術(shù)的中文微博情緒分析_第4頁
基于情緒詞典擴(kuò)展技術(shù)的中文微博情緒分析_第5頁
資源描述:

《基于情緒詞典擴(kuò)展技術(shù)的中文微博情緒分析》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、南京航空航天大學(xué)碩士學(xué)位論文摘要隨著微博等社交媒體在人們生活中的普及,微博對人們的生活和工作產(chǎn)生了很大的影響。因此,微博情緒分析也成為自然語言處理的一個研究熱點?,F(xiàn)階段中文微博的情緒分析正處起步階段,情緒詞典是微博情緒分析的重要資源。但現(xiàn)有情緒詞典地構(gòu)建還不夠健全,這是造成中文微博情緒分析準(zhǔn)確率較低的重要原因之一。因此,本文提出了一種基于詞典擴(kuò)展技術(shù)的微博情緒分析,通過在特定語料中對現(xiàn)有情緒詞典進(jìn)行情緒詞的擴(kuò)展和情緒權(quán)重的標(biāo)注,實現(xiàn)對現(xiàn)有情緒詞典的擴(kuò)展,并利用擴(kuò)展后的情緒詞典對該語料進(jìn)行情緒分析。首先,本文提出了一種情緒詞識別的

2、方法,該方法主要是識別語料中未被情緒詞典收錄,卻表達(dá)了情緒的詞語。利用情緒詞典中情緒色彩鮮明的情緒詞作為種子情緒詞,通過考察候選詞與種子情緒詞在語料中的相似性來識別候選詞中的情緒詞。利用識別出的情緒詞擴(kuò)展現(xiàn)有的情緒詞典,并使用無監(jiān)督的規(guī)則方法和有監(jiān)督的支持向量機(jī)(SVM)方法進(jìn)行微博情緒分析。將實驗結(jié)果與原情緒詞典的實驗結(jié)果進(jìn)行對比,結(jié)果表明,情緒詞地擴(kuò)展有效地改善了詞典對微博的覆蓋率,并顯著地提高了微博情緒分析的準(zhǔn)確率。其次,本文對語料中的情緒詞進(jìn)行了加權(quán)處理。通過考察情緒詞在語料中與各情緒類的共現(xiàn)模式判斷情緒詞在語料中對情緒

3、的激勵程度,利用情緒詞對情緒激勵程度的差別對情緒詞進(jìn)行加權(quán)。實驗結(jié)果表明,與詞典中標(biāo)注的情緒強(qiáng)度相比,該方法計算的情緒詞權(quán)重更準(zhǔn)確地表示了該詞在語料中對情緒表達(dá)的作用,有效地提高了微博情緒分析的精度。并且該方法可以有效的綜合多個情緒詞典的優(yōu)勢,更進(jìn)一步地提高微博情緒分析的準(zhǔn)確率。最后,本文綜合了前面兩個工作的優(yōu)勢進(jìn)行了情緒詞典擴(kuò)展。結(jié)合種子情緒詞的情緒權(quán)重進(jìn)行情緒詞的識別,并根據(jù)種子情緒詞的情緒權(quán)重對識別出的情緒詞進(jìn)行了加權(quán)處理。使用所生成的情緒詞典,利用無監(jiān)督的規(guī)則方法和有監(jiān)督的支持向量機(jī)(SVM)方法進(jìn)行微博情緒分析,并將實

4、驗結(jié)果與現(xiàn)有詞典以及未加權(quán)的語料情緒詞進(jìn)行比較,結(jié)果表明,該方法擴(kuò)展的情緒詞典中情緒詞具有更鮮明的情緒傾向,進(jìn)一步提高了微博情緒分析的準(zhǔn)確率。關(guān)鍵詞:情緒詞典,語料情緒詞,情緒強(qiáng)度,情緒向量,相似度計算i基于情緒詞典擴(kuò)展技術(shù)的微博情緒分析ABSTRACTWiththepopularityofsocialmediasuchasmicro-bloginpeople'slife,micro-blogproducedgreatinfluenceonpeople'slifeandwork.Therefore,micro-blogsenti

5、mentanalysishasbecomeanimportantresearchinNaturalLanguageProcessing.AutomaticanalysisoftheemotionalcontentinChinesemicro-blogisatthestageofbeginning,emotionaldictionaryisanimportantresourcemicro-blogemotionalanalysis.Buttheemotionaldictionaryconstructionisstillnotper

6、fect,thisisoneoftheimportantreasonsoflowaccuracyoftheChinesemicro-blogemotionalanalysis.Thispaperpropsesamethodtoidentifyemotionsinmicro-blogtextonthetechnologyoftheextendeddictionary.Insomecorpus,emotionaldictionaryisextendedbyaddingnewemotionawordsandannotatingemot

7、ionalintensityforeachemotionalwords.Identifysixemotionsinmicro-blogtextbyextendedemotionaldictionary.Firstly,thispaperproposesamethodtoexploitemotionalwords.Themethodistodetectemotionalwords,whicharenotintheexistingemotionlexiconsbutexpressemotionsinthecorpus.Inorder

8、todetectemotionalwordsandidentifytheemotionaworddenotesinacorpus,wemakeuseofasetofseedemotionalwordsandinvestigatethesimilaritybetw

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。