面向微博文本的情緒分析方法研究

面向微博文本的情緒分析方法研究

ID:35102109

大小:5.48 MB

頁(yè)數(shù):73頁(yè)

時(shí)間:2019-03-17

面向微博文本的情緒分析方法研究_第1頁(yè)
面向微博文本的情緒分析方法研究_第2頁(yè)
面向微博文本的情緒分析方法研究_第3頁(yè)
面向微博文本的情緒分析方法研究_第4頁(yè)
面向微博文本的情緒分析方法研究_第5頁(yè)
資源描述:

《面向微博文本的情緒分析方法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、諭糧碼翅m學(xué)號(hào):20雙歷9々易1u、等SOOCHOWUNIVERSITY'''"BHiiiiiiiiiii]iiiiiiii^Bliiiiiim^^^BBBM1Iifii1UIi/fr^/^HIHHHHHI^^^^^^^HH■下-方■nH,巧巧巧音泣巧御役泌函IH^H面向微博文本的情緒分析方法研究,u;■==^=指導(dǎo)教11巧姓名李軸專(zhuān)業(yè)名稱(chēng)計(jì)龍科學(xué)與技術(shù)n■H硏究方向自然贈(zèng)處理所在院部計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院um■一^蘇州大學(xué)學(xué)

2、位論文獨(dú)創(chuàng)性聲明本人鄭重聲明,獨(dú)立進(jìn)行:所提交的學(xué)位論文是本人在導(dǎo)師的指導(dǎo)下研巧工作所取得的成果。除文中己經(jīng)注明引用的內(nèi)容外,本論文不含其他個(gè)人或集體已經(jīng)發(fā)表或撰寫(xiě)過(guò)的研究成果,也不含為獲得蘇州大學(xué)或其它教育機(jī)構(gòu)的學(xué)位證書(shū)而使用過(guò)的材料。對(duì)本文的研究作出重要貢獻(xiàn)的個(gè)人。和集體,均己在文中W明確方式標(biāo)明本人承擔(dān)本聲明的法律責(zé)任。嗦磊之。成.f.u論文作者簽名;日期:_蘇州大學(xué)學(xué)位論文使用授權(quán)聲明本人完全了解蘇州大學(xué)關(guān)于收集、保存和使用學(xué)位論文的規(guī)定,即;學(xué)位論文著作權(quán)歸屬蘇州大學(xué)。本學(xué)位論文電子文檔的內(nèi)容和

3、紙質(zhì)論文的一心致。蘇州大學(xué)權(quán)書(shū)館、中國(guó)院息內(nèi)容相向國(guó)家圖社科文獻(xiàn)信情報(bào)中有萬(wàn)方(科學(xué)技術(shù)(數(shù)據(jù))、中國(guó)學(xué)術(shù)中信息研究所含電子出版社期刊光國(guó)盤(pán)版)電子雜志社送交本學(xué)位論文的復(fù)印件和電子文檔,允許論文被查飼,可,可、印或其他復(fù)制手段保存和匯編學(xué)位論文和借閱采用影印縮W入庫(kù)索。將的全或部分內(nèi)容有關(guān)數(shù)據(jù)進(jìn)行檢學(xué)位論文部編〇密論文涉年密適用規(guī)定。學(xué)位論文屬在月解后本本__□非涉密論文lb..oki葦磊藝6論文:日:作者簽名期;日;導(dǎo)師簽名如期斗面向微博文本的情緒分析方法研究中文摘要隨著互聯(lián)網(wǎng)的迅速發(fā)展

4、以及移動(dòng)智能終端的普及,越來(lái)越多的用戶(hù)在以微博為代表的社交網(wǎng)絡(luò)上表達(dá)自己的觀點(diǎn)和情感,由此產(chǎn)生了大量富有情緒表達(dá)的文本信息。近年來(lái),情感分析研究受到計(jì)算語(yǔ)言學(xué)領(lǐng)域研究者們的密切關(guān)注,成為一項(xiàng)基本的熱點(diǎn)研究任務(wù)。情緒分析是情感分析的一項(xiàng)基本任務(wù),旨在對(duì)這些文本表達(dá)的情緒(例如:喜、怒、哀、恐等)進(jìn)行自動(dòng)分析。本文針對(duì)微博文本情緒分析方法展開(kāi)深入研究,主要研究?jī)?nèi)容包括以下三個(gè)方面:首先,本文提出了一種基本情緒和復(fù)合情緒相結(jié)合的情緒分類(lèi)體系,并利用該分類(lèi)體系對(duì)微博文本進(jìn)行情緒標(biāo)注,構(gòu)建了一個(gè)規(guī)模較大的中文微博情緒語(yǔ)料庫(kù)。同時(shí),為了減少標(biāo)注的工作量,提

5、出了結(jié)合自動(dòng)標(biāo)注的標(biāo)注方法,提高了標(biāo)注效率。最后的標(biāo)注結(jié)果顯示,我們提出的情緒分類(lèi)體系能夠較好的區(qū)分不同的情緒類(lèi)別,同時(shí)取得了較高的標(biāo)注一致性。其次,本文提出了一種基于句法信息的微博情緒識(shí)別方法。該方法是一種監(jiān)督學(xué)習(xí)方法,將情緒識(shí)別看成一個(gè)二元分類(lèi)問(wèn)題。我們利用詞性標(biāo)注序列和句法樹(shù)表示文本的句法信息,并分別從中提取詞性標(biāo)注序列模式特征、重寫(xiě)規(guī)則特征和二元句法標(biāo)簽特征,應(yīng)用到機(jī)器學(xué)習(xí)分類(lèi)算法中。該方法有效克服了微博文本內(nèi)容短小、攜帶信息相對(duì)較少而帶來(lái)的不利影響。實(shí)驗(yàn)結(jié)果表明,本文提出的基于句法信息的情緒識(shí)別方法相對(duì)于僅使用詞特征方法能夠獲得更好的

6、識(shí)別效果。最后,針對(duì)多個(gè)情緒類(lèi)別中樣本分布不平衡問(wèn)題,本文提出了一種基于集成學(xué)習(xí)的微博情緒分類(lèi)方法。該方法核心思想是利用隨機(jī)欠采樣的方式產(chǎn)生一組訓(xùn)練子集,在此訓(xùn)練子集上訓(xùn)練基分類(lèi)器,最后融合所有基分類(lèi)器的結(jié)果,得到最終集成學(xué)習(xí)的結(jié)果。實(shí)驗(yàn)結(jié)果表明,本文的方法能夠充分的利用多類(lèi)樣本來(lái)幫助提高情緒分類(lèi)效果,較好地解決了情緒類(lèi)別樣本分布不平衡問(wèn)題。I關(guān)鍵詞:微博,情緒分析,語(yǔ)料庫(kù)構(gòu)建,情緒識(shí)別,情緒分類(lèi)作者:黃磊指導(dǎo)老師:李壽山IIResearchonEmotionAnalysisonChineseMicroblogAbstractWiththera

7、piddevelopmentoftheInternetandthepopularityofmobileintelligentterminal,moreandmoreusersexpresstheiropinionsandfeelingsthroughthesocialnetworks,generatingalargenumberofrichemotionalexpressiontext.Recently,sentimentanalysishasattractedmanyresearchers’attentionintheresearchcomm

8、unityofcomputationallinguisticsandbecomesabasichottopic.Emotionanalysisisab

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶(hù)上傳,版權(quán)歸屬用戶(hù),天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶(hù)請(qǐng)聯(lián)系客服處理。