基于深度學(xué)習(xí)的文本情感分析研究

基于深度學(xué)習(xí)的文本情感分析研究

ID:35067186

大?。?.14 MB

頁(yè)數(shù):63頁(yè)

時(shí)間:2019-03-17

基于深度學(xué)習(xí)的文本情感分析研究_第1頁(yè)
基于深度學(xué)習(xí)的文本情感分析研究_第2頁(yè)
基于深度學(xué)習(xí)的文本情感分析研究_第3頁(yè)
基于深度學(xué)習(xí)的文本情感分析研究_第4頁(yè)
基于深度學(xué)習(xí)的文本情感分析研究_第5頁(yè)
資源描述:

《基于深度學(xué)習(xí)的文本情感分析研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、碩士學(xué)位論文基于深度學(xué)習(xí)的文本情感分析研究THERESEARCHONTEXTSENTIMENTANALYSISBASEDONDEEPLEARNING曹宇慧哈爾濱工業(yè)大學(xué)2015年12月國(guó)內(nèi)圖書分類號(hào):TP391.3學(xué)校代碼:10213國(guó)際圖書分類號(hào):621.3密級(jí):公開(kāi)工學(xué)碩士學(xué)位論文基于深度學(xué)習(xí)的文本情感分析研究碩士研究生:曹宇慧導(dǎo)師:徐睿峰副教授申請(qǐng)學(xué)位:工學(xué)碩士學(xué)科:計(jì)算機(jī)科學(xué)與技術(shù)所在單位:深圳研究生院答辯日期:2015年12月授予學(xué)位單位:哈爾濱工業(yè)大學(xué)ClassifiedIndex:TP3

2、91.3U.D.C:621.3DissertationfortheMasterDegreeinEngineeringTHERESEARCHONTEXTSENTIMENTANALYSISBASEDONDEEPLEARNINGCandidate:YuhuiCaoSupervisor:AssociateProf.RuifengXuAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ComputerScienceandTechnologyAffilia

3、tion:ShenzhenGraduateSchoolDateofDefence:December,2015Degree-Conferring-Institution:HarbinInstituteofTechnology哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文摘要隨著互聯(lián)網(wǎng)的迅猛發(fā)展,社交平臺(tái)和電商平臺(tái)的數(shù)量急劇增加,世界各地的用戶在互聯(lián)網(wǎng)上發(fā)表意見(jiàn)、表達(dá)情感已經(jīng)成為一種新的習(xí)慣。利用自然語(yǔ)言處理技術(shù)對(duì)互聯(lián)網(wǎng)上的文本進(jìn)行分析,并挖掘其中所包含的情感傾向已經(jīng)成為社會(huì)輿情監(jiān)督和廠家售后信息反饋的重要途徑。因此,研

4、究文本情感分析方法具有重要的社會(huì)意義和商業(yè)價(jià)值?,F(xiàn)有的情感分析方法主要分為基于情感詞典的情感分析方法和基于機(jī)器學(xué)習(xí)的情感分析方法?;谇楦性~典的文本情感分析方法很大程度上依賴于情感詞典的質(zhì)量和覆蓋度,而基于機(jī)器學(xué)習(xí)的文本情感分析方法依賴于人工構(gòu)建和抽取的特征。近年來(lái),深度學(xué)習(xí)技術(shù)在自然語(yǔ)言處理領(lǐng)域取得了很大的進(jìn)展,因此本文主要研究基于深度學(xué)習(xí)的文本情感分析方法。本文主要的工作包括:首先,針對(duì)循環(huán)神經(jīng)網(wǎng)絡(luò)無(wú)法學(xué)習(xí)長(zhǎng)距離依賴信息的問(wèn)題,本文將長(zhǎng)短時(shí)記憶格替換循環(huán)神經(jīng)網(wǎng)絡(luò)的隱藏層節(jié)點(diǎn)組成長(zhǎng)短時(shí)記憶型循環(huán)神經(jīng)

5、網(wǎng)絡(luò)模型,并將該模型應(yīng)用于文本情感分析任務(wù)。在NLPCC2014年基于深度學(xué)習(xí)技術(shù)的情感分析(NLPCC-SCDL)評(píng)測(cè)任務(wù)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,預(yù)訓(xùn)練詞向量的加入能夠有效地提升模型的分類性能和訓(xùn)練速度。相比于NLPCC-SCDL評(píng)測(cè)中的最佳系統(tǒng),該模型在中文數(shù)據(jù)集的正面情感傾向性判別上的F1值提升了0.2%,在英文數(shù)據(jù)集的負(fù)面情感傾向性判別上的F1值提升了0.6%。然后,針對(duì)現(xiàn)有基于卷積神經(jīng)網(wǎng)絡(luò)的文本情感分析模型中全連接分類層對(duì)非線性分布的數(shù)據(jù)不能夠有效地進(jìn)行情感分類的問(wèn)題,本文提出了一種結(jié)合卷積

6、神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)的文本情感分析模型。此模型首先將輸入樣本的詞語(yǔ)序列替換為對(duì)應(yīng)的預(yù)訓(xùn)練詞向量序列,然后將卷積神經(jīng)網(wǎng)絡(luò)作為自動(dòng)特征學(xué)習(xí)器去學(xué)習(xí)輸入樣本的特征表達(dá),最后將獲得的特征表達(dá)作為支持向量機(jī)的輸入以得到最終的類別標(biāo)簽。在NLPCC-SCDL評(píng)測(cè)任務(wù)數(shù)據(jù)集上的實(shí)驗(yàn)顯示,相比于NLPCC-SCDL評(píng)測(cè)中的最佳系統(tǒng),該模型在中文數(shù)據(jù)集的正面和負(fù)面情感傾向性判別上的F1值分別提升了1.2%和1.0%,在英文數(shù)據(jù)集的正面和負(fù)面情感傾向判別上的F1值分別提升2.7%和2.9%。以上兩部分的實(shí)驗(yàn)結(jié)果表明,深度

7、學(xué)習(xí)技術(shù)能夠有效地提升文本情感分析的性能,并且本文提出的對(duì)深度學(xué)習(xí)模型的改進(jìn)方法進(jìn)一步提升了文本情感分析的性能。關(guān)鍵詞:情感分析;深度學(xué)習(xí);卷積神經(jīng)網(wǎng)絡(luò);循環(huán)神經(jīng)網(wǎng)絡(luò)-I-哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文AbstractWiththerapiddevelopmentoftheInternet,thenumberofsocialmediaande-commerceplatformsincreaseddramatically.Usersfromalloverworldsharetheircommentsan

8、dsentimentsontheInternetbecomeanewtradition.ApplyingnaturallanguageprocessingtechnologytoanalyzethetextontheInternetforminingtheemotionaltendencieshasbecomethemainwayinthesocialpublicopinionmonitoringandtheafter-salefeedbackofman

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。