資源描述:
《基于深度學(xué)習(xí)的文本情感分析研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、碩士學(xué)位論文基于深度學(xué)習(xí)的文本情感分析研究THERESEARCHONTEXTSENTIMENTANALYSISBASEDONDEEPLEARNING曹宇慧哈爾濱工業(yè)大學(xué)2015年12月國(guó)內(nèi)圖書分類號(hào):TP391.3學(xué)校代碼:10213國(guó)際圖書分類號(hào):621.3密級(jí):公開(kāi)工學(xué)碩士學(xué)位論文基于深度學(xué)習(xí)的文本情感分析研究碩士研究生:曹宇慧導(dǎo)師:徐睿峰副教授申請(qǐng)學(xué)位:工學(xué)碩士學(xué)科:計(jì)算機(jī)科學(xué)與技術(shù)所在單位:深圳研究生院答辯日期:2015年12月授予學(xué)位單位:哈爾濱工業(yè)大學(xué)ClassifiedIndex:TP3
2、91.3U.D.C:621.3DissertationfortheMasterDegreeinEngineeringTHERESEARCHONTEXTSENTIMENTANALYSISBASEDONDEEPLEARNINGCandidate:YuhuiCaoSupervisor:AssociateProf.RuifengXuAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ComputerScienceandTechnologyAffilia
3、tion:ShenzhenGraduateSchoolDateofDefence:December,2015Degree-Conferring-Institution:HarbinInstituteofTechnology哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文摘要隨著互聯(lián)網(wǎng)的迅猛發(fā)展,社交平臺(tái)和電商平臺(tái)的數(shù)量急劇增加,世界各地的用戶在互聯(lián)網(wǎng)上發(fā)表意見(jiàn)、表達(dá)情感已經(jīng)成為一種新的習(xí)慣。利用自然語(yǔ)言處理技術(shù)對(duì)互聯(lián)網(wǎng)上的文本進(jìn)行分析,并挖掘其中所包含的情感傾向已經(jīng)成為社會(huì)輿情監(jiān)督和廠家售后信息反饋的重要途徑。因此,研
4、究文本情感分析方法具有重要的社會(huì)意義和商業(yè)價(jià)值?,F(xiàn)有的情感分析方法主要分為基于情感詞典的情感分析方法和基于機(jī)器學(xué)習(xí)的情感分析方法?;谇楦性~典的文本情感分析方法很大程度上依賴于情感詞典的質(zhì)量和覆蓋度,而基于機(jī)器學(xué)習(xí)的文本情感分析方法依賴于人工構(gòu)建和抽取的特征。近年來(lái),深度學(xué)習(xí)技術(shù)在自然語(yǔ)言處理領(lǐng)域取得了很大的進(jìn)展,因此本文主要研究基于深度學(xué)習(xí)的文本情感分析方法。本文主要的工作包括:首先,針對(duì)循環(huán)神經(jīng)網(wǎng)絡(luò)無(wú)法學(xué)習(xí)長(zhǎng)距離依賴信息的問(wèn)題,本文將長(zhǎng)短時(shí)記憶格替換循環(huán)神經(jīng)網(wǎng)絡(luò)的隱藏層節(jié)點(diǎn)組成長(zhǎng)短時(shí)記憶型循環(huán)神經(jīng)
5、網(wǎng)絡(luò)模型,并將該模型應(yīng)用于文本情感分析任務(wù)。在NLPCC2014年基于深度學(xué)習(xí)技術(shù)的情感分析(NLPCC-SCDL)評(píng)測(cè)任務(wù)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,預(yù)訓(xùn)練詞向量的加入能夠有效地提升模型的分類性能和訓(xùn)練速度。相比于NLPCC-SCDL評(píng)測(cè)中的最佳系統(tǒng),該模型在中文數(shù)據(jù)集的正面情感傾向性判別上的F1值提升了0.2%,在英文數(shù)據(jù)集的負(fù)面情感傾向性判別上的F1值提升了0.6%。然后,針對(duì)現(xiàn)有基于卷積神經(jīng)網(wǎng)絡(luò)的文本情感分析模型中全連接分類層對(duì)非線性分布的數(shù)據(jù)不能夠有效地進(jìn)行情感分類的問(wèn)題,本文提出了一種結(jié)合卷積
6、神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)的文本情感分析模型。此模型首先將輸入樣本的詞語(yǔ)序列替換為對(duì)應(yīng)的預(yù)訓(xùn)練詞向量序列,然后將卷積神經(jīng)網(wǎng)絡(luò)作為自動(dòng)特征學(xué)習(xí)器去學(xué)習(xí)輸入樣本的特征表達(dá),最后將獲得的特征表達(dá)作為支持向量機(jī)的輸入以得到最終的類別標(biāo)簽。在NLPCC-SCDL評(píng)測(cè)任務(wù)數(shù)據(jù)集上的實(shí)驗(yàn)顯示,相比于NLPCC-SCDL評(píng)測(cè)中的最佳系統(tǒng),該模型在中文數(shù)據(jù)集的正面和負(fù)面情感傾向性判別上的F1值分別提升了1.2%和1.0%,在英文數(shù)據(jù)集的正面和負(fù)面情感傾向判別上的F1值分別提升2.7%和2.9%。以上兩部分的實(shí)驗(yàn)結(jié)果表明,深度
7、學(xué)習(xí)技術(shù)能夠有效地提升文本情感分析的性能,并且本文提出的對(duì)深度學(xué)習(xí)模型的改進(jìn)方法進(jìn)一步提升了文本情感分析的性能。關(guān)鍵詞:情感分析;深度學(xué)習(xí);卷積神經(jīng)網(wǎng)絡(luò);循環(huán)神經(jīng)網(wǎng)絡(luò)-I-哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文AbstractWiththerapiddevelopmentoftheInternet,thenumberofsocialmediaande-commerceplatformsincreaseddramatically.Usersfromalloverworldsharetheircommentsan
8、dsentimentsontheInternetbecomeanewtradition.ApplyingnaturallanguageprocessingtechnologytoanalyzethetextontheInternetforminingtheemotionaltendencieshasbecomethemainwayinthesocialpublicopinionmonitoringandtheafter-salefeedbackofman