資源描述:
《面向用戶(hù)在線(xiàn)評(píng)論的情感傾向分析》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、密級(jí):保密期限:密級(jí):保密期限:密級(jí):保密期限:碩士學(xué)位論文題目:面向用戶(hù)在線(xiàn)評(píng)論的情感傾向分析學(xué)號(hào):2015110363姓名:劉_菲專(zhuān)業(yè):信息與通信工程導(dǎo)師:吳曉非學(xué)院:信息與通信工程學(xué)院2018年03月14日中國(guó)■北京密級(jí):保密期限:分f仰t大華碩士學(xué)位論文題目:面向用戶(hù)在線(xiàn)評(píng)論的情感傾向分析學(xué)號(hào):2015110363姓名:劉菲菲專(zhuān)業(yè):信息與通信工程導(dǎo)師:吳曉非學(xué)院:信息與通信工程學(xué)院2018年3月14日BeuingUniversityofPostsandTelecommunicationsThesisforMasterDegreeTopic:EmotionalTenden
2、cyAnalysisofUserOnlineReviewsStudentNo.:2015110363Candidate:FeifeiLiuSubject:Supervisor:InformationandCommunicationEngineeringXiaofeiWuInstitute:_SchoolofInformationand_CommunicationEndneermsMarch14th2018獨(dú)創(chuàng)性(或創(chuàng)新性)聲明本人聲明所呈交的論文是本人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。盡我所知,除了文中特別加以標(biāo)注和致謝中所羅列的內(nèi)容以外,論文中不包含其他人已經(jīng)發(fā)表或
3、撰寫(xiě)過(guò)的研宄成果,也不包含為獲得北京郵電大學(xué)或其他教育機(jī)構(gòu)的學(xué)位或證書(shū)而使用過(guò)的材料。與我一同工作的同志對(duì)本研究所做的任何貢獻(xiàn)均已在論文中作了明確的說(shuō)明并表示了謝意。申請(qǐng)學(xué)位論文與資料若有不實(shí)之處,本人承擔(dān)一切相關(guān)責(zé)任。關(guān)于論文使用授權(quán)的說(shuō)明日期:日期:本人完全了解并同意北京郵電大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī)定,即:北京郵電大學(xué)擁有以下關(guān)于學(xué)位論文的無(wú)償使用權(quán),具體包括:學(xué)校有權(quán)保留井向國(guó)家有關(guān)部門(mén)或機(jī)構(gòu)送交學(xué)位論文,有權(quán)允許學(xué)位論文被查閱和借閱;學(xué)??梢怨紝W(xué)位論文的全部或部分內(nèi)容,有權(quán)允許采用影印、縮印或其它復(fù)制手段保存、匯編學(xué)位論文,將學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)
4、庫(kù)進(jìn)行檢索。(保密的學(xué)位論文在解密后遵守此規(guī)定)面向用戶(hù)在線(xiàn)評(píng)論的情感傾向分析摘要媒體一直是引導(dǎo)消費(fèi)者選擇各類(lèi)商品的方便高效的途徑,隨著互聯(lián)網(wǎng)的蓬勃發(fā)展,媒體也在不斷地發(fā)生變化,現(xiàn)如今互聯(lián)網(wǎng)深刻的影響了消費(fèi)者的消費(fèi)行為模式。利用情感分析技術(shù)判斷網(wǎng)站上的商品評(píng)論意見(jiàn)的褒貶態(tài)度,對(duì)于消費(fèi)者及商家都有很重要的意義。在線(xiàn)商品評(píng)論方式包括文字與評(píng)分兩種方式。評(píng)分雖然能夠簡(jiǎn)單明了地表明己購(gòu)用戶(hù)的態(tài)度,但僅能粗略的表明消費(fèi)者的情感傾向,而不同的用戶(hù)對(duì)于評(píng)分標(biāo)準(zhǔn)的把握又存在很大差異,所以,若要精確的了解在線(xiàn)商品評(píng)論的情感傾向分布,文字評(píng)論情感分析是一項(xiàng)重要的工作本文旨在利用情感分析技術(shù)判斷汽車(chē)
5、網(wǎng)站上的在線(xiàn)汽車(chē)評(píng)論意見(jiàn)的褒貶態(tài)度,得出情感極性程度分?jǐn)?shù),并綜合用戶(hù)評(píng)分,綜合計(jì)算評(píng)論分?jǐn)?shù)。本文所做的工作及創(chuàng)新點(diǎn)如下:1.優(yōu)化傳統(tǒng)的基于情感詞典進(jìn)行情感分類(lèi)的方法,計(jì)算在線(xiàn)汽車(chē)評(píng)論文本的情感極性程度分?jǐn)?shù)。(1)借助依存句法分析(DependencyParsing,DP)分析句子中單詞的語(yǔ)法關(guān)系,制定模板,采用規(guī)則匹配的方法簡(jiǎn)單有效的提取在線(xiàn)汽車(chē)評(píng)論文本中的商品屬性詞、情感評(píng)價(jià)詞以及情感程度詞三元組。(2)從已有的HowNet(HowNetKnowledgeDatabase)情感詞典中抽取出情感詞以及人工標(biāo)注具體評(píng)論角度下部分情感詞作為情感種子詞,然后利用Word2Vec計(jì)算語(yǔ)
6、義相似度,依據(jù)情感種子詞與候選詞的語(yǔ)義相似度,對(duì)情感候選詞進(jìn)行情感極性分類(lèi),并為情感詞賦予情感權(quán)重,構(gòu)建汽車(chē)領(lǐng)域各評(píng)論角度下的情感詞典。2.提出了一種基于機(jī)器學(xué)習(xí)的情感分類(lèi)方法SCCDW(SentimentClassincationbyCombiningDependencyParsingandWord2Vec),if算評(píng)論文本情感極性,與情感極性程度分?jǐn)?shù)做比較,以修正情感詞的情感權(quán)重。(1)基于依存句法分析提取存在語(yǔ)法關(guān)系的單詞對(duì)作為特征,避免了最終用相同的向量表示具有相同單詞但是語(yǔ)法結(jié)構(gòu)不同的句子。(2)利用Word2VeC得到單詞的離散向量并且使用K-means將單詞離散向
7、量進(jìn)行聚類(lèi),進(jìn)行單詞類(lèi)別映射,降低向量的維度,同時(shí)保證低頻特征的結(jié)構(gòu)。最終用支持向量機(jī)等機(jī)器學(xué)習(xí)的分類(lèi)算法進(jìn)行情感分類(lèi),得到在線(xiàn)汽車(chē)評(píng)論文本的情感極性。1.實(shí)現(xiàn)基于評(píng)論文本情感的綜合打分系統(tǒng)。結(jié)合SCCDW方法計(jì)算的情感極性以及計(jì)算出的情感極性程度分?jǐn)?shù),修正情感權(quán)重,計(jì)算評(píng)論文本情感極性程度分?jǐn)?shù)并劃分等級(jí),綜合用戶(hù)打分計(jì)算在線(xiàn)汽車(chē)評(píng)論的評(píng)分。本文使用汽車(chē)之家網(wǎng)站上的在線(xiàn)汽車(chē)評(píng)論,通過(guò)實(shí)驗(yàn)對(duì)本文的方法進(jìn)行了有效性的驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,本文的方法能夠有效的對(duì)在線(xiàn)汽車(chē)評(píng)論文本進(jìn)行情感極性程度分析,