資源描述:
《基于酒店中文評(píng)論情感傾向分析》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、工程碩士學(xué)位論文基于酒店中文評(píng)論情感傾向分析作者姓名李長(zhǎng)江工程領(lǐng)域軟件工程校內(nèi)指導(dǎo)教師左保河副教授校外指導(dǎo)教師楊新章高級(jí)工程師所在學(xué)院軟件學(xué)院論文提交日期2016年5月TextsentimentpolarityanalysisbasedonChinesereviewsinhoteldomainADissertationSubmittedfortheDegreeofMasterCandidate:LiChangjiangSupervisor:A.P.ZuoBaoheS.E.YangXinzhangSouthChinaUniversityofTechnologyGuangzhou,Chin
2、a分類號(hào):TP3學(xué)校代號(hào):10561學(xué)號(hào):201321033825華南理工大學(xué)碩士學(xué)位論文基于酒店中文評(píng)論情感傾向分析作者姓名:李長(zhǎng)江指導(dǎo)教師姓名、職稱:左保河副教授申請(qǐng)學(xué)位級(jí)別:工程碩士工程領(lǐng)域名稱:軟件工程論文形式:□產(chǎn)品研發(fā)□工程設(shè)計(jì)√應(yīng)用研究□工程/項(xiàng)目管理□調(diào)研報(bào)告研究方向:商務(wù)智能論文提交日期:2016年月日論文答辯日期:2016年6月5日學(xué)位授予單位:華南理工大學(xué)學(xué)位授予日期:年月日答辯委員會(huì)成員:主席:王振宇委員:彭新一李揮朱映波吳一民華南理工大學(xué)學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的論文是本人在導(dǎo)師的指導(dǎo)下獨(dú)立進(jìn)行研巧所。取得的研究成果除了文中特別加W標(biāo)
3、注引用的內(nèi)容外,本論文不包含任何其他個(gè)人或集體己經(jīng)發(fā)表或撰寫的成果作品。對(duì)本文的研究做出重要貢。獻(xiàn)的個(gè)人和集體,均己在文中W明確方式標(biāo)明本人完全意識(shí)到本聲明的法律后果由本人承擔(dān)。作者簽名日期:>/年/月主日:/學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,呂P:研究生在校攻讀學(xué)位期間論文工作的知識(shí)產(chǎn)權(quán)單位屬華南理工大學(xué)。學(xué)校有權(quán)保存并向國(guó)家有關(guān)部口或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許學(xué)位論文被查閱(除在保密期內(nèi)的保密論文外);學(xué)??晒紝W(xué)位論文的全、部或部分內(nèi)容,可W允許采用影印、縮印或其它復(fù)制手段保存匯編學(xué)位
4、^論文。本人電子文檔的內(nèi)容和紙質(zhì)論文的內(nèi)容相致。本學(xué)位論文屬于:□保密,(校保密委員會(huì)審定為渉密學(xué)位時(shí)間;年_月___日)^于年月日解密后適用本授權(quán)書。^____?’U不保密上發(fā)布,供校內(nèi)師生和與學(xué)校有共享協(xié)議,同意在校園網(wǎng)的單位瀏覽;同意將本人學(xué)位論文提交中國(guó)學(xué)術(shù)期刊(光盤版)電子雜志社全文出版和編入CNKI《中國(guó)知識(shí)資源總庫(kù)》,傳播學(xué)位論文的全部或部分內(nèi)容。""(請(qǐng)?jiān)谏舷鄳?yīng)方框內(nèi)打V)作者簽名:日期:2016年明巧指導(dǎo)教師簽名日期201巧明2日/聯(lián)作者聯(lián)系電話:電子郵箱:系地址(含郵編);摘要目前隨著互聯(lián)網(wǎng)的發(fā)展,特別是在進(jìn)入
5、Web2.0時(shí)代,互聯(lián)網(wǎng)上產(chǎn)生了大量的信息。其中這些信息大部分都是由互聯(lián)網(wǎng)用戶創(chuàng)造的,而這些信息很大一部分是以文字的形式出現(xiàn)在互聯(lián)網(wǎng)上。人們會(huì)使用電子商務(wù)網(wǎng)站進(jìn)行購(gòu)物,會(huì)留下對(duì)產(chǎn)品的評(píng)論;人們會(huì)通過(guò)新聞網(wǎng)站閱讀最新的新聞消息,留下自己對(duì)該新聞的看法與觀點(diǎn);人們也會(huì)在各種社交網(wǎng)絡(luò)平臺(tái)發(fā)表自己的各種情感。而對(duì)于這些文字信息的挖掘產(chǎn)生了自然語(yǔ)言處理領(lǐng)域的各種技術(shù)與研究方向,其中對(duì)文本情感的分析是目前熱門的研究課題。通過(guò)對(duì)用戶發(fā)表的文字信息使用自動(dòng)的情感分析技術(shù),在現(xiàn)實(shí)中有許多應(yīng)用場(chǎng)景,例如產(chǎn)品推薦系統(tǒng)、網(wǎng)絡(luò)輿情分析系統(tǒng)、政務(wù)決策系統(tǒng)等。中國(guó)作為擁有世界互聯(lián)網(wǎng)用戶數(shù)量最多的國(guó)家之一,對(duì)于中文文
6、本的情感分析需求日益增加。本文對(duì)酒店領(lǐng)域中文評(píng)論情感傾向分析應(yīng)用進(jìn)行了研究,主要任務(wù)有:(1)構(gòu)建了一個(gè)酒店領(lǐng)域的特征詞典和情感詞典。情感詞典構(gòu)建中使用常用的中文情感詞典作為基礎(chǔ)詞典,抽取酒店領(lǐng)域評(píng)論中的情感詞,并且使用詞向量計(jì)算詞之間的相似度的方法來(lái)確定候選情感詞的情感傾向,以此來(lái)擴(kuò)展詞典。(2)利用句法依存關(guān)系分析,特征詞典與情感詞典,對(duì)酒店評(píng)論進(jìn)行細(xì)粒度情感傾向分析。通過(guò)抽取特征詞,情感詞與修飾詞等組成的情感搭配元素組合并進(jìn)行情感傾向計(jì)算,獲得酒店在各個(gè)屬性特征上的情感傾向評(píng)價(jià)。(3)對(duì)酒店整條評(píng)論進(jìn)行情感傾向分析,采用情感詞典與機(jī)器學(xué)習(xí)結(jié)合的方法。首先對(duì)評(píng)論使用情感詞典計(jì)算情感
7、傾向值,挑選出每一類中情感傾向值明顯的評(píng)論作為訓(xùn)練集,并且使用多特征融合方法結(jié)合多個(gè)SVM-KNN分類器能力進(jìn)行分類。實(shí)驗(yàn)表明優(yōu)化挑選訓(xùn)練集能提高分類器效果,多特征融合方法比單一分類器效果略有優(yōu)勢(shì)。(4)設(shè)計(jì)實(shí)現(xiàn)了一個(gè)基于評(píng)論情感分析的酒店檢索系統(tǒng)。目前的酒店預(yù)訂網(wǎng)站對(duì)酒店的檢索都是使用酒店的客觀指標(biāo),比如酒店位置,價(jià)格范圍等。而本文的系統(tǒng)不僅使用酒店的客觀指標(biāo)并且通過(guò)對(duì)酒店評(píng)論進(jìn)行情感傾向分析,得到用戶對(duì)酒店的主觀評(píng)價(jià)指標(biāo),比如性價(jià)比是否高,