資源描述:
《畢業(yè)論文--基于情感詞典的微博評(píng)論情感分析》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、基于情感詞典的微博評(píng)論情感分析學(xué)生姓名:學(xué)號(hào):(理工學(xué)院信科系計(jì)科1301)[摘要]近年來(lái)微博的出現(xiàn),極大豐富了人們的生活。其簡(jiǎn)短寫作,便捷發(fā)布,實(shí)時(shí)交互的特點(diǎn)深受大眾歡迎。越來(lái)越多的用戶樂(lè)于在微博平臺(tái)上分享信息,交流觀點(diǎn)和情感。通過(guò)對(duì)這些信息展開(kāi)情感分析,可以實(shí)現(xiàn)微博輿情監(jiān)控等。情感分析主要是判別微博文本的情感傾向性,即屬于正面、負(fù)面、中性。根據(jù)中文微博的自身特點(diǎn),在傳統(tǒng)文本情感分析的已有基礎(chǔ)上,展開(kāi)對(duì)微博的情感傾向分析。首先,對(duì)微博進(jìn)行爬蟲(chóng)搜集微博評(píng)論數(shù)據(jù),然后對(duì)爬蟲(chóng)得到的評(píng)論進(jìn)行中文分詞。最后對(duì)分詞得到的文檔對(duì)照情感詞典進(jìn)行情感定位以及情感聚合,結(jié)果得到對(duì)
2、整條微博消息作加權(quán)計(jì)算獲得其情感傾向性,實(shí)現(xiàn)了一個(gè)面向中文微博的情感傾向分類系統(tǒng)。[關(guān)鍵詞]微博爬蟲(chóng)中文分詞情感詞典情感傾向目錄摘要.....................................................I一、緒論(一)研究背景..........................................(1)(二)研究意義..........................................(1)(三)國(guó)內(nèi)外發(fā)展現(xiàn)狀....................................(2)(四)論文的分
3、工........................................(3)二、具體內(nèi)容............................................(3)三、情感定位(一)情感定位簡(jiǎn)介......................................(4)(二)情感定位方法......................................(5)四、實(shí)驗(yàn)代碼、結(jié)果及相關(guān)分析(一)實(shí)驗(yàn)代碼..........................................(7)(二)實(shí)驗(yàn)結(jié)果以及分析....
4、..............................(10)五、總結(jié)與展望(一)全文總結(jié)..........................................(11)(二)進(jìn)一步的研究方向..................................(11)六、遇到的問(wèn)題(一)我們項(xiàng)目進(jìn)行時(shí)出現(xiàn)的問(wèn)題.........................(11)(二)老師對(duì)我們提出的問(wèn)題.............................(12)(三)其他小組向我們小組提出的問(wèn)題.....................(12)(四
5、)我們向其他小組提出的問(wèn)題以及得到的解答...........(13)一、緒論(一)項(xiàng)目背景英國(guó)Corpora軟件公司開(kāi)發(fā)了一套名叫“感情色彩(Sentiment)”的軟件,它能判斷報(bào)紙刊登的文章對(duì)一個(gè)政黨的政策是持肯定態(tài)度還是否定態(tài)度、或者網(wǎng)上評(píng)論文章是稱贊還是貶低一種產(chǎn)品,以幫助政府和一些大公司全面了解公眾輿論對(duì)他們的看法。長(zhǎng)期以來(lái),要了解關(guān)于某個(gè)問(wèn)題的報(bào)道是正面的還是反面的,是消極的還是中立的,往往需要求助于調(diào)查公司。這些公司的員工仔細(xì)閱讀有關(guān)某個(gè)機(jī)構(gòu)、個(gè)人、事件或問(wèn)題的所有文字,然后就這些評(píng)論的態(tài)度做出反饋。這不僅耗費(fèi)大量人力和財(cái)力,而且過(guò)程相當(dāng)緩慢。同
6、時(shí)近年來(lái),伴隨著Web與4G技術(shù)的高速發(fā)展,互聯(lián)網(wǎng)以其豐富的內(nèi)容,快捷的方式,呈現(xiàn)給我們一個(gè)前所未有的嶄新世界。無(wú)數(shù)用戶以及一大批基于互聯(lián)網(wǎng)的社交網(wǎng)絡(luò)平臺(tái)步入了高速發(fā)展期。與此同時(shí),論壇、博客、微博等得到了更為廣闊的發(fā)展空間,這些都給人們的生活和社會(huì)運(yùn)行方式帶來(lái)了深深的影響。從國(guó)外的Twitter、Plurk,到中國(guó)的飯否、新浪微博等,短時(shí)間里以驚人的速度發(fā)展并擁有了大量用戶。在國(guó)內(nèi),短短幾年時(shí)間里,微博從互聯(lián)網(wǎng)的新秀躍升為互聯(lián)網(wǎng)的基礎(chǔ)應(yīng)用之一,以微變革的力量,打開(kāi)了一個(gè)大時(shí)代之門。(二)研究意義當(dāng)今世界,信息量巨大,并呈指數(shù)級(jí)增長(zhǎng),從現(xiàn)有表達(dá)方式了解信息,是一
7、件困難的事情。從巨大的信息量中找到人們關(guān)心的信息或者隱含的結(jié)論,在現(xiàn)階段尚是個(gè)難題。龐大的微博信息流攬括了眾多話題,也許這些信息看似瑣碎,而且非常不規(guī)則,可事實(shí)上蘊(yùn)藏著巨大的潛在價(jià)值。微博平臺(tái)上的各種互動(dòng),往往與用戶的心理有關(guān),用戶一旦在微博中發(fā)言,便有了立場(chǎng)和傾向,這就可以對(duì)其做情感分析。通過(guò)情感分析的結(jié)果:名人可做自身形象維護(hù);企業(yè)可做微博營(yíng)銷、客戶關(guān)系管理以及品牌宣傳;商家可通過(guò)用戶產(chǎn)品體驗(yàn)后的評(píng)價(jià)做產(chǎn)品改進(jìn),從而提高市場(chǎng)占有率;政府機(jī)構(gòu)可掌握突發(fā)事件后的社會(huì)群體心理,進(jìn)行輿情監(jiān)控;除此之外,還可對(duì)特定的高壓力人群做情感分析,從而給他們提供有針對(duì)性的心理疏
8、導(dǎo)等等。因此,如何從微博