資源描述:
《基于本體的網(wǎng)絡(luò)輿情挖掘研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、基于本體的網(wǎng)絡(luò)輿情挖掘研究重慶大學(xué)碩士學(xué)位論文(學(xué)術(shù)學(xué)位)學(xué)生姓名:張俊勇指導(dǎo)老師:羅軍副教授專業(yè):計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)學(xué)科門(mén)類:工學(xué)重慶大學(xué)計(jì)算機(jī)學(xué)院二〇一四年四月
ResearchOnOntology-basedInternetPublicOpinionMiningAThesisSubmittedtoChongqingUniversityinPartialFulfillmentoftheRequirementfortheMaster’sDegreeofEngineeringByZhangJunyongSupervisedby
2、AssociateProf.LuoJunSpecialty:ComputerSystemArchitectureCollegeofComputerScienceofChongqingUniversity,Chongqing,ChinaApril2014
重慶大學(xué)碩士學(xué)位論文中文摘要摘要隨著互聯(lián)網(wǎng)的日益壯大,網(wǎng)絡(luò)迅速普及、網(wǎng)民數(shù)量快速增長(zhǎng)。從而,網(wǎng)絡(luò)輿情慢慢成為映射社會(huì)輿情的實(shí)時(shí)晴雨表,從某種程度上它可以最直接、最快速地反映了經(jīng)濟(jì)、政治、文化的狀況和發(fā)展態(tài)勢(shì)。網(wǎng)絡(luò)輿情分析順理成章的成為了解社情民意的關(guān)鍵技術(shù)之一。然而,監(jiān)管機(jī)
3、構(gòu)往往更關(guān)注某個(gè)領(lǐng)域、層次的輿情情況,從基于關(guān)鍵詞的搜索結(jié)果中的海量信息中找到與特定領(lǐng)域的相關(guān)的局部信息是非常困難的,另一方面,由于互聯(lián)網(wǎng)的開(kāi)放性、共享性、扁平性使得網(wǎng)絡(luò)輿情的出現(xiàn)和監(jiān)管不再具有地域性,不再具有邊界。因此,缺少語(yǔ)義理解的關(guān)鍵詞搜索,在正確表達(dá)搜索期望時(shí)總顯得力不從心。根據(jù)研究目的的需求,本文的研究工作需從以下內(nèi)容進(jìn)行:深入理解本體在輿情分析過(guò)程中的作用,使輿情分析基于語(yǔ)義的理解之上。本文針對(duì)傳統(tǒng)的web挖掘缺少對(duì)文本語(yǔ)義的理解問(wèn)題,提出了基于本體的Web挖掘。在挖掘分析之前,利用本體對(duì)文本語(yǔ)義的理解,之后進(jìn)
4、行挖掘分析。這就將本體知識(shí)運(yùn)用到Web挖掘之中,使得兩個(gè)領(lǐng)域的研究成果可以相互促進(jìn),共同來(lái)解決輿情分析這個(gè)復(fù)雜的社會(huì)問(wèn)題。研究文本分類算法,結(jié)合領(lǐng)域本體,改進(jìn)文本分類以適應(yīng)輿情分析特殊需求。由于傳統(tǒng)的分類方法不能很好的適應(yīng)輿情分析的特殊需要,本文對(duì)文本分類算法,做了適當(dāng)?shù)母倪M(jìn),以適應(yīng)輿情分析特定需求。輿情分析中,文本樣例分布不均會(huì)導(dǎo)致分類偏差,這種改進(jìn)有效的減小了樣例不均對(duì)分類結(jié)果的影響,從而減小了偏差。最后,完善傳統(tǒng)的情感傾向計(jì)算方法,對(duì)情感傾向性進(jìn)行定量的計(jì)算分析,本文完善了對(duì)情感傾向性定量的計(jì)算,而不僅僅是定性的分析
5、。使得情感傾向分析更加準(zhǔn)確,對(duì)輿情分析有重要意義。關(guān)鍵詞:本體,Web挖掘,輿情分析,文本分類,情感傾向計(jì)算I
重慶大學(xué)碩士學(xué)位論文英文摘要ABSTRACTAsthegrowthofInternet,networkquicklyspread,andthenumberofInternetusersgrowsrapidly.Thus,thenetworkpublicopiniongraduallybecomethereal-timebarometermappingsocialpublicopinion.Tosomeextent
6、,itcanbethemostdirectandrapidreflectionofthestatusanddevelopmenttrendofeconomic,politicalandculture.Naturally,thenetworkpublicopinionanalysishasbecomingoneofthekeytechnologiesofunderstandingthesocietyandpublicopinion.However,regulatorstendtobemoreconcernedaboutapa
7、rticularareaorlevelofpublicopinionsituation.Butfindingalocalinformationassociatedwithspecificdomainfromthemassofsearchresultsbasedonkeywordsisverydifficult.Ontheotherhand,theInternet'sopenness,sharing,flatmakesnetworkpublicopinionandsupervisionnolongertoberegional
8、andnoboundary.Therefore,whensearchingcorrectexpressionoftheexpected,thelackofsemanticunderstandingofsearchkeywordstotallyragged.Accordingtotheresearchpu