藏語(yǔ)實(shí)體關(guān)系抽取研究

藏語(yǔ)實(shí)體關(guān)系抽取研究

ID:37068481

大小:5.84 MB

頁(yè)數(shù):70頁(yè)

時(shí)間:2019-05-16

藏語(yǔ)實(shí)體關(guān)系抽取研究_第1頁(yè)
藏語(yǔ)實(shí)體關(guān)系抽取研究_第2頁(yè)
藏語(yǔ)實(shí)體關(guān)系抽取研究_第3頁(yè)
藏語(yǔ)實(shí)體關(guān)系抽取研究_第4頁(yè)
藏語(yǔ)實(shí)體關(guān)系抽取研究_第5頁(yè)
資源描述:

《藏語(yǔ)實(shí)體關(guān)系抽取研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、學(xué)校代碼10052:11180W¥號(hào):S5aaauBM^密級(jí):勸偉錟火聲MINZUUNIVERSITYOFCHINA碩士學(xué)位論文藏語(yǔ)賣體關(guān)糸抽取斫宄姓名:郭莉莉指導(dǎo)教師:孫媛副教授學(xué)院:信息工程學(xué)院專業(yè):計(jì)算機(jī)科學(xué)與技術(shù)完成日期:2018.05.10學(xué)位論文原創(chuàng)性聲明:所呈交的學(xué)位論文本人鄭重聲明,是本人在導(dǎo)師指導(dǎo)下進(jìn)行研宄工作所取得的研究成果。除文中已經(jīng)注明引用的內(nèi)容外,本學(xué)位論文的研究成果不包含任何他人創(chuàng)作的、己公開(kāi)發(fā)表或者沒(méi)有公開(kāi)發(fā)表的作品的內(nèi)容。對(duì)本論文所

2、涉及的研宄工作做出貢獻(xiàn)的其他個(gè)人和集體,均己在文中以明確方式標(biāo)明。本學(xué)位論文原創(chuàng)性聲明的法律責(zé)任由本人承擔(dān)。學(xué)位論文作者簽字:20I》年f月〖2曰學(xué)位論文使用授權(quán)書(shū)根據(jù)相關(guān)規(guī)定,我校的博士、碩士學(xué)位獲得者均須向中央民族大學(xué)提交本人的學(xué)位論文紙質(zhì)本及相應(yīng)電子版。本人完全了解并同意中央民族大學(xué)擁有在《著作權(quán)法》規(guī)定范圍內(nèi)的學(xué)位論文使用,:1學(xué)位獲得者必須按規(guī)定提交學(xué)位論文包括紙質(zhì)印刷本及電子版)權(quán)即();(2)為教學(xué)(和科研目的,學(xué)校可以將公開(kāi)的學(xué)位論文作為資料在圖書(shū)館等場(chǎng)所提供校內(nèi)師生閱讀等服務(wù);(3)根據(jù)教育部有關(guān)

3、規(guī)定,中央民族大學(xué)向教育部指定單位提交公開(kāi)的學(xué)位論文;4學(xué)位論文作者授權(quán)學(xué)校向中國(guó)學(xué)術(shù)期刊光盤(pán)電子出版社提交規(guī)定范圍的學(xué)位論文及()()其電子版并收入相應(yīng)學(xué)位論文數(shù)據(jù)庫(kù),通過(guò)其相關(guān)網(wǎng)站對(duì)外進(jìn)行信息服務(wù)。同時(shí)本人保留在其他媒體發(fā)表論文的權(quán)利。本人承諾,:本人的學(xué)位論文是在中央民族大學(xué)學(xué)習(xí)期間創(chuàng)作完成的作品并己通過(guò)一論文答辯,;提交的學(xué)位論文電子版與紙質(zhì)本論文的內(nèi)容致如因不同造成不良后果由本人自負(fù)。本人同意遵守上述規(guī)定。(保密的學(xué)位論文在解密后適用本授權(quán)書(shū),本論文:□不保密,□保密期限至年月止)學(xué)位論文作者暨授權(quán)人簽字:g

4、g204年以曰〈月I摘要互聯(lián)網(wǎng)數(shù)據(jù)的爆炸式增長(zhǎng),使得研究熱點(diǎn)更多轉(zhuǎn)向Web內(nèi)容結(jié)構(gòu)化分析[4]。在自然語(yǔ)言處理領(lǐng)域的研宄中,知識(shí)圖譜(KnowledgeGmph)己經(jīng)變成了一個(gè)熱點(diǎn)。在信息檢索、問(wèn)答系統(tǒng)以及知識(shí)庫(kù)構(gòu)建等研究中知識(shí)圖譜提供了完善的資源與支撐,但少數(shù)民族語(yǔ)言知識(shí)圖譜的構(gòu)建才剛剛起步,所有藏語(yǔ)信息以文本顯示為主。如果將藏語(yǔ)知識(shí)以結(jié)構(gòu)化形式表示,那么將會(huì)有利于藏語(yǔ)知識(shí)的結(jié)構(gòu)化分析和深度挖掘。所以藏語(yǔ)實(shí)體關(guān)系抽取成為需要一研宄的方向之。其中英、漢語(yǔ)言實(shí)體關(guān)系抽取有公開(kāi)的語(yǔ)料和很多研究方法,但是藏語(yǔ)在這方面的研

5、究還沒(méi)有公開(kāi)的語(yǔ)料,而且很多方法沒(méi)有使用到藏語(yǔ)實(shí)體關(guān)系抽取研宄中。所以本文針對(duì)藏語(yǔ)實(shí)體關(guān)系抽取進(jìn)行了研宄及分析,主要內(nèi)容如下:一1)本文提出了種基于模板和BP神經(jīng)網(wǎng)絡(luò)的藏語(yǔ)實(shí)體關(guān)系抽取方法。我們選取實(shí)體位置特征、實(shí)體之間的距離特征、實(shí)體及周圍詞特征以及關(guān)鍵詞的特征來(lái)進(jìn)一步進(jìn)行向量化,其中實(shí)體及周圍詞詞匯特征和關(guān)鍵詞特征用一-TFIDF值來(lái)表示。由于藏語(yǔ)的部分語(yǔ)料在句式上有定的相似性,本文提出將構(gòu)建的藏語(yǔ)模板融合到BP神經(jīng)網(wǎng)絡(luò)模型中。實(shí)驗(yàn)證明,F1值達(dá)到了74.29%,相比支持向量機(jī)方法提高了1.97%。一2)本文提出了種通

6、過(guò)使用優(yōu)化詞向量的GRU神經(jīng)網(wǎng)絡(luò)模型來(lái)進(jìn)行藏語(yǔ)實(shí)體關(guān)系抽取的方法。在模型的訓(xùn)練中我們加入了優(yōu)化的詞向量,在傳統(tǒng)的詞向量模型中結(jié)合藏語(yǔ)音節(jié)向量、音節(jié)位置向量、詞性向量等特征對(duì)詞II一向量進(jìn)步優(yōu)化。實(shí)驗(yàn)證明使用,并且選取了藏語(yǔ)詞匯特征和藏語(yǔ)句子特征優(yōu)化詞向量,F1值達(dá)到了78.43%。3)在優(yōu)化詞向量的GRU神經(jīng)網(wǎng)絡(luò)模型的基礎(chǔ)上引入了的Atention機(jī)制一,Atention機(jī)制影響關(guān)鍵詞的權(quán)重來(lái)突出關(guān)鍵詞和優(yōu)化特征提取進(jìn)步提高效果。用該模型在藏語(yǔ)實(shí)體關(guān)系抽取任務(wù)上對(duì)其做出評(píng)估實(shí)驗(yàn)。通過(guò)與其他模型做比較n.46%。,表明該

7、模型是有效的,值最終達(dá)到了81關(guān)鍵詞:實(shí)體關(guān)系抽?。唬拢猩窠?jīng)網(wǎng)絡(luò);詞向量;注意力機(jī)制;GRU神經(jīng)網(wǎng)絡(luò)IIIABSTRACTTheexlosiverowthofInternetdatahasturnedresearchhotsotsintoWebpgpcontentstructureanalsis.Intheresearchofnaturallanuaerocessinfieldyggpg,theKnowledeGraphhasbecomeahottopic.Intheresea

8、rchofinformation

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。