資源描述:
《【碩士論文】中文視頻問答系統(tǒng).pdf》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、摘要摘要問答系統(tǒng)(QA)是允許用戶輸入一個(gè)自然語言形式的提問,通過檢索,得到能夠回答該問句的比較簡短而準(zhǔn)確的一個(gè)句子、摘要或者一個(gè)詞。文本文檔的問答系統(tǒng)研究已經(jīng)取得了一定的進(jìn)展。隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,除了文本,網(wǎng)絡(luò)上其他多媒體信息變得越來越重要,這對問答系統(tǒng)既是機(jī)遇也是一種挑戰(zhàn)。視頻是我們獲捕外界信息的最有效媒體之一,因此本論文主要對新聞視頻進(jìn)行問答系統(tǒng)研究。在視頻的各種特征中,腳本是最重要的且是比較容易得到的,況且,視頻問答系統(tǒng)輸入的是一個(gè)純文本類型的問句,所以系統(tǒng)框架中主要運(yùn)用的是通過自動(dòng)語音識(shí)另0(ASR)而得到的腳本特征。本論文提出了一種
2、中文視頻問答系統(tǒng)的框架。整個(gè)系統(tǒng)包括6個(gè)模塊:視頻分割、語音識(shí)別、問句分類、腳本檢索、答案抽取和最后的視頻輸出。腳本中包含了大量的語音識(shí)別錯(cuò)誤,我們?nèi)藶榈貙Σ糠皱e(cuò)誤進(jìn)行了糾錯(cuò)。在問句分類模塊,本論文利用知網(wǎng)(HowNet)來提高問句分類的準(zhǔn)確率。視頻QA是為了得到問句的最準(zhǔn)確的視頻答案,而不僅僅是一個(gè)很長的故事單元,所以對檢索得到的故事單元需要進(jìn)行更詳細(xì)地答案抽取。本論文根據(jù)關(guān)鍵詞密度、問句分類時(shí)的答案類型等為輸出的句子打分,分?jǐn)?shù)最高的句子對應(yīng)的視頻作為輸出。本論文的重點(diǎn)研究在于:(1)在問句分類中知網(wǎng)的運(yùn)用;(2)把文本問答系統(tǒng)擴(kuò)展到中文視頻
3、中,這對問答系統(tǒng)研究是一個(gè)突破。對中文CCTV4新聞視頻的實(shí)驗(yàn)表明,我們提出的方法是可行的。關(guān)鍵詞問答系統(tǒng);視頻分割;信息檢索;自然語言處理;知網(wǎng)1.76極品火龍http://www.40ok.com燕山大學(xué)工學(xué)碩士學(xué)位論文AbstractQuestionAnsweringistolocate,extract,andrepresentaspecificanswertoauserquestionexpressedinnaturallanguage.a(chǎn)ndcurrentquestionansweriRgsystemssucceedinmanyasp
4、ensregardingtoquestionsoftextualdocuments.Withthedevelopmentoftheintemct,Inadditiontotraditionaltextmessage,multimediadatahasbecomeincreasinglyimportantdataontheweb,whichprovidesbotllopportunitiesandchallengesforquestionanswering.Videoisoneofthemosteffectiveinformationforcap
5、turingtheeventsintherealworld.Ourframeworkisbasedonnewsvideo.Inallfeatures,transcriptisthemostimportantandmostreadilyavailablevideofeatures.Moreover,themputofvideoquestionanswering(VideoQA)isashortquestion,SOwemainemploytranscriptfeaturethatisgainedbyASlLThispaperproposesa矗a
6、meworkforChineseVideoquestionansweringsystem_Thewholesystemconsistsofsixmodules:videosegmentation,speechrecognition,questionclassification,transcriptretrieval,answerextractionandvideooutput.Butthenewstranscriptscontainnumerousspeechrecognitionerrors,SOwemanuallycorrectsomeer
7、rors.Inthemoduleofquestionclassification,weemployHowNettoimprovetheaccuracy.VideoQAistoobtaintheclosevideoclips,andnotjustalongstoryunit,SOweneedtoprocessandpositiontheclosesentencestoanswertimquestion.Weclaimthatthebestsemencethatanb'wersthequestionshouldsatisfiedsomecondit
8、ionswhicharebasedonquerydensity,answertype,ere.Themainresearchesofthispaper