查詢語句概念分析的研究及其在檢索中應(yīng)用

查詢語句概念分析的研究及其在檢索中應(yīng)用

ID:34584822

大?。?.63 MB

頁數(shù):65頁

時間:2019-03-08

查詢語句概念分析的研究及其在檢索中應(yīng)用_第1頁
查詢語句概念分析的研究及其在檢索中應(yīng)用_第2頁
查詢語句概念分析的研究及其在檢索中應(yīng)用_第3頁
查詢語句概念分析的研究及其在檢索中應(yīng)用_第4頁
查詢語句概念分析的研究及其在檢索中應(yīng)用_第5頁
資源描述:

《查詢語句概念分析的研究及其在檢索中應(yīng)用》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫。

1、ADissertationSubmittedtoShanghaiJiaoTongUniversityfortheDegreeofMasterConceptualAnalysisoftheQueryandItsApplicationinRetrievalAuthor:DaniBiSpecialty:ComputerTechnologyAdvisor:YuquanChenSchoolofElectronicsandElectricEngineeringShanghaiJiaoTongUniversityShanghai,P.R.ChinaDecember20,

2、2012萬方數(shù)據(jù)上海交通大學工學碩士學位論文58萬方數(shù)據(jù)上海交通大學工學碩士學位論文59萬方數(shù)據(jù)上海交通大學學位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的學位論文,是本人在導師的指導下,獨立進行研究工作所取得的成果。除文中已經(jīng)注明引用的內(nèi)容外,本論文不包含任何其他個人或集體已經(jīng)發(fā)表或撰寫過的作品成果。對本文的研究做出重要貢獻的個人和集體,均已在文中以明確方式標明。本人完全意識到本聲明的法律結(jié)果由本人承擔。學位論文作者簽名:畢妲妮日期:2013年1月11日萬方數(shù)據(jù)上海交通大學學位論文版權(quán)使用授權(quán)書本學位論文作者完全了解學校有關(guān)保留、使用學位論文的規(guī)定,同意學校保留

3、并向國家有關(guān)部門或機構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán)上海交通大學可以將本學位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學位論文。保密□,在年解密后適用本授權(quán)書。本學位論文屬于不保密√。(請在以上方框內(nèi)打“√”)學位論文作者簽名:畢妲妮指導教師簽名:陳玉泉日期:2013年1月1日日期:2013年1月1日萬方數(shù)據(jù)上海交通大學工學碩士學位論文ABSTRACT查詢語句的概念分析及其在檢索中的應(yīng)用摘要近年來,隨著計算機技術(shù)的發(fā)展和互聯(lián)網(wǎng)的普及,Internet上的資源以指數(shù)級迅速增長,這不僅為

4、我們提供了博大的信息資源,也伴隨著信息爆炸的問題。面對紛繁復(fù)雜的網(wǎng)絡(luò)資源,如何從海量的信息中獲取自己所需的信息,也就是檢索系統(tǒng)如何從海量文檔中返回出最符合用戶需求的候選文檔,成為了現(xiàn)在最關(guān)注的問題。目前的信息檢索系統(tǒng)只能提供給使用者有限的幫助,檢索的準確率低下,大量的信息不僅不能給用戶提供幫助,反而帶來了不小的困擾。這個問題的癥結(jié)在于現(xiàn)有的大部分檢索系統(tǒng)采用的是如布爾模型等的“離散型”模型,用戶的需求和文檔被表示成離散的、無關(guān)的字串,從而喪失了它們概念上的完整性,帶來了新的噪聲。一個可行的方案是將自然語言理解的手段引入到檢索中,通過深層次的語義分析來提高檢

5、索的準確率。具體的說,就是應(yīng)用語義分析的方法標引需求和文檔,標引的基本單位不再是字串,而是完整的概念。這樣就構(gòu)建了需求和文檔中概念之間的關(guān)系。本文研究的是漢語用戶需求的概念分析,這是中文概念檢索系統(tǒng)必不可少的組成部分。需求分析是檢索過程中的第一步,其目的是還原用戶的檢索意圖以指導進一步的檢索工作。因此需求分析是檢索系統(tǒng)的首要任務(wù),其質(zhì)量直接影響了整個檢索系統(tǒng)的性能。需求分析,跟文本文檔的分析存在較大的區(qū)別,其目的除了將用戶查詢語句表示成概念信息;I萬方數(shù)據(jù)上海交通大學工學碩士學位論文ABSTRACT更重要的是能準確的刻畫用戶腦海中的檢索概念,其依據(jù)則是模糊

6、的用戶需求表達式。本論文引入概念新思想,在概念層次上,利用語義概念圖模型,處理中文查詢語句,再將其轉(zhuǎn)化為語義概念圖,把用戶輸入的關(guān)鍵詞通過它們之間的語義關(guān)系聯(lián)結(jié)成為內(nèi)涵完整的圖的形式,使得在整個語義檢索過程中不丟失其語義概念信息,從而可以根據(jù)用戶需求的完整概念內(nèi)涵,對返回的網(wǎng)頁結(jié)果進行相關(guān)性的衡量,達到提高準確率的效果。本文在用戶需求概念分析上提出了一種新的嘗試和方法,從內(nèi)涵概念圖層次上分析用戶的真正意圖,特別是在處理疑問句需求時,通過提取查詢語句的焦點信息,并用其替換句子中的疑問詞,構(gòu)建出表達查詢語句內(nèi)涵語義信息的概念圖。該方法從中文概念內(nèi)涵的角度,分析

7、用戶需求,較為完整、準確地還原用戶的檢索意圖,以指導接下去的檢索工作,從而提高了檢索系統(tǒng)的準確度。這對于中文搜索引擎的新開發(fā),提供了有效的技術(shù)支持。關(guān)鍵字:查詢語句,概念分析,概念圖,信息檢索II萬方數(shù)據(jù)上海交通大學工學碩士學位論文ABSTRACTConceptualAnalysisoftheQueryandItsApplicationinRetrievalABSTRACTWiththedevelopmentofcomputertechnologyandtheriseoftheInternet,informationresourcesinthenetwor

8、khadbeenrapidlygrowing.Itbringsma

當前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。