信息檢索搜索引擎數(shù)據(jù)采集語(yǔ)音識(shí)別自然語(yǔ)言處理論文

信息檢索搜索引擎數(shù)據(jù)采集語(yǔ)音識(shí)別自然語(yǔ)言處理論文

ID:28385426

大小:80.12 KB

頁(yè)數(shù):6頁(yè)

時(shí)間:2018-12-09

信息檢索搜索引擎數(shù)據(jù)采集語(yǔ)音識(shí)別自然語(yǔ)言處理論文_第1頁(yè)
信息檢索搜索引擎數(shù)據(jù)采集語(yǔ)音識(shí)別自然語(yǔ)言處理論文_第2頁(yè)
信息檢索搜索引擎數(shù)據(jù)采集語(yǔ)音識(shí)別自然語(yǔ)言處理論文_第3頁(yè)
信息檢索搜索引擎數(shù)據(jù)采集語(yǔ)音識(shí)別自然語(yǔ)言處理論文_第4頁(yè)
信息檢索搜索引擎數(shù)據(jù)采集語(yǔ)音識(shí)別自然語(yǔ)言處理論文_第5頁(yè)
資源描述:

《信息檢索搜索引擎數(shù)據(jù)采集語(yǔ)音識(shí)別自然語(yǔ)言處理論文》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、基于自然語(yǔ)言理解的智能檢索接口技術(shù)的研究及其應(yīng)用【摘?!侩S著互聯(lián)網(wǎng)信息量的爆炸式增長(zhǎng),當(dāng)今的時(shí)代已經(jīng)成為了信息的時(shí)代,信息檢索技術(shù)也在逐步趨向成熟,信息檢索工具搜索引擎也層出不窮。但是用搜索引擎檢索信息并不總是讓用戶滿意,一方面由于任何一個(gè)搜索引擎都不可能覆蓋互聯(lián)網(wǎng)上的所有網(wǎng)頁(yè),這樣就會(huì)致使用戶檢索不到所需要的信息;另一方面由于搜索引擎自身的因素,沒(méi)能正確準(zhǔn)確的理解用戶的語(yǔ)意而導(dǎo)致的不滿足用戶的檢索需求;另外,由于搜索引擎用戶逐年增加,人群遍及各行各業(yè),年齡從老到幼,他們使用搜索引擎的方法不當(dāng)引起沒(méi)能檢索到有用信息

2、。所以近年來(lái)研究搜索引擎技術(shù)的學(xué)者越來(lái)越多,最終的目的是使搜索引擎使用起來(lái)能夠更加的方便。作為河北省教育廳2009年度科學(xué)研究計(jì)劃,本課題研究的是基于自然語(yǔ)言的智能檢索接口技術(shù)的研究以及在高等藝術(shù)教育網(wǎng)中的應(yīng)用,在課題中主要針對(duì)自然語(yǔ)言的處理以及利用語(yǔ)音進(jìn)行輸入進(jìn)行了研究,重點(diǎn)做了以下工作:D數(shù)據(jù)采集,主要在網(wǎng)絡(luò)上釆集藝術(shù)類網(wǎng)頁(yè),并對(duì)網(wǎng)頁(yè)內(nèi)容進(jìn)行分析提取,再將網(wǎng)頁(yè)標(biāo)題、正文等有用信息存入數(shù)據(jù)庫(kù)。在網(wǎng)頁(yè)采集過(guò)程中,使用了在網(wǎng)頁(yè)中的去噪方法,將網(wǎng)頁(yè)信息的標(biāo)題和內(nèi)容等有用信息提取岀來(lái),為后續(xù)的檢索打下基礎(chǔ)。2)利用語(yǔ)音進(jìn)

3、行檢索輸入,語(yǔ)...更多還原創(chuàng)【Abstract】WiththeexplosivegrowthofInternetinformation,today?serahasbecometheeraoftheinformation.Notonlyinformationretrievaltechnologyhasbecomegraduallymaturing,butalsothetoolsofinformationretrieval-searchengineareincreasingly.Butusingsearchengin

4、estosearchinformationdonotalwaysmakethecustomersatisfied.Ononehand,itcannotcoverallthepagesontheInternetforanysearchengine?Ontheotherhand,becauseofthefactorsofthesearchengineitself,itca...更多還原團(tuán)【關(guān)鍵詞】信息檢索;搜索引擎;數(shù)據(jù)采集;語(yǔ)音識(shí)別;自然語(yǔ)言處理;【Keywords]Informationretrieval;sear

5、chengine;dataacquisition;speechrecognition;naturallanguagcprocessing;【索購(gòu)全文】Q聯(lián)系Q:138113721Q聯(lián)系Q:139938848付費(fèi)即發(fā)摘要4-5Abstract5-6第1章緒論9-131?1課題意義和應(yīng)用前景9-111.2課題的主要工作11-121.3章節(jié)安排12?13第2章信息檢索相關(guān)工作綜述13-212.1信息檢索概述13?152.1.1全文檢索13-142.2概念檢索152.3搜索引擎15-172.3.1全文搜索引擎16232目錄

6、搜索引擎16-172.3.3元搜索引擎172.4自然語(yǔ)言處理17?192.4.1基于句模的技術(shù)1弘192.4.2問(wèn)答系統(tǒng)192.5語(yǔ)音技術(shù)概述19?202.6本章小結(jié)20-21第3章智能信息處理的信息采集21-313.1概述21-223.1.1網(wǎng)頁(yè)爬取策略213.1.2網(wǎng)絡(luò)爬蟲(chóng)概述21-223.2工作流程22-233.3信息的提取23-253.3.1去噪23-243.3.2有用信息的捉取24-253.4有用信息的存儲(chǔ)253.5實(shí)驗(yàn)結(jié)果與分析25-303.5.1WebLech簡(jiǎn)介25-263.5.2抓取過(guò)程26-28

7、3.5.3實(shí)驗(yàn)結(jié)果比較28-303.6本章小結(jié)30-31第4章搜索引擎中對(duì)檢索輸入的研究31-414.1所需硬件環(huán)境314.2語(yǔ)音輸入的實(shí)現(xiàn)31-334.3實(shí)驗(yàn)結(jié)果與分析33-404.3.1微軟語(yǔ)音輸入法簡(jiǎn)介334.3.2實(shí)驗(yàn)過(guò)程與結(jié)果的比較33-394.3.3實(shí)驗(yàn)結(jié)果的分析39-404.4本章小結(jié)40-41第5章自然語(yǔ)言處理41-555」重定向41-435.1.1重定向的條件415.1.2重定向的實(shí)現(xiàn)41-435.2添加增刪概念43-445.2.1添加增刪概念的意義435.2.2添加增刪概念的實(shí)現(xiàn)原理圖43-44

8、5.3數(shù)據(jù)字典的擴(kuò)充44-465.3.1數(shù)據(jù)的準(zhǔn)備45532擴(kuò)充的實(shí)現(xiàn)45-465.4疑問(wèn)句的檢索46-485.4.1問(wèn)答式提問(wèn)句的分析465.4.2疑問(wèn)句與問(wèn)答式提問(wèn)句的處理46-485.5實(shí)驗(yàn)結(jié)果與分析48-535.5.1重定向的實(shí)驗(yàn)比較48-495.5.2問(wèn)答式提問(wèn)句的實(shí)驗(yàn)結(jié)果比較與分析49-535.6本章小結(jié)53-55結(jié)論55-57參考文獻(xiàn)

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。