資源描述:
《基于句模的歸約算法在自然語(yǔ)言檢索中的應(yīng)用.pdf》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫(kù)。
1、情報(bào)學(xué)報(bào)ISSN1000-0135JOURNALOFTHECHINASOCIETYFORSCIENTIFICANDTECHNICALINFORMATIONISSN1000-0135第29卷第1期22-31,2010年2月VoI.29No.1,22-31February2010!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!doi:10.3772/j.issn.1000-0135.2010.01.0041)基于句模的歸約算法在自然語(yǔ)言檢索中的應(yīng)用高凱(河北科技大學(xué)信
2、息科學(xué)與工程學(xué)院,石家莊050018)摘要基于句模分析的自然語(yǔ)言處理能識(shí)別面向搜索引擎應(yīng)用的自然語(yǔ)言檢索句中的核心檢索項(xiàng)。在此基礎(chǔ)上,本文通過(guò)定義產(chǎn)生式規(guī)則和使用歸約算法,對(duì)常見(jiàn)自然語(yǔ)言提問(wèn)中蘊(yùn)含的核心檢索項(xiàng)間的邏輯關(guān)系進(jìn)行識(shí)別與處理,對(duì)自然語(yǔ)言提問(wèn)中可能蘊(yùn)含的概念間的邏輯關(guān)系進(jìn)行識(shí)別,把概念間可能存在的邏輯關(guān)系轉(zhuǎn)化為必要的邏輯運(yùn)算并確定邏輯優(yōu)先級(jí)。通過(guò)在開(kāi)發(fā)的教育資訊搜索引擎與新聞搜索引擎系統(tǒng)上的使用與性能對(duì)比分析,該算法能提升自然語(yǔ)言提問(wèn)的理解能力,提高搜索引擎的智能性。文中亦對(duì)其不足進(jìn)行了說(shuō)明,并指出在此基礎(chǔ)上進(jìn)一步的研究?jī)?nèi)容。關(guān)鍵詞
3、自然語(yǔ)言處理句模產(chǎn)生式規(guī)則歸約TheApplicationofSentence-patternandReducingBasedAlgorithminNaturalLanguageRetrievalGaoKai(SchoolofInformationScience&Engineering,HebeiUniuersityofScienceandTechnology,Shijiazhuang050018)AbstractThesentence-patternbasedaIgorithmcanfindoutthesecoretermswithina
4、naturaIIanguagebasedguerystatement.OnthebasisoftheaIgorithm,thispaperpresentstheappIicationonproducingruIeandreducingbasedaIgorithminsearchengineonnaturaIIanguageunderstanding.TheproposedaIgorithmcanprocessmorecompIicatedguerieswheretherearesomecompIicatedIogicaIwordswithi
5、nthestatement.ThegoaIistofindoutthepossibIeIogicaIreIationshipswithinthenaturaIIanguagebasedguerystatement,andtotransIatetheexistingreIationshipsintothecorrectIogicaIoperations.MeanwhiIe,itaIsoneedstodeterminetheIogicaIorders.ThiscanenhancetheinteIIigenceandthepracticabiIi
6、tyofsearchengineonnaturaIIanguageunderstanding.TheexperimentaIresuItsvaIidatethefeasibiIityoftheapproach.Onthebasisoftheaboveworks,aneducationaIandanewssearchenginehavebeendeveIoped.TheIimitationofthestrategyandthefurtherworksarepresentintheend.KeywordsnaturaIIanguageunder
7、standing,sentence-pattern,productionruIe,reducing報(bào)告顯示,目前中國(guó)2.1億網(wǎng)民中使用搜索引擎的1引言比例為72.4%,而在美國(guó)這個(gè)比例已高達(dá)91%。但該中心近年發(fā)布的幾次統(tǒng)計(jì)報(bào)告也顯示,用戶(hù)對(duì)搜搜索引擎因其能提供較快捷準(zhǔn)確的檢索功能而索引擎性能感到非常滿(mǎn)意的比例為20%~30%,可成為當(dāng)前網(wǎng)絡(luò)用戶(hù)檢索信息的主要工具。據(jù)2008見(jiàn)搜索引擎仍有許多需改進(jìn)之處。統(tǒng)計(jì)顯示,用戶(hù)年1月發(fā)布的第21次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)在回答“檢索信息時(shí)遇到的最大問(wèn)題”時(shí),選擇“信息收稿日期:2008年9月22日作
8、者簡(jiǎn)介:高凱,男,1968年生,2007年畢業(yè)于上海交通大學(xué)電子信息與電氣工程學(xué)院計(jì)算機(jī)科學(xué)與工程系,博士,副教授,現(xiàn)主要從事網(wǎng)絡(luò)信息智能處理、信息檢索、自然語(yǔ)言處理等方面的研究