資源描述:
《圖書領域deep+web查詢接口集成的研究》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、摘要摘要Web上的信息根據(jù)深度可以劃分為兩大類:DeepWeb和SurfaceWeb。DeepWeb中的信息比SurfaceWeb中的信息質量更高、信息量更大,為了有效地利用這些信息,需要建立DeepWeb數(shù)據(jù)集成系統(tǒng),而查詢接口集成則是DeepWeb數(shù)據(jù)集成的關鍵步驟。本文主要針對中文圖書領域DeepWeb數(shù)據(jù)集成中的查詢接口集成進行研究。英文領域的接口集成方法很難有效地應用到中文領域,而中文領域的接口集成方法也存在著集成的屬性類型不夠全面和匹配準確率較低等一些不足之處。本文針對以上問題對接口集成方法進行了深入研究,首先根據(jù)DeepWeb接口的結構將查詢接口分為4類,然后給出了接口的形式
2、化表示,在此基礎上提出了基于關鍵字、本體和中文語義相似度計算對屬性進行匹配的方法。該方法首先對待匹配的屬性進行關鍵字匹配,接著對沒有匹配到的屬性應用本體進行匹配,然后對于前兩個步驟都沒有匹配到的屬性應用改進的語義相似度計算進行匹配,最后把匹配成功的屬性集成在一起構成最終的統(tǒng)一查詢接口并進行相應的查詢映射。該方法應用于中文圖書領域的接口集成,集成的屬性較為全面,對結構化、半結構化、無結構化和可轉換的混合型查詢接口都適用。實驗結果表明該方法具有較高的匹配準確率。關鍵詞接口集成關鍵字匹配本體語義相似度計算IAbstractAbstractAccordingtothedepthofinformat
3、ionontheWeb,itcanbedividedintoDeepWebandSurfaceWeb.SincethequalityandquantityofinformationinDeepWebishigherandbiggerthanthatinSurfaceWeb,inordertoeffectivelyusetheseinformation,itisnecessarytoestablishDeepWebdataintegrationsystem.InterfaceintegrationisanimportanttaskforintegratingDeepWebresources.
4、ThispapermainlystudiesthequeryinterfaceintegrationinDeepWebdataintegration.ThemethodofinterfaceintegrationinEnglishareaisdifficulttoeffectivelyappliedintotheChinesearea;andthemethodinChineseareaalsohassomeshortages,including:theintegratedattributesarenotsufficient,theaccuracyrateofmatchingislowand
5、etc.Thispapercarriedoutdeepresearchontheinterfaceintegrationmethodinviewoftheaboveproblems.AccordingtothestructureofDeepWebinterfaces,queryinterfacesarecategorizedintofourcategoriesinthispaper,andwegiventheformalizedexpressionfortheseinterfaces.Basedonabovework,thispaperpresentsaDeepWebinterfacein
6、tegrationapproachbasedonkeywordmatching,ontologymatchingandsemanticsimilaritycomputing.Thekeywordmatchingisperformedfirstly,fortheattributeswhichdidnotbematchedwithkeywords,thematchingisperformedbytheontology,andthenutilizetheimprovedsemanticsimilarityformulatomatchtheattributesthatdidnotbematched
7、inthefirsttwosteps,atlastsuccessfullymatchingattributesconstructfinalqueryinterfaceandestablishedthequerymapping.ThispaperpresentsaDeepWebinterfaceintegrationapproachofChinesebooksarea.Theattributesintegratedbyth