資源描述:
《deep+web查詢接口及查詢結(jié)果抽取研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、中論由學(xué)答南開大學(xué)學(xué)位論文使用授權(quán)書根據(jù)《南開大學(xué)關(guān)于研究生學(xué)位論文收藏和利用管理辦法》,我校的博士、碩士學(xué)位獲得者均須向南開大學(xué)提交本人的學(xué)位論文紙質(zhì)本及相應(yīng)電子版。本人完全了解南開大學(xué)有關(guān)研究生學(xué)位論文收藏和利用的管理規(guī)定。南開大學(xué)擁有在《著作權(quán)法》規(guī)定范圍內(nèi)的學(xué)位論文使用權(quán),即:(1)學(xué)位獲得者必須按規(guī)定提交學(xué)位論文(包括紙質(zhì)印刷本及電子版),學(xué)??梢圆捎糜坝?、縮印或其他復(fù)制手段保存研究生學(xué)位論文,并編入《南開大學(xué)博碩士學(xué)位論文全文數(shù)據(jù)庫》;(2)為教學(xué)和科研目的,學(xué)??梢詫⒐_的學(xué)位論文作為
2、資料在圖jf5館等場所提供校內(nèi)師生閱讀,在校園網(wǎng)上提供論文目錄檢索、文摘以及論文全文瀏覽、下載等免費(fèi)信息服務(wù);(3)根據(jù)教育部有關(guān)規(guī)定,南開大學(xué)向教育部指定單位提交公開的學(xué)位論文;(4)學(xué)位論文作者授權(quán)學(xué)校向中國科技信息研究所和中國學(xué)術(shù)期刊(光盤)電子出版社提交規(guī)定范圍的學(xué)位論文及其電子版并收入相應(yīng)學(xué)位論文數(shù)據(jù)庫,通過其相關(guān)網(wǎng)站對外進(jìn)行信息服務(wù)。同時(shí)本人保留在其他媒體發(fā)表論文的權(quán)利。非公開學(xué)位論文,保密期限內(nèi)不向外提交和提供服務(wù),解密后提交和服務(wù)同公開論文。論文電子版提交至校圖}5館網(wǎng)站:http:
3、#202.113.20.161:8001/index.htm。本人承諾:本人的學(xué)位論文是在南開大學(xué)學(xué)習(xí)期間創(chuàng)作完成的作品,并已通過論文答辯;提交的學(xué)位論文電子版與紙質(zhì)本論文的內(nèi)容一致,如因不同造成不良后果由本人自負(fù)。本人同意遵守上述規(guī)定。本授權(quán)書簽署一式兩份,由研究生院和圖}S館留存。作者暨授權(quán)人簽字:籃萱邀2010年5月25日南開大學(xué)研究生學(xué)位論文作者信息論文題目DeepWeb查詢接口及查詢結(jié)果抽取研究姓名張慧斌學(xué)號(hào)1120070132答辯日期2010年5月24日論文類別博士■學(xué)歷碩士口碩+專業(yè)學(xué)
4、位口高校教師口同等學(xué)力碩士口院/系/所信息技術(shù)科學(xué)學(xué)院專業(yè)計(jì)算機(jī)應(yīng)用技術(shù)聯(lián)系電話13466386878Emailzhanghuibin@126.com通信地址(郵編):天津市南開人學(xué)西區(qū)公寓:‘8A一7—103(300091)備注:是否批準(zhǔn)為非公開論文否注:本授權(quán)書適用我校授予的所有博士、碩士的學(xué)位論文。由作者填寫(一式兩份)簽字后交校圖書館,非公開學(xué)位論文須附《南開大學(xué)研究生申請非公開學(xué)位論文審批表》。南開大學(xué)學(xué)位論文原創(chuàng)性聲明㈣㈣㈣刪舢Y184§{甘:;;;I本人鄭重聲明:所呈交的學(xué)位論文,是本
5、人在導(dǎo)師指導(dǎo)下進(jìn)行研究工作所取得的研究成果。除文中已經(jīng)注明引用的內(nèi)容外,本學(xué)位論文的研究成果不包含任何他人創(chuàng)作的、己公開發(fā)表或者沒有公開發(fā)表的作品的內(nèi)容。對本論文所涉及的研究工作做出貢獻(xiàn)的其他個(gè)人和集體,均己在文中以明確方式標(biāo)明。本學(xué)位論文原創(chuàng)性聲明的法律責(zé)任由本人承擔(dān)。學(xué)位論文作者簽名:韭慧速2010年5月25日非公開學(xué)位論文標(biāo)注說明根據(jù)南開大學(xué)有關(guān)規(guī)定,非公丌學(xué)位論文須經(jīng)指導(dǎo)教師同意、作者本人申請和相關(guān)部門批準(zhǔn)方能標(biāo)注。未經(jīng)批準(zhǔn)的均為公開學(xué)位論文,公開學(xué)位論文本說明為空白。論文題目申請密級口限制
6、(≤2年)口秘密(≤10年)口機(jī)密(≤20年)保密期限20年月日至20年月日審批表編號(hào)批準(zhǔn)日期20年月日限制★2年(最長2年,可少于2年)秘密★10年(最長5年,可少于5年)機(jī)密★20年(最長10年,可少于10年)摘要隨著互聯(lián)網(wǎng)的迅速發(fā)展,Web中出現(xiàn)了大量可訪問的在線數(shù)據(jù)庫,其中蘊(yùn)含著豐富的信息,稱為DeepWeb信息。由于包含這些信息的頁面是DeepWeb網(wǎng)站根據(jù)用戶在查詢接口上提交查詢動(dòng)態(tài)生成的,因此傳統(tǒng)搜索引擎無法索引這些頁面。為了使用戶能高效快捷的訪問DeepWeb信息,DeepW曲數(shù)據(jù)集
7、成成為目前信息檢索領(lǐng)域一個(gè)亟待解決的問題,是目前研究的熱點(diǎn)。DeepWeb查詢接口的理解是DeepW
8、eb數(shù)據(jù)集成中的一個(gè)關(guān)鍵問題,本文在深入分析DeepW曲數(shù)據(jù)集成研究現(xiàn)狀的基礎(chǔ)上,對DeepW曲查詢接口相關(guān)的若干關(guān)鍵技術(shù)進(jìn)行了深入的研究,包括DeepWeb查詢接121領(lǐng)域模型的提出,DeepWeb查詢接口的發(fā)現(xiàn)、模式抽取和基于查詢實(shí)例的查詢結(jié)果抽取與標(biāo)注等內(nèi)容。具體的創(chuàng)新和貢獻(xiàn)如下:●提出了DeepWeb查詢接口領(lǐng)域模型DomainModel。在對DeepW曲查詢接口研究的基礎(chǔ)上,提出了領(lǐng)域模型
9、,它包含了同一領(lǐng)域中所有查詢接口的模式信息。從理論上分析了領(lǐng)域模型構(gòu)建的可行性,并給出了構(gòu)建方法和存儲(chǔ)方案。分析了領(lǐng)域模型在DeepWeb數(shù)據(jù)集成框架中的作用,基于領(lǐng)域模型為DeepWeb數(shù)據(jù)集成中的若干問題提出了新的解決方法,為突破集成框架的整體性能瓶頸提供了可能?!裉岢隽艘环NDeepW曲查詢接口發(fā)現(xiàn)方法PostClassifier。該方法通過對接口進(jìn)行查詢提交,根據(jù)返回結(jié)果頁面特征判定接口類型,屬于Post.Query方法。PostClassifier首先借助Pr