資源描述:
《基于schema的xml索引研究與實現(xiàn)》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、分類號學號642100200672280學校代碼10487密級碩士學位論文基于Schema的XML索引研究與實現(xiàn)學位申請人:陳興學科專業(yè):計算機軟件與理論指導教師:王元珍教授答辯日期:2008年6月6日AThesisSubmittedinPartialFulfillmentoftheRequirementsfortheDegreeofMasterofEngineeringResearchandImplementonXMLIndexBasedonSchemaCandidate:ChenXingMajor
2、:ComputerSoftwareandTheorySupervisor:Prof.WangYuanzhenHuazhongUniversityofScienceandTechnologyWuhan430074,P.R.ChinaJune,2008獨創(chuàng)性聲明本人聲明所呈交的學位論文是我個人在導師的指導下進行的研究工作及取得的研究成果。近我所知,除文中已標明引用的內容外,本論文不包含任何其他人或集體已經發(fā)表或撰寫過的研究成果。對本文的研究做出貢獻的個人和集體,均已在文中以明確方式標明。本人完全意識到本聲明的
3、法律結果由本人承擔。學位論文作者簽名:日期:學位論文版權使用授權書本學位論文作者完全了解學校有關保留、使用學位論文的規(guī)定,即:學校有權保留并向國家有關部門或機構送交論文的復印件和電子版,允許論文被查閱和借閱。本人授權華中科技大學可以將本學位論文的全部或部分內容編入有關數(shù)據庫進行檢索,可以采用影印、縮印或掃描等復制手段保存和匯編本學位論文。保密□,在______年解密后適用本授權數(shù)。本論文屬于不保密√。(請在以上方框內打“√”)學位論文作者簽名:日期:指導教師簽名:日期:摘要隨著可擴展標記語言XML應用的
4、普及,對XML文檔查詢的要求也就越來越高。如果不在XML文檔上建立索引結構,那么針對XML數(shù)據的任何查詢都很可能導致對整個文檔樹的遍歷,對于海量的XML文檔,這種遍歷所花費的開銷巨大。因此,建立高效索引、提高XML文檔的查詢效率成為近來研究的熱點。通過研究XML數(shù)據的特點,設計了一種基于Schema的XML索引方法。主要開展了四個方面的研究工作:節(jié)點編碼方法的設計、索引結構的設計和存儲、路徑查詢的實現(xiàn)及索引的維護。節(jié)點的編碼主要以現(xiàn)有的區(qū)間編碼方法為基礎,加以適當改進,增加了幾個新的字段,以支持XML文檔節(jié)
5、點的更新,為XML索引模型提供了編碼維護方案。以編碼方案為基礎,結合倒排索引和路徑索引的思想,為該索引設計了合理的數(shù)據結構,以及在關系數(shù)據庫系統(tǒng)中的存儲模式。為有效實現(xiàn)路徑查詢,以所設計的索引結構為基礎,擬定了XML數(shù)據庫各種查詢操作的步驟,主要包括Schema文檔的預處理和XML文檔結構匹配兩個階段,并提出了相應的結構連接算法。為了支持用戶更新XML文檔,提出的增加文檔的索引維護算法和刪除文檔的索引算法不僅實現(xiàn)了對XML文檔在數(shù)據庫中存儲的更新,還實現(xiàn)了對XML文檔本身的保持約束更新。在達夢XML系統(tǒng)的基
6、礎上,設計并實現(xiàn)了基于Schema的XML索引系統(tǒng),實驗結果表明,該索引方法能夠有效地提高XML的路徑查詢效率。關鍵詞:可擴展標記語言,編碼方式,索引,查詢IAbstractWiththerapiddevelopmentandwidespreaduseofXML,therequirementofXMLdocumentsQuerybecomehigherandstricter.WithouttheindexforXMLdocuments,anyqueryofXMLdatawillbesearchingthew
7、holeXMLtree,anditwillcostagreatamountoftime,moneyandenergy.Therefore,buildinganefficientindextoimprovetheeffectofXMLsearchingbecomesthekeypointofrecentresearch.WithstudyingthespecificsofXMLdata,theXMLindexismadeonthebasisofSchema.Mainlydividedintofourtasks
8、:designfornodecodingmethods、designandmemoryofindexconstruction、therealizationofpathqueryandthemaintenanceofindex.Nodecoding,mainlybasedontherangecoding,adaptstosomeinstanceandaddsseveralnewnumericfieldstosupp