資源描述:
《一種基于xml數(shù)據(jù)流查詢算法的設(shè)計與實現(xiàn)》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、TP392公開分類號:____________密級:______________UDC:____________單位代碼:______________10127碩士學(xué)位論文論文題目:一種基于XML數(shù)據(jù)流查詢算法的設(shè)計與實現(xiàn)200802067學(xué)號:_________________________王虎作者:_________________________計算機應(yīng)用技術(shù)專業(yè)名稱:_________________________2011年6月17日內(nèi)蒙古科技大學(xué)碩士學(xué)位論文論文題目:一種基于XML數(shù)據(jù)流查詢算法的設(shè)計與實現(xiàn)作者:_______________________
2、__王虎指導(dǎo)教師:張曉琳教授單位:內(nèi)蒙古科技大學(xué)協(xié)助指導(dǎo)教師:單位:單位:論文提交日期:2011年6月17日學(xué)位授予單位:內(nèi)蒙古科技大學(xué)一種基于XML數(shù)據(jù)流查詢算法的設(shè)計與實現(xiàn)TheDesignandImplementationofDataStreamQueryAlgrorithmbasedonXML研究生姓名:王虎指導(dǎo)教師姓名:張曉琳內(nèi)蒙古科技大學(xué)信息工程學(xué)院包頭014010,中國Candidate:WangHuSupervisor:ZhangXiao-linSchoolofInformationEngineeringInnerMongoliaUniversityofS
3、cienceandTechnologyBaotou014010,P.R.CHINA獨創(chuàng)性說明本人鄭重聲明:所呈交的論文是我個人在導(dǎo)師指導(dǎo)下進行的研究工作及取得研究成果。盡我所知,除了文中特別加以標(biāo)注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫的研究成果,也不包含為獲得內(nèi)蒙古科技大學(xué)或其他教育機構(gòu)的學(xué)位或證書所使用過的材料。與我一同工作的同志對本研究所做的任何貢獻均已在論文中做了明確的說明并表示了謝意。簽名:___________日期:____________關(guān)于論文使用授權(quán)的說明本人完全了解內(nèi)蒙古科技大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī)定,即:學(xué)校有權(quán)保留送交論文的復(fù)印件,
4、允許論文被查閱和借閱;學(xué)??梢怨颊撐牡娜炕虿糠謨?nèi)容,可以采用影印、縮印或其他復(fù)制手段保存論文。(保密的論文在解密后應(yīng)遵循此規(guī)定)簽名:___________導(dǎo)師簽名:___________日期:____________內(nèi)蒙古科技大學(xué)碩士學(xué)位論文摘要隨著互聯(lián)網(wǎng)的迅猛普及,網(wǎng)絡(luò)在人們生活中所占的比重也越來越大,網(wǎng)絡(luò)中出現(xiàn)大量與XML數(shù)據(jù)流有關(guān)的應(yīng)用,比如網(wǎng)絡(luò)日志、股票分析、互聯(lián)網(wǎng)監(jiān)控、數(shù)據(jù)安全管理、位置信息、電子信息查詢等。以XML數(shù)據(jù)流為形式傳輸?shù)臄?shù)據(jù)有以下特點:數(shù)據(jù)量較大,而且不可預(yù)知;所有的數(shù)據(jù)都是在線到達,實時性高,并且無法確定其到達的順序。顯而易見,如果按照傳統(tǒng)
5、的數(shù)據(jù)管理方式進行處理將會非常困難而且浪費資源,因為傳統(tǒng)的數(shù)據(jù)管理方式中的數(shù)據(jù)都是可以預(yù)知的,所有的數(shù)據(jù)都是預(yù)先存儲的。近幾年,研究人員已經(jīng)提出很多種對于XML數(shù)據(jù)流的查詢算法,如TurboXPath和StreamTX算法等。但TurboXPath已被證明在遞歸調(diào)用時存在潛在的隱患,StreamTX對于處理Parent-Child(PC)關(guān)系的查詢時,會有很高的計算代價,在效率和靈活性上一直不能體現(xiàn)出令人滿意的性能,所以設(shè)計一種更有效的查詢算法成為了當(dāng)務(wù)之急。針對以上問題,提出一種XML數(shù)據(jù)流小枝匹配算法TwigPM,在處理可能具有復(fù)雜的遞歸、層次結(jié)構(gòu)的XML數(shù)據(jù)流時能通
6、過獲取查詢節(jié)點的結(jié)構(gòu)關(guān)系,進行有效的剪枝操作,節(jié)省了存儲數(shù)據(jù)所占用的內(nèi)存空間,避免了匹配的過程中可能產(chǎn)生的大量中間結(jié)果。算法功能分為兩部分,第一部分得到查詢樹各節(jié)點的結(jié)構(gòu)關(guān)系(包括父親-孩子關(guān)系和祖先-后代關(guān)系),并將不同性質(zhì)的節(jié)點進行分類;第二部分是剪枝和匹配過程。對于先后到達的元素事件,根據(jù)第一部分的節(jié)點分類對進行剪枝操作,移除一定不會存在于最終結(jié)果中的節(jié)點元素,并且在每個與查詢根節(jié)點對應(yīng)的End事件到達時進行匹配操作,得到匹配結(jié)果。根據(jù)提出的算法進行了性能測試,實驗結(jié)果表明,TwigPM算法是高效的,尤其在處理存在父親-孩子關(guān)系的查詢時,能有效避免無關(guān)匹配,提高了查
7、詢效率。關(guān)鍵詞:XML數(shù)據(jù)流;XPath;XQuery;小枝匹配I內(nèi)蒙古科技大學(xué)碩士學(xué)位論文AbstractWiththerapidpopularizationofInternet,theproportionofnetworkinpeople'slivesisalsogrowing.TherehavebeenalargenumberofapplicationsaboutXMLdatastream,suchasblogs,stockanalysis,networkmonitoringdatasecuritymanagement,