資源描述:
《基于存儲(chǔ)優(yōu)化模型的rdf數(shù)據(jù)查詢(xún)機(jī)制研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、華中科技大學(xué)碩士學(xué)位論文基于存儲(chǔ)優(yōu)化模型的RDF數(shù)據(jù)查詢(xún)機(jī)制研究姓名:吳德龍申請(qǐng)學(xué)位級(jí)別:碩士專(zhuān)業(yè):計(jì)算機(jī)應(yīng)用技術(shù)指導(dǎo)教師:趙峰2011-01-16華中科技大學(xué)碩士學(xué)位論文摘要傳統(tǒng)的對(duì)RDF(ResourceDescriptionFramework)數(shù)據(jù)存儲(chǔ)的方法主要采用基于關(guān)系數(shù)據(jù)庫(kù)方式的三元組表,但由于RDF數(shù)據(jù)的稀疏性特點(diǎn),使得這種存儲(chǔ)方式的存儲(chǔ)空間利用率和查詢(xún)效率都不高。因此有研究提出了存儲(chǔ)模型的優(yōu)化方法,這些優(yōu)化方法主要基于對(duì)三元組本身的優(yōu)化存儲(chǔ),沒(méi)有考慮使用模式空間的信息對(duì)存儲(chǔ)模型進(jìn)行優(yōu)化。SPARQL(Simple
2、ProtocolandQueryLanguage)是萬(wàn)維網(wǎng)聯(lián)盟推薦的RDF數(shù)據(jù)查詢(xún)語(yǔ)言,如何在特定的存儲(chǔ)模型上高效地支持SPARQL查詢(xún)逐漸成為研究的熱點(diǎn)?;趦?nèi)存的RDF數(shù)據(jù)存儲(chǔ)和查詢(xún)系統(tǒng)DBLinkQL能夠?qū)崿F(xiàn)高效的SPARQL查詢(xún)。DBLinkQL首先建立高效的字符串與整形標(biāo)識(shí)符的映射模塊,統(tǒng)一將三元組的字符串形式轉(zhuǎn)化為整形標(biāo)識(shí)符來(lái)表示,提高存儲(chǔ)空間的利用率和查詢(xún)的效率;其次DBLinkQL提取RDF的模式空間文件中的特定詞匯,對(duì)這些詞匯進(jìn)行分類(lèi),結(jié)合垂直分割的思想,對(duì)存儲(chǔ)結(jié)構(gòu)進(jìn)行多種形式的優(yōu)化,進(jìn)一步的優(yōu)化了查詢(xún)的效率。
3、DBLinkQL支持了多種規(guī)范描述的RDF數(shù)據(jù)的導(dǎo)入,并可以將存儲(chǔ)模型映射到磁盤(pán)中,可以實(shí)現(xiàn)內(nèi)存存儲(chǔ)模型的快速重現(xiàn)。DBLinkQL通過(guò)對(duì)SPARQL查詢(xún)進(jìn)行轉(zhuǎn)換和處理,形成底層存儲(chǔ)模型可操作的查詢(xún)圖模型,SPARQL查詢(xún)系統(tǒng)對(duì)各種查詢(xún)操作情況進(jìn)行了處理,實(shí)現(xiàn)了部分支持了SPARQL查詢(xún)語(yǔ)言;通過(guò)對(duì)底層存儲(chǔ)數(shù)據(jù)進(jìn)行統(tǒng)計(jì),建立了查詢(xún)連接操作的代價(jià)模型,并使用貪婪算法實(shí)現(xiàn)了SPARQL查詢(xún)的優(yōu)化模塊,對(duì)查詢(xún)的先后順序進(jìn)行了調(diào)整,提高了查詢(xún)的性能。通過(guò)對(duì)查詢(xún)優(yōu)化模塊進(jìn)行測(cè)試,DBLinkQL存儲(chǔ)系統(tǒng)的SPARQL查詢(xún)優(yōu)化模塊對(duì)查詢(xún)性能
4、有較大的提高。性能測(cè)試表明,DBLinkQL的查詢(xún)平均性能相比JenaMemory和RDF-3X要好。關(guān)鍵詞:資源描述框架,存儲(chǔ)模型優(yōu)化,RDF數(shù)據(jù)查詢(xún)語(yǔ)言,查詢(xún)優(yōu)化I華中科技大學(xué)碩士學(xué)位論文AbstractTraditionalRDF(ResourceDescriptionFramework)storagesystemsuserelationaldatabasesystemtomanageRDFdatausingatripletable,butduetothesparsecharacteristicofRDFdata,thos
5、estoragesystemsdidnotshowefficientstorageusageandhighqueryperformance.Thus,somestorageoptimizationmethodsareproposed,buttheydonotuseschemainformationtooptimizethestoragemodel.SPARQL(SimpleProtocolandQueryLanguage)isaWorldWideWebConsortiumrecommendedRDFquerylanguage,h
6、owtoefficientlysupportSPARQLqueriesinaparticularstoragemodelbecomesaresearchhotspot.DBLinkQLisamemorybasedRDFdatastoragesystemthatdesignedforefficientlySPARQLquery.Inordertomakestorageefficiencyandhighqueryperformance,firstlyDBLinkQLbuildsthestringandintegeridentifie
7、rmappingmodulethatcantransferstringsintointegeridentifiersandviceversa;secondlyDBLinkQLextractsspecialvocabulariesfromRDFschemaspacefile,classifiesthevocabulariesintodifferentsetsandutilizestheverticalpartitionapproachtodomultipleoptimizationthatimprovingthequeryperf
8、ormance.DBLinkQLsupportsavarietyofspecificationsdescribedRDFdataimportedintostoragemodelwhichcanbemappedintodiskimage,fromwhichthem