分布式RDF數(shù)據(jù)處理架構(gòu)研究

分布式RDF數(shù)據(jù)處理架構(gòu)研究

ID:37022518

大?。?.64 MB

頁數(shù):53頁

時(shí)間:2019-05-16

分布式RDF數(shù)據(jù)處理架構(gòu)研究_第1頁
分布式RDF數(shù)據(jù)處理架構(gòu)研究_第2頁
分布式RDF數(shù)據(jù)處理架構(gòu)研究_第3頁
分布式RDF數(shù)據(jù)處理架構(gòu)研究_第4頁
分布式RDF數(shù)據(jù)處理架構(gòu)研究_第5頁
資源描述:

《分布式RDF數(shù)據(jù)處理架構(gòu)研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、分布式RDF數(shù)據(jù)處理架構(gòu)研究TheResearchofDistributedRDFDataProcessingArchitecture工程領(lǐng)域:計(jì)算機(jī)技術(shù)作者姓名:馮佳穎指導(dǎo)教師:馮志勇教授企業(yè)導(dǎo)師:郭曉和正高工天津大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院二零一七年十一月摘要資源描述框架(resourcedescriptionframework,RDF)作為語義網(wǎng)提出的數(shù)據(jù)規(guī)范,現(xiàn)已在生活中得到了廣泛應(yīng)用,這導(dǎo)致RDF數(shù)據(jù)量暴增。雖然當(dāng)前的分布式RDF數(shù)據(jù)處理架構(gòu)能滿足SPARQL查詢的要求,但局限于改進(jìn)存儲(chǔ)結(jié)構(gòu)和索引

2、結(jié)構(gòu)等方面,高效地執(zhí)行RDF查詢?nèi)允乾F(xiàn)階段研究的重點(diǎn)和難點(diǎn)。本文分析了大量分布式RDF數(shù)據(jù)處理系統(tǒng),從架構(gòu)的角度對(duì)分布式SPARQL查詢技術(shù)進(jìn)行綜合的分析,并針對(duì)RDF數(shù)據(jù)的存儲(chǔ)方法和SPARQL查詢策略這兩個(gè)影響性能的關(guān)鍵因素進(jìn)行定義和詳細(xì)分類。最后,通過實(shí)驗(yàn)分析對(duì)主流的引擎性能的影響進(jìn)行定量分析。基于實(shí)驗(yàn)結(jié)果,總結(jié)分布式RDF數(shù)據(jù)處理系統(tǒng)所面臨的挑戰(zhàn)和可能解決方案。結(jié)合上述分析,分布式RDF數(shù)據(jù)處理系統(tǒng)仍存在可改進(jìn)的空間。而且,從硬件角度來看,現(xiàn)有SPARQL查詢的方法均依賴于CPU的計(jì)算能力。近年

3、來,圖像處理單元(graphicprocessingunits,GPU)的發(fā)展提高了圖數(shù)據(jù)處理的性能。與CPU相比,GPU多處理器具有高并發(fā)、易擴(kuò)展以及價(jià)格成本低等優(yōu)勢(shì)。由于CPU處理大規(guī)模RDF數(shù)據(jù)的計(jì)算能力有限,本文考慮使用GPU作為系統(tǒng)計(jì)算能力的補(bǔ)充。本文提出了基于GPU的RDF查詢處理引擎——MapSQ。該系統(tǒng)創(chuàng)新的提出三個(gè)模塊:查詢分割器、基于GPU的MapReduce并行計(jì)算模板和計(jì)算CPU和GPU的資源管理,以減少SPAQRL查詢的響應(yīng)時(shí)間,并在基準(zhǔn)數(shù)據(jù)集LUBM上對(duì)該算法進(jìn)行性能測試,實(shí)

4、驗(yàn)結(jié)果表明該算法顯著優(yōu)于基于CPU架構(gòu)的算法。綜上所述,本文對(duì)于查詢效率低下的現(xiàn)狀,設(shè)計(jì)了基于MapReduce的GPU設(shè)計(jì)了分布式RDF數(shù)據(jù)查詢系統(tǒng)。該系統(tǒng)通過新硬件的加速,大大的提高了系統(tǒng)性能。對(duì)RDF數(shù)據(jù)處理系統(tǒng)中使用硬件加速處理提出了新的嘗試。關(guān)鍵詞:資源描述框架,SPARQL查詢處理,圖像處理單元,MapReduceIABSTRACTRDF(resourcedescriptionframework)describesresourcesandtherelationshipsofthemonthe

5、semanticWeb,whichhasbeenwidelyusedinlife.WiththevolumeofRDFdatarapidlyincreasing,ahighperformancemethodisnecessarytoefficientlyprocessingSPAQRL(simpleprotocolandRDFquerylanguage)queryoverRDFdata.ThispaperanalyzesalargenumberofdistributedRDFdataprocessing

6、engine,andbasedontheanalysisresultsproposedqueryperformanceoptimizationstrategy.WesurveycurrentparallelprocessingapproachesforSPARQLqueriesinRDFdata.Thispaperresearchtheenginesfromthreeaspects:systemarchitectures,RDFdatastoragemanagement,andSPARQLqueryex

7、ecutivestrategies.Weclassifythosearchitectures,respectively.Combiningtheaboveanalyze,mostexistingapproacheshavebeenproposedtoprocessingRDFdata,whichmostlydependoncalculativecapabilitiesofCPU.Inrecentyears,GPU(graphicprocessingunits)hasbeenadoptedtoaccele

8、rategraphdataprocessingwidelyinseveralworks,whichhavebettercomputationalperformance,superiorscalability,andmorereasonableprices.DuetothelimitedcomputationalpowerofCPUsforhandlinglarge-scaleRDFdata,thisarticleconsiderstheus

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。