基于學(xué)習(xí)的分布式局部敏感哈希算法研究

基于學(xué)習(xí)的分布式局部敏感哈希算法研究

ID:35063808

大小:6.02 MB

頁數(shù):58頁

時間:2019-03-17

基于學(xué)習(xí)的分布式局部敏感哈希算法研究_第1頁
基于學(xué)習(xí)的分布式局部敏感哈希算法研究_第2頁
基于學(xué)習(xí)的分布式局部敏感哈希算法研究_第3頁
基于學(xué)習(xí)的分布式局部敏感哈希算法研究_第4頁
基于學(xué)習(xí)的分布式局部敏感哈希算法研究_第5頁
資源描述:

《基于學(xué)習(xí)的分布式局部敏感哈希算法研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、分類號:密級05111UDC:單位代碼?乂是洛事乂拿全日制應(yīng)用型碩±研究生學(xué)位論文基于學(xué)習(xí)的分布式局部敏感哈希算法研究劉暢指導(dǎo)教師曲雲(yún)錦教授企業(yè)導(dǎo)師馮冰高級工程師申請學(xué)位類別工程碩±工程領(lǐng)域計(jì)算機(jī)技術(shù)學(xué)位授予單位大連海事大學(xué)2016年6月分類號密級UDC10151單位代碼大連海事大學(xué)工程碩±學(xué)位論文基于學(xué)習(xí)的分布式局部敏感哈希算法研巧(學(xué)位論文形式;應(yīng)用研究)劉暢指導(dǎo)教師曲委続職稱教授企業(yè)導(dǎo)師馮冰職稱商級工程師學(xué)位授予單位大連海事大學(xué)申請學(xué)位

2、級別工程碩±工程領(lǐng)域計(jì)算機(jī)技術(shù)論文完成日期2016年6月答辯日期20化年6月答辯委員會主席Learn-litingBasedDistributedLocaySensitiveHashingA化份isSubmitted化DalianMaritimeUniversityInartialfulfillmentofthereuirementsforthedereeofpqgMasterofEnineeringgbyChanLiugComuterTechnolo(pgy)ThesisSuervisorr

3、ProfessorWenuQupyJTune2016大連海事大學(xué)學(xué)位論文原創(chuàng)性聲明和使用授權(quán)說明原創(chuàng)巧聲明本人鄭重聲明:本論文是在導(dǎo)師的指導(dǎo)下獨(dú)立進(jìn)行研究工作所取得的成果,撰寫""成碩±學(xué)位論文基于學(xué)習(xí)的分布式局部敏感哈希算法研究。除論文中已經(jīng)注明引用的內(nèi)容外,對論文的研究做出重要貢獻(xiàn)的個人和集體,均己在文中明確方式標(biāo)明。本論文中不包含任何未加明確注明的其他個人或集體己經(jīng)公開發(fā)表或未公開發(fā)表的成果。本聲明的法律責(zé)任由本人承擔(dān)。學(xué)位論文作者簽名;學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者及指導(dǎo)教師完全了解大連海事大學(xué)有關(guān)保留、使用研究生學(xué)位論文的

4、規(guī)定,艮P:大連海事大學(xué)有權(quán)保留并向國家有關(guān)部口或機(jī)構(gòu)送交學(xué)位論文的復(fù)?。崳娂碗娮影妫试S論文被査閱和借閱。本人授權(quán)大連海事太學(xué)可W將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,也可采用影印、縮印或掃描等復(fù)制手段保存和匯編學(xué)位論文。同意將本學(xué)位論文收錄到《中國優(yōu)秀博碩±學(xué)位論文全文數(shù)據(jù)庫》(中國學(xué)術(shù)期刊(光盤版》()電子雜志社)、《中國學(xué)位論文全文數(shù)據(jù)庫中國科學(xué)技術(shù)信息研巧所)等數(shù)據(jù)庫中,并W電子出版物形式出版發(fā)行和提供信息服務(wù)。保密的論文在解密后遵守此規(guī)定。本學(xué)位論文屬于:保密□在年解密后適用本授權(quán)書。/""不保額方(請?jiān)冢咨戏娇騼?nèi)打V)論文儲簽

5、導(dǎo)師簽名:日親年0日t月心中文摘要摘要隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,網(wǎng)絡(luò)中充斥著各種各樣的海量高維數(shù)據(jù),在此數(shù)據(jù)中搜索目標(biāo)數(shù)據(jù)也隨之變得耗時和低效。為解決上述問風(fēng)近似近鄰搜索的、、概念及各種算法被陸續(xù)提出,并成為機(jī)器學(xué)習(xí)數(shù)據(jù)挖掘模式識別等多種應(yīng)用中的一類基本算法,而局部敏感哈希算法被證明是解決髙維空間近鄰捜索的最有效算法之一。在處理大數(shù)據(jù)問題上,基于kevalue的分布式結(jié)構(gòu)被越來越廣泛的采用,如(y,)經(jīng)典的并行編程框架MapReduce、TwiterStorm和Spark等。結(jié)合(key,value)結(jié)構(gòu),對經(jīng)典局部敏感哈希算法進(jìn)行分布

6、式化,是近期的研巧熱點(diǎn)。為了保證查詢精度,需要建立大量的哈希表,這無疑將占用不少內(nèi)存空間,尤其是在處理高維數(shù)據(jù)的場合。同化在分布式背景下,由于哈希桶位于不同的節(jié)庶在不同的哈希桶進(jìn)行查。詢就會產(chǎn)生多次網(wǎng)絡(luò)調(diào)用,從而導(dǎo)致大量的網(wǎng)絡(luò)傳輸為了減少內(nèi)存占用和網(wǎng)絡(luò)調(diào)度費(fèi)用,LaeredLSH給出了采用0片個哈希表的分布式局部敏感哈希方案。不過y),研巧中發(fā)現(xiàn)會降低查詢的精度。一keva本文嘗試設(shè)計(jì)了種將學(xué)習(xí)算法應(yīng)用在基于(ylue的分布式結(jié)構(gòu),且在該,)索引基礎(chǔ)上進(jìn)行了基于MapReduce的空間近鄰查詢實(shí)現(xiàn)。本文的主要工作如下:(1)LB-LSHEntroL細(xì)的分布k

7、value提出了查詢精度更髙的算法,改進(jìn)了e型。py式(y,)模aeredLSH機(jī)-巧類似于Ly制,LBLSH在采用01個哈希表的情況下保證了查詢()精度3adoo-L細(xì),大大減少了網(wǎng)絡(luò)傳輸和頻繁的I/O。()在Hp平臺上實(shí)現(xiàn)了LB,一些哈希算法大量的實(shí)驗(yàn)結(jié)果顯示,該算法優(yōu)于當(dāng)前所采用的。>關(guān)11^1educe!巧維^/^;局部£<8&#;MapR英文摘要ABSTRAC

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。