資源描述:
《面向數(shù)據(jù)流的差分隱私直方圖發(fā)布》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在學術論文-天天文庫。
1、學校代碼:10255學號:2131590面向數(shù)據(jù)流的差分隱私直方圖發(fā)布DIFFERENTIALPRIVATEHISTOGRAMPUBLICATIONFORDATASTREAM學科專業(yè):軟件工程作者:劉慧藝指導教師:夏小玲答辯日期:2016年1月東華大學計算機科學與技術學院2016年1月東華大學學位論文原創(chuàng)性聲明本人鄭重聲明:我恪守學術道德,崇尚嚴謹學風。所呈交的學位論文,是本人在導師的指導下,獨立進行研究工作所取得的成果。除文中已明確注明和引用的內(nèi)容外,本論文不包含任何其他個人或集體已經(jīng)發(fā)表或撰寫過的作品及成果的內(nèi)容。論文為本人親自撰寫,我對所寫的內(nèi)容負責,并完全意識到本聲明的法律結果由本人
2、承擔。學位論文作者簽名:日期:年月日東華大學學位論文版權使用授權書學位論文作者完全了解學校有關保留、使用學位論文的規(guī)定,同意學校保留并向國家有關部門或機構送交論文的復印件和電子版,允許論文被查閱或借閱。本人授權東華大學可以將本學位論文的全部或部分內(nèi)容編入有關數(shù)據(jù)庫進行檢索,可以采用影印、縮印或掃描等復制手段保存和匯編本學位論文。保密□,在年解密后適用本版權書。本學位論文屬于不保密□。學位論文作者簽名:指導教師簽名:日期:年月日日期:年月日面向數(shù)據(jù)流的差分隱私直方圖發(fā)布面向數(shù)據(jù)流的差分隱私直方圖發(fā)布摘要近年來,隨著信息化技術與互聯(lián)網(wǎng)技術的快速發(fā)展,在信息共享和信息傳播的過程中,用戶信息泄露的案
3、例時有發(fā)生,隱私保護引起人們的重視。在大數(shù)據(jù)信息化時代,數(shù)據(jù)需要共享,才可以更充分的發(fā)揮出數(shù)據(jù)潛在的價值。因此,個人、事業(yè)單位的隱私安全保護問題顯得日益重要。目前,差分隱私是一種嚴格的隱私保護模型,在很多領域中受到人們的關注與研究。差分隱私基于攻擊者具有最大化背景知識假設的條件,通過在原始數(shù)據(jù)集上添加少量的噪聲進行擾動,從而達到保護用戶隱私的目的,具有添加噪聲量少,信息泄露風險率低的優(yōu)點。現(xiàn)有的差分隱私發(fā)布技術主要是基于靜態(tài)數(shù)據(jù)集以及二進制流的數(shù)據(jù)集,相對于真實應用中數(shù)據(jù)以流數(shù)據(jù)形式到達,并且數(shù)據(jù)具有多樣性等特點,原有方法的實際操作性和針對性均不夠理想?;诖?,本文提出了一種高效、面向分布不
4、均勻的數(shù)值型數(shù)據(jù)流的差分隱私直方圖發(fā)布算法。本文首先對隱私與差分隱私的相關內(nèi)容進行詳細描述,闡述了數(shù)據(jù)流處理模型以及直方圖相關技術,并探究了云平臺下SparkStreaming框架的流處理與批處理技術;其次,提出了一種面向分布不均勻的數(shù)值型數(shù)據(jù)流的動態(tài)差分隱私直方圖發(fā)布算法DDPA。基于滑動窗口模型,利用相鄰兩個時間戳的數(shù)據(jù)集分布的相似性,動態(tài)合理分配隱私預算,使得每一個窗口的總預算不超過隱私預算?,并運用分組與合并策略,快速計算出局部最優(yōu)直方圖。通過將DDPA算法與同類算法進行對比,對其發(fā)布數(shù)據(jù)的可用性進行分析,實驗結果表明,DDPA算法是有效可行的;然后,基于Spark集群,運用Spar
5、kStreaming框架,對動態(tài)差分I面向數(shù)據(jù)流的差分隱私直方圖發(fā)布隱私直方圖發(fā)布算法DDPA中EMD相似度方法進行改進,使其能夠應用到分布式的Spark云計算平臺上,滿足大數(shù)據(jù)流分布式處理的需求。從大數(shù)據(jù)角度,基于Spark云平臺,結合SparkStreaming的流處理以及批處理性能,實現(xiàn)動態(tài)差分隱私直方圖發(fā)布技術。最后,通過對改進后的算法與同類算法進行對比,對其發(fā)布數(shù)據(jù)的可用性進行了分析。實驗結果表明,改進后的算法是有效、可行的。從大數(shù)據(jù)應用的角度,提高了流數(shù)據(jù)的差分隱私直方圖發(fā)布的實際應用價值,具有一定的參考意義。關鍵詞:數(shù)據(jù)流;差分隱私;直方圖發(fā)布;SparkStreamingII
6、面向數(shù)據(jù)流的差分隱私直方圖發(fā)布DIFFERENTIALPRIVATEHISTOGRAMPUBLICATIONFORDATASTREAMABSTRACTInrecentyears,withtherapiddevelopmentofinformationtechnologyandInternettechnology,andintheprocessingofinformationsharingandinformationdissemination,thecasesofuser’sinformationleakagehaveoccurred,whichmakepeoplepayattentionto
7、privacyprotection.Intheeraofbigdata,thedataneedstobeshared,whichcanbemorefullyplayoutthedata’spotentialvalue,andthereforetheprivacyprotectionofindividuals,enterprisesandinstitutionshasbecomingincreasinglyim