微數(shù)據(jù)發(fā)布中提高匿名數(shù)據(jù)可用性的匿名化方法研究

微數(shù)據(jù)發(fā)布中提高匿名數(shù)據(jù)可用性的匿名化方法研究

ID:33620915

大?。?.39 MB

頁數(shù):60頁

時(shí)間:2019-02-27

微數(shù)據(jù)發(fā)布中提高匿名數(shù)據(jù)可用性的匿名化方法研究_第1頁
微數(shù)據(jù)發(fā)布中提高匿名數(shù)據(jù)可用性的匿名化方法研究_第2頁
微數(shù)據(jù)發(fā)布中提高匿名數(shù)據(jù)可用性的匿名化方法研究_第3頁
微數(shù)據(jù)發(fā)布中提高匿名數(shù)據(jù)可用性的匿名化方法研究_第4頁
微數(shù)據(jù)發(fā)布中提高匿名數(shù)據(jù)可用性的匿名化方法研究_第5頁
資源描述:

《微數(shù)據(jù)發(fā)布中提高匿名數(shù)據(jù)可用性的匿名化方法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、萬方數(shù)據(jù)ResearchonAnonymityMethodstoImprovetheDataUtilityofAnonymousDataforMicrodataPublishingThesisSubmittedtoZhejiangNormalUniversityinpartialfulfillmentoftherequirementforthedegreeofMasterofEngineeringMaYeling(ComputerSoftware&Theory)ThesisSupervisor:WangJ

2、iyiHanJianminMay,2014萬方數(shù)據(jù)微數(shù)據(jù)發(fā)布中提高匿名數(shù)據(jù)可用性的匿名化方法研究摘要llIIlllllllllllllllllqlllllUllllqllllllqlLlllllY2664102微數(shù)據(jù)在數(shù)據(jù)分析和科學(xué)研究等領(lǐng)域發(fā)揮著越來越重要的作用。因此,越來越多的組織機(jī)構(gòu)收集并共享微數(shù)據(jù),然而微數(shù)據(jù)的發(fā)布和共享會(huì)泄漏包含在數(shù)據(jù)中的隱私信息。因此,微數(shù)據(jù)發(fā)布中隱私保護(hù)問題近幾年來成為數(shù)據(jù)挖掘領(lǐng)域的研究熱點(diǎn)。目前在微數(shù)據(jù)發(fā)布的隱私保護(hù)領(lǐng)域中,匿名化技術(shù)是該領(lǐng)域中的主流方法,其主要思想是通過對(duì)

3、原始待發(fā)布數(shù)據(jù)的處理,減少個(gè)體身份被攻擊者唯一標(biāo)識(shí)的概率,從而實(shí)現(xiàn)個(gè)體的隱私保護(hù)。本文通過結(jié)合噪音技術(shù)、模糊粗糙集等領(lǐng)域知識(shí),對(duì)微數(shù)據(jù)發(fā)布中隱私保護(hù)在匿名數(shù)據(jù)可用性上進(jìn)行了研究,主要工作如下:(1)提出了將泛化和噪音技術(shù)相結(jié)合的隱私保護(hù)匿名化方法的研究。在現(xiàn)有的實(shí)現(xiàn)缸匿名模型的隱私保護(hù)方法中,泛化技術(shù)的應(yīng)用相當(dāng)廣泛。尤其是在數(shù)據(jù)分布均勻的狀況下,其數(shù)據(jù)匿名效果較好。但當(dāng)數(shù)據(jù)規(guī)模不是很大,分布不均勻的情況下,會(huì)出現(xiàn)數(shù)據(jù)泛化程度過大,匿名數(shù)據(jù)可用性過低的問題。針對(duì)這個(gè)缺陷,本文提出了噪音和泛化技術(shù)相結(jié)合的GN

4、匿名方法,該方法通過在泛化過程中添加噪音降低泛化程度;并提出噪音添加模型,保證添加噪音后的匿名數(shù)據(jù)中敏感屬性分布與原始數(shù)據(jù)基本不變;還提出了實(shí)現(xiàn)算法GN-Bottom.up算法,且實(shí)驗(yàn)證明GN方法比原始一般匿名方法能有效降低泛化的程度,提高數(shù)據(jù)的可用性。(2)提出了基于模糊粗糙集的加權(quán)聚類隱私保護(hù)方法的研究。在現(xiàn)有隱私保護(hù)方法產(chǎn)生的匿名數(shù)據(jù)中,普遍存在針對(duì)聚類應(yīng)用的可用性差問題。針對(duì)該問題,本文提出一種考慮屬性權(quán)重的隱私保護(hù)方法(FSRS)。其中通過基于模糊粗糙集的客觀權(quán)重分配方法,得到屬性權(quán)重以更好進(jìn)行

5、聚類泛化,達(dá)到提高數(shù)據(jù)聚類應(yīng)用的目的。本文還通過Weka中聚類效果分析驗(yàn)證該方法的有效性。(3)提出了基于粗糙集理論的匿名化方法的研究。在工作點(diǎn)二的研究基礎(chǔ)上,本文提出了一種改進(jìn)后考慮屬性權(quán)重的隱私保護(hù)方法(PBRS)。其中各個(gè)屬性的權(quán)重由粗糙集中系統(tǒng)屬性重要度定義的方法獲得。本文也通過Weka中聚類效果分析萬方數(shù)據(jù)摘要驗(yàn)證該方法的有效性。關(guān)鍵字:隱私保護(hù):肛匿名;噪音;模糊粗糙集;泛化Ⅱ萬方數(shù)據(jù)RESEARCHONANONYMITYM匝THODSTOIMPROVE唧DAI'AUTILITYOFANONY

6、MOUSDATAFORMICODAl-~PUBLISHINGABSTRACTMicrodataplayanincreasinglyimportantroleindataanalysisandscientificresearch.Therefore,manyorganizationsarecollectingandsharingmicrodata.However,publishingandsharingmicrodatawillputrisksonindividual’Sprivacy.Duetothisp

7、roblem,privacypreservationforpublishingmicrodatahasbecomeahottopicintheareaofdatamining.Atpresent,theanonymousmethod,foritssecurityandeffectiveness,becomesthehotspotamongtheorientedmicrodataprivacyprotectionmethods.Theanonymousmethodisanapproachofdataprep

8、rocessing,whosegoalistoreducetheprobabilitythatanattackeruniquelyidentifiestheindividualidentityinformation,SOastoprotecttheprivacyofindividuals.Incombinationwiththeknowledgeofnoisetechnologiesandfuzzyroughsets,this

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。