資源描述:
《隱私保護(hù)數(shù)據(jù)發(fā)布中身份保持的匿名方法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、萬方數(shù)據(jù)ISSN1000·9825,CODENRUXUEWJournalofSoftware,V01.21,No.4,April2010,PP.771—781doi:lO.3724/SEJ.1001.2010.03466@byInstituteofSoftware.theChineseAcademyofSciences.Allrightsreserved.隱私保護(hù)數(shù)據(jù)發(fā)布中身份保持的匿名方法幸童云海,陶有東+,唐世渭,楊冬青(機(jī)器感知與智能教育部重點(diǎn)實(shí)驗(yàn)室(北京大學(xué)),北京100871)Identity-ReservedAnonymityinP
2、rivacyPreservingDataPublishingTONGYun-Hai,TAOYou-Dong+,TANGShi-Wei,YANGDong-Qing噼eyLaboratoryofMachinePerceptionofMinistryofEducation(PekingUniversity),Beijing100871,China)+Correspondingauthor:E—mail:taoyd@plcll.edu.cnE—mail:jos@iscas.∞.cnhttp://www.jos.org.cnTbl腰ax:+86.10.6
3、2562563TongYH,TaoYD,TangSW,YangBQ.Identity—Reservedanonymityinprivacypreservingdatapublishing·JournalofSoftware,2010,21(4):771-781.http://www.jos.org.cn/1000—9825/3466.htmAbstract:Intheresearchofpfivacypreservingdatapublishing,thepresentmethodalwaysremovestheindividualidenti
4、ficationattributesandthenanonymizesthequasi-identifierattributes.Thispaperanalyzesthesituationofmultiplerecordsoneindividualandproposestheprincipleofidentity-reservedanonymity.Thismethodreservesmoreinformationwhilemaintainingtheindividualprivacy.Thegeneralizationandloss-join
5、approachesaredevelopedtomeetthisrequirement.Thealgorithmsareevaluatedinanexperimentalscenario,reservingmoreinformationanddemonstratingpracticalapplicabilityoftheapproaches.Keywords:privacypreservation;datapublishing;anonymity;identity-reserved;lossyjoin;generalization摘要:在隱私保
6、護(hù)的數(shù)據(jù)發(fā)布研究中,目前的方法通常都是先刪除身份標(biāo)識(shí)屬性,然后對準(zhǔn)標(biāo)識(shí)屬性進(jìn)行匿名處理.分析了單一個(gè)體對應(yīng)多個(gè)記錄的情況,提出了一種保持身份標(biāo)識(shí)屬性的匿名方法,它在保持隱私的同時(shí)進(jìn)一步提高了信息有效性.采用概化和有損連接兩種實(shí)現(xiàn)方式.實(shí)驗(yàn)結(jié)果表明,該方法提高了信息有效性,具有很好的實(shí)用性.關(guān)鍵詞:隱私保護(hù);數(shù)據(jù)發(fā)布;匿名;身份保持;有損連接;概化中圖法分類號:TP309文獻(xiàn)標(biāo)識(shí)碼:A當(dāng)今社會(huì),個(gè)人的信息記錄被不同的政府部門或者機(jī)構(gòu)廣泛地收集和分析.為了有利于數(shù)據(jù)分析,有些機(jī)構(gòu)會(huì)發(fā)布這些涉及到個(gè)人數(shù)據(jù)的信息.這些數(shù)據(jù)在發(fā)布時(shí),一方面要保護(hù)個(gè)人隱私
7、不被泄露,另一方面又要具備足夠的信息供分析使用.近年來,數(shù)據(jù)發(fā)布中的隱私保護(hù)方法從信息技術(shù)方面得到了進(jìn)一步廣泛的研究,并對隱私保護(hù)的程度和泄露都作了一定的定量研究.?dāng)?shù)據(jù)發(fā)布中的隱私保護(hù)試圖在保護(hù)個(gè)體隱私的同時(shí)保存更多的信息有效性,群匿名[1-3]是其中的核心思想.待發(fā)布的數(shù)據(jù)表通常包含3類屬性:(1)個(gè)體標(biāo)識(shí)屬性(individuallyidentifyingattribute,簡稱ID),包括可以顯式表明個(gè)體身份的屬性,比如姓名、身份證號碼和手機(jī)號碼.(2)準(zhǔn)標(biāo)識(shí)屬性(quasi.identifierattribute,簡稱QI),可以用于鏈
8、接攻擊的屬性,并可用于表明數(shù)據(jù)保護(hù)的程度,比如性別、年齡和郵政編碼.(3)敏感屬性(sensitive·SupposedbytheNationalNa