資源描述:
《外包數(shù)據(jù)挖掘隱私保護(hù)算法研究和改進(jìn)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、上海交通大學(xué)碩士學(xué)位論文外包數(shù)據(jù)挖掘隱私保護(hù)算法研究和改進(jìn)姓名:任靜涵申請(qǐng)學(xué)位級(jí)別:碩士專業(yè):通信與信息系統(tǒng)指導(dǎo)教師:陳曉樺;張保穩(wěn)20090101上海交通大學(xué)碩士學(xué)位論文中文摘要外包數(shù)據(jù)挖掘隱私保護(hù)算法研究和改進(jìn)摘要數(shù)據(jù)挖掘旨在研究從大量的數(shù)據(jù)集合中,發(fā)掘出潛在的、有價(jià)值的信息或知識(shí)的過程,在商業(yè)決策、潛在客戶分析等方面可以給企業(yè)帶來巨大商業(yè)利益。但其對(duì)軟、硬件資源有著較高要求,所以在具體實(shí)踐中,大多數(shù)中小型企業(yè)或組織由于內(nèi)部缺少必要的資源和專家,阻礙了其獲得數(shù)據(jù)挖掘所帶來的商業(yè)利益。此時(shí),外包數(shù)據(jù)挖掘是一種很好的解決方式。然而,這必將涉及到信息安全與
2、隱私保護(hù)問題。因此,作為數(shù)據(jù)挖掘一個(gè)新的分支,隱私保護(hù)數(shù)據(jù)挖掘技術(shù)研究變得越來越重要,特別是對(duì)外包數(shù)據(jù)挖掘中隱私保護(hù)技術(shù)的研究具有顯著的實(shí)際意義。本文首先對(duì)PPDM技術(shù)的原理進(jìn)行了深入分析,并從基本流程上比較了它與數(shù)據(jù)挖掘的異同,并且對(duì)典型PPDM技術(shù)進(jìn)行總結(jié),并指出它們?cè)诟黝愅诰蛩惴ㄖ械膽?yīng)用。其次,與一般PPDM技術(shù)不同,外包數(shù)據(jù)挖掘?qū)﹄[私保護(hù)技術(shù)有著特殊的要求,本文對(duì)外包數(shù)據(jù)挖掘和其隱私保護(hù)技術(shù)進(jìn)行研究,并提出了基于隱私保護(hù)的外包數(shù)據(jù)挖掘項(xiàng)目基本流程。最后,本文進(jìn)一步對(duì)外包聚類挖掘和外包關(guān)聯(lián)規(guī)則挖掘進(jìn)行深入研究。在保證安全性和準(zhǔn)確性的前提下,提出了外
3、包聚類挖掘隱私保護(hù)技術(shù)的設(shè)計(jì),完成了對(duì)現(xiàn)存三種外包關(guān)聯(lián)規(guī)則隱私保護(hù)算法的分析,并且根據(jù)PPDM算法的評(píng)價(jià)標(biāo)準(zhǔn),改進(jìn)了其中的不確定一對(duì)多替換加密算法。本文設(shè)計(jì)的快速替換加密算法與原始算法相比,獲得更高的變換效率,同時(shí)仍然保證了有效性和安全性,更適于實(shí)際應(yīng)用。關(guān)鍵詞:外包數(shù)據(jù)挖掘,隱私保護(hù),外包聚類,外包關(guān)聯(lián)規(guī)則挖掘–I–上海交通大學(xué)碩士學(xué)位論文英文摘要PRIVACYPRESERVINGALGORITHMRESEARCHANDIMPROVEMENTOFOUTSOURCINGDATAMININGABSTRACTDataminingfocusesonfindin
4、gunknownvaluableinformationandknowledgefromahugemountofdatasets,whichbenefitsenterprisesoncommercialdecision,potentialcostumeranalysisandetc.However,ithashighrequirementsonsoftwareandhardwareresources.Sothemajorityofsmallandmedium-sizedenterprisesandorganizationsarepracticallyhin
5、deredfromcommercialinterestsbroughtbydatamining,duetothelackofthenecessaryinternalresourcesandexperts.Thenoutsourcingdataminingispresentedasagoodsolution.However,dataconfidentialityandprivacyhavebeenincreasinglyrecognizedasanimportantaspectofoutsourcingtask.Consequently,privacypr
6、eservingdatamining(PPDM)asanewbranchofdataminingisbecomingmoreandmoreimportant,especiallyprivacypreservingtechniquesinoutsourcingdataminingisofsignificantpracticalimportance.ThispaperfirstlyprovidedadeepinsightintotheprinciplesofPPDMandmarkedoutthedifferencebetweenPPDMandnormalDM
7、inthegeneralprocess.Next,typicalPPDMtechniqueswerereviewedandanalyzed,andtheapplicationsofthesetechniquesinseveralminingalgorithmsareshownaswell.Second,differentfromthegeneralPPDMtechniques,privacypreservinginoutsourcingdatamininghasspecialrequirements.Thispaperdidaresearchonitan
8、dpointedoutbasicprocessesofoutsourcingda