資源描述:
《數(shù)據(jù)挖掘與個人信息隱私保護》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、數(shù)據(jù)挖掘與個人信息隱私保護陰紅志?摘要:本文介紹了數(shù)據(jù)挖掘、商業(yè)智能和個人信息隱私權(quán),并結(jié)合案例分析了在利用數(shù)據(jù)挖掘技術(shù)分析個人信息時,會侵害個人信息隱私權(quán)。針對這個問題,本文從法律、行業(yè)自律和技術(shù)三個角度概述和分析了解決該問題的基本方法。關(guān)鍵詞:數(shù)據(jù)挖掘數(shù)據(jù)倉儲個人信息隱私信息道德引言隨著計算機應(yīng)用技術(shù)的快速發(fā)展,令各行各業(yè)收集數(shù)據(jù)的能力大大提升,隨之也帶來了"數(shù)據(jù)爆炸"現(xiàn)象。如何將這些海量的數(shù)據(jù)存儲與分析,轉(zhuǎn)換成信息和知識,輔助決策管理,已成為亟待解決的問題。由此,數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)應(yīng)運而生,并已在保險業(yè)務(wù)、電子商務(wù)管理、金融風(fēng)險預(yù)測、基因工程研究、產(chǎn)品產(chǎn)量
2、、質(zhì)量分析和石油工業(yè)等領(lǐng)域中得到了成功應(yīng)用。數(shù)據(jù)挖掘技術(shù)近年來發(fā)展迅速,隨著反恐和國家安全問題的日益凸現(xiàn),數(shù)據(jù)挖掘中的隱私保護愈發(fā)引起人們的注意。數(shù)據(jù)挖掘可以用來檢測異常模式、恐怖活動和欺詐行為,但同時也意味著一般人都可以應(yīng)用這些數(shù)據(jù)挖掘工具到資料數(shù)據(jù)庫或者個人檔案中挖掘分析出他們感興趣的私人信息。我們搜集的各種個人的信息都可能被應(yīng)用數(shù)據(jù)挖掘,從而數(shù)據(jù)挖掘技術(shù)可能成為個人隱私和公民自由的威脅[1]。所以,個人信息隱私保護成為數(shù)據(jù)挖掘要面對的一個重要問題。為此,相關(guān)專家和科技工作者正在積極開發(fā)有關(guān)研究方法,隱私保護已經(jīng)成為一個新興的,并且非常熱門的研究領(lǐng)域。數(shù)據(jù)挖掘2
3、.1數(shù)據(jù)挖掘數(shù)據(jù)挖掘[2](DataMining,DM)是指從大量的、不完全的、有噪聲的、模糊的數(shù)據(jù)中提取出隱含在其中的、人們事先未知的有用信息和知識的過程。簡而言之就是,從已知的數(shù)據(jù)中發(fā)現(xiàn)隱含的有用的新穎的信息或知識。數(shù)據(jù)挖掘[3],可以為決策者的決策分析提供智能的、自動化的輔助手段,在零售業(yè)、金融保險業(yè)等多個領(lǐng)域都有很好的應(yīng)用。2.2用戶信息的數(shù)據(jù)挖掘數(shù)據(jù)挖掘不是一個新詞,比如微軟、雅虎,他們都是數(shù)據(jù)挖掘的高手,甚至有一條數(shù)字管理神經(jīng)。數(shù)據(jù)挖掘的真正含義是,他們就像水質(zhì)檢測儀,面對一個數(shù)億級的消費群,誰能把握消費之水的流動,誰就掌握了規(guī)則。所以,目前研究最多,應(yīng)
4、用也最普遍的是對用戶信息的數(shù)據(jù)挖掘。通過對用戶的個人信息進(jìn)行數(shù)據(jù)分析與挖掘,最后得出關(guān)于用戶興趣的挖掘報告。因而,正確有用的組織、個人或其他事物的信息是數(shù)據(jù)挖掘的基礎(chǔ),也是其成功的關(guān)鍵。例如,一些業(yè)內(nèi)人士分析認(rèn)為,騰訊最具門檻性的核心競爭力是"數(shù)據(jù)挖掘系統(tǒng)",就是從大量數(shù)據(jù)中獲取有效的、新穎的、潛在可用的、最終可理解的信息,以輔佐公司戰(zhàn)略的數(shù)字神經(jīng)系統(tǒng)。2007年,騰訊成立了研究院,研究院共有六大研究方向,數(shù)據(jù)挖掘正是其中之一。對用戶的數(shù)據(jù)挖掘后來在騰訊網(wǎng)絡(luò)游戲的崛起中發(fā)揮了大作用。騰訊從2003年開始運營網(wǎng)絡(luò)游戲,曾遭遇挫折,直到2008年,騰訊才在多個細(xì)分市場找
5、到了合適的韓國游戲作品,在代理韓國游戲的過程中,騰訊提出來要介入所代理游戲的研發(fā),例如對《穿越火線》中子彈射出后的彈道設(shè)置,騰訊根據(jù)對用戶的挖掘數(shù)據(jù)認(rèn)為,韓方原本設(shè)計的逼真效果對中國用戶并不合適,用戶對騰訊設(shè)計出的"比較爽快的,節(jié)奏快的,鮮明的"的彈道設(shè)計更加興奮。最后的結(jié)果表明,騰訊是對的。用戶數(shù)據(jù)挖掘與個人信息隱私權(quán)3.1個人信息隱私權(quán)1890年,美國私法學(xué)者布蘭戴斯和沃倫在《哈佛法學(xué)評論》(《HarvardLawReview》)上發(fā)表了《論隱私權(quán)》一文,首次提出了隱私權(quán)(therighttoprivacy)的概念。此后近百年的時間里,隱私權(quán)作為公民人格權(quán)利的重
6、要內(nèi)容逐漸得到法律上的確認(rèn)和保護,并呈現(xiàn)出國際統(tǒng)一化的趨勢。隱私權(quán),即個人依照法律規(guī)定保護自己的隱私不受侵害的權(quán)利[4]。個人信息隱私指在信息中涉及的與個人身份及特征密切相聯(lián)系的信息[5]。主要內(nèi)容為:1)個人數(shù)據(jù):如姓名、性別、年齡、身高、體重、個人身世、血型、指紋、出生日期與地點、種族、身份證號、家庭地址、工作單位、學(xué)歷、生活經(jīng)歷與習(xí)慣、健康狀況等。2)私人信息:如個人存款賬號及密碼、工資單及賬號、股東卡賬號及證券交易密碼、信用卡號及密碼、社會保險號碼、私人財務(wù)清單、電話、費清單、個人債務(wù)、購物習(xí)慣及偏好、消費者的信用和財產(chǎn)狀況等。3)個人領(lǐng)域:公民的電話號碼、
7、手機號碼、傳呼號碼、QQ號碼、通信地址、E-mail地址及個人計算機內(nèi)存儲的信息等。4)個人網(wǎng)絡(luò)活動蹤跡。如IP地址、瀏覽蹤跡、活動內(nèi)容,均屬個人信息的隱私。美國國會1974年《個人隱私法》規(guī)定,公民個人有權(quán)決定在何種程度上公開自己的個人信息,未經(jīng)許可的披露、公開、使用都構(gòu)成對公民隱私權(quán)的侵犯。3.2案例與分析案例1:某市英語四六級報名,每個報考人員需填上自己的姓名、住址、聯(lián)系電話等。不久后,他們的手機經(jīng)常收到莫名其妙的短信。在有些學(xué)校里,大二、大三的學(xué)生宿舍還經(jīng)常收到報考四六級輔導(dǎo)班的資料、無線耳機的出售等。后來經(jīng)查實,是他們這次報考的個人資料包括電話等個人隱