資源描述:
《大數(shù)據(jù)時(shí)代下的數(shù)據(jù)挖掘-簡(jiǎn)易ppt》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、大數(shù)據(jù)時(shí)代生活、工作與思維的大變革L(fēng)iving,workingandthinkingbigchanges0引言大數(shù)據(jù)開(kāi)啟了一次重大的時(shí)代轉(zhuǎn)型。就想望遠(yuǎn)鏡讓我們能夠感受宇宙,顯微鏡讓我們能夠觀(guān)測(cè)微生物一樣,大數(shù)據(jù)正在改變我們的生活以及理解世界的方式,成為新發(fā)明和新服務(wù)的源泉,而更多的改變正蓄勢(shì)待發(fā)……一場(chǎng)生活、工作與思維的大變革引言一場(chǎng)生活、工作與思維的大變革大數(shù)據(jù),變革公共衛(wèi)生大數(shù)據(jù),變革商業(yè)大數(shù)據(jù),變革思維大數(shù)據(jù),開(kāi)啟重大的時(shí)代轉(zhuǎn)型預(yù)測(cè),大數(shù)據(jù)的核心大數(shù)據(jù),大挑戰(zhàn)什么是大數(shù)據(jù)2009年,甲型H1N1流感在全球爆
2、發(fā)傳播,為了發(fā)現(xiàn)和控制疫情,各國(guó)政府和衛(wèi)生相關(guān)部門(mén)付出了巨大努力,但得到的數(shù)據(jù)仍然滯后一兩周,而Google對(duì)人們的搜索的歷史記錄進(jìn)行處理,建立合理的數(shù)學(xué)模型后,得到的預(yù)測(cè)結(jié)果與官方的數(shù)據(jù)相關(guān)性高達(dá)97%,能夠立刻判斷出流感是從哪里傳播出來(lái)的,沒(méi)有一兩周的滯后。Google處理了5000萬(wàn)條歷史記錄、4.5億個(gè)不同的數(shù)學(xué)模型。什么是大數(shù)據(jù)Farecast是一個(gè)對(duì)機(jī)票價(jià)格進(jìn)行預(yù)測(cè)的公司,幫助消費(fèi)者抓住最佳購(gòu)買(mǎi)機(jī)票的時(shí)機(jī),使乘客節(jié)省很多錢(qián)。最初預(yù)測(cè)系統(tǒng)建立在41天之內(nèi)的12000個(gè)價(jià)格樣本基礎(chǔ)上,數(shù)據(jù)是從旅游網(wǎng)站上抓
3、取的,如今已經(jīng)擁有超過(guò)2000億條飛行記錄。系統(tǒng)只推測(cè)機(jī)票的價(jià)格何時(shí)最便宜,不關(guān)心是什么原因?qū)е碌膬r(jià)格下降。Farecast→Bing大數(shù)據(jù)的特性大數(shù)據(jù)的特性更關(guān)注相關(guān)性主要用于預(yù)測(cè)數(shù)據(jù)量巨大實(shí)時(shí)性要求高目錄01大數(shù)據(jù)時(shí)代的思維變革02大數(shù)據(jù)時(shí)代的商業(yè)變革03大數(shù)據(jù)時(shí)代的管理變革一、大數(shù)據(jù)時(shí)代的思維變革一、大數(shù)據(jù)時(shí)代的思維變革—更多“更多”——不是隨機(jī)樣本,而是全體數(shù)據(jù)當(dāng)數(shù)據(jù)處理技術(shù)已經(jīng)發(fā)生翻天覆地的變化時(shí),在大數(shù)據(jù)時(shí)代進(jìn)行抽樣分析就像在汽車(chē)時(shí)代騎馬一樣。一切都改變了,我們需要的是所有的數(shù)據(jù),“樣本=總體”。讓數(shù)
4、據(jù)“發(fā)聲”小數(shù)據(jù)時(shí)代的隨機(jī)采樣,最少的數(shù)據(jù)獲得最多的信息全數(shù)據(jù)模式,樣本=總體一、大數(shù)據(jù)時(shí)代的思維變革—更雜“更雜”——不是精確性,而是混雜性執(zhí)迷于精確性是信息缺乏時(shí)代和模擬時(shí)代的產(chǎn)物。只有5%的數(shù)據(jù)是有框架且能適用于傳統(tǒng)數(shù)據(jù)庫(kù)的。如果不能接受混亂,剩下95%的非框架數(shù)據(jù)都無(wú)法被利用,只有接受不精確性,我們才能打開(kāi)一扇從未涉足的世界的窗戶(hù)。允許不精確大數(shù)據(jù)的簡(jiǎn)單算法比小數(shù)據(jù)的復(fù)雜算法更有效紛繁的數(shù)據(jù)越多越好混雜性,不是竭力避免,而是標(biāo)準(zhǔn)途徑新的數(shù)據(jù)庫(kù)設(shè)計(jì)的誕生一、大數(shù)據(jù)時(shí)代的思維變革—更好“更好”——不是因果關(guān)系
5、,而是相關(guān)關(guān)系知道“是什么”就夠了,沒(méi)必要知道“為什么”。在大數(shù)據(jù)時(shí)代,我們不必非得知道現(xiàn)象背后的原因,而是要讓數(shù)據(jù)自己“發(fā)聲”。關(guān)聯(lián)物,預(yù)測(cè)的關(guān)鍵“是什么”,而不是“為什么”改變,從操作方式開(kāi)始大數(shù)據(jù),改變?nèi)祟?lèi)探索世界的方法二、大數(shù)據(jù)時(shí)代的商業(yè)變革二、大數(shù)據(jù)時(shí)代的商業(yè)變革—數(shù)據(jù)化“數(shù)據(jù)化”——一切皆可“量化”大數(shù)據(jù)發(fā)展的核心動(dòng)力來(lái)源于人類(lèi)測(cè)量、記錄和分析世界的渴望。信息技術(shù)變革隨處可見(jiàn),但是如今信息技術(shù)變革的重點(diǎn)在“T”(技術(shù))上,而不是在“I”(信息)上?,F(xiàn)在,我們是時(shí)候把聚光燈打向“I”,開(kāi)始關(guān)注信息本身了
6、。數(shù)據(jù),從最不可能的地方提取出來(lái)數(shù)據(jù)化,不是數(shù)字化量化一切,數(shù)據(jù)化的核心當(dāng)文字變成數(shù)據(jù)當(dāng)方位變成數(shù)據(jù)當(dāng)溝通成為數(shù)據(jù)一切事物的數(shù)據(jù)化二、大數(shù)據(jù)時(shí)代的商業(yè)變革—價(jià)值“價(jià)值”——“取之不盡,用之不竭”的數(shù)據(jù)創(chuàng)新數(shù)據(jù)就像一個(gè)神奇的鉆石礦,當(dāng)它的首要價(jià)值被發(fā)掘后仍能不斷給予。它的真實(shí)價(jià)值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,而絕大部分都隱藏在表面之下。數(shù)據(jù)創(chuàng)新1:數(shù)據(jù)的再利用數(shù)據(jù)創(chuàng)新2:重組數(shù)據(jù)數(shù)據(jù)創(chuàng)新3:可擴(kuò)展數(shù)據(jù)數(shù)據(jù)創(chuàng)新4:數(shù)據(jù)的折舊值數(shù)據(jù)創(chuàng)新5:數(shù)據(jù)廢氣數(shù)據(jù)創(chuàng)新6:開(kāi)放數(shù)據(jù)給數(shù)據(jù)估值二、大數(shù)據(jù)時(shí)代的商業(yè)變
7、革—角色定位“角色定位”——數(shù)據(jù)、技術(shù)與思維的三足鼎立微軟以1.1億美元的價(jià)格購(gòu)買(mǎi)了大數(shù)據(jù)公司Farecast,而兩年后谷歌則以7億美元的價(jià)格購(gòu)買(mǎi)了給Farecast提供數(shù)據(jù)的ITASoftware公司。如今,我們正處在大數(shù)據(jù)時(shí)代的早期,思維和技術(shù)是最有價(jià)值的,但是最終大部分價(jià)值還是必須從數(shù)據(jù)本身來(lái)挖掘。大數(shù)據(jù)價(jià)值的3大構(gòu)成大數(shù)據(jù)掌控公司大數(shù)據(jù)技術(shù)公司大數(shù)據(jù)思維公司和個(gè)人全新的數(shù)據(jù)中間商專(zhuān)家的消亡與數(shù)據(jù)科學(xué)家的崛起大數(shù)據(jù),決定企業(yè)的競(jìng)爭(zhēng)力三、大數(shù)據(jù)時(shí)代的管理變革二、大數(shù)據(jù)時(shí)代的管理變革—風(fēng)險(xiǎn)“風(fēng)險(xiǎn)”——讓數(shù)據(jù)主宰
8、一切的隱憂(yōu)我們時(shí)刻都暴露在“第三只眼”之下:亞馬遜監(jiān)視著我們的購(gòu)物習(xí)慣,谷歌監(jiān)視著我們的網(wǎng)頁(yè)瀏覽習(xí)慣,而微博似乎什么都知道,不僅竊聽(tīng)到了我們心中的“TA”,還有我們的社交關(guān)系網(wǎng)。無(wú)處不在的“第三只眼”我們的隱私被二次利用了預(yù)測(cè)與懲罰,不是因?yàn)椤八觥?,而是因?yàn)椤皩⒆觥睌?shù)據(jù)獨(dú)裁掙脫大數(shù)據(jù)的困境二、大數(shù)據(jù)時(shí)代的管理變革—掌控“掌控”——責(zé)任與自由并舉的信息管理當(dāng)世界開(kāi)始邁向大