資源描述:
《大數(shù)據(jù)崛起-趨勢、機遇和挑戰(zhàn)》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、大數(shù)據(jù)崛起:趨勢、機遇和挑戰(zhàn) 掘大數(shù)據(jù)之寶藏提及大數(shù)據(jù),大多會圍繞幾個角度:一方面是它的海量性;另一方面是快速數(shù)據(jù)處理能力;另外就是數(shù)據(jù)的多樣化。通過一些結(jié)構(gòu)化的數(shù)據(jù),企業(yè)ERP、商務(wù)平臺、非結(jié)構(gòu)化視頻圖片、收集到的各種數(shù)據(jù)、互聯(lián)網(wǎng)交互數(shù)據(jù),各種各樣的數(shù)據(jù)種類給大數(shù)據(jù)技術(shù)提供了一個很好的發(fā)展平臺,因為大數(shù)據(jù)的強項就是處理更多的數(shù)據(jù)種類,并快速把數(shù)據(jù)進行分類存儲、挖掘以及提取它的價值。大數(shù)據(jù)因其巨大的商業(yè)價值和市場需求正日益成為推動信息產(chǎn)業(yè)變革的新引擎。面向大數(shù)據(jù)市場的新產(chǎn)品、新技術(shù)、新服務(wù)、新業(yè)態(tài)正在不斷涌現(xiàn)。大數(shù)據(jù)時代的到
2、來已經(jīng)不是一種單純的理念思路,而是一種不可逆轉(zhuǎn)的趨勢了。首先,大數(shù)據(jù)能夠產(chǎn)生價值。無論是在日常生活中還是企業(yè)生產(chǎn)里,都需要通過數(shù)據(jù)的收集和處理來做出決定,以最大化的滿足個人或者客戶的需求,而大數(shù)據(jù)理論的特點就在于這一過程的高效性、簡易性甚至實時性。通過大數(shù)據(jù)的處理,可以完成對于系統(tǒng)或是結(jié)構(gòu)化數(shù)據(jù)的實時更新,從而完成最快速度的決策,這毫無疑問將為社會進步創(chuàng)造巨大的價值。6其次,大數(shù)據(jù)具備不可替代性。隨著信息社會的發(fā)展,信息量將以爆炸的速度進行膨脹增長,在這個過程中無論科技具有怎樣的發(fā)展方向,對于大規(guī)模數(shù)據(jù)的處理將始終占據(jù)工作和科
3、研中重中之重的位置,而無論是云計算還是其他的執(zhí)行方式,都只是對于這一思想的具體實現(xiàn)和有力支撐,而不可能從根源上替代大數(shù)據(jù)這一體系的存在價值。最后,大數(shù)據(jù)具備充足的生命力。無論是社交網(wǎng)絡(luò)的廣泛推廣,還是諸如蘋果、谷歌等企業(yè)對于大數(shù)據(jù)發(fā)展的不斷推動,大數(shù)據(jù)的整體發(fā)展形勢都會像滾雪球一樣越來越大。而同樣的,調(diào)查表明,有超過80%的公司代表認(rèn)為大數(shù)據(jù)理論的發(fā)展將對公司的商業(yè)分析等過程起到有效的幫助,這一點有力地證明了大數(shù)據(jù)具備充分廣闊的生長空間。大數(shù)據(jù)不僅影響著人們生活的方方面面,更重要的是它給企業(yè)帶來的改變。據(jù)Gartner預(yù)測,企
4、業(yè)數(shù)據(jù)將在五年內(nèi)增加800%,其中80%是非結(jié)構(gòu)化數(shù)據(jù),大部分來自團體、社區(qū),以及社交網(wǎng)絡(luò)的非業(yè)務(wù)數(shù)據(jù)。面對如此規(guī)模的數(shù)據(jù),對于有準(zhǔn)備的企業(yè)來說這無疑是一座信息金礦,能否將海量數(shù)據(jù)轉(zhuǎn)換為有價值的信息,將成為未來企業(yè)的決勝法寶。開源大數(shù)據(jù)的制勝法寶6大數(shù)據(jù)蘊藏的商業(yè)價值不可小覷。對于當(dāng)今的企業(yè)而言,數(shù)據(jù)就是一種重要的戰(zhàn)略資產(chǎn),如果能夠正確評估其商業(yè)價值并且迅速行動起來,將會在未來的競爭中占得先機。然而,傳統(tǒng)關(guān)系型數(shù)據(jù)庫的技術(shù)擅長處理結(jié)構(gòu)化數(shù)據(jù),對于未來企業(yè)中占絕大多數(shù)的非結(jié)構(gòu)化數(shù)據(jù)卻無從下手。此時,大量新技術(shù)應(yīng)運而生。大數(shù)據(jù)獲得
5、動力,關(guān)鍵在于開放源代碼,幫助分解和分析數(shù)據(jù)。以Hadoop為代表的一系列開源技術(shù),成為大數(shù)據(jù)存儲、處理和分析的主力軍。各大IT巨頭瞄準(zhǔn)開源技術(shù),紛紛推出各自的大數(shù)據(jù)戰(zhàn)略。Hadoop作為其中的最受關(guān)注的技術(shù),已逐漸走向商業(yè)化的道路。不可否認(rèn),Hadoop的確是一款非常出色的處理大數(shù)據(jù)的開源工具。除了Hadoop之外,還有很多優(yōu)秀的技術(shù)和工具如雨后春筍般成長起來,包括開源語言R、NoSQL數(shù)據(jù)庫和非結(jié)構(gòu)化數(shù)據(jù)存儲解決方案等,也已成為大數(shù)據(jù)舞臺上不可或缺的成員。開源是靈感的匯集,凝聚了全世界范圍自由開發(fā)人的思想結(jié)晶;開源,是無界
6、的合作,沒有地理位置的阻隔,沒有商業(yè)條款的羈絆??v使開源不是為商業(yè)化而生,但事實證明開源卻有著商業(yè)化應(yīng)用不可比擬的優(yōu)勢?,F(xiàn)在的商業(yè)智能和企業(yè)搜索的專有應(yīng)用程序都沒有“坐以待斃”。商業(yè)智能增加了更多類似搜索的功能,并且搜索還取代了很多商業(yè)智能功能。6但是在幾年前,專有解決方案似乎是最安全的方法,而開源解決方案似乎更具風(fēng)險。而現(xiàn)在,很多公司開始看到,因為開源項目獨立于企業(yè)財務(wù)決策,他們對于保護其長期投資更具后勁。此外,很多企業(yè)發(fā)現(xiàn)他們更容易獲得、培訓(xùn)和留住開源人才,因為,他們可以深入代碼。何以解大數(shù)據(jù)存儲之惑也許,人們對大數(shù)據(jù)的印
7、象很多是從存儲容量的廉價性而來。但實際上,企業(yè)每天都在創(chuàng)造大量的數(shù)據(jù),而且越來越多,而人們正在努力地從浩瀚的數(shù)據(jù)海洋中尋覓有價值的商業(yè)情報。另一方面,用戶還會保存那些已經(jīng)分析過的數(shù)據(jù),因為這些舊數(shù)據(jù)可以與未來收集的新數(shù)據(jù)進行差異化分析,依然有潛在的利用可能。大數(shù)據(jù)應(yīng)用的一個主要特點是實時性或者近實時性。比如,如果警察攔住一輛車,想得到這輛車的相關(guān)信息,那么這對時間的要求是越快越好。類似的,一個金融類的應(yīng)用,能為業(yè)務(wù)員從數(shù)量巨大種類繁多的數(shù)據(jù)里快速挖掘出相關(guān)信息,能幫助他們領(lǐng)先于競爭對手做出與交易相關(guān)的決定。隨著大數(shù)據(jù)應(yīng)用的爆發(fā)
8、性增長,它已經(jīng)衍生出了自己獨特的架構(gòu),而且也直接推動了存儲、網(wǎng)絡(luò)以及計算技術(shù)的發(fā)展。畢竟處理大數(shù)據(jù)這種特殊的需求是一個新的挑戰(zhàn)。硬件的發(fā)展最終還是由軟件需求推動的,就這個角度來說,可以很明顯地看到大數(shù)據(jù)分析應(yīng)用需求正在影響著數(shù)據(jù)存儲基礎(chǔ)設(shè)施的發(fā)展。6數(shù)據(jù)通常以每年50%的速度