資源描述:
《大數(shù)據(jù)時代企業(yè)競爭情報研究的創(chuàng)新與發(fā)展[權(quán)威資料]》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、大數(shù)據(jù)時代企業(yè)競爭情報研究的創(chuàng)新與發(fā)展本文檔格式為WORD,若不是word文檔,則說明不是原文檔。最新最全的學(xué)術(shù)論文期刊文獻(xiàn)年終總結(jié)年終報告工作總結(jié)個人總結(jié)述職報告實習(xí)報告單位總結(jié) 摘要:文章概述了大數(shù)據(jù)的主要特征,分析了大數(shù)據(jù)對企業(yè)競爭情報研究的影響,包括企業(yè)競爭力的提升需要大數(shù)據(jù)的支持,現(xiàn)有企業(yè)競爭情報數(shù)據(jù)處理面臨的一些新問題,企業(yè)競爭情報分析方法亟待創(chuàng)新,提出在大數(shù)據(jù)時代企業(yè)競爭情報研究的發(fā)展方向,應(yīng)重視數(shù)據(jù)和信息的集成、注意對數(shù)據(jù)的清洗與過濾、關(guān)注新的數(shù)據(jù)類型的挖掘分析方法、促進(jìn)數(shù)據(jù)分
2、析的可視化、探索大數(shù)據(jù)新的分析技術(shù)和工具的應(yīng)用等。 關(guān)鍵詞:大數(shù)據(jù) 企業(yè) 競爭情報 數(shù)據(jù)挖掘 中圖分類號: G250.2 文獻(xiàn)標(biāo)識碼:?。痢∥恼戮幪枺骸?003-6938(2012)06-0009-06 1 引言 隨著信息技術(shù)的不斷發(fā)展,互聯(lián)網(wǎng)的普及利用,各種終端設(shè)備記錄了人類社會復(fù)雜頻繁的信息行為從而產(chǎn)生了驚人的數(shù)據(jù)量。據(jù)國際數(shù)據(jù)公司(IDC)的研究報告稱,2011年全球被創(chuàng)建和被復(fù)制的數(shù)據(jù)總量為1.8ZB,并預(yù)測到2020年,全球?qū)碛?5ZB(1ZB=10億TB)的數(shù)據(jù)量[1]。大
3、數(shù)據(jù)已經(jīng)滲透到每一個行業(yè)和領(lǐng)域,被視為“未來的新石油” ,逐漸成為重要的生產(chǎn)因素。隨著消費(fèi)者、企業(yè)、各個經(jīng)濟(jì)領(lǐng)域不斷挖掘大數(shù)據(jù)的潛力,我們正處在一個巨大浪潮的尖峰,這個浪潮就是大數(shù)據(jù)驅(qū)動的技術(shù)創(chuàng)新、生產(chǎn)率提高、經(jīng)濟(jì)增長以及新的競爭形勢和新價值的產(chǎn)生[2]。近年來,大數(shù)據(jù)技術(shù)研究和應(yīng)用迅速發(fā)展,許多國家已經(jīng)意識到了大數(shù)據(jù)的重要性,并作為戰(zhàn)略性技術(shù)大力推動其發(fā)展,大數(shù)據(jù)時代已悄然而至。 2 大數(shù)據(jù)的含義與特征 目前對大數(shù)據(jù)還沒有標(biāo)準(zhǔn)的定義,通常認(rèn)為它是一種數(shù)據(jù)量很大、數(shù)據(jù)形式多樣化的非結(jié)構(gòu)化數(shù)據(jù)
4、。亞馬遜網(wǎng)絡(luò)服務(wù)、數(shù)據(jù)科學(xué)家John Rauser曾提到一個簡單的定義:大數(shù)據(jù)是任何超過了一臺計算機(jī)處理能力的龐大數(shù)據(jù)量[3]。維基百科定義為:大數(shù)據(jù)是指無法在一定時間內(nèi)用常規(guī)軟件工具對其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合[4]。百度百科定義為:大數(shù)據(jù)通常用來形容一個公司創(chuàng)造的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關(guān)系型數(shù)據(jù)庫用于分析時會花費(fèi)過多時間和金錢。從各種各樣類型的數(shù)據(jù)中快速獲得有價值信息的能力,就是大數(shù)據(jù)技術(shù)[5]。IBM從三個基本特性角度來定義大數(shù)據(jù),即:“3V”:體量(Vol
5、ume),速度(Velocity)和多樣性(Variety)。也有人為大數(shù)據(jù)包括三個要素,即:大分析(Big Analytic)、大帶寬(Big Bandwidth)和大內(nèi)容(Big Content)[6]?! 「爬ㄆ饋?,大數(shù)據(jù)的特征主要體現(xiàn)在如下幾個方面: ?。?)數(shù)據(jù)總量規(guī)模增長巨大。同一類型的數(shù)據(jù)在快速增長,目前在傳感器網(wǎng)絡(luò)、地理信息導(dǎo)航系統(tǒng)、社會網(wǎng)絡(luò)(如微博)、即時通訊(如QQ)、電子商務(wù)(如淘寶)、數(shù)字圖書館、網(wǎng)絡(luò)日志等領(lǐng)域都產(chǎn)生了龐大的數(shù)據(jù),規(guī)模在不斷擴(kuò)大。如淘寶目前每天活躍數(shù)據(jù)量已
6、經(jīng)超過50TB,共有4億條產(chǎn)品信息和2億多名注冊用戶在上面活動。零售巨頭沃爾瑪每小時都要處理100多萬筆客戶交易,數(shù)據(jù)庫估計超過2500萬億字節(jié)——相當(dāng)于美國國會圖書館書籍?dāng)?shù)的167倍,而移動互聯(lián)網(wǎng)用戶發(fā)送和上傳的數(shù)據(jù)量達(dá)到1.3EB[7]?! 。?)數(shù)據(jù)增長的速度呈指數(shù)級持續(xù)增長。目前很多領(lǐng)域的數(shù)據(jù)都以驚人的速度增長,根據(jù)WinterCorp的調(diào)查顯示,最大的數(shù)據(jù)倉庫中的數(shù)據(jù)量每兩年增加3倍(年均增長率為173%),其增長速度遠(yuǎn)超摩爾定律增長速度。照此計算,2015年最大數(shù)據(jù)倉庫中的數(shù)據(jù)量將逼
7、近100PB[8]。大數(shù)據(jù)的動態(tài)性強(qiáng),要求分析處理應(yīng)快速響應(yīng),在動態(tài)變化的環(huán)境中快速完成分析過程,有些甚至必須實時分析,否則這些結(jié)果可能就是過時、無效的。如導(dǎo)航定位系統(tǒng)、股票分析系統(tǒng)等對數(shù)據(jù)實時處理有著較高的要求,大數(shù)據(jù)分析和處理的方法必須能快速地適應(yīng)相關(guān)業(yè)務(wù)更新頻率加快的需求?! 。?)新的數(shù)據(jù)來源和數(shù)據(jù)類型在不斷增加。目前產(chǎn)生大數(shù)據(jù)的領(lǐng)域在不斷增加,數(shù)據(jù)類型不僅包括普通文本、照片、動畫、音頻與視頻等,還有像位置信息、鏈接信息等新類型的數(shù)據(jù)。伴隨著社交網(wǎng)絡(luò)、移動計算和傳感器等新技術(shù)不斷的應(yīng)用,
8、大數(shù)據(jù)中有許多是非結(jié)構(gòu)化數(shù)據(jù)或半結(jié)構(gòu)化數(shù)據(jù),沒有特定的描述模型,數(shù)據(jù)結(jié)構(gòu)是不固定、不完全或不規(guī)則的?! 。?)數(shù)據(jù)的價值日益突現(xiàn)。大數(shù)據(jù)猶如一座富礦,通過海量數(shù)據(jù)的處理、整合分析,可以發(fā)現(xiàn)新的知識,從而創(chuàng)造新的更大的價值。大數(shù)據(jù)為許多行業(yè)帶來新的商機(jī)和發(fā)展機(jī)遇,充分利用大數(shù)據(jù)可為企業(yè)帶來強(qiáng)大的競爭力。大數(shù)據(jù)分析能從龐大的數(shù)據(jù)中發(fā)現(xiàn)稀疏而有高價值的知識和規(guī)律,為預(yù)測和決策提供相關(guān)支持。如視頻監(jiān)控的數(shù)據(jù)量通常十分大,雖然絕大部分可能沒有實際利用價值,但幾秒鏡頭捕捉到某罪犯體貌特征,可能對公安部門而言