基于通信數(shù)據(jù)的移動(dòng)用戶行為分析

基于通信數(shù)據(jù)的移動(dòng)用戶行為分析

ID:3706700

大?。?46.50 KB

頁(yè)數(shù):10頁(yè)

時(shí)間:2017-11-23

基于通信數(shù)據(jù)的移動(dòng)用戶行為分析_第1頁(yè)
基于通信數(shù)據(jù)的移動(dòng)用戶行為分析_第2頁(yè)
基于通信數(shù)據(jù)的移動(dòng)用戶行為分析_第3頁(yè)
基于通信數(shù)據(jù)的移動(dòng)用戶行為分析_第4頁(yè)
基于通信數(shù)據(jù)的移動(dòng)用戶行為分析_第5頁(yè)
資源描述:

《基于通信數(shù)據(jù)的移動(dòng)用戶行為分析》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、基于通信數(shù)據(jù)的移動(dòng)用戶行為分析[摘要]認(rèn)為分析移動(dòng)用戶行為特征與分類,對(duì)移動(dòng)應(yīng)用個(gè)性化服務(wù)的改進(jìn)具有重要的參考價(jià)值?;趪?guó)內(nèi)電信運(yùn)營(yíng)商隨機(jī)抽取某市一萬(wàn)移動(dòng)用戶一周的日志記錄,其中含有4萬(wàn)余條通話記錄和200余萬(wàn)條網(wǎng)絡(luò)請(qǐng)求,每條請(qǐng)求包含對(duì)應(yīng)的基站標(biāo)號(hào)以及基站地理位置。本研究從消費(fèi)能力、通話量、網(wǎng)絡(luò)請(qǐng)求量、位移量四個(gè)維度從這批數(shù)據(jù)中提取14種基本特征指標(biāo)。利用K-Means聚類方法將移動(dòng)用戶區(qū)分成規(guī)律通話型、隨機(jī)上網(wǎng)型、居家節(jié)約型和隨機(jī)高消費(fèi)型等四類用戶模型。[關(guān)鍵詞]用戶行為分析;移動(dòng)用戶研究;聚類分析;數(shù)據(jù)挖掘[分類號(hào)]G351引言隨著移動(dòng)通信

2、技術(shù)的迅猛發(fā)展和廣泛應(yīng)用,移動(dòng)終端大量普及于民眾,也產(chǎn)生了大量用戶信息記錄,如何利用大數(shù)據(jù)來(lái)了解移動(dòng)用戶行為與習(xí)慣特征的研究不斷涌現(xiàn)。通過(guò)對(duì)移動(dòng)用戶的分析與了解,許多企業(yè)與政府部門可以依據(jù)結(jié)果提供各式各樣的服務(wù)與應(yīng)用方案。移動(dòng)用戶行為分析通常是指基于地理信息涉及用戶訪問(wèn)網(wǎng)絡(luò)、通話的行為規(guī)律與活動(dòng)研究。電信運(yùn)營(yíng)商通過(guò)獲取用戶訪問(wèn)移動(dòng)互聯(lián)網(wǎng)、使用移動(dòng)應(yīng)用及通話的行為規(guī)律,能夠有效地配置網(wǎng)絡(luò)資源并提供具有針對(duì)性的服務(wù)。近年來(lái),針對(duì)桌面端日志挖掘的研究層出不窮,[15,16,17]都是針對(duì)桌面端web服務(wù)的后臺(tái)日志挖掘入手,通過(guò)分析用戶訪問(wèn)頁(yè)面的占比、

3、用戶訪問(wèn)的頁(yè)面順序等對(duì)用戶的行為進(jìn)行建模。而針對(duì)移動(dòng)用戶的行為分析研究則在很多方面借鑒了桌面端的研究,同時(shí)利用移動(dòng)端設(shè)備的地理位置位置記錄,挖掘出用戶移動(dòng)軌跡模式,找出軌跡中重要的位置并結(jié)合通信數(shù)據(jù)、互聯(lián)網(wǎng)日志數(shù)據(jù)以及移動(dòng)應(yīng)用數(shù)據(jù)作為研究的基礎(chǔ),分析挖掘移動(dòng)用戶的需求、行為、興趣,甚至是通過(guò)預(yù)測(cè)用戶的目的地、推測(cè)用戶下一步即將到達(dá)的位置以便提供針對(duì)性的推薦服務(wù)[1,13]。傳統(tǒng)的移動(dòng)用戶軌跡分析,多數(shù)利用軟件采集仿真數(shù)據(jù),屬于細(xì)時(shí)空粒度下的數(shù)據(jù),即可以采集到用戶一天中連續(xù)時(shí)間段的位置數(shù)據(jù)。Y.Zhu等作者著眼于用戶位置數(shù)據(jù)中經(jīng)常出現(xiàn)的地點(diǎn),并根

4、據(jù)出現(xiàn)時(shí)間來(lái)推測(cè)用戶所處的位置是家還是公司[2]。此外,S.Akoush和A.Sameh則通過(guò)指定時(shí)間粒度,聚類用戶在多日同一時(shí)間段的行動(dòng)軌跡,利用稀疏數(shù)據(jù)擬合出用戶在這時(shí)間段移動(dòng)軌跡的目的[3]。研究用戶的移動(dòng)軌跡,實(shí)現(xiàn)預(yù)測(cè)用戶下一步位置目的的方法,包括利用貝葉斯算法、聚類、數(shù)據(jù)挖掘方法等。實(shí)際上,電信運(yùn)營(yíng)商服務(wù)器上的數(shù)據(jù)是粗時(shí)間粒度的,唯有請(qǐng)求通信或上網(wǎng)時(shí)才會(huì)被記錄,因此用戶位置變化是不連貫的,具有隨機(jī)性、稀疏性的特點(diǎn),不能支持用戶行為軌跡直接且連續(xù)的刻畫描述。譚均元等人提出了生活熵概念作為用戶移動(dòng)軌跡規(guī)律程度的度量[4],采用了個(gè)人多天時(shí)

5、段移動(dòng)序列的算法來(lái)彌補(bǔ)實(shí)際數(shù)據(jù)的這種不足,即通過(guò)對(duì)多天數(shù)據(jù)的分析來(lái)獲得更準(zhǔn)確的用戶移動(dòng)軌跡。S.A.Shad則結(jié)合地理信息與用戶提供的上下文語(yǔ)義信息來(lái)增加預(yù)測(cè)準(zhǔn)確性[5]。梁鵬等作者則透過(guò)在WAP網(wǎng)關(guān)進(jìn)行數(shù)據(jù)采集,并對(duì)數(shù)據(jù)進(jìn)行數(shù)值分析和擬合,最后得到用戶行為的統(tǒng)計(jì)性特征來(lái)建立用戶行為分析模型[6]。呂洋利用上網(wǎng)數(shù)據(jù)研究用戶的網(wǎng)絡(luò)請(qǐng)求行為、時(shí)間、網(wǎng)頁(yè)應(yīng)用、數(shù)據(jù)包大小等信息建立用戶行為模型[7]。Y.Liu關(guān)注于移動(dòng)用戶上網(wǎng)過(guò)程中訪問(wèn)頻率、訪問(wèn)時(shí)間、訪問(wèn)深度之間的關(guān)系[8]。G.F.Zhao等作者則利用二分網(wǎng)絡(luò)模型來(lái)分析移動(dòng)用戶上網(wǎng)過(guò)程中用戶與不同

6、網(wǎng)站之間的關(guān)聯(lián)。對(duì)移動(dòng)用戶上網(wǎng)請(qǐng)求過(guò)程中數(shù)據(jù)包的大小、請(qǐng)求響應(yīng)時(shí)間等的研究也是與運(yùn)營(yíng)商相關(guān)的研究方向[9,10,11,12]。由此可知,國(guó)內(nèi)外對(duì)移動(dòng)用戶行為的研究呈現(xiàn)向上的趨勢(shì),研究的方法也越來(lái)越多樣。筆者基于運(yùn)營(yíng)商提供的移動(dòng)數(shù)據(jù),提取用戶特征,并將選取的特征作為聚類分析的輸入?yún)?shù),以發(fā)現(xiàn)具有不同行為特征的用戶類別。利用消費(fèi)能力、通話量、網(wǎng)絡(luò)請(qǐng)求量、位移量四個(gè)維度作為分析用戶行為的基礎(chǔ),從該批數(shù)據(jù)中提取相關(guān)的評(píng)價(jià)指標(biāo)。通過(guò)聚類算法對(duì)用戶的分類,分析各類型用戶所獨(dú)有的屬性、行為特征。各類用戶模型分析結(jié)果可以作為電信運(yùn)營(yíng)商、服務(wù)或應(yīng)用提供企業(yè)根據(jù)不

7、同用戶類型提供更好的推薦服務(wù)。2數(shù)據(jù)集及預(yù)處理2.1數(shù)據(jù)集本研究的數(shù)據(jù)集來(lái)自國(guó)內(nèi)移動(dòng)電信運(yùn)營(yíng)商某市內(nèi)的一萬(wàn)注冊(cè)用戶的一周數(shù)據(jù),時(shí)間為2013年12月的第一周。數(shù)據(jù)包括用戶基本信息、通話記錄、上網(wǎng)記錄、以及使用基站地理位置等,其中共有456006條通話記錄和21441422條網(wǎng)絡(luò)請(qǐng)求記錄。該批數(shù)據(jù)中的所使用到的具體的信息字段包括:用戶編號(hào)(user_id)、移動(dòng)產(chǎn)品品牌(brand_name)、用戶通話產(chǎn)生的費(fèi)用(call_fee)、用戶上網(wǎng)產(chǎn)生的流量費(fèi)用(gprs_fee)、增值業(yè)務(wù)費(fèi)(databusiness_fee)、終端品牌(brand_

8、chn)、手機(jī)操作系統(tǒng)(operation_sys)、通話開始時(shí)間(start_time)、通話結(jié)束時(shí)間(end_time)、通話基站緯度(longi

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。