資源描述:
《我們的生活:評(píng)估日常位置軌跡的相似度》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、我們的生活:評(píng)估日常位置軌跡的相似度JamesBiagionilandJohnKrumm21DepartmentofComputerScienee,UniversityofIllinoisatChicago,Chicago,IL,USAjbiagil@uic.edu2MicrosoftResearch,MicrosoftCorporation,Redmond,WAZUSAjckrumm@microsoft.com摘要。我們開發(fā)和測(cè)試的算法是基于GPS記錄的個(gè)人日常位置軌跡的相似度的評(píng)佔(zhàn)。一份將確的相似度評(píng)佔(zhàn)可以被用來發(fā)現(xiàn)界常行為,聚類相似的
2、天數(shù),并且預(yù)測(cè)耒來的旅程。我們根據(jù)30名志愿測(cè)試者的46天的GPS軌跡,收集了-?份平均數(shù)據(jù)。每個(gè)測(cè)試者每犬隨機(jī)匹配并且被要求評(píng)估它們的和似度。我們測(cè)試了8種不同的相似度算法以準(zhǔn)確再現(xiàn)我們的測(cè)試者的評(píng)估結(jié)果,并且我們的統(tǒng)計(jì)測(cè)試發(fā)現(xiàn)有2種算法比其他算法優(yōu)秀。我們也成功的運(yùn)用其中一種相似度算法于通過使用位置軌跡聚集相似的天數(shù)。關(guān)鍵詞:位置軌跡,相似度,異常檢測(cè),聚類。1介紹消費(fèi)者和企業(yè)都意識(shí)到了通過位置軌跡來了解日常習(xí)慣和預(yù)測(cè)臨時(shí)的需求的價(jià)值,并H安裝了GPS的智能于?機(jī)的大量使用使得這些史容易收集。這些軌跡可以幫助我們了解II?;顒?dòng);特別的是
3、,我們可以使用位置軌跡發(fā)現(xiàn)異常的天和聚類相似的天,以使得更好的了解我們的口常行程。這兩個(gè)任務(wù)都需要一種方法來比較這些天和其他的不同。木文開發(fā)和測(cè)試算法測(cè)算相似天數(shù)來表示位置軌跡,從真實(shí)川戶的相似性評(píng)估測(cè)試。通過可靠的方法測(cè)算相似度,我們可以發(fā)現(xiàn)與其它截然不同的異常天數(shù),比如暗示混淆(一個(gè)重要的在人群中檢測(cè)到認(rèn)知障礙的用戶的現(xiàn)彖)或者某種習(xí)慣的改變。我們也可以將屬于一起的天數(shù)做出合理的歸類來獲取他們的變化并且預(yù)測(cè)一犬會(huì)如何發(fā)展,為未來適應(yīng)系統(tǒng)的影響力提供冇用的基礎(chǔ)知識(shí)。我們相信這是第-?次使用位置軌跡以人類的評(píng)估的方式來測(cè)算天數(shù)的相似度。各種
4、各樣的傳感器可以用來描述一天的數(shù)據(jù),比如測(cè)算一個(gè)人的手機(jī),臺(tái)式電腦,車輛,社交網(wǎng)站,生物識(shí)別傳感器等等活動(dòng)。我們的工作是針對(duì)位置軌跡,通常使用GPS來測(cè)算。這樣的一個(gè)好處是,位置是一個(gè)持續(xù)存在的狀態(tài)(如果不是總是可以測(cè)量的話),而不是基于事件的活動(dòng),比如短信活動(dòng),這只是偶爾發(fā)生。人多數(shù)人的位置也是不斷變化的并且在戶外是易于使用GPS來測(cè)算的。這些特征使得位置成為一個(gè)很方便的測(cè)算天數(shù)Z間的相似度的變量。地理信息系統(tǒng)社區(qū)已經(jīng)廣泛的關(guān)注位置軌跡的相似度,比如,【1】,但是這些努力主要是機(jī)器處理過程。我們感興趣的是匹配人類評(píng)估的相似度,這似乎更常見
5、于異常檢測(cè)的研究中。在【2】中,Ma從GPS軌跡中檢測(cè)到的異常首先呈現(xiàn)一個(gè)正常軌跡作為地面矩陣序列的結(jié)果。如果一個(gè)新的矩陣軌跡與其他正常軌跡完全不同,那么一個(gè)異常會(huì)被申明。這里的相似度測(cè)算是明確的,它依賴于一個(gè)在正常行程和查詢行程Z間的地理差異的數(shù)量測(cè)算。同時(shí)它也忽略的時(shí)間。在【3】中,Patterson等進(jìn)行了基于GPS跟蹤的界常行為檢測(cè)。他們基于一個(gè)人的歷史GPS軌跡建立了一個(gè)動(dòng)態(tài)的概率模型。如果建立的模型的不準(zhǔn)確度超過了一般先驗(yàn)?zāi)P停敲聪到y(tǒng)就會(huì)小明一個(gè)異常。這是一個(gè)隱含的相似度測(cè)算的例子?!?】和【3】的目的都在于檢測(cè)生活中認(rèn)知障礙
6、的異常。【4】中Giroux等人的系統(tǒng)也是同樣的目的,只冇他們?cè)诩抑惺褂脗鞲衅鳈z測(cè)與預(yù)定義日常行程不同的異常,比如制作咖啡。如果違反了事件的正常序列或者該序列的時(shí)間與正常冇所不同,那么一個(gè)異常會(huì)被申明。研究人員也在錄像屮檢測(cè)到異常比如Xian和Gong[51他們的系統(tǒng)能自動(dòng)建立正常的模型。所有這些技術(shù)都依賴于從觀察學(xué)會(huì)某種正常行為的模型,這懣味著他們必須接受新的訓(xùn)練。我們的目標(biāo)之一就是找到一個(gè)單一的相似度量測(cè)算工作是否適合多人,且不需要經(jīng)過任何培訓(xùn)。此外,以前的技術(shù)檢測(cè)基于研究者設(shè)計(jì)的算法或閥值的不同行為。相反,我們的另一個(gè)目標(biāo)就是找到一個(gè)
7、相似度最能近似估算一個(gè)人類卞題的數(shù)據(jù)。實(shí)現(xiàn)這些目標(biāo)將使我們能夠提供一種未來的H適應(yīng)系統(tǒng)的方法來準(zhǔn)確地再現(xiàn)評(píng)估人類一天的相似度且對(duì)一般人效果很好不需要任何訓(xùn)練,也許有助于緩解相關(guān)應(yīng)用領(lǐng)域的冷啟動(dòng)問題。為此,我們從30名支援測(cè)試者中收集了他們的GPS數(shù)據(jù)并讓他們?cè)u(píng)估他們每天的相似度。冇了這些真實(shí)數(shù)據(jù),我們進(jìn)行了各種相似度測(cè)算并且找出了2種方法能夠較好的再現(xiàn)測(cè)試者的評(píng)佔(zhàn)結(jié)果。我們先論述如何從實(shí)驗(yàn)中收集到數(shù)據(jù)。2GPS數(shù)據(jù)和進(jìn)程為了完成基于位置軌跡天數(shù)相似度的評(píng)估實(shí)驗(yàn)的結(jié)果,我們收集到的數(shù)據(jù)來自志愿者的車輛。本節(jié)展現(xiàn)了我們?yōu)榱说谌?jié)的實(shí)驗(yàn)準(zhǔn)備的數(shù)據(jù)
8、的記錄和處理過程。圖1.一段間隔10S的GPS采樣點(diǎn)的段序列2.1志愿者的GPS數(shù)據(jù)我們記錄了30名志愿者(8名女性)的GPS數(shù)據(jù)。每位志愿者借了一臺(tái)RoyalTekRBT-23