資源描述:
《位置相關(guān)信息服務(wù)中一種基于價值的數(shù)據(jù)預(yù)取方法》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、位置相關(guān)信息服務(wù)中一種基于價值的數(shù)據(jù)預(yù)取方法摘要:基于ldd的預(yù)取策略如ddp考慮了數(shù)據(jù)距離,但是沒有考慮數(shù)據(jù)的訪問概率和更新頻率和數(shù)據(jù)大小,針對以上問題提出基于價值的數(shù)據(jù)預(yù)取(cdp)策略,一些重要的數(shù)據(jù)預(yù)取因素如訪問概率、更新頻率、數(shù)據(jù)項大小、數(shù)據(jù)距離和有效范圍等都包含在價值函數(shù)里,根據(jù)價值函數(shù)值的大小來選擇被預(yù)取的數(shù)據(jù)。通過實驗對比,cdp比ddp策略更有效的提高緩存的命中率。abstract:ldd-basedprefetchingstrategieslikeddptakethedatadistanceintoaccount,butdonottakeintoacc
2、ounttheaccessprobabilityofdata,updatingdataandsizeoffrequency.fortheseissues,thispaperproposesavalue-baseddataprefetching(cdp)strategy,andsomeimportantdataprefetchingfactors,suchasaccessprobability,updatefrequency,dataitemsize,datadistanceandrangeofdataareincludedinthevaluefunction.ent,cd
3、pismoreeffectivethanddpstrategytoimprovethecachehitrate.關(guān)鍵詞:位置相關(guān)信息服務(wù);位置相關(guān)數(shù)據(jù);數(shù)據(jù)預(yù)??;緩存命中率keyationservices;locationdependentdata;dataprefetching;cachehitratio0引言移動計算環(huán)境下,網(wǎng)絡(luò)的弱連接、低帶寬使得用戶而無法及時獲取所需的信息,特別是查詢位置相關(guān)數(shù)據(jù)(locationdependentdata,ldd)時,容易因用戶位置的改變而導(dǎo)致查詢結(jié)果過時失效或者不正確。lOcaLhOst而數(shù)據(jù)預(yù)取技術(shù)能夠顯著提高數(shù)據(jù)訪問速度和充
4、分利用廣播帶寬[1]。1基于價值的數(shù)據(jù)預(yù)取策略1.1位置相關(guān)數(shù)據(jù)的模型位置相關(guān)數(shù)據(jù)(ldd),是指其值取決于具體地理位置的數(shù)據(jù),ldd具有特定的適用范圍。數(shù)據(jù)的有效范圍區(qū)域(validscopearea),是指數(shù)據(jù)實例有效范圍的幾何區(qū)域。每個ldd實例有一個特定的有效范圍,只有在此有效范圍之內(nèi),該實例才是正確的。數(shù)據(jù)距離(datadistance),是指mc當前位置和數(shù)據(jù)實例有效范圍之間的距離。1.2cdp預(yù)取方法本文提出cdp策略,預(yù)取時根據(jù)價值函數(shù)的值進行選擇,預(yù)取價值函數(shù)如下:cost=puseful×(benefit-penalty)(1)式(1)中puseful
5、為mc訪問ldd的概率,benefit為mc預(yù)取ldd的獲益價值,penalty為預(yù)取ldd的懲罰代價。1.2.1數(shù)據(jù)預(yù)取的獎懲代價數(shù)據(jù)預(yù)取到本地緩存后,并非所有的數(shù)據(jù)都是mc需要的,經(jīng)過運算處理后能成為有效查詢的數(shù)據(jù)才是用戶需要的,只有這部分數(shù)據(jù)才能給mc的查詢訪問帶來獲益。本文用fbenefit(di)表示預(yù)取數(shù)據(jù)di的獲益價值函數(shù),即mc未預(yù)取數(shù)據(jù)時的訪問時間與預(yù)取數(shù)據(jù)時的訪問時間減少的比例。1.2.2訪問ldd的概率對于mc訪問某一種ldd可能性的概率,主要以mc經(jīng)過該數(shù)據(jù)有效范圍的概率和未來訪問該數(shù)據(jù)的概率為依據(jù),因此把mc將來可能經(jīng)過有效范圍內(nèi)數(shù)據(jù)列為預(yù)取的候
6、選集c。主要考慮以下兩點因素:①從時間的角度來考慮。越久未被更新的數(shù)據(jù),說明其因服務(wù)器端的數(shù)據(jù)更新而導(dǎo)致預(yù)取數(shù)據(jù)失效的可能性越?。欢骄梦幢辉L問的數(shù)據(jù)說明其比較陳舊,再次被訪問的可能性就越小。②從空間的角度來考慮。研究表明,在位置相關(guān)信息服務(wù)的數(shù)據(jù)訪問中,mc沿著某條移動路徑通過的概率越高,數(shù)據(jù)距mc當前的位置越近,且數(shù)據(jù)有效范圍區(qū)域的面積越大,或者越靠近mc當前移動路徑或移動方向上的ldd越容易被訪問。1.3備選預(yù)取數(shù)據(jù)的擇取數(shù)據(jù)預(yù)取的目標是希望在mc有限資源的前提下,使得所預(yù)取的數(shù)據(jù)盡可能都是mc需要的,并且盡可能多的提供有效查詢信息。在數(shù)據(jù)擇取過程中應(yīng)考慮以下兩種情
7、況:①當s=0(緩存已滿)時,不論c中是否有剩余的未被預(yù)取的ldd,都將停止預(yù)取。②當0<s(緩存還有剩余空間)且size(i)>s,則根據(jù)mc當前位置和緩存的剩余空間來計算應(yīng)預(yù)取數(shù)據(jù)總量的大小。2模擬實驗及性能分析實驗以預(yù)取數(shù)據(jù)在緩存中的命中率為指標進行測試對比。測試的工作負載為一組隨機產(chǎn)生的查詢序列,由100個查詢組成,每次查詢生成的條件字段、條件值和數(shù)據(jù)表都是按照一定的規(guī)則隨機產(chǎn)生的。將mc的緩存的大小分別設(shè)置為實驗數(shù)據(jù)總量的10%、15%、20%、25%、30%時分別進行五組實驗,實驗結(jié)果如圖1所示。3結(jié)論在移動