純真ip數(shù)據(jù)庫格式詳解

純真ip數(shù)據(jù)庫格式詳解

ID:11157858

大?。?9.50 KB

頁數(shù):8頁

時間:2018-07-10

純真ip數(shù)據(jù)庫格式詳解_第1頁
純真ip數(shù)據(jù)庫格式詳解_第2頁
純真ip數(shù)據(jù)庫格式詳解_第3頁
純真ip數(shù)據(jù)庫格式詳解_第4頁
純真ip數(shù)據(jù)庫格式詳解_第5頁
資源描述:

《純真ip數(shù)據(jù)庫格式詳解》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。

1、純真IP數(shù)據(jù)庫格式詳解摘要網(wǎng)絡(luò)上的IP數(shù)據(jù)庫以純真版的最為流行,LumaQQ也采用了純真版IP數(shù)據(jù)庫做為IP查詢功能的基礎(chǔ)。不過關(guān)于其格式的文檔卻非常之少,后來終于在網(wǎng)上找到了一份文檔,得以了解其內(nèi)幕,不過那份文檔寥寥數(shù)語,也是頗為耐心才讀明白。在這里我重寫一份,以此做為LumaQQ開發(fā)者文檔的一部分,我想還是必要的。本文詳細(xì)介紹了純真IP數(shù)據(jù)庫的格式,并且給出了一些Demo以供參考。Luma,清華大學(xué)修改日期:2005/01/14Note:在此感謝純真IP數(shù)據(jù)庫作者金狐和那唯一一份文檔的作者。修改歷史:2005-01-14修改了原來一些表達(dá)不清和錯誤

2、的地方自從有了IP數(shù)據(jù)庫這種東西,QQ外掛的顯示IP功能也隨之而生,本人見識頗窄,是否還有其他應(yīng)用不得而知,不過,IP數(shù)據(jù)庫確實(shí)是個不錯的東西。如今網(wǎng)絡(luò)上最流行的IP數(shù)據(jù)庫我想應(yīng)該是純真版的(說錯了也不要扁我),迄今為止其IP記錄條數(shù)已經(jīng)接近30000,對于有些IP甚至能精確到樓層,不亦快哉。2004年4、5月間,正逢LumaQQ破土動工,為了加上這個人人都喜歡,但是好像人人都不知道為什么喜歡的顯IP功能,我也采用了純真版IP數(shù)據(jù)庫,它的優(yōu)點(diǎn)是記錄多,查詢速度快,它只用一個文件QQWry.dat就包含了所有記錄,方便嵌入到其他程序中,也方便升級?;窘Y(jié)

3、構(gòu)QQWry.dat文件在結(jié)構(gòu)上分為3塊:文件頭,記錄區(qū),索引區(qū)。一般我們要查找IP時,先在索引區(qū)查找記錄偏移,然后再到記錄區(qū)讀出信息。由于記錄區(qū)的記錄是不定長的,所以直接在記錄區(qū)中搜索是不可能的。由于記錄數(shù)比較多,如果我們遍歷索引區(qū)也會是有點(diǎn)慢的,一般來說,我們可以用二分查找法搜索索引區(qū),其速度比遍歷索引區(qū)快若干數(shù)量級。圖1是QQWry.dat的文件結(jié)構(gòu)圖。圖1.QQWry.dat文件結(jié)構(gòu)要注意的是,QQWry.dat里面全部采用了little-endian字節(jié)序一.了解文件頭QQWry.dat的文件頭只有8個字節(jié),其結(jié)構(gòu)非常簡單,首四個字節(jié)是第一條

4、索引的絕對偏移,后四個字節(jié)是最后一條索引的絕對偏移。二.了解記錄區(qū)每條IP記錄都由國家和地區(qū)名組成,國家地區(qū)在這里并不是太確切,因?yàn)榭赡軙槌鰜怼扒迦A大學(xué)計(jì)算機(jī)系”之類的,這里清華大學(xué)就成了國家名了,所以這個國家地區(qū)名和IP數(shù)據(jù)庫制作的時候有關(guān)系。所以記錄的格式有點(diǎn)像QName,有一個全局部分和局部部分組成,我們這里還是沿用國家名和地區(qū)名的說法。于是我們想象著一條記錄的格式應(yīng)該是:[IP地址][國家名][地區(qū)名],當(dāng)然,這個沒有什么問題,但是這只是最簡單的情況。很顯然,國家名和地區(qū)名可能會有很多的重復(fù),如果每條記錄都保存一個完整的名稱拷貝是非常不理想的

5、,所以我們就需要重定向以節(jié)省空間。所以為了得到一個國家名或者地區(qū)名,我們就有了兩個可能:第一就是直接的字符串表示的國家名,第二就是一個4字節(jié)的結(jié)構(gòu),第一個字節(jié)表明了重定向的模式,后面3個字節(jié)是國家名或者地區(qū)名的實(shí)際偏移位置。對于國家名來說,情況還可能更復(fù)雜些,因?yàn)檫@樣的重定向最多可能有兩次。那么什么是重定向模式?根據(jù)上面所說,一條記錄的格式是[IP地址][國家記錄][地區(qū)記錄],如果國家記錄是重定向的話,那么地區(qū)記錄是有可能沒有的,于是就有了兩種情況,我管他叫做模式1和模式2。我們對這些格式的情況舉圖說明:圖2.IP記錄的最簡單形式圖2表示了最簡單的I

6、P記錄格式,我想沒有什么可以解釋的圖3.重定向模式1圖3演示了重定向模式1的情況。我們看到在模式1的情況下,地區(qū)記錄也跟著國家記錄走了,在IP地址之后只剩下了國家記錄的4字節(jié),后面3個字節(jié)構(gòu)成了一個指針,指向了實(shí)際的國家名,然后又跟著地址名。模式1的標(biāo)識字節(jié)是0x01。圖4.重定向模式2圖4演示了重定向模式2的情況。我們看到了在模式2的情況下(其標(biāo)識字節(jié)是0x02),地區(qū)記錄沒有跟著國家記錄走,因此在國家記錄之后4個字節(jié)之后還是有地區(qū)記錄。我想你已經(jīng)明白了模式1和模式2的區(qū)別,即:模式1的國家記錄后面不會再有地區(qū)記錄,模式2的國家記錄后會有地區(qū)記錄。下

7、面我們來看一下更復(fù)雜的情況。圖5.混和情況1圖5演示了當(dāng)國家記錄為模式1的時候可能出現(xiàn)的更復(fù)雜情況,在這種情況下,重定向指向的位置仍然是個重定向,不過第二次重定向?yàn)槟J?。大家不用擔(dān)心,沒有模式3了,這個重定向也最多只有兩次,并且如果發(fā)生了第二次重定向,則其一定為模式2,而且這種情況只會發(fā)生在國家記錄上,對于地區(qū)記錄,模式1和模式2是一樣的,地區(qū)記錄也不會發(fā)生2次重定向。不過,這個圖還可以更復(fù)雜,如圖7:圖6.混和情況2圖6是模式1下最復(fù)雜的混和情況,不過我想應(yīng)該也很好理解,只不過地區(qū)記錄也來重定向而已,有一點(diǎn)我要提醒你,如果重定向的地址是0,則表示未

8、知的地區(qū)名。所以我們總結(jié)如下:一條IP記錄由[IP地址][國家記錄][地區(qū)記錄]組成,對于國家

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。