工作中經(jīng)常遇到一類(lèi)需求,根據(jù) IP 地址段來(lái)查找 IP 對(duì)應(yīng)的歸屬地信息。如果把查詢(xún)過(guò)程放到關(guān)系型數(shù)據(jù)庫(kù)中,會(huì)帶來(lái)很大的 IO 消耗,速度也不能滿(mǎn)足,顯然是不合適的。
創(chuàng)新互聯(lián)公司從2013年開(kāi)始,先為東營(yíng)區(qū)等服務(wù)建站,東營(yíng)區(qū)等地企業(yè),進(jìn)行企業(yè)商務(wù)咨詢(xún)服務(wù)。為東營(yíng)區(qū)企業(yè)網(wǎng)站制作PC+手機(jī)+微官網(wǎng)三網(wǎng)同步一站式服務(wù)解決您的所有建站問(wèn)題。那有哪些更好的辦法呢?為此做了一些嘗試,下面來(lái)詳細(xì)說(shuō)明。
構(gòu)建索引文件
在 GitHub 上看到一個(gè)ip2region 項(xiàng)目,作者通過(guò)生成一個(gè)包含有二級(jí)索引的文件來(lái)實(shí)現(xiàn)快速查詢(xún),查詢(xún)速度足夠快,毫秒級(jí)別。但如果想更新地址段或歸屬地信息,每次都要重新生成文件,并不是很方便。
不過(guò)還是推薦大家看看這個(gè)項(xiàng)目,其中建索引的思想還是很值得學(xué)習(xí)的。作者的開(kāi)源項(xiàng)目中只有查詢(xún)的相關(guān)代碼,并沒(méi)有生成索引文件的代碼,我依照原理圖寫(xiě)了一段生成索引文件的代碼,如下:
# -*- coding:utf-8 -*- import time import socket import struct IP_REGION_FILE = './data/ip_to_region.db' SUPER_BLOCK_LENGTH = 8 INDEX_BLOCK_LENGTH = 12 HEADER_INDEX_LENGTH = 8192 def generate_db_file(): pointer = SUPER_BLOCK_LENGTH + HEADER_INDEX_LENGTH region, index = '', '' # 文件格式 # 1.0.0.0|1.0.0.255|澳大利亞|0|0|0|0 # 1.0.1.0|1.0.3.255|中國(guó)|0|福建省|福州市|電信 with open('./ip.merge.txt', 'r') as f: for line in f.readlines(): item = line.strip().split('|') print item[0], item[1], item[2], item[3], item[4], item[5], item[6] start_ip = struct.pack('I', struct.unpack('!L', socket.inet_aton(item[0]))[0]) end_ip = struct.pack('I', struct.unpack('!L', socket.inet_aton(item[1]))[0]) region_item = '|'.join([item[2], item[3], item[4], item[5], item[6]]) region += region_item ptr = struct.pack('I', int(bin(len(region_item))[2:].zfill(8) + bin(pointer)[2:].zfill(24), 2)) index += start_ip + end_ip + ptr pointer += len(region_item) index_start_ptr = pointer index_end_ptr = pointer + len(index) - 12 super_block = struct.pack('I', index_start_ptr) + struct.pack('I', index_end_ptr) n = 0 header_index = '' for index_block in range(pointer, index_end_ptr, 8184): header_index_block_ip = index[n * 8184:n * 8184 + 4] header_index_block_ptr = index_block header_index += header_index_block_ip + struct.pack('I', header_index_block_ptr) n += 1 header_index += index[len(index) - 12: len(index) - 8] + struct.pack('I', index_end_ptr) with open(IP_REGION_FILE, 'wb') as f: f.write(super_block) f.write(header_index) f.seek(SUPER_BLOCK_LENGTH + HEADER_INDEX_LENGTH, 0) f.write(region) f.write(index) if __name__ == '__main__': start_time = time.time() generate_db_file() print 'cost time: ', time.time() - start_time
當(dāng)前名稱(chēng):使用Redis有序集合實(shí)現(xiàn)IP歸屬地查詢(xún)?cè)斀?創(chuàng)新互聯(lián)
地址分享:http://jinyejixie.com/article44/hgjhe.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站制作、響應(yīng)式網(wǎng)站、軟件開(kāi)發(fā)、靜態(tài)網(wǎng)站、域名注冊(cè)、做網(wǎng)站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶(hù)投稿、用戶(hù)轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話(huà):028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容