Python實(shí)現(xiàn)JS解密并爬取網(wǎng)站?很多新手對(duì)此不是很清楚,為了幫助大家解決這個(gè)難題,下面小編將為大家詳細(xì)講解,有這方面需求的人可以來學(xué)習(xí)下,希望你能有所收獲。
創(chuàng)新互聯(lián)公司 - 雅安移動(dòng)機(jī)房,四川服務(wù)器租用,成都服務(wù)器租用,四川網(wǎng)通托管,綿陽服務(wù)器托管,德陽服務(wù)器托管,遂寧服務(wù)器托管,綿陽服務(wù)器托管,四川云主機(jī),成都云主機(jī),西南云主機(jī),雅安移動(dòng)機(jī)房,西南服務(wù)器托管,四川/成都大帶寬,成都機(jī)柜租用,四川老牌IDC服務(wù)商打開開發(fā)者工具
選擇XHR標(biāo)簽頁,沒有找到什么
再查看一下這些圖片的URL值
http://mhpic.xiaomingtaiji.net/comic/D%2F%E6%96%97%E7%A0%B4%E8%8B%8D%E7%A9%B9%E6%8B%86%E5%88%86%E7%89%88%2F20%E8%AF%9D%2F1.jpg-zymk.middle.webp
嘗試搜索圖片元素
發(fā)現(xiàn)有一個(gè)js文件,打開搜索
發(fā)現(xiàn)這里有一個(gè)疑點(diǎn),這不是html里面的字段嗎,那么 “i.getPicUrl(e)” 不就是那個(gè)圖片的URL的值了嗎
在這里下一個(gè)斷點(diǎn),走你
果然,這個(gè)就那個(gè)圖片URL生成的切入點(diǎn),現(xiàn)在就是看調(diào)用棧,找到這個(gè)函數(shù)的起點(diǎn),點(diǎn)擊右側(cè)的 ”e.init“,這里有一個(gè)setInitData函數(shù),從名字來看,應(yīng)該就是設(shè)置初始數(shù)據(jù)的地方,在這里下一個(gè)斷點(diǎn),進(jìn)去看看
這里有一個(gè)this.imgpath,這個(gè)應(yīng)該就是圖片的URL值了,點(diǎn)擊F10,再單步調(diào)式,來到了charcode函數(shù)
進(jìn)去看看,這里應(yīng)該就是加密函數(shù)了
這里一步步調(diào)式,不要著急,來到了這里
繼續(xù)單步調(diào)式,在第二次打開這么VM文件的時(shí)候,”__cr.imgpath“這個(gè)看起來很熟悉呀
Plain Text
"L-:N-M>-A>-A?-M?-I8-J<-M@-@J-@L-M?-IA-JA-M>-@J-@>-M=-@@-@>-M?-@A-@@-:N:8-M@-IN-AL-:N"
打開頁面源代碼,就在這里啦,不僅僅有圖片的URL加密值,還有其他數(shù)據(jù),這些都是在后面圖片URL拼接需要使用到的
現(xiàn)在我們?cè)僦匦驴纯茨莻€(gè)加密函數(shù),它無非就是遍歷那個(gè)加密值的每個(gè)字符,獲取其Unicode值,再與__cr.chapter_id進(jìn)行相關(guān)運(yùn)算,然后再得到的Unicode數(shù)值返回字符
現(xiàn)在我們可以用python仿寫這個(gè)算法
接下就是平常get請(qǐng)求獲取必要的數(shù)據(jù)了,通過正則獲取元素,拼接,以下是源碼
看完上述內(nèi)容是否對(duì)您有幫助呢?如果還想對(duì)相關(guān)知識(shí)有進(jìn)一步的了解或閱讀更多相關(guān)文章,請(qǐng)關(guān)注創(chuàng)新互聯(lián)-成都網(wǎng)站建設(shè)公司行業(yè)資訊頻道,感謝您對(duì)創(chuàng)新互聯(lián)的支持。
新聞標(biāo)題:Python實(shí)現(xiàn)JS解密并爬取網(wǎng)站-創(chuàng)新互聯(lián)
文章出自:http://jinyejixie.com/article48/dpeeep.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站設(shè)計(jì)公司、搜索引擎優(yōu)化、網(wǎng)站改版、品牌網(wǎng)站建設(shè)、面包屑導(dǎo)航、服務(wù)器托管
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容