成人午夜视频全免费观看高清-秋霞福利视频一区二区三区-国产精品久久久久电影小说-亚洲不卡区三一区三区一区

Python怎么爬取網(wǎng)站音樂素材

本篇內(nèi)容主要講解“Python怎么爬取網(wǎng)站音樂素材”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“Python怎么爬取網(wǎng)站音樂素材”吧!

創(chuàng)新互聯(lián)公司是一家集網(wǎng)站建設,興山企業(yè)網(wǎng)站建設,興山品牌網(wǎng)站建設,網(wǎng)站定制,興山網(wǎng)站建設報價,網(wǎng)絡營銷,網(wǎng)絡優(yōu)化,興山網(wǎng)站推廣為一體的創(chuàng)新建站企業(yè),幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強企業(yè)競爭力??沙浞譂M足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網(wǎng)需求。同時我們時刻保持專業(yè)、時尚、前沿,時刻以成就客戶成長自我,堅持不斷學習、思考、沉淀、凈化自己,讓我們?yōu)楦嗟钠髽I(yè)打造出實用型網(wǎng)站。

前言

基本開發(fā)環(huán)境

  • Python 3.6

  • Pycharm

相關(guān)模塊的使用

import os
import concurrent.futures
import requests
import parsel

安裝Python并添加到環(huán)境變量,pip安裝需要的相關(guān)模塊即可。

一、確定需求

Python怎么爬取網(wǎng)站音樂素材


如果想要驗證這個鏈接是否是音頻的真實下載地址,可以復制鏈接粘貼到新的窗口中。

Python怎么爬取網(wǎng)站音樂素材

https://downsc.chinaz.net/Files/DownLoad/sound1/202102/s830.mp3

老思路了,復制鏈接中的某些參數(shù)在開發(fā)者工具中進行搜索,很明顯 s830 就是音頻的ID了。


搜索 s830 找到來源,發(fā)現(xiàn)網(wǎng)頁頁面中自帶有下載地址。獲取音頻下載地址之后需要自己拼接url。

網(wǎng)頁數(shù)據(jù)不復雜,相對而言還是比較簡單的。
1、請求當前網(wǎng)頁數(shù)據(jù),獲取音頻地址以及音頻標題
2、保存下載就可以了

三、代碼實現(xiàn)

獲取音頻ID以及音頻標題

def main(html_url):
    html_data = get_response(html_url).text
    selector = parsel.Selector(html_data)
    lis = selector.css('#AudioList .container .audio-item')
    for li in lis:
        name = li.css('.name::text').get().strip()
        src = li.css('audio::attr(src)').get()
        audio_url = 'https:' + src
        save(name, audio_url)
        print(name, audio_url)

保存數(shù)據(jù)

def save(name, audio_url):
    header = {
        'Upgrade-Insecure-Requests': '1',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
    }
    audio_content = requests.get(url=audio_url, headers=header).content
    path = 'audio\\'
    if not os.path.exists(path):
        os.mkdir(path)
    with open(path + name + '.mp3', mode='wb') as f:
        f.write(audio_content)

這里想要重新給一個headers參數(shù),不然會下載不了。代碼會一直運行,但是沒有反應

多線程爬取

if __name__ == '__main__':
    executor = concurrent.futures.ThreadPoolExecutor(max_workers=5)
    for page in range(1, 31):
        url = f'https://sc.chinaz.com/yinxiao/index_{page}.html'
        # main(url)
        executor.submit(main, url)

Python怎么爬取網(wǎng)站音樂素材

到此,相信大家對“Python怎么爬取網(wǎng)站音樂素材”有了更深的了解,不妨來實際操作一番吧!這里是創(chuàng)新互聯(lián)網(wǎng)站,更多相關(guān)內(nèi)容可以進入相關(guān)頻道進行查詢,關(guān)注我們,繼續(xù)學習!

網(wǎng)站名稱:Python怎么爬取網(wǎng)站音樂素材
URL網(wǎng)址:http://jinyejixie.com/article8/ijjgop.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站導航、微信公眾號、網(wǎng)站制作面包屑導航、動態(tài)網(wǎng)站、靜態(tài)網(wǎng)站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

營銷型網(wǎng)站建設
鹤庆县| 图木舒克市| 天等县| 静海县| 鹤峰县| 临泽县| 叙永县| 台南市| 康保县| 冷水江市| 大城县| 张掖市| 大荔县| 那坡县| 双柏县| 德钦县| 乐陵市| 永年县| 保亭| 虞城县| 梅河口市| 高淳县| 马鞍山市| 南丹县| 临邑县| 宣威市| 黔西| 江西省| 揭西县| 洛南县| 丹东市| 阿拉尔市| 焦作市| 信宜市| 绿春县| 普兰县| 平昌县| 新竹市| 犍为县| 灵宝市| 奈曼旗|