成人午夜视频全免费观看高清-秋霞福利视频一区二区三区-国产精品久久久久电影小说-亚洲不卡区三一区三区一区

怎么用node抓取寶可夢(mèng)圖鑒并生成Excel文件

本文小編為大家詳細(xì)介紹“怎么用node抓取寶可夢(mèng)圖鑒并生成Excel文件”,內(nèi)容詳細(xì),步驟清晰,細(xì)節(jié)處理妥當(dāng),希望這篇“怎么用node抓取寶可夢(mèng)圖鑒并生成Excel文件”文章能幫助大家解決疑惑,下面跟著小編的思路慢慢深入,一起來(lái)學(xué)習(xí)新知識(shí)吧。

站在用戶的角度思考問(wèn)題,與客戶深入溝通,找到黟縣網(wǎng)站設(shè)計(jì)與黟縣網(wǎng)站推廣的解決方案,憑借多年的經(jīng)驗(yàn),讓設(shè)計(jì)與互聯(lián)網(wǎng)技術(shù)結(jié)合,創(chuàng)造個(gè)性化、用戶體驗(yàn)好的作品,建站類型包括:網(wǎng)站建設(shè)、網(wǎng)站制作、企業(yè)官網(wǎng)、英文網(wǎng)站、手機(jī)端網(wǎng)站、網(wǎng)站推廣、申請(qǐng)域名、雅安服務(wù)器托管、企業(yè)郵箱。業(yè)務(wù)覆蓋黟縣地區(qū)。

怎么用node抓取寶可夢(mèng)圖鑒并生成Excel文件

爬取數(shù)據(jù)

既然是爬取數(shù)據(jù),那我們先找一個(gè)有寶可夢(mèng)圖鑒數(shù)據(jù)的網(wǎng)頁(yè):

這個(gè)網(wǎng)站是用PHP寫(xiě)的,前后沒(méi)有做分離,所以我們不會(huì)讀接口來(lái)捕獲數(shù)據(jù),我們使用 crawler 庫(kù),來(lái)捕獲網(wǎng)頁(yè)中的元素從而得到數(shù)據(jù)。提前說(shuō)明一下,用 crawler 庫(kù),好處是你可以用 jQuery 的方式在Node環(huán)境中捕獲元素。

安裝:

yarn add crawler

實(shí)現(xiàn):

const Crawler = require("crawler");
const fs = require("fs")
const { resolve } = require("path")

let crawler = new Crawler({
    timeout: 10000,
    jQuery: true,
});

let crawler = new Crawler({
    timeout: 10000,
    jQuery: true,
});

function getPokemon() {
    let uri = "" // 寶可夢(mèng)圖鑒地址
    let data = []
    return new Promise((resolve, reject) => {
        crawler.queue({
            uri,
            callback: (err, res, done) => {
                if (err) reject(err);
                let $ = res.$;
                try {
                    let $tr = $(".roundy.eplist tr");
                    $tr.each((i, el) => {
                        let $td = $(el).find("td");
                        let _code = $td.eq(1).text().split("\n")[0]
                        let _name = $td.eq(3).text().split("\n")[0]
                        let _attr = $td.eq(4).text().split("\n")[0]
                        let _other = $td.eq(5).text().split("\n")[0]
                        _attr = _other.indexOf("屬性") != -1 ? _attr : `${_attr}+${_other}`
                        if (_code) {
                            data.push([_code, _name, _attr])
                        }
                    })
                    done();
                    resolve(data)
                } catch (err) {
                    done()
                    reject(err)
                }

            }
        })
    })
}

在生成實(shí)例的時(shí)候,還需要開(kāi)啟 jQuery 模式,然后,就可以使用 $ 符了。而以上代碼的中間部分的業(yè)務(wù)就是在捕獲元素爬取網(wǎng)頁(yè)中所需要的數(shù)據(jù),使用起來(lái)和 jQuery API 一樣,這里就不再贅述了 。

getPokemon().then(async data => {
    console.log(data)
})

最后我們可以執(zhí)行并打印一下傳過(guò)來(lái)的 data 數(shù)據(jù),來(lái)驗(yàn)證確實(shí)爬取到了格式也沒(méi)有錯(cuò)誤。

怎么用node抓取寶可夢(mèng)圖鑒并生成Excel文件

寫(xiě)入Excel

既然剛才已經(jīng)爬取到數(shù)據(jù)了,接下來(lái),我們就將使用 node-xlsx 庫(kù),來(lái)完成把數(shù)據(jù)寫(xiě)入并生成一個(gè) Excel 文件中。

首先,我們先介紹一下,node-xlsx 是一個(gè)簡(jiǎn)單的 excel 文件解析器和生成器。由 TS 構(gòu)建的一個(gè)依靠 SheetJS xlsx 模塊來(lái)解析/構(gòu)建 excel 工作表,所以,在一些參數(shù)配置上,兩者可以通用。

安裝:

yarn add node-xlsx

實(shí)現(xiàn):

const xlsx = require("node-xlsx")

getPokemon().then(async data => {
    let title = ["編號(hào)", "寶可夢(mèng)", "屬性"]
    let list = [{
        name: "關(guān)都",
        data: [
            title,
            ...data
        ]
    }];
    const sheetOptions = { '!cols': [{ wch: 15 }, { wch: 20 }, { wch: 20 }] };
    const buffer = await xlsx.build(list, { sheetOptions })
    try {
        await fs.writeFileSync(resolve(__dirname, "data/pokemon.xlsx"), buffer, "utf8")
    } catch (error) { }
})

name 則是Excel文件中的欄目名,而其中的 data 類型是數(shù)組其也要傳入一個(gè)數(shù)組,構(gòu)成二維數(shù)組,其表示從 ABCDE.... 列中開(kāi)始排序傳入文本。同時(shí),可以通過(guò)!cols來(lái)設(shè)置列寬。第一個(gè)對(duì)象wch:10  則表示 第一列寬度為10 個(gè)字符,還有很多參數(shù)可以設(shè)置,可以參照 xlsx 庫(kù) 來(lái)學(xué)習(xí)這些配置項(xiàng)。

最后,我們通過(guò) xlsx.build 方法來(lái)生成 buffer 數(shù)據(jù),最后用 fs.writeFileSync 寫(xiě)入或創(chuàng)建一個(gè) Excel 文件中,為了方便查看,我這里存入了 名叫 data 的文件夾里,此時(shí),我們?cè)?data 文件夾 就會(huì)發(fā)現(xiàn)多出一個(gè)叫 pokemon.xlsx 的文件,打開(kāi)它,數(shù)據(jù)還是那些,這樣把數(shù)據(jù)寫(xiě)入到Excel的這步操作就完成了。

怎么用node抓取寶可夢(mèng)圖鑒并生成Excel文件

讀取Excel

讀取Excel其實(shí)非常容易甚至不用寫(xiě)  fs 的讀取, 用xlsx.parse 方法傳入文件地址就能直接讀取到。

xlsx.parse(resolve(__dirname, "data/pokemon.xlsx"));

當(dāng)然,我們?yōu)榱蓑?yàn)證準(zhǔn)確無(wú)誤,直接寫(xiě)一個(gè)接口,看看能不能訪問(wèn)到數(shù)據(jù)。為了方便我直接用 express 框架來(lái)完成這件事。

先來(lái)安裝一下:

yarn add express

然后,再創(chuàng)建  express 服務(wù),我這里端口號(hào)就用3000了,就寫(xiě)一個(gè) GET 請(qǐng)求把讀取Excel文件的數(shù)據(jù)發(fā)送出去就好。

const express = require("express")
const app = express();
const listenPort = 3000;

app.get("/pokemon",(req,res)=>{
    let data = xlsx.parse(resolve(__dirname, "data/pokemon.xlsx"));
    res.send(data)
})

app.listen(listenPort, () => {
    console.log(`Server running at http://localhost:${listenPort}/`)
})

最后,我這里用 postman 訪問(wèn)接口,就可以清楚的看到,我們從爬取到存入表格所有的寶可夢(mèng)數(shù)據(jù)都接收到了。

怎么用node抓取寶可夢(mèng)圖鑒并生成Excel文件

讀到這里,這篇“怎么用node抓取寶可夢(mèng)圖鑒并生成Excel文件”文章已經(jīng)介紹完畢,想要掌握這篇文章的知識(shí)點(diǎn)還需要大家自己動(dòng)手實(shí)踐使用過(guò)才能領(lǐng)會(huì),如果想了解更多相關(guān)內(nèi)容的文章,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。

分享名稱:怎么用node抓取寶可夢(mèng)圖鑒并生成Excel文件
文章來(lái)源:http://jinyejixie.com/article38/ghhdpp.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供軟件開(kāi)發(fā)網(wǎng)站設(shè)計(jì)、動(dòng)態(tài)網(wǎng)站、定制開(kāi)發(fā)、網(wǎng)站建設(shè)建站公司

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

h5響應(yīng)式網(wǎng)站建設(shè)
敖汉旗| 三门峡市| 凌源市| 桂林市| 伽师县| 乐平市| 资阳市| 洞头县| 抚松县| 日土县| 张掖市| 沾化县| 泽州县| 慈利县| 彭水| 霍邱县| 玛曲县| 泰兴市| 大同市| 确山县| 昭觉县| 克拉玛依市| 渝北区| 家居| 平湖市| 兴化市| 江都市| 青浦区| 邹城市| 荥经县| 沈丘县| 上饶县| 崇明县| 长白| 稻城县| 肇庆市| 朝阳市| 镇坪县| 内江市| 三明市| 周至县|