成人午夜视频全免费观看高清-秋霞福利视频一区二区三区-国产精品久久久久电影小说-亚洲不卡区三一区三区一区

使用C#CefSharpPython采集某網(wǎng)站簡歷并且自動發(fā)送邀請短信的方法

前言

創(chuàng)新互聯(lián)建站2013年開創(chuàng)至今,先為漾濞等服務(wù)建站,漾濞等地企業(yè),進行企業(yè)商務(wù)咨詢服務(wù)。為漾濞企業(yè)網(wǎng)站制作PC+手機+微官網(wǎng)三網(wǎng)同步一站式服務(wù)解決您的所有建站問題。

以往爬蟲沒怎么研究過,最近有個需求,要從某網(wǎng)站采集敏感信息,稍稍考慮了一下,決定利用C# Winform和Python一起來解決這個事件。

整個解決方案不復雜:C#編寫WinForm窗體,進行數(shù)據(jù)分析和采集, Python本來不想用的,一下子沒找到C#下Woff字體轉(zhuǎn)Xml的方案,而網(wǎng)上Python的則有很多,所以就加了一個Python項目,雖然就1個腳本。

使用C# CefSharp Python采集某網(wǎng)站簡歷并且自動發(fā)送邀請短信的方法 

一、幾個步驟:

首先要模擬登錄,登錄完了進入簡歷采集,然后模擬下載,下載完了以后就可以看到求職者的電話了。

這個電話號碼是使用動態(tài)生成的Base64字體,所以直接提取文字是無法成功的。

1、先將Base64轉(zhuǎn)成Woff字體,這個可以用C#完成(這其中的iso-8859-1編碼是個坑,一般用Default會出現(xiàn)驚喜):

SetMainStatus("正在生成WOFF...");
   byte[] fontBytes = Convert.FromBase64String(CurFont);
   string fontStr = Encoding.GetEncoding("iso-8859-1").GetString(fontBytes).TrimEnd('\0');
   StreamWriter sw2 = new StreamWriter(@"R58.woff", false, Encoding.GetEncoding("iso-8859-1"));
   sw2.Write(fontStr);
   sw2.Close();

2、再將已經(jīng)生成的Woff轉(zhuǎn)成XML(WoffDec.exe是我用Python打包的Exe,其實有點小題大做了,為了這一個轉(zhuǎn)化專門打了一個包,有時間還是整一個C#下面的好)

//調(diào)用python exe 生成xml文件
   ProcessStartInfo info = new ProcessStartInfo
   {
    FileName = "WoffDec.exe",
    WindowStyle = ProcessWindowStyle.Hidden
   };
   Process.Start(info).WaitForExit(2000);//在2秒內(nèi)等待返回

整個WoffDec.py的代碼就3行:

from fontTools.ttLib import TTFont
font = TTFont('R12.woff')
font.saveXML('R12.xml')

這個打包是有點意思的,先試了py2exe,不成功,換pyinstaller, 成了,連EXE一起有11M,也不是很大。

https://github.com/pyinstaller/pyinstaller 下載 或者 本地下載 ,或者在VS2017 Python環(huán)境下搜索PyInstaller直接安裝。

右鍵使用“打開此處的命令提示符”;輸入pyinstaller /path/to/yourscript.py即可打包成一個exe文件。在Winform應(yīng)用調(diào)用時,應(yīng)該整個文件夾都拷貝過去。

3、XML文件有了以后,以上面的Woff文件為基準準備為一個數(shù)據(jù)字典存儲起來(這個地方有點繞,先找一個網(wǎng)站把Woff顯示成文字和編碼,然后根據(jù)編碼在XML中查找它的字體定位點,我取的X和Y組成唯一值(X,Y就代表一個字),當然也可以取更多;

internal static readonly Dictionary<string, string> DicChar = new Dictionary<string, string>()
  {
   {"91,744","0" },
   {"570,0","1"},
   {"853,1143","2" },
   {"143,259","3" },
   。。。。。。
  };

4、上面這一步是要花點時間的,基準字典有了以后,就可以按每次生成的XML文件來進行匹配真實文字了。

5、真實文字取出后面的就簡單了,直接采集到數(shù)據(jù)庫,再連上短信發(fā)送業(yè)務(wù),就可以自動群發(fā)了。

二、使用場景

上班后開啟采集服務(wù)即不用再理會,由系統(tǒng)每間隔一段時間自動下載簡歷,并自動推送面試邀請短信。只要有新人發(fā)布對口的求職信息,系統(tǒng)就會馬上給他發(fā)送邀請,實為搶人利器。

BTW:網(wǎng)頁模擬操作使用的CEFSharp將另開一章。

總結(jié)

以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對創(chuàng)新互聯(lián)的支持。

本文標題:使用C#CefSharpPython采集某網(wǎng)站簡歷并且自動發(fā)送邀請短信的方法
當前路徑:http://jinyejixie.com/article26/gcepcg.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供做網(wǎng)站、自適應(yīng)網(wǎng)站網(wǎng)站制作、域名注冊、網(wǎng)站維護手機網(wǎng)站建設(shè)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

綿陽服務(wù)器托管
定兴县| 商丘市| 新丰县| 凤庆县| 道孚县| 林州市| 肥乡县| 张家界市| 台前县| 三门县| 吉木萨尔县| 宁城县| 云阳县| 子长县| 军事| 大兴区| 开原市| 开原市| 康保县| 礼泉县| 陵川县| 湘西| 高尔夫| 镇安县| 英德市| 杭州市| 巍山| 犍为县| 陆河县| 余干县| 东乡| 阳西县| 共和县| 靖安县| 宕昌县| 邻水| 浑源县| 上饶县| 城固县| 元氏县| 耒阳市|