欧美日产国产精品,国产精品vvv,国内精品视频久久,综合国产精品

每周一數丨數據+采集規則,免費送!

2019-10-31 13:43:41 瀏覽:5717
采集網址:

http://www.bio-equip.com/Suppliers.asp?=&page=1

QQ截圖20191031133635.png


采集目標:


廠商名稱,地區,電話,網站,瀏覽數


使用工具:
1. 火車采集器
2. Fidder抓包軟件
采集成果:

QQ截圖20191031133709.png



那么我們接下來看如何用火車采集器來獲取法律法規數據。
第一步:打開火車官網 www.52gzqy.com 下載最新版火車采集器并安裝
第二步:


在桌面瀏覽器中打開列表頁網址:

http://www.bio-equip.com/Suppliers.asp?=&page=1 

 

點擊下一頁,可以看到網址中有頁數變化:

http://www.bio-equip.com/Suppliers.asp?=&page=2

 

同時可以觀察到需要采集的字段都在列表頁頁面上顯示



QQ截圖20191031133836.png

第三步:


那么在采集器中起始網址可以使用批量網址的操作


QQ截圖20191031133906.png




打開列表頁網址源碼,在源碼中獲取提取內容頁網址的字符串:

QQ截圖20191031133934.png



同時可以看到需要采集的字段在列表頁源碼中也存在(且列表頁源碼中可以看到td位置對應需要采集字段的值),那么就可以直接在列表頁中采集

QQ截圖20191031134006.png

把所有需要的數據用組合標簽在列表頁中獲取下來,然后在內容頁采集規則中細分多個標簽中去。


第四步:


把組合標簽處理下,讓組合標簽中的數據只有<td>數據</td>,方便細分標簽的提取。

QQ截圖20191031134044.png


然后細分標簽中使用組合標簽,按照td的數量進行提取:比如廠商名稱(是第一個td中的值)

QQ截圖20191031134115.png



第五步:


比如電話標簽(是第三個td中的值)

QQ截圖20191031134141.png




每周一數數據以及采集規則領取時間為2019/10/30日發文后5個工作日內。采集規則涉及到商業版本功能,建議用戶登錄商業版本使用此規則。


數據領取資格:火車采集器/火車瀏覽器/觸控精靈商業版軟件用戶(服務年限內),如果您不是商業用戶或者已經過了服務年限,但也想參與活動的話,可以新購軟件或者升級續費,這樣就能參與活動啦!通知一下哦,雙11火車活動優惠折扣很大呢!活動將于11月1日開始,詳情登陸官網:www.52gzqy.com 查看。


數據領取方式

第一步:掃碼添加火車運營微信號,火車運營助手會拉你進入活動群。

微信圖片_20191024173419.jpg


第二步:進群后添加數據咨詢客服.雅的微信號,經客服驗證為服務年限內商業用戶身份后,即可領取


好啦,本期的“每周一數”就到這里了。如果您還有想要獲取更多的數據資源以及采集器規則的話,可以在文章下方或是公眾號后臺留言,小采會綜合大家的意見選擇下一期贈送數據的主題哦!

掃碼關注微信
主站蜘蛛池模板: 潜江市| 武城县| 犍为县| 宾川县| 龙海市| 上思县| 旬阳县| 墨竹工卡县| 修文县| 浦北县| 赣榆县| 玉龙| 平乡县| 山阳县| 南昌县| 运城市| 恩平市| 敖汉旗| 岚皋县| 九龙城区| 天峨县| 崇左市| 钟山县| 留坝县| 司法| 舟山市| 正阳县| 青川县| 舞阳县| 个旧市| 德江县| 开封市| 当阳市| 杭锦后旗| 龙海市| 台东县| 旬阳县| 高淳县| 阿鲁科尔沁旗| 昌邑市| 上虞市|