如何批量提取網(wǎng)頁圖片

如何批量提取網(wǎng)頁圖片

ID:31592613

大?。?.75 MB

頁數(shù):18頁

時間:2019-01-14

如何批量提取網(wǎng)頁圖片_第1頁
如何批量提取網(wǎng)頁圖片_第2頁
如何批量提取網(wǎng)頁圖片_第3頁
如何批量提取網(wǎng)頁圖片_第4頁
如何批量提取網(wǎng)頁圖片_第5頁
資源描述:

《如何批量提取網(wǎng)頁圖片》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。

1、八爪魚·云采集網(wǎng)絡(luò)爬蟲軟件www.bazhuayu.com如何批量提取網(wǎng)頁圖片很多人需要在網(wǎng)頁上收集大量的圖片,一個個下載費事費力。今天教給大家一個批量提取網(wǎng)頁圖片的方法,供大家提高工作效率。采集網(wǎng)站:http://image.baidu.com/search/index?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=-1&st=-1&fm=result&fr=&sf=1&fmq=1511164186444_R&pv=&ic=0&nc=1&z=&se=1&showtab=0&

2、fb=0&width=&height=&face=0&istype=2&ie=utf-8&hs=2&word=%E5%A4%8F%E7%9B%AE%E5%8F%8B%E4%BA%BA%E5%B8%90?使用功能點:l?Ajax下拉滾動/tutorialdetail-1/ajgd_7.htmll?分頁列表信息采集/tutorialdetail-1/fylb-70.html?步驟1:創(chuàng)建采集任務八爪魚·云采集網(wǎng)絡(luò)爬蟲軟件www.bazhuayu.com1)進入主界面,選擇自定義模式??2)將上面網(wǎng)址的網(wǎng)址復制粘貼到

3、網(wǎng)站輸入框中,點擊“保存網(wǎng)址”八爪魚·云采集網(wǎng)絡(luò)爬蟲軟件www.bazhuayu.com??3)系統(tǒng)自動打開網(wǎng)頁。我們發(fā)現(xiàn),百度圖片網(wǎng)是瀑布流的網(wǎng)頁,經(jīng)過每一次下拉加載,都會出現(xiàn)新的數(shù)據(jù)。當圖片足夠多的時候,可無數(shù)次下拉加載。因而,此網(wǎng)頁涉及AJAX技術(shù),需要設(shè)置AJAX超時,以便確保數(shù)據(jù)采集的時候不會遺漏。?八爪魚·云采集網(wǎng)絡(luò)爬蟲軟件www.bazhuayu.com選中“打開網(wǎng)頁”步驟,打開“高級選項”,勾選“頁面加載完成向下滾動”,設(shè)置滾動次數(shù)為“5次”(根據(jù)自身需求進行設(shè)置),時間為“2秒”,滾動方式為“

4、向下滾動一屏”;最后點擊“確定”?注意:示例網(wǎng)站,沒有翻頁按鈕,滾動次數(shù)、滾動方式會影響數(shù)據(jù)采集數(shù)量,可按需設(shè)置?步驟2:采集圖片URL八爪魚·云采集網(wǎng)絡(luò)爬蟲軟件www.bazhuayu.com1)選中頁面內(nèi)第一個圖片,系統(tǒng)會自動識別同類圖片。在操作提示框中,選擇“選中全部”??2)選擇“采集以下圖片地址”八爪魚·云采集網(wǎng)絡(luò)爬蟲軟件www.bazhuayu.com??步驟3:修改Xpath1)選中“循環(huán)”步驟,打開“高級選項”??梢钥吹桨俗︳~系統(tǒng)自動采用的是“不固定元素列表”循環(huán),Xpath為://DIV[@i

5、d='imgid']/DIV[1]/UL[1]/LI八爪魚·云采集網(wǎng)絡(luò)爬蟲軟件www.bazhuayu.com??2)將此條Xpath://DIV[@id='imgid']/DIV[1]/UL[1]/LI,復制到火狐瀏覽器中進行觀察——僅可定位到網(wǎng)頁中22張圖片八爪魚·云采集網(wǎng)絡(luò)爬蟲軟件www.bazhuayu.com??3)我們需要一條能夠定位到網(wǎng)頁中全部所需圖片的Xpath。觀察網(wǎng)頁源碼并將Xpath修改為://DIV[@id='imgid']/DIV/UL[1]/LI,網(wǎng)頁中全部所需的圖片均被定位了八爪魚

6、·云采集網(wǎng)絡(luò)爬蟲軟件www.bazhuayu.com??4)將修改后的Xpath://DIV[@id='imgid']/DIV/UL[1]/LI,復制粘貼到八爪魚中相應位置,完成后點擊“確定”八爪魚·云采集網(wǎng)絡(luò)爬蟲軟件www.bazhuayu.com??5)點擊“保存”,再點擊“開始采集”,這里選擇“啟動本地采集”八爪魚·云采集網(wǎng)絡(luò)爬蟲軟件www.bazhuayu.com?說明:本地采集占用當前電腦資源進行采集,如果存在采集時間要求或當前電腦無法長時間進行采集可以使用云采集功能,云采集在網(wǎng)絡(luò)中進行采集,無需當前

7、電腦支持,電腦可以關(guān)機,可以設(shè)置多個云節(jié)點分攤?cè)蝿眨?0個節(jié)點相當于10臺電腦分配任務幫你采集,速度降低為原來的十分之一;采集到的數(shù)據(jù)可以在云上保存三個月,可以隨時進行導出操作。步驟4:數(shù)據(jù)采集及導出1)采集完成后,會跳出提示,選擇導出數(shù)據(jù)八爪魚·云采集網(wǎng)絡(luò)爬蟲軟件www.bazhuayu.com??2)選擇合適的導出方式,將采集好的數(shù)據(jù)導出八爪魚·云采集網(wǎng)絡(luò)爬蟲軟件www.bazhuayu.com??步驟5:將圖片URL批量轉(zhuǎn)換為圖片經(jīng)過如上操作,我們已經(jīng)得到了要采集的圖片的URL。接下來,再通過八爪魚專用的

8、圖片批量下載工具,將采集到的圖片URL中的圖片,下載并保存到本地電腦中。圖片批量下載工具:https://pan.baidu.com/s/1c2n60NI1)下載八爪魚圖片批量下載工具,雙擊文件中的MyDownloader.app.exe文件,打開軟件八爪魚·云采集網(wǎng)絡(luò)爬蟲軟件www.bazhuayu.com??2)打開File菜單,選擇從EXCEL導入(目前只支持EXCEL格式文件)

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。