能夠下載京東商城的商品詳情頁圖片、主圖、SKU圖,大尺寸高清原圖無損。還支持下載京東主圖視頻,軟件特色:下載后用商品標(biāo)題作為文件夾的名稱,然后sku圖、主圖、詳情圖分成三個(gè)小文件夾,并且sku圖也帶名稱的,方便查看。
京東商品詳情頁采集工具介紹
打開京東商品詳情頁(實(shí)例網(wǎng)址:https://item.jd.com/100006607659.html#crumb-wrap ),采集點(diǎn)擊不同的參數(shù)(顏色、版本等)后得到的數(shù)據(jù)(商品編號(hào)、價(jià)格、主圖鏈接等字段會(huì)隨著參數(shù)變化而變化)。
京東商品詳情頁采集工具玩法
鼠標(biāo)放到圖片上,右鍵,選擇【在新標(biāo)簽頁中打開圖片】可查看高清大圖
下文其他圖片同理
采集字段
商品標(biāo)題、顏色、版本、價(jià)格、商品名稱、商品編號(hào)、圖片網(wǎng)址等。
采集結(jié)果
采集結(jié)果可導(dǎo)出為Excel、CSV、HTML、數(shù)據(jù)庫等多種格式。導(dǎo)出為Excel示例:
京東商品詳情頁采集工具技巧
步驟一、打開網(wǎng)頁
步驟二、循環(huán)點(diǎn)擊顏色屬性,并提取對(duì)應(yīng)文本
步驟三、循環(huán)點(diǎn)擊版本屬性,并提取對(duì)應(yīng)文本
步驟四、提取其他字段
步驟五、編輯字段
步驟六、啟動(dòng)采集
京東商品詳情頁采集工具使用方法
以下為具體步驟:
步驟一、打開網(wǎng)頁
在首頁輸入框中,輸入網(wǎng)址 https://item.jd.com/100006607659.html#crumb-wrap ,然后點(diǎn)擊【開始采集】,八爪魚自動(dòng)打開網(wǎng)頁。
特別說明:
a. 打開網(wǎng)頁后,如果開始開始【自動(dòng)識(shí)別】,請(qǐng)等待自動(dòng)識(shí)別完成。八爪魚支持自動(dòng)識(shí)別網(wǎng)頁上的列表、滾動(dòng)和翻頁,識(shí)別成功后直接啟動(dòng)采集即可獲取數(shù)據(jù)。如果【自動(dòng)識(shí)別】的結(jié)果不是我們需要的,可點(diǎn)擊【取消】關(guān)閉智能識(shí)別,自行配置采集流程。詳情點(diǎn)擊查看 【自動(dòng)識(shí)別】
步驟二、循環(huán)點(diǎn)擊顏色屬性,并提取對(duì)應(yīng)文本
通過以下幾步,實(shí)現(xiàn)點(diǎn)擊每個(gè)顏色屬性并提取對(duì)應(yīng)文本
1、循環(huán)點(diǎn)擊顏色屬性
2、提取顏色屬性的文本
3、將循環(huán)點(diǎn)擊顏色屬性與提取顏色文本聯(lián)動(dòng)起來
1、循環(huán)點(diǎn)擊顏色屬性
① 選中頁面上第1個(gè)顏色屬性
② 在黃色操作提示框中,選擇【選中全部】
③ 選擇【循環(huán)點(diǎn)擊每個(gè)鏈接】
特別說明:
a. 經(jīng)過以上連續(xù)3步,【循環(huán)-點(diǎn)擊元素】創(chuàng)建完成!狙h(huán)】中的項(xiàng),對(duì)應(yīng)著頁面上所有顏色屬性。啟動(dòng)采集以后,八爪魚就會(huì)按照循環(huán)中的順序依次點(diǎn)擊每個(gè)顏色屬性。
b. 為何通過以上3步,可建立【循環(huán)-點(diǎn)擊元素】?詳情點(diǎn)擊查看 采集點(diǎn)擊多個(gè)鏈接后的詳情頁數(shù)據(jù)教程 。
2、提取顏色屬性的文本
選中頁面中的顏色屬性框,在操作提示框中選擇【采集該鏈接文本】,顏色屬性的文本提取下來。
3、將循環(huán)點(diǎn)擊顏色屬性與提取顏色文本聯(lián)動(dòng)起來
進(jìn)入【提取數(shù)據(jù)】設(shè)置頁面,勾選【采集當(dāng)前循環(huán)中設(shè)置的元素】后保存。
點(diǎn)擊【顏色】字段后的 按鈕,勾選【相對(duì)于循環(huán)里的XPath】后保存。
特別說明:
a. 什么是【相對(duì)于循環(huán)里的XPath】?點(diǎn)擊查看 相對(duì)XPath教程
步驟三、循環(huán)點(diǎn)擊版本屬性,并提取對(duì)應(yīng)版本文本
通過以下幾步,實(shí)現(xiàn)點(diǎn)擊每個(gè)版本屬性并提取對(duì)應(yīng)文本
1、循環(huán)點(diǎn)擊版本屬性
2、提取版本屬性的文本
3、將循環(huán)點(diǎn)擊版本屬性與提取版本文本聯(lián)動(dòng)起來
1、循環(huán)點(diǎn)擊版本屬性
① 選中頁面上第1個(gè)版本屬性
② 在黃色操作提示框中,選擇【選中全部】
③ 選擇【循環(huán)點(diǎn)擊每個(gè)鏈接】
特別說明:
a. 經(jīng)過以上連續(xù)3步,【循環(huán)-點(diǎn)擊元素】創(chuàng)建完成!狙h(huán)】中的項(xiàng),對(duì)應(yīng)著頁面上所有版本屬性。啟動(dòng)采集以后,八爪魚就會(huì)按照循環(huán)中的順序依次點(diǎn)擊每個(gè)版本屬性。
b. 為何通過以上3步,可建立【循環(huán)-點(diǎn)擊元素】?詳情點(diǎn)擊查看 采集點(diǎn)擊多個(gè)鏈接后的詳情頁數(shù)據(jù)教程 。
2、提取版本屬性的文本
選中頁面中的版本屬性框,在操作提示框中選擇【采集該鏈接文本】,版本屬性的文本提取下來。
3、將循環(huán)點(diǎn)擊版本屬性與提取版本文本聯(lián)動(dòng)起來
進(jìn)入【提取數(shù)據(jù)】設(shè)置頁面,勾選【采集當(dāng)前循環(huán)中設(shè)置的元素】后保存。
點(diǎn)擊【版本】字段后的 按鈕,勾選【相對(duì)于循環(huán)里的XPath】后保存。
特別說明:
a. 什么是【相對(duì)于循環(huán)里的XPath】?點(diǎn)擊查看 相對(duì)XPath教程
b. 經(jīng)過步驟二和步驟三,版本屬性的【循環(huán)-點(diǎn)擊元素】?jī)?nèi)嵌在顏色屬性的【循環(huán)-點(diǎn)擊元素】中,根據(jù) 采集原理與流程執(zhí)行邏輯 中學(xué)到的知識(shí),我們知道它會(huì)從上到下,由內(nèi)而外執(zhí)行流程,展示出每種顏色屬性和版本屬性的組合,以采集其對(duì)應(yīng)數(shù)據(jù),如下圖所示。如果有更多其他屬性,則繼續(xù)向內(nèi)建立嵌套循環(huán)。
步驟四、提取其他字段
選中頁面中的文本,然后在操作提示框中,點(diǎn)擊【采集該元素文本】。
文本類字段都可以按照這樣的方式提取。示例中我們提取了商品標(biāo)題、商品價(jià)格、主圖鏈接、商品編號(hào)等多個(gè)字段。
特別說明:
a. 文本、圖片、視頻、源碼是不同的數(shù)據(jù)形式,在操作提示框選擇提取方式時(shí)稍有不同。文本一般為【采集該元素文本】,圖片一般為【采集該圖片地址】,更多提取方式請(qǐng)點(diǎn)擊查看 不同數(shù)據(jù)類型(文本、圖片、鏈接、源碼等)的抓取方式 教程
步驟五、編輯字段
1、編輯字段
進(jìn)入【提取數(shù)據(jù)1】設(shè)置頁面,可刪除多余字段,修改字段名,移動(dòng)字段順序等。
2、格式化字段
【商品名稱】和【商品編號(hào)】這2個(gè)字段,默認(rèn)提取的內(nèi)容有與表頭重復(fù)的部分。如果沒關(guān)系,可跳過此步驟。
如果想要去掉內(nèi)容中多余的部分,可使用數(shù)據(jù)格式化功能。
以【商品名稱】格式化為例:點(diǎn)擊字段后的 按鈕,選擇【格式化數(shù)據(jù)】→ 點(diǎn)擊【添加步驟】,選擇【替換】,將【商品名稱:】替換為【空】,輸出【華為P40 Pro】并保存。
特別說明:
a. 數(shù)據(jù)格式化是什么?點(diǎn)擊查看 數(shù)據(jù)格式化教程 。
步驟六、啟動(dòng)采集
1、單擊【采集】并【啟動(dòng)本地采集】。啟動(dòng)后八爪魚開始自動(dòng)采集數(shù)據(jù)。
特別說明:
a. 【本地采集】是使用自己的電腦進(jìn)行采集,【云采集】是使用八爪魚提供的云服務(wù)器采集,點(diǎn)擊查看 本地采集與云采集詳解。
2、采集完成后,選擇合適的導(dǎo)出方式來導(dǎo)出數(shù)據(jù)。支持導(dǎo)出為Excel,CSV,HTML,數(shù)據(jù)庫等。這里導(dǎo)出為Excel。
拓展閱讀
以上教程詳解了如何采集京東單個(gè)商品詳情頁數(shù)據(jù),多個(gè)商品詳情頁怎么辦呢?
如果已有一批京東商品詳情頁鏈接,可使用 URL循環(huán)功能
也可以通過 京東商品列表數(shù)據(jù)采集(搜索關(guān)鍵詞)和 京東商品列表數(shù)據(jù)采集(分類目),先獲得一批京東商品詳情頁鏈接,再使用 URL循環(huán)功能
- PC官方版
- 安卓官方手機(jī)版
- IOS官方手機(jī)版