幕思城>電商行情>運營>淘寶運營>怎么采集京東商品詳情頁信息?八爪魚采集器使用教程-京東開店京東新品上架京東工具

    怎么采集京東商品詳情頁信息?八爪魚采集器使用教程-京東開店京東新品上架京東工具

    2022-12-30|19:02|發(fā)布在分類 / 淘寶運營| 閱讀:188

    本文主題京東開店,京東新品上架,商品采集,京東開店,八爪魚,京東工具。

    怎么采集京東商品詳情頁信息?八爪魚采集器使用教程

    怎么采集京東商品詳情頁信息?八爪魚采集器使用教程

    不懂網(wǎng)絡(luò)爬蟲技術(shù),怎么去采集其他網(wǎng)店商品信息呢?幕思城這里給大家介紹一個可以

    采集多平臺信息

    的工具—

    八爪魚

    。讓不懂網(wǎng)絡(luò)爬蟲技術(shù)的我們,也可以輕松采集數(shù)據(jù)信息。下面就以京東商品詳情頁采集為例,一起來看看八爪魚采集器的使用教程吧~

    一、八爪魚介紹

    八爪魚全球百萬用戶信賴的數(shù)據(jù)采集器。滿足多種業(yè)務(wù)場,適合產(chǎn)品、運營、銷售、數(shù)據(jù)分析、政府機關(guān)、電商從業(yè)者、學術(shù)研究等多種身份職業(yè)。

    使用場景:

    1、電商:

    京東、淘寶、Amazon、速賣通、百度愛采購平臺信息采集

    2、設(shè)計媒體:

    微博、搜狗微信、知乎、b站、豆瓣等平臺評論、、視頻、熱點采集

    3、新聞資訊

    今日頭條文章采集、首頁新聞采集

    4、生活服務(wù)

    168孔夫子、百度、58同城、天眼查、攜程等平臺信息采集

    5、金融

    東方財富、同花順、銀保監(jiān)、雪球、股吧等平臺數(shù)據(jù)、公告采集

    6、房產(chǎn)

    小豬短租、趕集網(wǎng)、百姓網(wǎng)、游天下、58同城、房天下等平臺房源數(shù)據(jù)采集

    二、【京東】商品詳情頁采集教程

    下面幕思城就以京東商品詳情頁為例,給大家?guī)戆俗︳~的使用教程。

    步驟一、打開網(wǎng)頁

    在首頁輸入框中,輸入網(wǎng)址https://item.jd.com/100006607659.html#crumb-wrap(舉例),然后點擊【開始采集】,八爪魚自動打開網(wǎng)頁。

    怎么采集京東商品詳情頁信息?八爪魚采集器使用教程

    幕思城特別說明:

    打開網(wǎng)頁后,如果開始開始【自動識別】,請等待自動識別完成。八爪魚支持自動識別網(wǎng)頁上的列表、滾動和翻頁,識別成功后直接啟動采集即可獲取數(shù)據(jù)。如果【自動識別】的結(jié)果不是我們需要的,可點擊【取消】關(guān)閉智能識別,自行配置采集流程。

    步驟二、循環(huán)點擊顏色屬性,并提取對應(yīng)文本

    通過以下幾步,實現(xiàn)點擊每個顏色屬性并提取對應(yīng)文本

    1、循環(huán)點擊顏色屬性

    2、提取顏色屬性的文本

    3、將循環(huán)點擊顏色屬性與提取顏色文本聯(lián)動起來

    1、循環(huán)點擊顏色屬性

    ①選中頁面上第1個顏色屬性

    ②在黃色操作提示框中,選擇【選中全部】

    ③選擇【循環(huán)點擊每個鏈接】

    3、將循環(huán)點擊顏色屬性與提取顏色文本聯(lián)動起來

    進入【提取數(shù)據(jù)】設(shè)置頁面,勾選【采集當前循環(huán)中設(shè)置的元素】后保存。

    點擊【顏色】字段后的按鈕,勾選【相對于循環(huán)里的XPath】后保存。

    怎么采集京東商品詳情頁信息?八爪魚采集器使用教程

    步驟三、循環(huán)點擊版本屬性,并提取對應(yīng)版本文本

    通過以下幾步,實現(xiàn)點擊每個版本屬性并提取對應(yīng)文本

    1、循環(huán)點擊版本屬性

    ①選中頁面上第1個版本屬性

    ②在黃色操作提示框中,選擇【選中全部】

    ③選擇【循環(huán)點擊每個鏈接】

    a.經(jīng)過以上連續(xù)3步,【循環(huán)-點擊元素】創(chuàng)建完成?!狙h(huán)】中的項,對應(yīng)著頁面上所有版本屬性。啟動采集以后,八爪魚就會按照循環(huán)中的順序依次點擊每個版本屬性。

    怎么采集京東商品詳情頁信息?八爪魚采集器使用教程

    2、提取版本屬性的文本

    選中頁面中的版本屬性框,在操作提示框中選擇【采集該鏈接文本】,版本屬性的文本提取下來。

    3、將循環(huán)點擊版本屬性與提取版本文本聯(lián)動起來

    進入【提取數(shù)據(jù)】設(shè)置頁面,勾選【采集當前循環(huán)中設(shè)置的元素】后保存。

    點擊【版本】字段后的按鈕,勾選【相對于循環(huán)里的XPath】后保存。

    步驟四、提取其他字段

    選中頁面中的文本,然后在操作提示框中,點擊【采集該元素文本】。

    文本類字段都可以按照這樣的方式提取。示例中我們提取了商品標題、商品價格、主圖鏈接、商品編號等多個字段。

    特別說明:

    a.文本、圖片、視頻、源碼是不同的數(shù)據(jù)形式,在操作提示框選擇提取方式時稍有不同。文本一般為【采集該元素文本】,圖片一般為【采集該圖片地址。

    怎么采集京東商品詳情頁信息?八爪魚采集器使用教程

    步驟五、編輯字段

    1、編輯字段

    進入【提取數(shù)據(jù)1】設(shè)置頁面,可刪除多余字段,修改字段名,移動字段順序等。

    2、格式化字段

    【商品名稱】和【商品編號】這2個字段,默認提取的內(nèi)容有與表頭重復(fù)的部分。如果沒關(guān)系,可跳過此步驟。

    如果想要去掉內(nèi)容中多余的部分,可使用數(shù)據(jù)格式化功能。

    以【商品名稱】格式化為例:點擊字段后的按鈕,選擇【格式化數(shù)據(jù)】→點擊【添加步驟】,選擇【替換】,將【商品名稱:】替換為【空】,輸出【華為P40Pro】并保存。

    怎么采集京東商品詳情頁信息?八爪魚采集器使用教程

    步驟六、啟動采集

    1、單擊【采集】并【啟動本地采集】。啟動后八爪魚開始自動采集數(shù)據(jù)。

    特別說明:

    a.【本地采集】是使用自己的電腦進行采集,【云采集】是使用八爪魚提供的云服務(wù)器采集,點擊查看本地采集與云采集詳解。

    2、采集完成后,選擇合適的導(dǎo)出方式來導(dǎo)出數(shù)據(jù)。支持導(dǎo)出為Excel,CSV,HTML,數(shù)據(jù)庫等。這里導(dǎo)出為Excel。

    怎么采集京東商品詳情頁信息?八爪魚采集器使用教程

    那么以上就是全部的內(nèi)容啦~在開店的過程中遇到問題,都可以來幕思城官網(wǎng)搜索查找干貨內(nèi)容,或者點擊頁面最上方的賣家問答,解開疑惑哦~想要了解更多電商干貨、電商運營工具,記得關(guān)注搜索幕思城。

    幕思城為您更新最近最有用的電商資訊、電商規(guī)則京東開店,京東新品上架京東工具。了解更多電商資訊、行業(yè)動向,記得關(guān)注幕思城!

    這個問題還有疑問的話,可以加幕.思.城火星老師免費咨詢,微.信號是為: msc496。

    難題沒解決?加我微信給你講!【僅限淘寶賣家交流運營知識,非賣家不要加我哈】
    >

    更多資訊請關(guān)注幕 思 城。

    發(fā)表評論

    別默默看了 登錄\ 注冊 一起參與討論!

      微信掃碼回復(fù)「666