怎么采集京東商品詳情頁信息?八爪魚采集器使用教程-京東開店京東新品上架京東工具
2022-12-30|19:02|發(fā)布在分類 / 淘寶運營| 閱讀:188
2022-12-30|19:02|發(fā)布在分類 / 淘寶運營| 閱讀:188
本文主題京東開店,京東新品上架,商品采集,京東開店,八爪魚,京東工具。
不懂網(wǎng)絡(luò)爬蟲技術(shù),怎么去采集其他網(wǎng)店商品信息呢?幕思城這里給大家介紹一個可以
的工具—
。讓不懂網(wǎng)絡(luò)爬蟲技術(shù)的我們,也可以輕松采集數(shù)據(jù)信息。下面就以京東商品詳情頁采集為例,一起來看看八爪魚采集器的使用教程吧~
八爪魚全球百萬用戶信賴的數(shù)據(jù)采集器。滿足多種業(yè)務(wù)場,適合產(chǎn)品、運營、銷售、數(shù)據(jù)分析、政府機關(guān)、電商從業(yè)者、學術(shù)研究等多種身份職業(yè)。
1、電商:
京東、淘寶、Amazon、速賣通、百度愛采購平臺信息采集
2、設(shè)計媒體:
微博、搜狗微信、知乎、b站、豆瓣等平臺評論、、視頻、熱點采集
3、新聞資訊
今日頭條文章采集、首頁新聞采集
4、生活服務(wù)
168孔夫子、百度、58同城、天眼查、攜程等平臺信息采集
5、金融
東方財富、同花順、銀保監(jiān)、雪球、股吧等平臺數(shù)據(jù)、公告采集
6、房產(chǎn)
小豬短租、趕集網(wǎng)、百姓網(wǎng)、游天下、58同城、房天下等平臺房源數(shù)據(jù)采集
下面幕思城就以京東商品詳情頁為例,給大家?guī)戆俗︳~的使用教程。
在首頁輸入框中,輸入網(wǎng)址https://item.jd.com/100006607659.html#crumb-wrap(舉例),然后點擊【開始采集】,八爪魚自動打開網(wǎng)頁。
打開網(wǎng)頁后,如果開始開始【自動識別】,請等待自動識別完成。八爪魚支持自動識別網(wǎng)頁上的列表、滾動和翻頁,識別成功后直接啟動采集即可獲取數(shù)據(jù)。如果【自動識別】的結(jié)果不是我們需要的,可點擊【取消】關(guān)閉智能識別,自行配置采集流程。
通過以下幾步,實現(xiàn)點擊每個顏色屬性并提取對應(yīng)文本
1、循環(huán)點擊顏色屬性
2、提取顏色屬性的文本
3、將循環(huán)點擊顏色屬性與提取顏色文本聯(lián)動起來
①選中頁面上第1個顏色屬性
②在黃色操作提示框中,選擇【選中全部】
③選擇【循環(huán)點擊每個鏈接】
進入【提取數(shù)據(jù)】設(shè)置頁面,勾選【采集當前循環(huán)中設(shè)置的元素】后保存。
點擊【顏色】字段后的按鈕,勾選【相對于循環(huán)里的XPath】后保存。
通過以下幾步,實現(xiàn)點擊每個版本屬性并提取對應(yīng)文本
①選中頁面上第1個版本屬性
②在黃色操作提示框中,選擇【選中全部】
③選擇【循環(huán)點擊每個鏈接】
a.經(jīng)過以上連續(xù)3步,【循環(huán)-點擊元素】創(chuàng)建完成?!狙h(huán)】中的項,對應(yīng)著頁面上所有版本屬性。啟動采集以后,八爪魚就會按照循環(huán)中的順序依次點擊每個版本屬性。
2、提取版本屬性的文本
選中頁面中的版本屬性框,在操作提示框中選擇【采集該鏈接文本】,版本屬性的文本提取下來。
3、將循環(huán)點擊版本屬性與提取版本文本聯(lián)動起來
進入【提取數(shù)據(jù)】設(shè)置頁面,勾選【采集當前循環(huán)中設(shè)置的元素】后保存。
點擊【版本】字段后的按鈕,勾選【相對于循環(huán)里的XPath】后保存。
選中頁面中的文本,然后在操作提示框中,點擊【采集該元素文本】。
文本類字段都可以按照這樣的方式提取。示例中我們提取了商品標題、商品價格、主圖鏈接、商品編號等多個字段。
特別說明:
a.文本、圖片、視頻、源碼是不同的數(shù)據(jù)形式,在操作提示框選擇提取方式時稍有不同。文本一般為【采集該元素文本】,圖片一般為【采集該圖片地址。
1、編輯字段
進入【提取數(shù)據(jù)1】設(shè)置頁面,可刪除多余字段,修改字段名,移動字段順序等。
2、格式化字段
【商品名稱】和【商品編號】這2個字段,默認提取的內(nèi)容有與表頭重復(fù)的部分。如果沒關(guān)系,可跳過此步驟。
如果想要去掉內(nèi)容中多余的部分,可使用數(shù)據(jù)格式化功能。
以【商品名稱】格式化為例:點擊字段后的按鈕,選擇【格式化數(shù)據(jù)】→點擊【添加步驟】,選擇【替換】,將【商品名稱:】替換為【空】,輸出【華為P40Pro】并保存。
1、單擊【采集】并【啟動本地采集】。啟動后八爪魚開始自動采集數(shù)據(jù)。
特別說明:
a.【本地采集】是使用自己的電腦進行采集,【云采集】是使用八爪魚提供的云服務(wù)器采集,點擊查看本地采集與云采集詳解。
2、采集完成后,選擇合適的導(dǎo)出方式來導(dǎo)出數(shù)據(jù)。支持導(dǎo)出為Excel,CSV,HTML,數(shù)據(jù)庫等。這里導(dǎo)出為Excel。
那么以上就是全部的內(nèi)容啦~在開店的過程中遇到問題,都可以來幕思城官網(wǎng)搜索查找干貨內(nèi)容,或者點擊頁面最上方的賣家問答,解開疑惑哦~想要了解更多電商干貨、電商運營工具,記得關(guān)注搜索幕思城。
幕思城為您更新最近最有用的電商資訊、電商規(guī)則京東開店,京東新品上架京東工具。了解更多電商資訊、行業(yè)動向,記得關(guān)注幕思城!
這個問題還有疑問的話,可以加幕.思.城火星老師免費咨詢,微.信號是為: msc496。
更多資訊請關(guān)注幕 思 城。
微信掃碼回復(fù)「666」
別默默看了 登錄\ 注冊 一起參與討論!