1. 打开产品 Reviews 页的第一页,网址格式如:https://www.amazon.com/product-reviews/+产品的ASIN
2. 点击 浏览器右上角 插件图标,打开
3. 会自动判断可抓取的页面区域,如果区域不对,点击 「Try another table」 按钮可以切换区域
4. 点击「Locate "Next" button」 按钮来定位页面中的「Next」按钮或链接
5. 点击「Start crawling」按钮开始爬取页面,插件会实时显示爬取到数据,请耐心等待,切勿打开其他页面,不然爬取会中断出错
6. 等数据都爬取完了就可以点击绿色按钮进行下载,可选 CSV 或 Excel 文件
7. 打开下载好的 CSV 或 Excel 文件,删掉你不需要的数据列即可
简单吧?7 步搞定亚马逊评价(Reviews)的爬取和采集!另外,Q&A 也是可以爬取的哦。
有了这些 Review 评论信息,我们可以利用关键词云图,如:
或者文本情感分析等大数据分析工具,快速对产品的特性和消费者情感做出大致判断,而不需要一条一条的去阅读 Review,比较适合大范围的批量选品。