接触过很多做电商的客户,他们经常会问这个问题:用GooSeeker网页抓取软件可以采到sku库存吗?没有做过电商的人可能不知道sku是什么,它的全称是Stock Keeping Unit(库存量单位),具体就是指下面蓝框里的数字,还有几个相关概念,后面再给大家详细说一下。
怎么抓取商品sku库存?
现在回归正题,用过GooSeeker产品的人都知道,只要在网页上能看到的信息,就可以采集下来,所以,我对第一个问这个问题的人就很确定说可以做到,结果他是想要拿到商品下的所有sku库存值,就是说,不是第一次看到的那个总库存量,而是要把尺码、颜色都组合一遍,然后拿到对应的库存量。
想了一下,要采集单个sku库存也不难,利用GooSeeker爬虫特有的连续动作功能,通过指定要点击的属性对象,然后爬虫就可以自动点击各种属性组合,再把库存值爬取下来,也就是说,我们的爬虫帮你完成了点击和拷贝保存的工作。如果对采集sku感兴趣的话,我会在另一篇文章里分享怎么用GooSeeker爬虫实现自动点击采集sku库存。
sku、spu、item分别指什么
好了,说完上面的问题了,下面再说说电商领域,关于商品的一些概念吧。
sku:Stock Keeping Unit 库存单位
从库存的角度,可以看到剩下多少存货,要不要进货,有时也能反映出商品的热销程度,比如说,缺货的商品通常是很好卖的。从定义上看,sku是定义商品的最小单位,由商品的属性组合决定的,比如,对于服装来说,尺码、颜色等可以让买家选择的特征就是商品属性,拿上面图片的商品来说,尺码、颜色分别有3种选择,那这个商品就有3*3=9个sku,每个sku都有一个唯一编码,作用就像身份证那样,用来区分和记录不同属性组合的信息;
spu:Standard Product Unit 标准化商品
具体来说,spu是商品信息聚合的最小单位,在服装行业,就是指不同的品类,比如T恤、牛仔裤等等,在手机行业,就是具体到手机型号了,通常搜索一个spu,你会找到很多相同的商品,分别是由不同的商家在售,通俗地讲,spu就是指具有相同属性集合的一类商品吧。
Item:商品
在搜索关键词后,看到的那一个个商品,比如,搜索T恤,就会看到很多T恤,任意点击一个T恤(item)进到详情页面,然后选择颜色、尺码,看到的就是sku了,从范围大小上讲,spu>item>sku。
淘宝商品、京东商品的区别
最后还要说一下淘宝和京东在这3个概念的区别。
淘宝为了展示灵活,是用item来代表商品的,在商品网址里可以看到这个item的编号id,而sku是包含在item里的,没有单独的id,所以把尺码和颜色任意组合,商品网址都不会改变,在不选择任何属性组合时,你可以看到item的总库存,在选择了属性组合后,还可以看到单个sku库存;
京东上是用sku代表商品的,每一个sku都有唯一的编码id,也就是说在商品详情页里点击属性组合,商品网址就会发生变化,实际上是切换到另一个sku编码,但是京东上不直接显示库存,只会告诉你有货还是没货,所以,你只能看到sku编码,库存数量是看不到的,虽然有点遗憾,但是sku也许不是那么重要吧,因为更多人是想要收集sku组合和对应的价格,而抓取方法还是用前面第3段提到的方法。