2017年淘宝搜索引擎算法更新的经验总结
的有关信息介绍如下:那么基于搜索排名优化,一定是基于不断的给消费者带来更好的消费体验和平台利润最大化作为规则制定的数据表现。那么我们只要基于这一点去思考,便对规则猜的八九不离十,进而得出搜索引擎的算法和规则。一方面是消费者的消费体验,一方面是平台利润率。在强调用户体验和平台的uv价值。
再比如,掌柜优化主图这个事情,对消费者有什么坏处?我们发现,单单只优化主图(单纯目的也是为了提高用户点击),对于消费者只有好处,没有坏处。所以,你正常改主图一定没有任何问题,我们爆款主图几乎每周一改,从来没有问题,但是改主图一定要建立在你知道新老主图点击率的情况下(点击率的价值所在)。
搜索工作原理主要分为四个要点:一、扩展关键词二、框定产品池三、算法排序模型四、数据反馈闭环
为了让大家能更好的“独立思考”,理解原理,融会贯通发掘出新的宝贝排名优化方法,今天,我给你先系统的解析下淘宝搜索引擎的工作原理,基于这些规则你应该怎么优化,后面我会在接下来的文章再和大家分享我的做法。
1.扩展关键词。(同义词,专有名词)
淘宝搜索的核心,并不是匹配用户的搜索词,而是潜在匹配搜索词背后的“用户需求”。搜索引擎会有一个“同义词”词库。我们来举例说明下“同义词”库是怎么工作的?当用户在淘宝搜索“裤子 女士”,用户的需求就是想要个女裤,所以搜索引擎会匹配所有包含“裤”和“女”的标题,不管是否含有“子”或者女士,女式等,标题不需要出现“同义词”词库里的所有词,都能搜索到,而且不影响排名。
从目的上来说,搜索引擎的这个设定,对小白用户非常好,她不需要擅长搜索技巧,也不需要了解搜索引擎算法,也能找到更多自己想要的宝贝。
但是淘宝还有一个“专有名词”词库。在这一步,很多标题会重复出现女裤和裤子,其实没必要,浪费字节位置。但是,又不是所有的词都不能重复。我们来举例说明下“专有名词”又是怎么工作的?就说“擎天柱”这个词,如果你标题写“擎天之柱”,虽然包含擎天柱,但是你会发现搜索不到,你拆开它搜索引擎就认为是另外一个东西,所以当你了解了这个层面的逻辑关系后,对于扩展关键词的理解就会有一个更直观的理解。
2.框定产品池。(类目属性匹配、作弊商品剔除、非活跃商品剔除)
“类目属性匹配”原则,淘宝搜索在做产品展示的时候,并不是你标题有这个字,就一定会有展示。比如搜索iphone8的时候,iPhone8数据线标题也有这词,但是不展现,这是为什么呢?这就是“类目属性匹配”规则的结果导向,搜索引擎基于搜索词猜测用户想要什么类目的产品,比如搜索iPhone8,用户更想要的是手机,这个消费意图很明确,所以系统会展示手机类目的产品。
当然,iPhone8这种情况,“类目属性匹配”规则的情况比较单一,iPhone8就是手机,所以类目放置没什么问题。但是举例“跑步鞋女”这个词,运动鞋也可以放,女鞋里的低帮鞋,也可以放。这时候到底要放置到哪个类目,就要看数据了,看下面的图片来理解这个问题更直观。
以“跑步鞋女”举例说明,一般情况下,我们建议卖家把产品放在生意参谋-搜索词查询里,搜索“跑步鞋女”关键词下的第一展示子类目,也就是说,放在女鞋下的低帮鞋这个类目,会拿到更多的流量。除了类目匹配以外,搜索引擎在从全国各地各个服务器要产品结果的时候,还会剔除掉两类宝贝,一类是作弊,或者诚信分过低的宝贝;一类是非活跃的垃圾数据宝贝,就是那些通过软件一键上传后,长期没有旺旺在线,没有加购收藏数据的宝贝。这就是“作弊产品剔除”原则和“非活跃商品剔除”原则。
3.算法模型排序。(单品权重、品牌权重、店铺权重、平台商品丰富性)
搜索引擎会基于算法工程师制定的算法,对筛选出来的宝贝进行排序,到目前为止,进行排序的时候,搜索引擎会从三个维度来给宝贝综合打分:单品权重,店铺权重和品牌权重。原理其实也就是“人,货,场”的概念。
单品权重:对应的是购买“人数”,准确的说是“销量贡献值”,也就是说其它维度相同的情况下,买的人越多,排序越好(这里说的就是坑产概念);
品牌权重:对应的是“货”,准确的说就是品牌,货是谁生产出来的,其它维度相同,品牌调性分越高,排序越好;店铺权重:对应的是“场”,准确的说就是是店铺层级,也就是卖场,其它维度相同,卖场越大,排序越好。商品上架的前期,宝贝的基础权重更多的是由两个因素决定的。一个是店铺层级,另一个就是品牌调性分,但是这个影响因素是相互的,当单品维度对于宝贝的影响超过前两个因素后,单品的销量差别也会越来越大,反之当单品销量差别越来越大时,店铺层级和品牌调性的影响因素就会越来越小。这很像王者荣耀的新赛季定段位,不会让大家都从零开始,而是根据你的历史战绩给每个人一个不同的初始段位。而在淘宝,新品的表现将参考历史数据,就是新品所在的店铺和新品挂靠的品牌。
商品的丰富性:最早,淘宝为什么要学习eBay做上下架时间呢,回到我们开头的原理说,站在消费者的角度,如果早期淘宝没有上下架时间,大家不管什么时间搜索,看到的宝贝永远都是那几个,就失去了平台产品的多样性和活跃度,这并不符合淘宝一直在宣扬的“万能的淘宝”的口号,主观来说这对消费者并不是一个好事,客观来说对于平台发展也是不利的。除了这些之外,还有一些保证商品展现丰富性的“算法干扰模型”,比如上面说到的上下架时间、千人千面、打散原则。千人千面:淘宝搜索在算法里加入了很多让商品展示多样化的算法,上下架是时间概念上面已经解释了。但是呢,到现在为止,无线端的上下架时间,几乎已经弱化到没用了,从消费者角度考虑,目前的千人千面已经能做到根据用户标签做多样个性化展示,并且比上下架时间这种轮播算法更加智能合理,所以上下架时间就可以退出历史舞台了。
另外,发展到现在的千人千面的算法,你会发现一个问题,大家如果在手机淘宝搜索“手机壳”,你会发现,默认排序的手机壳,除去直通车位置,都是25元以上的,而销量排序里就有很多销量很大价格低的手机壳,但是默认搜索里看不到,这就是系统做的干扰动作:低价屏蔽。
打散原则:
除了千人千面,可能会有很多细心的卖家发现,当你搜索一个关键词,不算直通车展示的话,不管某店铺再强,手机淘宝搜索页面也只能看到他的两个商品,基于这个原理我们来分析,如果一个店铺只做一个子类目,不管怎么努力,也只能做出来两个爆款,这就是“算法干扰模型”最常见的同店打散原则。所以,基于搜索规则的店铺产品布局就显得无比重要了,后面我们会重点讲。
4.数据反馈闭环。
2014年,标题优化一度很火,行业里面疯传的10分钟冲排名玩法,甚至有些人认为做好上下架时间、标题优化就可以可以拿到单个词前三名的位置,确实有些牛逼的大神做的效果非常好,也相继创造出了一系列标题优化的新名词:紧密匹配,靠近匹配,前后匹配等等。但是我在这里要告诉你的是,2014年我们经过反复测试,有些人可能已经发现通过调整标题关键词位置,优化排名,这种优化排名的方法已经失效了。取而代之的是,搜索从原来的“文本相关性”算法全面进化成“数据智能算法”。
到上一步,基于工程师制定的算法模型,得到了一个初始的宝贝排序页面,然后当流量开始导入的时候,如果10000个人搜索某个关键词,都不点第一个宝贝,而去点第三个宝贝,这很可能说明第一个宝贝用户认为和她们搜索的词匹配度不高,而第三个高,这个时候系统就会介入,通过数据反馈做一系列的调整动作。
注意,我们这里面说的是某个词,搜索在进行数据反馈闭环,是以单个词的维度来计算的。举例说明,如果某个宝贝在“修身上衣”上点击表现不好,但是在“宽松上衣”这个词表现就很好,所以数据智能算法带来的第一个改变是,和你宝贝不相关的词,流量再大,你可能也拿不到流量了。
从这个角度来看,标题里的每个词,其实是“各自为战”,我们在做宝贝排名的时候,初期的搜索词越集中,对于宝贝的帮助越大,也就是说早期要围绕一个词猛打。
而当这个词能拿到更多的销量,这个词的流量就会显著增加,直通车开的时候也要围绕这个词出价,随着这个词流量越来越大,带动起来整个宝贝的销量权重之后,这时候再开始做其它的词。
好了,我们今天淘宝搜索工作原理就讲到这里,其实后期我们很多系统运营的玩法,都是基于搜索基础原理演变出来的,比如如何通过新品x曲线打爆新品,老品如何操作m曲线获得二次增长,标品半标品如何通过w曲线玩法安全快速起爆,如何做店铺产品布局和买家心理学研究等等。
如果今天的分享对你有帮助,欢迎分享给身边有需要的朋友。