推荐系统之标签体系

为什么要先介绍标签体系?

一个推荐系统效果好与坏最基本的保障、最基础的是什么?如果让我来回答,一定是标签体系。我这里说的标签主要是针对物料的,对于电商平台来说就是商品;对于音乐平台来说就是每一个首歌,对于新闻资讯平台来说就是每一条新闻。下一篇要介绍的是用户画像,画像中那些用户实时变化的兴趣点大都也是来自于标签体系,依据用户长期和短期行为中对于物料搜索、点击、收藏、评论、转发等事件,将物料的标签传导到用户画像上,就构成了用户的实时画像和离线画像中的各个动态维度。

标签体系概览

推荐系统之标签体系

以京东的标签体系中的京东超市为例用思维导图来拆解,后面我们会详细的介绍如何构建标签体系。

推荐系统之标签体系

这里对京东超市标签拆解粒度到三只松鼠年货大礼包的实体级别,实际上各个公司的标签体系大致都是如下构成

推荐系统之标签体系

一、二、三级分类体系都很好理解,参考京东超市的拆解,相信大家就会明白。标签体系中实体标签和概念标签不好理解。

实体标签

必须是名词,且必须是唯一指代。

学术性的解释逼格高,但是不容易理解,回答下面的问题

  • 老板问:苹果,是实体标签吗?
  • 给你三秒钟思考
  • 你回答:是!
  • 老板说:错!
  • 你懵逼:靠!为啥不是?

实体标签的要求:名词,且唯一指代。

苹果,是名词,但不是唯一指代,苹果 = 科技公司、手机、水果、牛仔裤

推荐系统之标签体系

概念标签

难道我就不能用“苹果”了吗?当然可以用,只不过要给它另外起个名字:概念标签。

概念标签通常表示的是“一类”或“某种相似”的内容,例如

推荐系统之标签体系

主题词

这里以之家的标签体系举例,要给买车用户推荐评测导购(一级)的文章,用户画像中车的品牌(二级)偏好太粗,而实体标签如奔驰GLC又太细,填补这中间的粒度空白,满足用户购车意图的画像,就加入“代步优选”的主题词,这样不仅保持了推荐的多样性,又不至于过分精准而导致的极度收敛。

推荐系统之标签体系

以上大致介绍了一下标签体系,那么我们接下介绍一下如何构建标签体系以及其构建过程中应遵循的一些原则。


标签体系构建原则

原则一、放弃⼤而全的框架,以业务场景倒推标签需求

原则二、标签生成自助化,解决效率和沟通成本

原则三、有效的标签管理机制

分别解释以下为什么提炼出这三个原则,分别用于解决什么问题?

关于第一项原则:

每个公司的产品、运营、商务对标签的诉求有较大的差异,同时不同的运营团队的诉求也存在很大差异,⼤而全的标签框架实际是站在用户视角搭建的,但是标签的真正应用者是业务方,所以应该从业务视角来实现。

因此最佳的处理方式是,我们应该放弃顶层的用户抽象视角,针对各业务线或部门的诉求和实际的应用场景,分别将