年度反思之2024我在淘宝做内容

本文写于2025年2月,一方面是最近读到了若干篇Google在短视频推荐方向的文章,另一方面是年前和某前同事聊新工作在做的事情,感觉思路更开阔了,顺便把以前做的事情再拿出来“鞭尸”一下。

全文中的”内容“仅指 各类短视频内容,暂不讨论直播。

本文主要内容如下:

  1. 近期Google的几篇短视频相关文章,都讲了什么,有哪些令我印象深刻的巧思
  2. 之前在淘宝做内容的时候,做过哪些类似的事情,和Google这几篇论文相比,有哪些做得好、哪些做得差
  3. what if,如果站能在更高的视角,个人观点,淘宝内容做不起来的原因是什么,有没有能够做好的机会

Google SFV Recommendation

(SFV:Short-Form Video,短视频)

最近半年陆陆续续读到几篇google做短视频推荐的文章,部分方向的事情我之前也做过,此处做一些讨论,先简单summary以下这几篇文章的核心contribution:

  • 主链路模型优化
    • 【CIKM'23】Multitask Ranking System for Immersive Feed and No More Clicks: A Case Study of Short-Form Video Recommendation
      • debias,多任务训练,稀疏转化建模
    • 【RecSys'24】Short-form Video Needs Long-term Interests: An Industrial Solution for Serving Large User Sequence Models
      • 异步打长序列的embedding,缓存结果给后续请求使用。
  • 冷启
    • 【KDD'23】Fresh Content Needs More Attention: Multi-funnel Fresh Content Recommendation
      • 内容冷启动链路,包含一个针对完全新内容的双塔模型和一个根据近实时用户相关行为的序列模型
    • 【WSDM'24】Long-Term Value of Exploration: Measurements, Findings and Algorithm
      • 通过供给屏蔽实验的方式,证明了”新内容“对于短视频推荐系统的价值,并给出了实践中供给侧的评估指标和实验方式,最后“水”了一个用Neural Linear Bandit 来做explore的模型。
  • 创作者生态
    • 【RecSys'24】Co-optimize Content Generation and Consumption in a Large Scale Video Recommendation System
      • 传统推荐系统往往只关注于用户消费价值的建模,但是对于内容平台,内容的生产也十分重要。文中讨论了建模「稀疏的内容生产行为」所用到的模型优化技巧,以及通过建模用户参与度的方式,来做用户维度差异化排序公式,平衡推荐内容的消费价值和内容生产价值。
    • 【RecSys'24】Optimizing for Participation in Recommender System
      • 与上一篇类似,本文讨论的也是如何提高平台创作者的参与度,更偏向于如何 促进/提高/优化 创作者的创作能力。
      • 用户生产内容的参与度优化。存在 Delay Feedback 和 Sparse Signal 问题,作者通过一个 参与度归因模型,将用户在一定时间窗口内的内容消费行为和最终的生产参与行为联系起来,归因模型会用于训练参与度预估模型,也会用于筛选灵感内容集合;另一方面,通过多任务模型来学习内容生产的中间过程行为,来辅助“内容生产”主任务的学习。
      • 目标用户筛选。用一个用户维度的模型,预估用户未来一段时间内生产内容的概率,这个模型的预估会用于潜在生产用户的筛选、排序中差异化权重以及在模型中对生产概率高的“高价值”样本进行加权。
      • 灵感内容识别。灵感内容主要有两种类型,趋势内容和经久不衰的优质内容,文中用“实时发现”和“参与度归因模型评估”的方式来筛选具备流行趋势的种子内容。

我在淘宝做内容

首先回答,当时为什么选择去做内容,主要是两个考虑

  • 当时的环境下,抖音快手小红书B站一众内容平台飞速发展,用户肯定存在消费内容的需求的,在淘宝这个场景,是可能存在一些特殊的内容供给,能够满足用户差异化的需求;
  • 平台用户规模和时长增长乏力,必然需要一些“新”的、“符合时代”的增长点,来给平台注入一些新的动力。

23.07~24.04 期间主要在做内容生态方向,主要做了几个方向的事:

  1. 内容平台的「供需度量」与「供给牵引机制」
  2. 创作者的商业化变现机制
  3. for平台行业运营的流量工具

内容平台的「供需度量」与「供给牵引机制」

对于内容平台而言,推荐分发内容的效率决定了平台的下限,内容供给的质量则决定了内容平台的上限,当时去了之后,老板给的第一个命题就是做供给牵引机制的设计。

针对这个问题,第一个想法是先找度量供给的“维度”,也即我们该用什么样的维度,来描绘 我们需要 这种、那种 的内容,当时选择组织内容供给的维度是 hashtag、topic、品类标和行业类别标签:

  • hashtag,就是一般我们发布内容中带「#」标签,创作者在发布内容时候,会把一些相关的内容标签加到文本中
  • topic则是平台发布的活动词条,一般对应特定的招投稿的活动,比如7、8月时候会有暑期活动之类的话题,9月会有开学季的话题
  • 品类标,在淘宝对带有电商属性的内容有一些行业贡献的标签,比如服饰行业会有三坑少女、洛丽塔、汉服等标签
  • 行业类别标签,这个很好理解,属于很基础的基建标签

在能够描述内容的基础上,下一个问题是 我们如何度量 我们缺什么样的内容,也即内容的供需度量。比如TGI指数,用不同内容品类内容消费 VV/时长 的占比的比值来衡量 应该增加什么样内容的供给,但这个做法过于“数据科学”了,实际落地层面中,也很难指导后续流量策略的设计。作为一个算法同学,站在流量分发视角,内容供需该如何度量?

同时,不同的消费维度,比如VV、时长、互动和GMV 指标 之间的平衡关系是什么呢?热点时效 的内容,篇均VV更高,影视娱乐篇均内容时长更多,家居种草类评论互动更多,服饰类千展GMV更高,那么用什么指标计算供需呢?如果对多个维度采用加权求和的方式,那么各个维度权重又该如何定义?

当时对于这几个问题,有两个思考:

  1. 供需的定义 要与 流量分发机制 有一致性。如果平台希望分发更多什么样的内容,会体现在内容的曝光展示数量上(即 VV数),如果平台认为 互动行为更有价值,那么互动价值更高的内容就会获得更多的曝光,平台认为GMV更有价值,高转化率、高客单价的内容就会获得更多的曝光,所以,平台的分发策略 天然定义了 不同维度的权重。

  2. 供需的定义 要 服务于内容消费增长。那如何保证更多供给能带来更多的内容消费的增量?这就要说到Uplift/Caual Inference了,这个方向研究的就是单一或者多个变量的改变所能带来最终结果的改变,所以内容供需可以理解为 不同数量的内容供给 与 大盘内容消费量 之间的函数关系,增加内容数量如果能带来大盘内容消费量的增长,那么就是供小于求的。

沿着这两个思考,设计了供给屏蔽实验,通过减少内容供给的数量,观察不同内容数量下,内容消费量增长的情况,建模之后进行外推预测,预估增加内容所能带来内容消费的增长有多少。

当我们能够度量供需状况后,如何牵引内容,就变成相对容易的事了,我们只需要在更缺供给的内容上,加大各种招投稿的力度,给各种扶持即可。当时在这个方向上,做了一些流量牵引机制,针对缺供给的内容类别,给予更多的扶持流量,也在创作者侧做一些创作指引等。

创作者的商业化变现机制 和 for平台行业运营的流量工具

这两部分的工作相对中规中矩:

  • 商业化变现机制上,淘宝内容会有不同层级创作者适合的商业化变现工具,包括 流量分成、挂品带货、商单视频 以及 直播,当时的设想下,创作者来淘宝后,可以先通过 流量分成 来创收 活下去,积累一定粉丝之后,再做带货和商单,最终开直播带货。

  • for平台行业运营的流量工具,就是投流系统,运营作为广告主帮助创作者进行投流,扶持创作者成长

事后再来看

离开阿里后,重新再审视这些事又有别样的视角。

淘宝内容做不起来的原因?

  1. 高P们职场战争内耗 与 中层“无人可用”困境。十八罗汉也不是个个能打,阿里组织内耗程度在国内也是首屈一指,大部分嫡系弟子又蠢又不爱干活。这倒也不是说公司文化有问题,是组织所处的周期,所导致的必然结果,管理学问题。
  2. 没有想清楚要服务好谁。
    1. 对于内容而言,一定是创作者的生存环境更好了,有更多的内容供给,才会有更多的用户来此处消费。在当时的时间点来看,创作者只是平台的工具人,帮助高P们完成用户时长的KPI,nobody 关心创作者。这样政策下,也导致 平台上所谓的创作者,也只剩下各种 抖快内容的搬运号。
    2. 这句话也适用于目前的淘宝,服务好广告主是目标,服务好用户是手段
  3. 广告预算类型稀少,作为电商平台,平台大部分广告预算都是电商广告主的预算,这类广告预算在内容消费的场域的效果远低于货架、搜索(电商搜索广告,CPM高到令人发指),由于缺少更适配内容场景的广告预算,内容场景变现能力偏弱,高层对于内容的长期投入减少,短短两三年,内容就从高举高打 变成 过街老鼠。

淘宝内容应该长成什么样子?

首先否认UGC,作为PGC平台有一定突围的机会。

UGC or 内容社区的愿景很美好,但是做不起来,平台无法培养用户,平台只能通过提供的差异化的供来选择用户。在高层准备减少投入,中层们准备讲UGC自造血故事的时候,我就知道这事完了。

淘宝需要的是,能够通过内容自身就可以完成商业化变现的“创作者”,既内容本身既商品(写到这里真是笑死,真是老牌电商App的路径依赖),如果做PGC,那么平台是有机会把屁股摆正的,毕竟服务好专业的创作者,以后可能有钱赚。那什么样专业创作者 产出 什么样的内容,能够既做到 内容留住用户 也能做到 内容变现 呢?目前想到的答案只有短剧、小说、小游戏。

这个角度下,直播在淘宝一直能活得不错 也是合理的,店播(电商广告主的直播)是符合上述逻辑的,广告主 也是淘宝熟悉的电商商家。

从内容视角跳出来,从商业形态来看,怎么理解淘宝?

货架电商App存在天然优势,端内流量更值钱,同时可商业化上限更高,并且端内积攒的用户电商消费偏好数据,在联盟外投场景更好用,电商的外投广告收入应该会远高于其它广告联盟。

由上述继续推演,如果想保证这个优势持续存在,需要用户在平台内能留下更多的消费行为,不仅能够提高端内收入,也能提高外投收入。那么继续推:

  1. PDD 极致成交 和 低价,在淘宝完全复现是不ok的,浏览、点击等偏好,虽然在端内不会产生价值,但是在外投上仍有价值;淘宝联盟可以吃品牌预算,端内在成交大目标下,多样性和笔单价同样重要;
  2. 从端内的视角来说,只需要 用增和商业化,用增负责把流量盘子做大,商业化负责变现
    1. 货架App用增如何把流量盘子做大,千古难题,商品不像内容,长期的留存天然更难做,电商App要靠啥长期留住用户,我没有答案,待思考,目前各种外投拉活+低价商品承接+小游戏,这种做法着实不够优雅
    2. 推荐场域 是 用增和商业化的交叉地带,算是两边都需要兼顾的复杂地带,难上加难
  3. 单纯的内容消费时长,既无法贡献 电商消费偏好数据,又抢占已有流量,从这个角度看,没办法为平台提供收入的内容,在淘宝注定是死路一条。此处不讨论做内容带来流量规模增量高于流量效率损失的情况,淘宝的流量太贵了,内容和货架的转化率差,高到难以想象。

Final

这篇文章写完时,阿里股价已经回到150了,希望老东家AI的故事越讲越好,也唏嘘 内容的故事 已经被扔进了历史的垃圾桶。