Arvin's Blog

Poem & Algorithm


  • 首页

  • 分类

  • 关于

  • 归档

  • 标签

  • 搜索

ate_decomposition

发表于 2022-04-24 | 分类于 BriefSummary
今天在公司内部技术论坛上看到一个帖子,关于用Tree方法做ATE估计的,本着一个严(zhao)谨(cha)的态度,认认真真看了一遍,发现里面一个式子长的比较奇怪,随手推了推感觉还挺有意思的。在这里记一下。 POM框架就不多写了,这篇文章的目的是估计平均因果效应\(\tau\),然后提到最简单的办法就是用实验组的期望减去对照组的期望,即 \[ \begin{aligned} \hat{\tau} & ...
阅读全文 »

Beyond Customer Lifetime Valuation: Measuring the Value of Acquisition and Retention for Subscription Services

发表于 2022-03-18 | 分类于 PaperNote
TL;DR 这篇文章核心是在回答,如何评估营销活动期间的拉新、留存和流失召回的增量LTV。 Introduction Understanding the incremental value of subscribers is essential to subscription services. Marketing or product investments generally aim to ...
阅读全文 »

Personalized Treatment Selection using Causal Heterogeneity

发表于 2021-11-30 | 分类于 PaperNote
问题背景 现在在各大互联网平台上都存在着许多AB实验,服务每个用户所使用的机器学习模型、推荐系统参数、甚至UI界面等等,都由这些AB实验中配置的干预变量所决定的,通常我们会从众多干预中选择出表现最好的,进行全量,这种方式成为全局分配。 全局分配这种方式往往会是次优的,因为不同的干预对于每个用户或者说每个用户群体的效用,可能是不同的,全量某种干预方式很可能会给某个用户群体带来较差的用户体验,个性化干 ...
阅读全文 »

Large-Scale Data-Driven Airline Market Influence Maximization

发表于 2021-08-21 | 分类于 PaperNote
这篇文章是KDD2021的一篇文章,讲的是做航空路线的资源分配的。 我发现自己好像就喜欢看这个类型的文章,偏实际的业务问题+充斥着骚操作的解决方案,对于那种well-defined问题的文章好像看的不是那么多。 最近也被若干老板diss了说写东西逻辑以及表达不好,回看了一下以前写的文章,发现在写东西的时候还是比较随意的,以后尽量按照固定的框架来写,问题背景->解决方法->试验结果-&g ...
阅读全文 »

Causal Models for Real Time Bidding with Repeated User Interactions

发表于 2021-07-09 | 分类于 PaperNote
这篇文章是criteo ai lab发表在KDD2021上的一篇文章,文中的一些idea非常棒,同时跟我最近手头上做的事情比较像,拿出来详细写一下。 Introduction 关于竞价广告的背景就不在这里啰嗦了。。 竞价策略会依赖于展示广告的价值,这个价值一般需要用机器学习算法进行预测,这篇文章主要讨论一个广告是否需要重复、多次展示给一个用户。对于一个状态为\(x_t\)的用户,一次展示\(D_t ...
阅读全文 »

Markdowns in E-Commerce Fresh Retail: A Counterfactual Prediction and Multi-Period Optimization Approach

发表于 2021-06-06 | 分类于 PaperNote
Markdowns in E-Commerce Fresh Retail: A Counterfactual Prediction and Multi-Period Optimization Approach 这篇文章中了KDD2021,是做阿里盒马生鲜的折扣定价问题。 我个人很早之前也关注过电商商品定价的问题,之前看过比如说rue lala、一号店、zara的一些动态定价的方法,心里有些比较模糊 ...
阅读全文 »

Causal Tree & Causal Forest & Generalized Random Forest(grf algo slides)

发表于 2021-05-16 | 分类于 Slides
这次是Causal Tree -> Causal Forest -> Generalized Random Forest的slides。 从个人经验来看,GRF依然是很多场景下ITE预估的SOTA,且有一些非常棒的insight。 1 2 3 4 5 6 7
阅读全文 »

Double Machine Learning(DML algo slides)

发表于 2021-05-13 | 分类于 Slides
最近在写一些个人总结,其中部分章节有关算法的总结,拿出来分享。 这次是Double Machine Learning相关的总结slides,参考文献如下: Díaz, Iván. "Machine learning in the estimation of causal effects: targeted minimum loss-based estimation and double/debi ...
阅读全文 »

Improving Deep Learning For Airbnb Search

发表于 2021-02-15 | 分类于 PaperNote
这篇文章是airbnb中的2020的kdd,讲的是在之前的dl的探索之后的改进,也是一篇实战性非常强的文章,基础背景,Applying Deep Learning To Airbnb Search。 Optimizing The Architecture 在最开始对DL模型进行迭代的时候,我们也是从增加数据、增加网络深度来优化模型,但是却没什么收益,为了解释增加网络深度为什么对于最后结果没有提升, ...
阅读全文 »

Applying Deep Learning To Airbnb Search

发表于 2021-02-15 | 分类于 PaperNote
这篇文章是airbnb团队在KDD2019上的一篇文章。在当时来看,GBDT的模型已经对他们的业务有了一定的贡献,这篇文章主要是在讲,该团队在尝试使用NN模型来做进一步的迭代。相比于其他文章更关注于新的建模技巧,这篇文章描述的更多的是从树模型到NN模型这一路走来的心路历程,同时也希望给其他准备尝试NN的团队一些启示和建议。 看完这篇文章还是有很多感想的,会在结束的时候做一些讨论。 Introdu ...
阅读全文 »
<i class="fa fa-angle-left"></i>1234…12<i class="fa fa-angle-right"></i>

116 日志
10 分类
56 标签
RSS
Creative Commons
© 2025 YuyangZhangFTD
由 Hexo 强力驱动
主题 - NexT.Muse