Deep Crossing- Web-Scale Modeling without Manually Crafted Combinatorial Features

这篇应该是最早的DL做CTR的文章了,好像是KDD2016的best,微软出品。

现在看这篇文章有点普通,但在当时应该还是挺应景的,做的是15年火的embedding和16年火的residual network的结合。模型结构如图所示

1

本篇论文突出的特点应该是不用人工设计feature,在当时应该也是一个break。

文章后面重点写了embedding和stacking策略以及residual层的应用,以及和DSSM的对比,这里我搜了一下,DSSM是一个深度语义匹配模型,手动微笑,并没有看过,所以他的第三点比较我就没有仔细看,过一阵子填坑,最近要看的太多了。再往后就是模型实现等等,不看了。

短短两年,一个best paper就成为了“古董”,真是让人感慨。