今天有点累了,记一篇之前看过的论文吧。Deep Content-based Music Recommendation这篇文章是发在13年的nips上,当年挺经典的一篇文章,后来很多music recommendation都是顺着他们的思路来的。
文中分享了一个在推荐中很重要的点,semantic gap,就是说你能抓住拿来用的特征到刻画用户的偏好之间,会存在一个gap,而这个gap则是极难跨越的。在音乐推荐上,这个gap就可以表现为一首歌能够影响用户偏好的特性与它的声音信号中,大致相近的音律却能给用户带来不一样的感受,而我们一般说的感情、韵律、主题都需要非常复杂的模型才能刻画,甚至有很多事无法刻画的。(就像小苹果能火起来,why??)
文章中提到了几个常用音乐推荐数据集:million song dataset、last.fm等等,做这方面的同学可以关注一下。BTW,明年RecSys的比赛题目与music有关,有心的小伙伴早作准备。
文中作者采用了多种方法,包括加权矩阵分解、提取歌词特征和对音律图像做CNN分类,然后做了实验对比,这里就不具体说了,感觉模型部分不是特别出彩,当也能算上面面俱到了,本文重点在于介绍music recommendation的问题,以及总结了很多前任的工作,为后续大家用dl做music的推荐提供了思路。