Arvin's Blog

Poem & Algorithm


  • 首页

  • 分类

  • 关于

  • 归档

  • 标签

  • 搜索

A Boosting Algorithm for Item Recommendation with Implicit Feedback

发表于 2017-09-23
AdaBRP 今天这篇看的是一篇ensemble方法和推荐系统结合的文章,提出一个叫AdaBPR(Adaptive Boosting Personalized Ranking),这篇文章前面的Introduction和related work都写不错,还对我一直不太明白的point-wise、pair-wise和list-wise三种基于模型的方法做出了解释,并给出了一系列参考文献: point ...
阅读全文 »

something about SLIM in recommendation system

发表于 2017-09-17 | 分类于 PaperNote
看16年recsys的best paper,Local Item-Item Models for Top-N Recommendation 中提到的SLIM方法,最近抓着这个方法研究了一下。然后还发现了Xia Ning和George Karypis这两位,这两位一直是SLIM相关论文的主要作者,XiaNing应该是George Karypis的学生,从最早的SLIM方法开始,到后面也有两篇(好像是 ...
阅读全文 »

数据库的读写分离

发表于 2017-09-15
数据库读写分离及相关 什么是读写分离 将数据库分为主数据库和从数据库,主数据库来处理事务性增、删、改操作,让从数据库处理查操作,用数据库复制将事务性操作变更同步到集群的从数据库中。 为什么要读写分离 主要原因就在于数据量的增加,当单表数据量达到一定条数之后,数据库操作的性能下降,将读写分离后操作会快很多。 分库分表方式 可以根据主键散列分表,如一些订单号等等,或者是用户的内部一致的userid等等 ...
阅读全文 »

GC in Python

发表于 2017-09-15 | 分类于 Python
Python垃圾回收处理 引用计数 当一个对象被创建或者复制时,对象的引用计数加一,当对象的引用被销毁时,对象的引用计数减一,当引用计数为0时,会将该对象所占内存释放。 优点在于实时性,任何内存一旦没有指向它的引用,就会立即被回收,其它垃圾回收机制是建立在一些特殊条件下。 缺点在于维护计数所造成的计算开销。同时,引用计数会造成循环引用,如下所示 12345678a = []b = []a.appe ...
阅读全文 »

python的dict源码解读

发表于 2017-09-15 | 分类于 Python
python的dict源码解读 PyDictEntry 12345typededf struct{ Py_ssize_t me_hash; PyObject *me_key; PyObject *me_value;} PyDictEntry 其中me_hash 用于存储hash值 PyDictObject 123456789101112typedef struct _di ...
阅读全文 »

Incremental Collaborative Filtering for Highly-Scalable Recommendation Algorithms

发表于 2017-09-14 | 分类于 PaperNote
因为最近在公司搞一个实时性要求比较高的推荐,所以最近会看一些新闻推荐、实时推荐相关的论文,今天这篇是一篇比较老的增量学习+协同过滤的论文,想法很简单,就是在计算相似度时分类讨论,不同情况选择不同的增量方式,尽最大的可能性减少计算量。 传统的相似度计算方式为 \[ \text{sim}(u_x,u_y)=\frac {\sum^n_{h=1}(r_{u_x,i_h}-\overline{r_{u_x ...
阅读全文 »

Exploiting Music Play Sequence for Music Recommendation

发表于 2017-09-12 | 分类于 PaperNote
这篇文章发在IJCAI2017上,是一篇音乐推荐的文章,简单解读一下。 用户在听歌的时候会留下很多数字信息,不仅可以反映出用户的喜好,还能够反映出歌曲之间的相似度,这在之前的音乐推荐中是不被重视的。本文提出了一种个性化的音乐推荐算法,能够有效地刻画出用户的喜好,作者先用word embedding方法估计歌曲之间的相似度,之后再将学习到的相似度嵌入矩阵分解模型中,来提升潜在特征的辨识度,一般选取\ ...
阅读全文 »

pytorch note 09.09

发表于 2017-09-09 | 分类于 Python
Pytorch note 09.09 求导机制 每个变量的requires_grad 表明这个变量是否需要计算导数,在创建变量的时候进行设定 z = Variable(torch.randn(5, 5), requires_grad=True) 这个参数可以让我们动态的调整每个变量是否需要梯度和是否更新。 volatile 是干什么的暂时没有看懂,先留个坑。 torch pytorch的基本包to ...
阅读全文 »

Recommendation vs Sentiment Analysis- A Text-Driven Latent Factor Model for Rating Prediction with Cold-Start Awareness

发表于 2017-09-03 | 分类于 PaperNote
这篇论文核心思想是利用评论去解决冷启动问题同时增加预测的准确性,发表在IJCAI上,给我感觉稍微有点水的意味,文章中具体训练步骤说的不是很清楚,可能是我之前没有接触过,先挖个坑,以后填 TLFM 文中的主要思想是利用矩阵分解探究潜在影响因素,文中作者提出加入评论的个人因素作为补充: \[ \hat{y}_{ui}=g(base+(\sum_{w\in W(r_{ui})}\alpha_wv_w^T ...
阅读全文 »

Application of Dimensionality Reduction in Recommender System

发表于 2017-09-02 | 分类于 PaperNote
这篇论文应该是最早用SVD做推荐系统的文章,观点早已烂大街,前面篇幅的推荐方法分析也不是很适用现在的情况,本篇就记录一下算法细节。 Existing Recommender Systems Approaches and their Limitations 大部分协同过滤算法都是通过构造近似的近邻来达到推荐的目的,推荐算法分为: 预测用户对物品的打分 推荐用户最有可能买的物品Top-N 目前推荐 ...
阅读全文 »
<i class="fa fa-angle-left"></i>1…91011<i class="fa fa-angle-right"></i>

110 日志
10 分类
50 标签
RSS
Creative Commons
© 2022 YuyangZhangFTD
由 Hexo 强力驱动
主题 - NexT.Muse