深入浅出之 Factorization Machines
Factorization Machines 由日本 Osaka University 的 Steffen Rendle [1] 在 2010 年提出。FM 是一种常用的因子机模型
FM
电影评分
【数据图】
$$
FM vs SVM
对于经典的特征组合问题,不难想到使用 SVM 求解。Steffen 在论文中也多次将 FM 和 SVM 做对比。
一个二阶
最后总结一下,FM 相比于 SVM 有下面三个特点: 1. SVM 中虽然也有特征交叉项,但是只能在样本中含有相对应的特征交叉数据时才能学习。但是 FM 能在数据稀疏的时候学习到交叉项的参数。 2. SVM 问题无法直接,常用的方法是根据拉格朗日对偶性将原始问题转化为对偶问题。 3. 在使用模型预测时,SVM 依赖部分训练数据(支持向量),FM 模型则没有这种依赖。
NFM
在工业界,实际上大部分需要处理的问题都是非线性,前文介绍的 FM 模型很难学习特征之间的高阶隐藏关系。Neural Factorization Machines 正是在这样的背景下诞生的,它的结构如下:
其中第一项和第二项是线性回归,第三项是神经网络。神经网络中利用 FM 模型的二阶特征交叉结果做为输入,学习数据之间的高阶特征。与直接利用高阶 FM 模型相比,可以降低模型的训练复杂度,加快训练速度。
模型的神经网络部分包含 4 层,分别是 Embedding Layer、Bi-Interaction Layer、Hidden Layers、Prediction Score。
- Embedding Layer 层对输入的稀疏数据进行 Embedding 操作。一般来说最常见的 Embedding 是在一张权值表中进行 lookup 操作,论文中作者强调他们这一步操作需要处理带权重的向量。
- Bi-Interaction Layer 层是这篇论文的创新,这一层将 Embedding vector 转换成为只有 k 维的单独向量。
- Hidden Layers 层是一个常规的 DNN
Reference
- Rendle, Steffen. “Factorization Machines,” 995–1000, IEEE, 2010. doi:10.1109/icdm.2010.127.
- 深入浅出Factorization Machines系列
- 因子机深入解析