电影推荐模型的思想训练过程

思想训练过程

周末在暴风电视本周最新榜上看了四部电影：《影》《幸福终点站》《球王的诞生》《美国动物》，难得的是，竟然都没有让我失望，想起之前有些周末，我在豆瓣上精心挑选了一些电影，反而难以让我感到满意。我想这是个选择模型$f$的问题。

为什么回产生这种现象呢，我们分析一下。如果把推荐电影当作一个任务 $f$ ,那么有以下几种模型：

电影天堂：“最近的电影”
不断推出最新电影，可以看作是随机生成。由于没有针对单独用户进行推荐，所以信息有效率较低。
豆瓣推荐：“我曾经喜欢的电影”
根据以往我对所看过电影的打分情况，推荐我爱看的，这是经典的feed流。如果我喜欢科幻电影，系统会一直给我推荐科幻电影，早前的推荐会让我感到很满意，但是后期当我出现审美疲劳的时候，系统已经陷入了“信息茧房”。这里请注意，我说的是系统陷入了茧房，而不是我陷入了茧房。我不会因为系统无限制推荐而陷入科幻电影，但是推荐系统却深深陷入了科幻电影。
朋友推荐：“大家都说好看的电影”
当豆瓣的推荐无法满足用户的时候，用户会通过社交媒体或者朋友之间推荐。对于能够推荐电影的朋友，一般圈子较近，思想层次比较相似，因此这种能够有效得到一些比较满意的电影，但是这种方式效率较低。

可以看出，目前并没有有效的机制可以推荐“用户喜欢的电影”，在人的思想和意识无法被读取之前，比较有效的方式就是“以往喜好”加上“随机游走”，不断试探用户对其他电影的接受可能性。

从模型在线训练的角度，就是当数据收敛之后，不断加上新的数据分布，防止茧房。这个倒是跟我们实验室周老大的研究比较相似，温度场控制曲线训练好之后，间断加入随机模式，防止模型过拟合。

通过以上分析，对于我自己来说，最有效的方式就是主动找一些自己以前不喜欢的电影，逃出自己喜欢的电影圈子，这样可能会有意外收获。