思想训练过程
周末在暴风电视本周最新榜上看了四部电影:《影》 《幸福终点站》 《球王的诞生》《美国动物》,难得的是,竟然都没有让我失望,想起之前有些周末,我在豆瓣上精心挑选了一些电影,反而难以让我感到满意。我想这是个选择模型$f$的问题。
为什么回产生这种现象呢,我们分析一下。如果把推荐电影当作一个任务 $f$ ,那么有以下几种模型:
电影天堂:“最近的电影”
不断推出最新电影,可以看作是随机生成。由于没有针对单独用户进行推荐,所以信息有效率较低。豆瓣推荐:“我曾经喜欢的电影”
根据以往我对所看过电影的打分情况,推荐我爱看的,这是经典的feed流。如果我喜欢科幻电影,系统会一直给我推荐科幻电影,早前的推荐会让我感到很满意,但是后期当我出现审美疲劳的时候,系统已经陷入了“信息茧房”。这里请注意,我说的是系统陷入了茧房,而不是我陷入了茧房。我不会因为系统无限制推荐而陷入科幻电影,但是推荐系统却深深陷入了科幻电影。朋友推荐:“大家都说好看的电影”
当豆瓣的推荐无法满足用户的时候,用户会通过社交媒体或者朋友之间推荐。对于能够推荐电影的朋友,一般圈子较近,思想层次比较相似,因此这种能够有效得到一些比较满意的电影,但是这种方式效率较低。
可以看出,目前并没有有效的机制可以推荐“用户喜欢的电影”,在人的思想和意识无法被读取之前,比较有效的方式就是“以往喜好”加上“随机游走”,不断试探用户对其他电影的接受可能性。
从模型在线训练的角度,就是当数据收敛之后,不断加上新的数据分布,防止茧房。这个倒是跟我们实验室周老大的研究比较相似,温度场控制曲线训练好之后,间断加入随机模式,防止模型过拟合。
通过以上分析,对于我自己来说,最有效的方式就是主动找一些自己以前不喜欢的电影,逃出自己喜欢的电影圈子,这样可能会有意外收获。