关于推荐系统基于内容的推荐中使用TF-IDF建模词对资料重要度问题


@寒老师 ,寒老师好,机器学习算法班第9课推荐系统,基于内容的推荐,用tf-idf建模词对资料的重要度。老师提到使用tf-id需要手调很多东西,跟数据集有关,如果数据集权重调的恰好的话,你可以拿到一个非常好的结果。请问老师这里手调是什么意思,具体需要调哪些东西?
已邀请:

寒老师

赞同来自:


其实我想说的是,如果你的数据集有倾斜性(举个极端的例子,全是“不顶不是中国人”的重复),那其实它学不出来很好的词权重表示。如果你的数据集,各个词出现的频度比较合理,那得到的ft-idf也会合理一点。

要回复问题请先登录注册

返回顶部