集6 上海推荐小分队的问题汇总


1
胡 2018/12/11 0:11:35
@七月在线魏博士 老师,你了解django做的网页里面的数据库怎么操作的

我用django搭建起来一个前端,但是数据库一直操作不对
推荐系统后台的数据是怎么存储的,是用程序对数据库直接进行操作吗

七月在线魏博士 2018/12/11 11:08:50
原始数据一般用hbase/hive,前端用到的数据来源可以是redis
你用你熟悉的数据库就可以

2
胡 2018/12/11 18:47:57
老师,推荐系统里的数据的存储是怎么分配的,我想在的我的数据库中分别存储电影信息、用户信息、用户在不同情况下的TOP10电影信息,这样合理吗?
@七月在线魏博士

七月在线魏博士 2018/12/11 18:54:33
可以,如果实时反馈的话,推荐列表是实时生成的

3
胡 2018/12/11 22:12:03
老师,我有几个问题还是想问清楚一下,
1是数据库里面的数据是存储处理过后的数据还是原始数据,哪个比较合适;
2是电影信息包含电影的名称、导演、演员一些信息,但是同一条电影有不同的分类信息,比如《老炮儿》的类型分成三类:剧情、动作、犯罪,这个需要做个统一吗,还是说只删除其他类型保留一个,用户信息里面有些复杂,每一行是一个用户对一个电影的评分,但是数据里同一个用户对多个电影都有评分,这个信息处理出来,那每个用户都有不同数量的电影评分,这个就不太好办了吧,还是说用户信息的数据库表单里只存储用户名和ID,另外加上用户对所有的类型电影中TOP10的电影名,(我找到的数据里面用户没有像年龄学历爱好这样的其他信息),还是说在用户和电影关联的数据表单中单独存储两者的关系

七月在线魏博士 2018/12/11 22:42:57
1、前端需要什么数据,你就存什么,后端的数据存储形式可以灵活选择
2、标签都保留下来
3,最后的每条训练数据是:一个用户,一个电影,评分,这样的形式
已邀请:

要回复问题请先登录注册

返回顶部