数据预处理的时候, 哪些特征应该变成 numerical, 哪些特征变成 categorical 呢?


数据预处理的时候, 哪些特征应该变成 numerical, 哪些特征变成 categorical 呢?
已邀请:

我理解范畴内
age这种本来就是连续值,只不过你也可以离散化到一个个bin里,这样就变成离散变量了(连续和离散哪种好,要结合场景自己试)
“红”,“绿”,“蓝”这种本来就是类别型,可以用one-hot encoding之类的编码方式编码

要回复问题请先登录注册