2017年度学员专访之五:我是怎么进入机器学习领域的


1 简要介绍一下你自己,比如哪个大学毕业的,现在哪上班,具体做什么工作
S聪:我是北京邮电大学毕业的,本硕都是通信工程,在校期间没有接触过大数据。之前加入一家初创公司做开发,工作内容是web平台搭建,目前正在跳槽中。
69AB368A-A143-47DF-AB6C-930F5D06FB80.png

2 工作中遇到的最大困难是什么,后来怎么解决的
S聪:由于是加入的是创业公司,好多平台架构都需要自己搭建。我做开发一开始就着手搭建考勤与请假系统。这对于一个新员工来说是个一个棘手的问题。当初也考察过一个开源的人脸识别方案,还用docker部署、拿自己的笔记本前置摄像头测试过识别率,发现其虽然可以很好的区分出不同的人,但却不能区别出真人和照片,因此沿用了公司之前购买的一套人脸识别系统,通过读取它的打卡数据计算每一个员工考勤时间。也是通过这次经历使我对机器学习产生了浓厚的兴趣,初步了解后,发现其可以延伸到我们生活的各个领域,并正在改变我们的生活。

3 参加七月在线机器学习集训营最大的心得和感受是什么
S聪:加入七月在线机器学习集训营主要是想系统的学习一下机器学习,找人带自己快速入门。如果每堂课都跟下来并且按时完成作业,确实可以收获很多。老师在课程中会介绍很多项目和案例,对于有点开发经验的人来说可以直接参考老师提供的代码与数据完成一些机器学习的项目,增加项目经验。集训营最大的好处是有老师、同学帮自己答疑解惑,别人的经验会让自己绕过很多坑,达到提高效率的目的。

4 最近有在参加阿里云天池一个比赛?可否简单分享下参赛经历和经验
S聪:自己也有幸被同学拉着一起参加了天池比赛,进入复赛后成绩也一度达到了前20。参加比赛于与之前唯一不同是在于接触到的都是真实的数据,需要自己对其进行去异常、填充缺失值等处理。要学会用pandas批量处理数据,用seaborns查看数据分布、发现规律,才能找到更好的特征。不同的模型对数据有不同的要求,比如有的决策树模型可以允许数据有缺失值,但其他一些模型就不允许有缺失等。自己总结的参赛经验首先是基础要扎实,比如避免有些模型没有对特征进行归一化或独热向量编码导致结果偏差的错误,其次是不管用什么模型,都要对处理的数据有着深入的分析与研究,因为到最后模型调参对结果影响小于一个有用的特征带来的改善。同时感谢一下寒小阳老师在比赛中给了我们很多的指导和建议。

5 对未来有什么职业规划
S聪:我对数字比较敏感,也喜欢做处理数据的工作。未来主要从事大数据领域,做一些数据分析、机器学习方面的工作。目标是通过分析、计算找到有价值的数据,带来生产上的利润。这段时间需要夯实基础,并努力践行,和同学们一同成长。
已邀请:

要回复问题请先登录注册

返回顶部