集2专访:差点因没报集训营,而险些走歪路


1 介绍一下你的工作经历
(1)2017.3.24北邮硕士毕业,计算数学,方向数学物理方程
(2)2017.3.21——2017.6.30第一份工作,控制运动算法
(3)2017.9——2017.9.30图像处理方向实习,虹膜识别
(4)2017.12.10集2结课
(5)2017.12.18投了40份左右简历(没投BATJTMD…)
(6)2017.12.21拿到了第一个offer
(7)2017.12.29入职(互联网金融,AI风控算法)

2 找工作做了哪些准备
(1)常见的ML算法:LR,决策树,随机森林,朴素贝叶斯,SVM等
(2)两三个案例:数据清洗,特征工程,模型选择与调参,评估分析
(3)常见面试问题:寒老师最后几节课给的总结文档,七月在线的题库
(4)修改简历:July校长最后几节课给找了几名BAT等知名公司leader指导

3 从集训营2中收获到了哪些技能
(1)ML工作方向:外行的自己v.s.内行的老师,差不多7月份就和七月在线的工作人员沟通了,后来感觉自己编程基础不够,就没跟集训营1,自己9月份找实习本来是觉得图像有意思,去实习岗位边学边做就不需要参加集训营了,结果险些走歪路,按自己的想法找的图像公司做的虹膜识别,基本工作内容就是数字图像处理、模式识别、特征比对,干了一个月就不干了,后来参加了集训营2,跟老师交流了解到一些方向,比如NLP、CV、风控、推荐系统、计算广告、量化投资等等,也比较有针对性地学习和为找工作做准备
(2)ML算法工作技能:老师带着学,知识覆盖度够,还有答疑
(3)ML之外的IT技能:网络配置、搭建服务器、Linux后台开发、环境配置等
(4)知名互联网公司的需求
(5)在合作中进步:组队学习、组队比赛

4 自己做过哪些项目,具体介绍其中一个?
小的项目比如分析iris数据集分类,boston数据集回归等。对比不同的方法,包括树模型、LR、SVM等等,查看不同模型分类边界或拟合曲线的差异性。大一点的项目比如movielens数据集作推荐系统,mnist数据集用深度学习网络模型分类,自己爬取的文本用nltk和jieba作分词及编码等。
更接近工业实际的项目比如Kaggle上的比赛Titanic数据集,利用pandas进行数据预处理,缺失值填充、单个特征和组合特征的可视化分析、类别型特征one-hot编码、数值型特征标准化处理、将数据切分成训练集/验证集/测试集后利用sklearn库建模、交叉验证的同时进行参数的网格搜索、进行过拟合/欠拟合分析、bad-case分析、重新查看特征、模型融合等步骤。

5 对年后找工作的同学有何建议
(1)跟着老师的节奏:做老师留的练习和要求看的视频,复习课上代码和视频
(2)可以写个人博客:留作学习/复习个人笔记(写博客一定要有点原创,照搬照抄对自己也没什么好处)
(3)遇到问题提问:在讨论中进步,在学习群里可以@老师和助教
(4)新集训营加了新项目——测评,小组学习等
(5)额外建议大家可以学有余力时,学一学七月上的某些小课程,比如Python数据分析、机器学习项目班等等

6 未来三年的职业规划是什么
强化自己的计算机基础,打算尽快学习自己欠缺的数据结构和算法,刷刷leetcode。
在工作中,加强自己的代码能力、开发经验和模型结合业务的判断能力。
希望有机会做一些有关推荐系统、用户画像的工作,工作行业还是会选择互联网。
已邀请:

要回复问题请先登录注册

返回顶部