双非硕士面试之旅:数据分析、特征工程、模型构建、模型优化等流程要熟练


我是七月在线机器学习系训营第4期的学员,是一名19届双非院线的普通应届生,研究生是控制工程专业。作为小白的我,那时候根本不知道机器学习是什么。第一次接触机器学习是在研一的暑假,导师给的一个课题思路,让用机器学习的方法去解决,也因此让我接触到了机器学习。刚开始的学习是很痛苦的,一些算法模型的,看都看不懂,当时通过师兄的介绍花了一个暑假去学完了吴恩达老师的机器学习课程,只让我对机器学习有了简单的认识,也让我感受到了它的乐趣。

真正接触到七月在线是在研二的上学期,当时感受到师兄们找工作的压力,决心要好好学习机器学习,找一份相关的工作,师兄给我推荐了七月在线的课程,起初是在网盘上下载的七月在线视频,有理论有实战,被老师丰富的知识经验所吸引,所以就报名了机器学习集训营第四期,感谢七月在线带入门,那时候依稀记得在集训营群里大家讨论问题的场景,老师也及时的回复,解答同学们问题,在此表示感谢七月在线的老师的指导,不仅是学习的指导还有人生规划的指导。老师们的简历指导和面试经验也对我的面试求职起了巨大的帮助。

说道面试,简历按照老师们的讲解一定要好好写,把项目内容写得详实一些,简历中有的,已经要保证自己都会,没有的不要写上去。项目部分,就写了上课所讲的金融实战项目和kaggle比赛项目,一定要拿着代码一边看一边跑,了解比赛和项目的构造,数据分析,特征工程,模型的构建和模型优化等等。算法方面,要学会手推公式,像经典的LR,SVM和XGBOOST等算法一定要多多在纸上练习推导。
此外,还有 leetcode 刷题的课程,如果你想要去大公司,一定要熟练的完成 leetcode 刷题。

下面给大家分享一下我的一些面试过程。

CVTE研究院数据挖掘岗

1. 自我介绍(研究方向)
2. 研究方向上目前的研究成果有哪些(介绍了自己的两篇论文和专利)
3. 参加的竞赛
4. 围绕kaggle分享预测竞赛开始发问:
1)自己在竞赛中的角色
2)比赛的难点
3)如何解决该难题
4)竞赛中上分最高的几个手段是哪些
5)特征工程如何做的,有哪些特征,为何使用这些特征
6)单模型最高与模型融合的结果差距多少?如何进行的融合
5. 阐述SVM原理,为何使用对偶性以及对偶性原理,SVM如何解决多分类,SVM与LR对比。
6. 阐述GBDT、xgboost、lightGBM的异同,xgb的优势,lgb的优势,二者的并行如何实现。
7. 阐述word2vec的原理,为何使用哈弗曼树,如何构建哈夫曼,负采样的原理。
8. 对于一个取值较多的类别变量在不能进行onehot的情况下如何使用?
9 .阐述Hadoop与Spark的区别?
10 .Spark的工作原理是什么?

平安科技算法岗

1. 先是自我介绍,然后提了一些项目的问题,抠得比较细,抓到一个点就一直问下去。
2. 写公式:交叉熵、softmax、He初始化
3. 写公式并说一下KNN、 kmeans、 朴素贝叶斯的原理
4. 池化层如何反向传播
5. 上采样有哪些方式
6. 在分类任务中会用到哪些loss function
7. 一个智力题
8. lc的一道中等难度的算法题,讲算法,分析复杂度,最后代码实现

招银网络

1. 项目相关
2. 监督无监督区别,无监督实际场景?
3. 给定矩形内有若干点,求距离最小的两个点的距离,不能用穷举法?
4. 常见数据结构,栈队列区别和常见应用,完全二叉树和满二叉树。
5. 过拟合问题以及解决方法
6. GBDT和Random Forest介绍
7. 激活函数,损失函数
8. 梯度消失、梯度爆炸原因和解决方法

这里只介绍了其中几个秋招面试的公司,可以发现,面试题都是比较基础的,课程中基本都有学到过。主要在于你面试时是否可以答到点子上,是否有自己的理解和思考,还有就是手推公式和leetcode刷题。推荐一些我用过的书籍,《剑指offer》,西瓜书,《百面机器学习》等。

最后,希望我的一些经验对你们有所帮助,真心祝愿七月在线的学弟学妹们,希望你们在这里七学有所成,得到满意的offer。谢谢!
已邀请:

要回复问题请先登录注册