18应届毕业拿到机器学习offer的面经:嘉和美康、贷鱼科技


我是今年应届毕业生,从报名参加了七月在线的机器学习集训营,完成了3个月的集训营课程后,便开始求职,并最终拿到机器学习offer。在求职过程中遇到了一些挑战,在这里与大家一起分享,希望能给大家一些帮助。

首先简历要有一定的含金量,也可以自己找项目来进行充实。
(1)找准工作方向,然后写对应的工作经历,可以两个项目,一个kaggle/天池的比赛;
(2)项目的来龙去脉要搞清楚;
(3)基础技能部分写自己比较清楚的,这部分是面试官必问的,而且会往深处问,有实践的如:SQL,编程这是还要手写。
接下来我按面试的流程给大家分享一下我面试的流程与面试过程中的遇到的一些问题以及面试之后的反思与总结。

1.公司:嘉和美康 岗位:机器学习开发工程师 行业方向:医疗

笔试加技术
(1)开始面试前会收到一份笔试题,题目包含数据结构算法题,大数据分析常使用的工具SPARK,以及NLP相关的问题。笔试数据结构这部分推荐大家刷一刷剑指offer,其他的问题集训营的课程一般会有介绍,大家平时多练一练,课程认真听一般不会有什么问题。
(2)讲一讲项目。自己做个简短的介绍,这个项目的背景,做这个项目有多少人员,在其中担当什么角色,做了哪些工作,最后达到了什么效果。在介绍的时候面试官会看看简历,然后结合我们的介绍进行提问。
(3)面试官开始根据项目的流程进行提问!这个和简历布局有关,我在项目标题下面提出了使用了哪些模型。面试官一般就从使用的模型开始问起!为什么选择这几个模型,这就要求大家在学玩模型之后对各个模型使用的场景,计算效率,准确率有一个了解。一般分类树模型较有优势,分类能力强,而且可以查出分类出错的原因。讲了应用方面的知识后就是模型的原理,大公司尤其注重这一块,这一块也决定我们日后能不能自己进行模型的优化和调优。基础的要了解模型的思想,然后对公式进行推理,最后的难关就是自己有能力对模型进行建模。初学者进小公司只需会用,模型的思想清楚即可,大公司对模型的自己建模会在乎一些。
(4)特征工程:特征工程这一块特征怎么找出来的?特征怎么筛选?特征一般需要对业务有一定的了解,将一些认识的到的重要特征列出来,对于遗漏或未知的特征用特征组合或特征筛选挑出比较重要的特征。特征筛选有一些方法:包裹型,过滤性,嵌入型这些要讲一讲。
(5)数据:数据来源,数据量,数据预处理。数据来源我的是信息系统里面有的,直接使用,当然大家的数据来源不一定一致,大家结合自己的项目数据来源来说即可。数据量是企业比较关注的一个点,个人觉得得千万级别,大公司可能要上到百亿级别。这个数据量要咨询一下寒老师。数据预处理包括分桶,离散化,等相关处理,这个过程要讲详细一点。

2.公司:贷鱼 岗位:机器学习工程师 方向:金融

一面技术
(1)看简历基础技能部分,然后挑一些实践较重要的技能进行口述。这一部分主要问了两个问题,挑一个较熟悉的模型讲清楚这个模型的原理?spark mllib/sql针对这两个实用的技能进行询问,出了一道题来考察:spark可以建立视图吗?使用视图有什么优缺点?spark肯定可以建立视图,使用视图的缺点是计算效率慢。大家平时复习的时候与效率有关的问题要了解一下。

(2)结合项目问特征工程,模型。数据量多大,数据来源,数据处理过程,会挑一个模型让我讲解。这部分与第一家公司大致相同,简历上的模型大家要清楚。

二面技术
这次面试的是老总,其实技术还不如一面,只不过老总阅历较丰厚,会通过人的表现来判别一个人的技术水平。问题还是哪些老问题,就是要表现的自信一点。老总更多关心能不能完成工作,给一定的压力来试探一下。能不能服从加班?能不能按时完成工作?能不能快速学习新技术?有没有对市场对业务的观点和看法?着一些考察个人综合素质。

三面人事
(1)接受最低薪资是多少?然后讲一堆人情话,大家刚出来都是从几千元开始的,你过来又可以学习,能不能降低。有没有企业给offer?找工作多久了?现在住哪里?以前的工作为什么辞掉?
有没有企业给offer,这个问题是企业之间照对比。找工作多久,可以看面试者的水平,太久肯定不行,太短企业也不接受。住宿,北京住宿较贵,上班通勤较麻烦,离公司比较远一般会放弃。

最后面试的总结与心得:
1.面试看简历:
简历的项目真实,面试官一般问算法的较少,有真实项目算法只要能答出基本思想即可,有真实项目一般问比赛的比较少。我的简历两个真实项目一个比赛,面试官直接问我真实项目,最后附带问问主要技能以及工作经历。我的简历放在拉钩上面,项目写的比较详细,自己投的很少(想转NLP)就有企业直接联系我,这个也感谢寒老师为我的简历把关。

2. 大中型公司一般会有笔试:
笔试一般包含一两道数据结构的算法题,希望进大中厂的同学要准备一下,我就是被卡在数据结构上。如果数据结构实在没时间准备可以找小伙伴大家相互帮助一下(在企业笔试没有面试官监督,可以拍照给小伙伴看看,大家一起做,一起找答案),一般过了初面,这些也就不太重要了(个人理解)。也可以自己将常考的题目自己多练习,有些公司会出leetcode或剑指offer上面题目的变种题,就是会在原题上面在加深,这类的题目要求大家对算法题了解的情况下继续加深,打算法的本质搞懂搞透(真心比较费时间)!

3. 真实项目里面的核心类容要清楚:
如样本数量,模型融合,模型选择,评估方法,最后的实施部署。项目写的好吸引力就强,样本量,服务器配置,模型搭建过程遇到哪些问题,如何解决的,找一两个亮点,这样面试官也会觉得是我们自己做过的。这个问题大家可以参加kaggle比赛进行迁移学习,将比赛中遇到的一些难题进行迁移,其他相关问题可以问问资深开发大佬或者寒老师,有这些背景,面试官再问也就不会露馅,也能让面试官相信我们是真实做过的。建议:大家最好自己一个人完成比赛,这样能够将项目中遇到的问题自己过一遍,知识进行融合、实践,对自己能力提升很快。

4. 项目相关信息:
主要考察面试者是否真实参与该项目。面试官一般会变着发着尝试从我们的回答中找到我们是突击学习的。项目的背景,开发团队人数,主要责任。

5. 人事:
当人事来找面试者的时候基本就是商量工资的时候,前面的面试基本都通过了,这个时候不要以为自己刚毕业或者技术不娴熟就少要,斩钉截铁直接告诉人事自己的要求。一般人事也会砍点价,面试的时候期望薪资适当提高一点。有些企业会问很多个人相关信息,学校里实习在干什么,学机器学习多久了,用python多久了,以前的实习工资,来北京多久,找工作多久,手头有几个offer。这些在准备面试前,自己心里要有准备。

6.感谢:
来七月学习还是一个很不错的选择!有老师带,有学员可以交流,有宁哥指导就业,经常发红包给我们鼓励,这对毅力不足的我来说是个非常好的条件。七月也提供了足够的设备(虽然CV不够用),但我做文本分析的还是足够了,感谢七月的各位老师提供的帮助。最后分享点学习经验:学完机器学习在进入NLP和CV要简单很多,我就是过渡时间太长,浪费了一段时间,祝大家能够找到一个好工作!
已邀请:

要回复问题请先登录注册

返回顶部