校招面试分享:我是如何连拿华为、苏宁、携程、招商4个offer的


我是机器学习集训营第六期的学员,参加集训营的时候是一名正在参加秋招的研三准毕业生,机器学习方面的项目经验很少,秋招一开始阶段并不顺利。
因为我起初接触机器学习的时候就看过七月的一些nlp方面的小课,讲的很简单易懂。为了找个好工作所以就咬咬牙保留集六,如果当时有nlp的集训营 我就直接报这个了。 学习的时间有四个多月,我一边参加秋招一边学习巩固知识,优化简历。

整个找工作结束,拿到了好几个offer,其实四个月我学的还是不够的,我现在也在不断的看一些以前上课的视频,继续充实自己。下面介绍一下我面试时的情况,也给大家一些经验。因为我是校招,所以下面这些面试经验校招生可以好好看看。希望能对你们找工作有好的用处。

首先,集训营老师给的意见是自己确定好一两个方面,最好定两个简历模板,然后不断优化。譬如我当时就一心想去搞nlp,所以就只做了一份简历。大家不要和我学,哈哈哈。 首先不管我们是要走cv、nlp、推荐什么方向的,面试的时候都是基于简历上我们自己写的。不过既然都选择了NLP或者CV等等,我们都必须熟悉且能手推出LR、adaboost、xgboost、svm这些经典的机器学习算法,这是最基础的了。下面我就介绍一下我面试的公司的一些情况

华为: 笔试完 总共两面 获得offer
一面较为轻松,因为面试的是一个脾气很好的小哥。一上来就问我平时都使用什么语言,然后用最熟悉的语言先练练手,写一个快排,面了很多家感觉手撕代码大部分都会先来个快排。
然后看着我的简历开始一个个问:
最熟悉那个机器学习模型,xgboost多分类 参数怎么设置 数据不平衡的时候xgboost可以直接训练吗? 会不会有影响。讲一下xgboost的推导,大概讲讲就好。
然后开始看项目,忘了介绍,我简历一共三个项目,一个是集六中的ai法官项目,一个是京东的潜在用户预测,一个是我自己的毕设论文项目。

首先面试官对ai法官比较感兴趣,让我说一下模型的整体框架,对项目细节问的比较多,比如为什么要选择用cnn来作文本,为什么不选用RNN一类的来做。然后询问wrod2vec 和 glove的区别,模型输入是只有word2vec吗?用别人训练好的word2vec来训练你的模型有没有什么影响?有没有考虑用RNN的模型来做,怎么做?

二面的时候应该是部门的老大,整体问的问题都比较前沿,问了了解过transformer吗?你觉得bert的优点是什么?说一说transformer、rnn、cnn这些模型的优缺点,比较一下这三种特征抽取器。
整体下来感觉基础知识要牢靠,面试之中的问题都是从我的项目出发,考察我的解决问题的一些思路和想法。

苏宁 总共一面 获得offer
不知道为什么,今年校招只有一面。俩面试官同时面试我。坐下来的时候就很慌。

一位一直询问机器学习的问题:
简要介绍一下你做一个机器学习问题的完整流程。
如何判断过拟合,模型过拟合了怎么解决。
LR 和 SVM的区别
介绍一下随机森林
为什么随机森林不需要做特征选择
svm的核函数都用过哪些
rnn的优缺点
cnn的优缺点
cnn怎么做文本分类,优势是什么,缺点是什么
LSTM改进了rnn 的什么问题
也记不清了 反正问的很多,感觉他有个面试题库 挨个问我。

另外一位是做nlp,开了我的项目就问了一个问题,命名实体识别中,你如果一开始分词分错了怎么办,这样后面的实体识别不就蹦了吗? 你是怎么考虑的?
果然一对二不占优势。不过问的问题除了最后一个其它都是比较基础的,比较好回答。

搜狗 加上hr面 一共两面
很神奇 苏宁和搜狗都是只有一面技术面。
直接说问题吧
因为面试官是做搜索方面的,所以一上来就让写个代码。写一个最大字符串匹配的问题。
然后开始问:
word2vec是怎么训练的,negative sampling解释一下
tfidf的原理
lstm解决了rnn什么问题?
cnn在文本中的用法,pooling的作用
深层网络容易过拟合还是浅层网络容易过拟合?
注意力机制的理解,从公式出发
relu和sigmoid有什么区别
xgboost里面的lambdarank的损失函数是什么
xgboost在什么地方做剪枝
lightbm和xgboost有什么区别?loss方面
问了很多问题,记得的也就这么多了,隔了好久了。

整个秋招到最后 又拿到了携程、招商银行网络科技的offer

总结
首先传统机器学习算法:svm、lr、softmax、决策树、随机森林、GBDT、xgboost、adaboost、bp神经网络、朴素贝叶斯等等这些都必须自己手推一次或者多次。深度学习方面:CNN、RNN、LSTM、常用激活函数(tanh、relu等)、adam优化函数、梯度消失这些原理或者是结构都应该能手画出来

nlp方面:强烈建议tfidf、textrank、word2vec、注意力机制、transformer都应该非常熟悉。源码看不看随意,但是必须自己去运行实践一边,因为不这样去搞,好多处理我们都不知道是为什么,而面试最爱问的就是为什么这样做。最后祝大家找到心仪的工作,前程似锦。
已邀请:

要回复问题请先登录注册