留学生数据分析转NLP的面经:seq2seq、transformer、bert基本必考


作为留学生,在寻找国内工作的时候相比于国内同学来说,在信息和精力方面来讲相对处于劣势,对于国内学生来说毕业的前一年被称为应届生,可以参加各项校招,对于留学生来说,提前一年来找会有一些时间、课业、距离上的不便,就拿互联网公司的笔试来讲,可能需要半夜3点或者凌晨5点爬起来做1.5到2个小时的编程题。

不过现在比较好的是大多数互联网大厂都接受远程面试,从一面到终面最后签约都可以远程完成,但如果想要参加国企央企类的校园招聘,就必须得进行面对面的交流了,对于留学生毕业的当年还是否属于应届生这个问题,对于不同的毕业时间、不同的公司可能会有些不同,如果是在9月前毕业的,就只能参加很多互联网大厂的校招了。

基于对于在国内招聘信息以及求职规划不明确的情况下,我报名了七月在线的一对一就业班,方向是NLP,之前专业比较偏向于大数据挖掘分析,专业不是针对于某一个小方向,而是属于大且杂,不过之前对于深度学习、NLP也有一定的了解,也动手推导以及代码写过过神经网络框架以及back propagation的过程,但是做过的项目并没有很多,并且当时leecode也是刚刚开始刷。

不得不说对于找算法类的工作,leetcode绝对是基础,在面试时,基本都需要手撕代码,所以提前准备好这个方面真的十分重要,一对一辅导班中导师有推荐一些可以学习以及练手的项目,并在学习之后也推荐了一些可以写在简历上并可以继续研究的项目,对于一些问题也有很详细的解答,接下来我把面试中一部分的经验总结一下,希望可以帮助到大家。

面经中因为有一些时间有些久了,记得不太清楚,只把一些我记得的写了下来,并且没有分一二三面,因为实在记不清了,所以混在了一起

1 作业帮
算法题
不同二叉搜索树个数
最长回文字符

xgboost和RF区别与联系
seq2seq框架
seq2seq和transformer区别
HMM与CRF区别
还有一些项目的细节,以及一些其他的记不清楚了
概率题:如何判断一个城市的平均收入,如何判断哪些收入属于高收入,哪些属于低收入,如何对平均值进行估算

2 美团
聊的项目比较多,有问很多项目的细节
数据从哪里来,数据量有所少,为什么使用这个模型网络中用了多少层
文本如何表示如何做预训练,预训练区别和优缺点等
seq2seq, transformer, lstm, rnn等框架的基础推导
目前所使用的这些框架有什么优缺点
GBDT的原理
XGBOOST和GBDT相比的优点
SVM推导
fasttext和word2vec区别

3 某医疗公司
解释attention
multi-head好在哪,每个head是使用全部还是局部
softmax是否可以作为激活函数,为什么
LSTM中为什么使用sigmoid和tanh函数
CRF详解
BLEU详解
seq2seq详解
处理UNKOWN数据时应该如何处理最好
word2vec是否可以用作预训练

4 头条
算法:
括号配对问题
股票买卖最大利润(只够买卖各一次已经无限制次数)
还有一道SQL题,但忘记是什么了好像是计算工资类的

数据预处理方法
如何处理缺失值
Bagging和Boosting区别
seq2seq,transformer,Bert详解
attention有哪些、区别
为什么使用attention 优点
word2vec和fasttext
生成式学习和判别式区别
tf-idf
l1 l2正则
sigmoid梯度消失问题
概率:一桌人戴帽子,看到别人但看不到自己的,可以举报,第三轮举报,问至少有几个人戴帽子(其实和之前的打狗的概率题是一个意思)
还有一些项目相关的以及一些其他问题(比较难写出来)
已邀请:

要回复问题请先登录注册

收藏七月在线,一起向大牛进阶

ctrl+D或command+D可以快速收藏哦~