NLP面试总结


面经~面经~,说真的写这类东西都是考验技术含量的,这里感谢在老师孜孜不倦的教导下终于排出了这篇传说中的面试经验,也算是在七月的总结篇!

我是集七的学员,选的NLP,之前是大数据开发的,双非辣鸡一枚,接触七月是在我一个老哥在七月学习之后的薪资让我有了怦然心动的感觉,之后一路顺利的加入了这个大家庭,学了一段时间后辞职做的《毕业设计》,后来找到了一家不错的电商公司,相比之前更满意现在的生活~废话不说,一下是我面试了一些比较靠谱的公司后后总结一些经验,也是我觉得比较重要的一些,也是常问到的地方。

数据来源?
数据预处理(处理方法有哪些),存储?
模型选定,为什么选这个模型,是否还有备用模型。
模型的度量指标。
模型训练和优化方法,具体看你项目里的来说明。
细节:
请简要介绍下SVM
请简要介绍下tensorflow的计算图
欧氏距离、曼哈顿距离
overfitting
LR 和 SVM
BAGGING Boosting
Xgboost优化点
谈谈判别式模型和生成式模型?
各种聚类算法的优缺点 划分:K-means 层次:AGNES 密度:DBSACN 模型:EM
Xgboost优化点、LightGBM 与XGboost 的联系及区别,是都试过了么
tf-idf怎么做的
为什么tf-idf char会对结果有提高?
RNN怎么做的?
RNN 为何引出LSTM,其优缺点,解决的问题时?
glove和fasttext怎么训练的?

词向量如何训练的?(word2vector)
word2vector为啥语义相近的词的词向量相近?怎么达到效果的?
RNN网络结构,各结构有什么作用?
LSTM输出是所有时刻的?还是最后时刻的?
简单说下seq2seq
lgb怎样的?缺失值处理过程?特征如何做的?

之后都是说自己项目遇到的难题以及解决方案,加上linux系统的一些命令,以及各种编程语言的使用方法(自己简历上写的),自己项目不熟悉的地方千万不要写上去,不管是语言及各种编程工具的使用等,面试时一定要有礼貌耐心的回答问题不要急,急了会忘记东西,回答问题会就答,不会的话不要乱猜,猜错了印象会变的很不好,减分操作~
手写代码是个难题,有时间多练练
面试之前了解这个公司的体制和需要的技术
最好还是一边在职一边学习,多努力点,希望大家都能找到理想中的工作~
已邀请:

要回复问题请先登录注册

收藏七月在线,一起向大牛进阶

ctrl+D或command+D可以快速收藏哦~