跨专业转行AI的艰辛历程与NLP面经


回想着自己参加七月的机器学习集训营已经是一年前了,我记得机器学习集训营5期就是8月1号开课的,那时的我对机器学习停留的认知依旧只是西瓜书上的那一系列的理论知识,虽然我对所有的理论知识都有所了解,但是却很难将理论知识与实际项目结合在一起。没有老师的指导,一个人不停的在河边摸着石头过河是一件非常折磨人的事情,没有明确的目的与方向会让自己觉得一点都不踏实。

虽然在参加集训营五期之前我已经找到了NLP的工作,但是正是因为自己是从别的专业转行过来,项目经验的缺乏就像悬在头上的达摩克利斯之剑,害怕稍有不慎,就会掉下来。不过,也正是由于这份担心,我才选择了机器学习集训营,想夯实一下机器学习的理论知识的同时,逐项积累一些比较好的项目经验。

在报名之后,我才发现以前自己闭门造车的学习,学习进度滞后的有点过分,不停的追求数学公式的推导,使得自身对于项目的实践与理解产生了严重的偏差。反观机器学习集训营,其学习课程由浅及深,梯度式学习让自身的压力也降低了很多。机器学习集训营的内容真的很丰富,虽然线上课讲解的时间只有2小时,但是里面所包含的信息确实很巨大,这些知识要将其吸收并转化为自己的知识,可不是一朝一夕可以完成的。但一旦消化完成,基本上也就掌握了这些知识,当然好记性不如烂笔头,我在集训营的学习过程中使用OneNote做了接近五万字的学习笔记,便于后期能在需要的时候将知识捡起来。

说实话,集训营的课程安排还是比较合理的,每周几节线上课程,用于讲解理论知识的同时还会具体剖析一些代码案例,这一点是在任何书本上无法学习到的,讲师还会为那些基础较差的学员进行讲解(比如我),直到听懂为止。讲师一般会会留下一些课后作业,让学员能在课后巩固学习到的知识并为之付出实践,周末还会有线下课的讲师会和我们讲解一些比较经典的机器学习方面的项目案例。

在完成了机器学习集训营的课程后,自己在实际工作中面对一些复杂的需求也确实能得心应手的去面对,尤其是在一些数据挖掘的工作任务中,我成功应用了在课程上学习到seaborn,pyecharts和机器学习的知识做出了一系列精美的数据分析报告,得到了上级领导的表扬,直到这一刻我也才明白机器学习集训营的课程还是真的很接地气的。

虽然我并没有因为有机器学习集训营的学习经验而去换工作,但是我却因为它而成长了许多,也能在实际工作中独当一面了。

这里我也分享我闭门造车的过程的一些面试经历,面试的公司中小型的互联网公司,因为地标在广州,寻找工作的时间又是在招聘淡季,薪资不是很高。这里我将几次重要的面试情况进行了总结,大家有兴趣可以参考一二。
Python
1、浅复制与深复制的区别?

SQL
1、数据库查询有哪些常用的优化方法?
2、主要是通过什么方法来判断某些SQL语句需要进行优化的?
3、除了使用索引以外,还有什么方法可以加快查询速度?

ML
1、你在构建线性模型的时候,有没有遇到多重共线性的问题?是怎样解决的?
2、说一说逻辑回归和SVM的区别和联系?
3、简单介绍一下逻辑回归?
4、决策树模型中的预剪枝和后剪枝是什么意思?
5、你所知道的决策树做最优属性划分使用的指标有哪一些?
6、请你简单介绍一下SVM?
7、SVM中有用到对偶方法,请问对偶方法是什么,在满足什么条件下,对偶问题的解才能等于原问题的解?
8、工程上,经常遇到一些约束问题,一般要通过什么方法来进行求解?(拉格朗日乘子法) 9、SMO算法在求解SVM的超平面方程中,扮演了一个什么样的角色?
10、请说一说朴素贝叶斯模型?它的假设条件是什么?
11、你了解的聚类算法有哪些?(我只答了k-means,DBSCAN)
12、请说一说K-means的思想?
13、你知道那些降维算法?知道t-sne吗?
14、请说一说PCA?
15、知道那些矩阵分解的方法?
16、请说一下你是通过什么方法来判断模型欠拟合和过拟合的?
17、你主要绘制的可视化的图表有那些?(面的一家数据公司)
18、请说一下GBT和XGboost的优缺点和区别?
19、简单说一下XGboost?
20、请简单介绍一下随机森林?随机森林里面的随机代表了什么?

NLP
1、你知道哪些文本分类的方法?(我从机器学习和深度学习两个方面回答的)
2、在你从事的专业领域,遇到未登录词怎么办?你是使用什么方法进行分词的?(我说从搜狗输入法的词库下载 的,然后结合jieba的自定义词库,完成的分词)
3、你是怎么去提取文本的关键词的?
4、如何去判定两个文本的相似性的?相似性的度量标准有哪些?你可以说一说余弦相似度和皮尔逊系数间的差异 吗?
5、可以简单介绍一些word2vec吗?
6、请简述CBOW和FastText之间的区别?
6、TextCNN的结构可以说一下吗?卷积核的层数应该怎么取?
7、说一下SVD的时间复杂度?
8、PLSA的核心思想是什么?
9、可以简单介绍一下LDA吗?求解主题使用的优化方法是什么(变分推断法和GIBBS采样)
10、如果给一段用户的对话,如何提取对话里的关键词将商城里面的商品推荐给他,这些关键词应该是什么? (我说要收集大量用户的历史行为记录,构建一个模型,当用户日常对话留言中有这些特征时,就可以把商品推 荐给他)
11、用户与智能设备之间的语音交互中,如果将用户的对话对应到设备的一系列操作命令上,如果出现了一对多 或者多对一的关系,该怎么处理?
12、请问A/B测试是什么?
13、你知道注意力机制吗?
已邀请:

要回复问题请先登录注册