工科生转行AI


可以说我是个地地道道的工科生,本科是一个二本学校,硕士是北京一所211学校,我起初对计算机并不是很感兴趣,但受师兄和一些同在北京上学的高中同学的影响,对数据分析、数据挖掘和算法有了初步的了解,就渐渐开始有了跨行的打算,可能我心里的一个声音告诉我这个时代是一个高速发展的时代,是一个智能化,自动化的时代。我研究生期间其实也算是做了一些和数据分析相关的东西,通过数值模拟软件导出数据进行分析,但可能要求的代码能力并不是很强。

刚开始我是自学的,问同学要了一些资料,看了李航的统计学习方法,深入浅出统计学,西瓜书,吴恩达视频课等等,刚开始还觉得很有意思,但后面碰到一些比较难推导的公式就觉得有些吃力,特别像SVM的推导,Adaboost的推导,以及后来Xgboost的推导等等,刚开始可能很难看懂,而到了看懂的时候又很难自己推出来,反反复复推几遍好不容易熟悉了,时间一长还是会忘,可能学习知识就是这样,需要不断地反复,敲代码也是一样的感觉吧,需要不断坚持,可以练习,代码能力才会稳步提升,LeetCode,剑指offer可以由难到易有针对性地刷,学习过程中还接触到了一些网课,当时通过看七月在线的课,我对一些知识及代码的理解更加透彻一些,包括对数据的处理,模型算法的调参等等。后来又报了金融就业班。就业班老师会讲一些企业用到的一些自动化的特征处理及模型调优的方法。

关于面试,感觉今年的就业形势很不好,投了很多家公司,但给面试机会的屈指可数,可能因为我的专业不对口,还有就是可能没有相关的实习经验,下面就简单谈谈一些面试经历吧。
1、 手推逻辑回归公式(不止一家公司问到)
2、 手推Xgboost公式,树的生成过程(还碰到有面试官让你边手推边讲)
3、 从几个表中用sql进行提数,包括去重排序等操作
4、 给你一份数据集,让你用pandas按照相关要求对数据进行处理
5、 用pandas按要求对日期型数据进行转换
6、 逻辑推理题:如五匹马五条赛道问题,五间房子住着五个国籍的人,那么鱼是属于谁的等等
7、 逻辑回归为什么用最大似然而不用最小二乘
8、 涉及到项目会问调参过程和分箱原理
9、 Psi和IV值的计算公式
10、 混淆矩阵
11、 Python中的浅拷贝和深拷贝
12、 python中的list和array的不同之处
13、 项目中用到的一些算法如Boderline-Smote算法,孤立森林算法、局部异常因子等
14、 信用评分卡的概率转换评分的公式
15、 GBDT、Xgoost、LightGBM的区别
16、 评分卡模型使用逻辑回归的优点和缺点
17、 ID3、C4.5、Cart树节点分裂的依据及公式,三个算法的区别
18、 LI、L2正则化的区别
19、 Bagging和Boosting区别等等

还有就是会根据你项目的情况对一些细节进行提问,总之就是要对项目很熟悉,对基础知识的掌握一定要牢固,刚开始有几次面试手推Xgboost的时候因为有点慢,面试官就会有点不耐烦,让我直接写结果,所以熟练也是很重要的,机器学习、深度学习的发展很快,需要不断地学习,坚持刷题提升自己的代码能力,不断总结项目经验,或者参加一些比赛来得到提升都是很有必要的。
已邀请:

要回复问题请先登录注册

收藏七月在线,一起向大牛进阶

ctrl+D或command+D可以快速收藏哦~