985小本3年后台转算法


经历

我毕业于某 985 高校计算机专业,小本。毕业后做了一年多销售,然后转行做了两三年的后台研发。去年转算法(NLP),最终确定的offer年薪 40 万。


## 面试题 ##
直奔主题 —— 面试题 ~~ (以下公司全部使用 “*” 补齐 4 个字,无论是否真的是 4 个字)

- 京 ** 团 (推荐算法)
1. 项目相关,为什么使用这个模型 ?
2. 数据清洗流程,概述以下
3. 为什么集成这些模型 ?什么模型不适合这种方法集成 ? (《百面》中有相关论述)
4. 常见推荐算法

- 美 ** 评 (NLP)
1. 一道动态规划的题目,难度大概就是爬楼梯那种级别的
2. 推导下 SVM
3. LSTM 梯度消失的原因
4. 数学智力题
5. 快速排序的原理,怎么消除快排的缺点 (极客时间的算法课中有相关论述)


- 金 ** 团 (NLP)
1. LSTM 的图, GRU 的图
2. 梯度消失及其缓解策略
3. BERT 和 GPT 的区别
4. 手推 SVM 、 LR
5. 项目细节,比如清洗流程、Embedding 的维度之类

- 望 ** 慧 (机器学习)
1. 为什么使用这么复杂的模型?
2. 对于样本中缺失的特征怎么处理 ? (医疗领域很关注)
3. 写一个函数,均匀采样随机数生成正态分布随机数
4. 手写快排

- 五道口某金融公司 (NLP)
1. 忘记这个公司的名字了, CTO 是以前网易有道的大神
2. 推导 SVM
3. 推导 LR
4. 会 Spark 、 Hive 之类吗
5. 链表反转


- 百 *** (NLP)
1. 推导 LR
2. Doc2Vec 两种方法孰优孰略?
3. 样本量多少?为什么使用深度神经网络?
4. 读取文件,计算 TF-IDF
5. ID3 C4.5 CART 的分裂标准,写出公式

- 总结
1. 面试基本组成就是:算法题、机器学习/深度学习/NLP之类子领域基础知识、项目、其他基础知识
2. 算法:CS 出身的同学们基本都会被考算法题,非 CS 的据说有的不考。算法题基本上刷一刷 LeetCode 的常见题目就可以了,无非就是字符串操作、广/深度优先搜索、链表、动态规划、树。面试算法其实不难,我刷了大概 100 多道的时候面试算法题就都没问题了。刷算法题我建议找一个 LeetCode 题目的分类帖子,然后从容易的开始刷,换着类型刷。上来直接写答案提交,如果觉得实在太难,就搜答案或者看讨论区的答案,理解后自己实现。(这种方法虽然不是正经的学习方法,但是现在是面向 offer 编程)一般切两三次就烂熟于心了。另外,对于一些很难的题目,我不建议死磕,因为面试中遇不到的。动态规划的难度也不会出到很高的那种难度,如果有,那就告辞 ~~~
3. ML/DL : 机器学习反正就是看看 百面,DL 方面至少要对 CNN/RNN/LSTM/GRU 这种了解透。当然,也分情况,比如 NLP 是 LSTM 向的,CNN 没人问过我。
4. 项目:项目最好自己去做一下,至少要跑通。数据规模和来源、预处理流程、评价标准以及结果、哪些模型影响比较大、模型设计细节之类,这些都要记住。
5. paper 和 数学:如果时间不多(大部分人都不多),我认为可以先不管(这东西很耗时间),但是就职后最好补上。
6. 其他基础知识: 如果你和我一样是 CS 科班出身,有可能会被问 Linux 命令、网络工程之类的东西。这个就看积累了,但是至少基本的 Linux 命令总要会。
7. 大数据相关:小公司一般会很关注 Spark 、 Hive之类,


## 碎碎念 ##

1. 不要裸辞。
2. 希望你是真的喜欢算法这个行业,有意愿持续学习。(想想每天都要看看论文 —— 当然,你也可以不看,就是可能会在未来被淘汰)
已邀请:

要回复问题请先登录注册

收藏七月在线,一起向大牛进阶

ctrl+D或command+D可以快速收藏哦~