BAT机器学习面试1000题系列(第106~110题)


上期思考题及参考解析
105.当机器学习性能遭遇瓶颈时,你会如何优化的?
  可以从这4个方面进行尝试:、基于数据、借助算法、用算法调参、借助模型融合。当然能谈多细多深入就看你的经验心得了。这里有一份参考清单:机器学习性能改善备忘单(http://blog.csdn.net/han_xiaoy ... 53145
分割线
106.做过什么样的机器学习项目?比如如何从零构建一个推荐系统
  这里有一个推荐系统的公开课http://www.julyedu.com/video/play/18/148,另,再推荐一个课程:机器学习项目班 [10次纯项目讲解,100%纯实战](https://www.julyedu.com/course/getDetail/48

107.什么样的资料集不适合用深度学习?
  @抽象猴,来源:https://www.zhihu.com/question/41233373
  a.数据集太小,数据样本不足时,深度学习相对其它机器学习算法,没有明显优势。
  b.数据集没有局部相关特性,目前深度学习表现比较好的领域主要是图像/语音/自然语言处理等领域,这些领域的一个共性是局部相关性。图像中像素组成物体,语音信号中音位组合成单词,文本数据中单词组合成句子,这些特征元素的组合一旦被打乱,表示的含义同时也被改变。对于没有这样的局部相关性的数据集,不适于使用深度学习算法进行处理。举个例子:预测一个人的健康状况,相关的参数会有年龄、职业、收入、家庭状况等各种元素,将这些元素打乱,并不会影响相关的结果。

108.广义线性模型是怎被应用在深度学习中?
  @许韩,来源:https://www.zhihu.com/question ... 04190
A Statistical View of Deep Learning (I): Recursive GLMs
  深度学习从统计学角度,可以看做递归的广义线性模型。
  广义线性模型相对于经典的线性模型(y=wx+b),核心在于引入了连接函数g(.),形式变为:y=g−1(wx+b)。
  深度学习时递归的广义线性模型,神经元的激活函数,即为广义线性模型的链接函数。逻辑回归(广义线性模型的一种)的Logistic函数即为神经元激活函数中的Sigmoid函数,很多类似的方法在统计学和神经网络中的名称不一样,容易引起初学者(这里主要指我)的困惑。下图是一个对照表

108-1.jpg


109.准备机器学习面试应该了解哪些理论知识
  @穆文,来源:https://www.zhihu.com/question/62482926

109-1.jpg


  看下来,这些问题的答案基本都在本BAT机器学习面试1000题系列里了。
分割线
本期思考题:
110.标准化与归一化的区别?

在评论区留言,一起交流探讨,让更多小伙伴受益。
参考答案在明天公众号上公布,敬请关注!

往期题目:
【BAT机器学习面试题】前100题汇总及勘误(上)
【BAT机器学习面试题】前100题汇总及勘误(中)
【BAT机器学习面试题】前100题汇总及勘误(下)
BAT机器学习面试1000题系列(第101~105题)
已邀请:

要回复问题请先登录注册

返回顶部