BAT机器学习面试1000题(661~665题)


661题

下面哪一项对梯度下降(GD)和随机梯度下降(SGD)的描述是正确的?

1 在 GD 和 SGD 中,每一次迭代中都是更新一组参数以最小化损失函数。

2 在 SGD 中,每一次迭代都需要遍历训练集中的所有样本以更新一次参数。

3 在 GD 中,每一次迭代需要使用整个训练集或子训练集的数据更新一个参数。

A、只有 1

B、只有 2

C、只有 3

D、都正确

正确答案是:A

解析:
答案为(A):在随机梯度下降中,每一次迭代选择的批量是由数据集中的随机样本所组成,但在梯度下降,每一次迭代需要使用整个训练数据集。

662题

下面哪个/些超参数的增加可能会造成随机森林数据过拟合?
1 树的数量
2 树的深度
3 学习速率

A、只有 1

B、只有 2

C、只有 3

D、都正确

正确答案是: B

解析:
答案为(B):通常情况下,我们增加树的深度有可能会造成模型过拟合。学习速率在随机森林中并不是超参数。增加树的数量可能会造成欠拟合。

663题

假如你在「Analytics Vidhya」工作,并且想开发一个能预测文章评论次数的机器学习算法。你的分析的特征是基于如作者姓名、作者在 Analytics Vidhya 写过的总文章数量等等。那么在这样一个算法中,你会选择哪一个评价度量标准?

1 均方误差
2 精确度
3 F1 分数

A、 只有 1

B、只有 2

C、只有 3

正确答案是:A

解析:
答案为(A):你可以把文章评论数看作连续型的目标变量,因此该问题可以划分到回归问题。因此均方误差就可以作为损失函数的度量标准。

664题

给定以下三个图表(从上往下依次为1,2,3), 哪一个选项对以这三个图表的描述是正确的?

1.jpg

2.jpg

3.jpg


A、1 是 tanh,2 是 ReLU,3 是 SIGMOID 激活函数

B、1 是 SIGMOID,2 是 ReLU,3 是 tanh 激活函数

C、1 是 ReLU,2 是 tanh,3 是 SIGMOID 激活函数

D、1 是 tanh,2 是 SIGMOID,3 是 ReLU 激活函数

正确答案是:D
解析:
答案为(D):因为 SIGMOID 函数的取值范围是 [0,1],tanh 函数的取值范围是 [-1,1],RELU 函数的取值范围是 [0,infinity]。

665题

以下是目标变量在训练集上的 8 个实际值 [0,0,0,1,1,1,1,1],目标变量的熵是所少?

A、-(5/8 log(5/8) + 3/8 log(3/8))

B、5/8 log(5/8) + 3/8 log(3/8)

C、3/8 log(5/8) + 5/8 log(3/8)

D、5/8 log(3/8) – 3/8 log(5/8)

正确答案是:A

题目来源:七月在线官网(https://www.julyedu.com/)——面试题库——笔试练习——机器学习
已邀请:

要回复问题请先登录注册

返回顶部