BAT机器学习面试1000题(746~750题)


746题

下列哪个坐标用于最小二乘拟合?假设水平轴为自变量,垂直轴为因变量。

1.jpg


A、垂直坐标

B、正交坐标

C、都可以,视情况而定

D、都不对

正确答案是:A

解析:

答案:A一般将残差想作垂直坐标,正交坐标在PCA的例子中很有用

747题

假设你在训练一个线性回归模型,以下哪项是正确的?

1.数据越少越易过拟合

2.假设区间小则易过拟合

A、都是错的

B、1错2对

C、1对2错

D、都是对的

正确答案是:C

解析:

1.小训练数据集更容易找到过拟合训练数据的假设,对于泛化能力,小数据集很难训练处泛化能力强的学习器。2.从偏差和方差的权衡中可以看出,假设区间小,偏差更大,方差更小。所以在小假设区间的情况下,不太可能找到欠拟合数据的假设。

748题

假设我们用Lasso回归拟合一个有100个特征值(X1,X2…X100)的数据集,现在,我们重新调节其中一个值,将它乘10(将它视作X1),并再次拟合同一规则化参数。下列哪一项正确?

A、X1很可能被模型排除

B、X1很可能被包含在模型内

C、很难说

D、都不对

正确答案是: B

解析:

答案:B大特征值= 小相关系数= 更少lasso penalty = 更可能被保留

749题

下图显示了对相同训练数据的三种不同拟合模型(蓝线标出),从中可以得出什么结论?

2.jpg


1.同第二第三个模型相比,第一个模型的训练误差更大

2.该回归问题的最佳模型是第三个,因为它有最小的训练误差

3.第二个模型比第一、第三个鲁棒性更好,因为它在处理不可见数据方面表现更好

4.相比第一、第二个模型,第三个模型过拟合了数据

5.因为我们尚未看到测试数据,所以所有模型表现一致

A、1和3

B、1和2

C、1,3和4

D、只有5

正确答案是:C

解析:

答案C数据的趋势看起来像以X 为自变量的二项式。更高的次数(最右边的图)的多项式对于训练数据可能具有更高的准确性,但在测试集上毫无疑问的惨败。在最左面一张图中,由于数据欠拟合,将会得到最大训练误差。

750题

下列哪项可以评价回归模型?

1.R方R Squared

2.调整R方

3.F统计量

4.RMSE/MSE/MAE

A、2和4

B、1和2

C、2,3和4

D、以上所有

正确答案是:D

解析:

答案:D以上这些都是评价回归模型的指标

题目来源:七月在线官网(https://www.julyedu.com/)——面试题库——笔试练习——机器学习
已邀请:

要回复问题请先登录注册

返回顶部