BAT机器学习面试1000题(701~705题)


701题

一个人年龄和健康之间的相关系数是-1.09,据此可以得出:

A、年龄是健康预测的好的参考量

B、年龄是健康预测的不好的参考量

C、都不对

正确答案是:C

解析:

相关系数的范围是[-1,1],-1.09 是不可能的。

702题

下列哪个坐标用于最小二乘拟合?假设水平轴为自变量,垂直轴为因变量。

1.jpg


A、垂直坐标

B、正交坐标

C、都可以,视情况而定

D、都不对

正确答案是:A

解析:

一般将残差想作垂直坐标,正交坐标在PCA的例子中很有用

703题

假设我们有由三次多项式回归产生的数据(三次多项式完美契合数据),下列说法哪些是对的?

1.简单线性回归有高偏差和低方差

2.简单线性回归有低偏差和高方差

3.三次多项式有低偏差和高方差

4.三次多项式有低偏差和低方差

A、1

B、1和3

C、1和4

D、2和3

正确答案是:C

解析:

如果选择比3更高的次数来拟合,则会过拟合,因为模型会变得更复杂。如果选择比3低的次数,模型会变得简单,这样会有高偏差和低方差。但是在三次多项式拟合的情况下,偏差和方差都是低的。

704题

假设你在训练一个线性回归模型,以下哪项是正确的?

1.数据越少越易过拟合

2.假设区间小则易过拟合

A、都是错的

B、1是错的,2是对的

C、1是对的,2是错的

D、都是对的

正确答案是:C

解析:

1.小训练数据集更容易找到过拟合训练数据的假设,对于泛化能力,小数据集很难训练处泛化能力强的学习器。

2.从偏差和方差的权衡中可以看出,假设区间小,偏差更大,方差更小。所以在小假设区间的情况下,不太可能找到欠拟合数据的假设。

705题

假设我们用Lasso回归拟合一个有100个特征值(X1,X2…X100)的数据集,现在,我们重新调节其中一个值,将它乘10(将它视作X1),并再次拟合同一规则化参数。下列哪一项正确?

A、X1很可能被模型排除

B、X1很可能被包含在模型内

C、很难说

D、都不对

正确答案是: B

解析:

大特征值=⇒小相关系数=⇒更少lasso penalty =⇒更可能被保留

题目来源:七月在线官网(https://www.julyedu.com/)——面试题库——笔试练习——机器学习
已邀请:

要回复问题请先登录注册