BAT机器学习面试1000题(576~580题)


576、SVM在下列那种情况下表现糟糕

A、线性可分数据

B、清洗过的数据

C、含噪声数据与重叠数据点

正确答案是:C

解析:

当数据中含有噪声数据与重叠的点时,要画出干净利落且无误分类的超平面很难

577、假定你使用了一个很大γ值的RBF核,这意味着:

A、模型将考虑使用远离超平面的点建模

B、模型仅使用接近超平面的点来建模

C、模型不会被点到超平面的距离所影响

D、以上都不正确

正确答案是: B

解析:

SVM调参中的γ衡量距离超平面远近的点的影响。

对于较小的γ,模型受到严格约束,会考虑训练集中的所有点,而没有真正获取到数据的模式、对于较大的γ,模型能很好地学习到模型。

578、SVM中的代价参数表示:

A、交叉验证的次数

B、使用的核

C、误分类与模型复杂性之间的平衡

D、以上均不是

正确答案是:C

解析:

代价参数决定着SVM能够在多大程度上适配训练数据。

如果你想要一个平稳的决策平面,代价会比较低;如果你要将更多的数据正确分类,代价会比较高。可以简单的理解为误分类的代价。

579、假定你使用SVM学习数据X,数据X里面有些点存在错误。现在如果你使用一个二次核函数,多项式阶数为2,使用松弛变量C作为超参之一。

当你使用较大的C(C趋于无穷),则:

A、仍然能正确分类数据

B、不能正确分类

C、不确定

D、以上均不正确

正确答案是:A

解析:

采用更大的C,误分类点的惩罚就更大,因此决策边界将尽可能完美地分类数据。

580、如果我使用数据集的全部特征并且能够达到100%的准确率,但在测试集上仅能达到70%左右,这说明:

A、欠拟合

B、模型很棒

C、过拟合

正确答案是:C

解析:

如果在训练集上模型很轻易就能达到100%准确率,就要检查是否发生过拟合。
已邀请:

要回复问题请先登录注册

返回顶部