BAT机器学习面试1000题(581~585题)


581、假定你使用SVM学习数据X,数据X里面有些点存在错误。现在如果你使用一个二次核函数,多项式阶数为2,使用松弛变量C作为超参之一。

如果使用较小的C(C趋于0),则:

A、误分类

B、正确分类

C、不确定

D、以上均不正确

正确答案是:A

解析:

分类器会最大化大多数点之间的间隔,少数点会误分类,因为惩罚太小了。

582、下面哪个属于SVM应用

A、文本和超文本分类

B、图像分类

C、新文章聚类

D、以上均是

正确答案是:D

解析:

SVM广泛应用于实际问题中,包括回归,聚类,手写数字识别等。

583、假设你训练SVM后,得到一个线性决策边界,你认为该模型欠拟合。在下次迭代训练模型时,应该考虑:

A、增加训练数据

B、减少训练数据

C、计算更多变量

D、减少特征

正确答案是:C

解析:

由于是欠拟合,最好的选择是创造更多特征带入模型训练。

584、假设你训练SVM后,得到一个线性决策边界,你认为该模型欠拟合。假如你想修改SVM的参数,同样达到模型不会欠拟合的效果,应该怎么做?

A、增大参数C

B、减小参数C

C、改变C并不起作用

D、以上均不正确

正确答案是:A

解析:

增大参数C会得到正则化模型

585、SVM中使用高斯核函数之前通常会进行特征归一化,以下关于特征归一化描述不正确的是?

A、经过特征正则化得到的新特征优于旧特征

B、特征归一化无法处理类别变量

C、SVM中使用高斯核函数时,特征归一化总是有用的

正确答案是:C

解析:

非万能。
已邀请:

要回复问题请先登录注册

返回顶部