BAT机器学习面试1000题(486~490题)


486、位势函数法的积累势函数K(x)的作用相当于Bayes判决中的()

A、后验概率

B、先验概率

C、类概率密度

D、类概率密度与先验概率的和

正确答案是:A

解析:

具体的,势函数详解请看——《势函数法》。

来源:@刘炫320,链接:http://blog.csdn.net/column/details/16442.html

487、隐马尔可夫模型三个基本问题以及相应的算法说法错误的是( )

A、评估—前向后向算法

B、解码—维特比算法

C、学习—Baum-Welch算法

D、学习—前向后向算法

正确答案是:D

解析:

评估问题,可以使用前向算法、后向算法、前向后向算法。

488、在其他条件不变的前提下,以下哪种做法容易引起机器学习中的过拟合问题?

A、增加训练集量

B、减少神经网络隐藏层节点数

C、删除稀疏的特征

D、SVM算法中使用高斯核/RBF核代替线性核

正确答案是:D

解析:

一般情况下,越复杂的系统,过拟合的可能性就越高,一般模型相对简单的话泛化能力会更好一点。

B.一般认为,增加隐层数可以降低网络误差(也有文献认为不一定能有效降低),提高精度,但也使网络复杂化,从而增加了网络的训练时间和出现“过拟合”的倾向, svm高斯核函数比线性核函数模型更复杂,容易过拟合

D.径向基(RBF)核函数/高斯核函数的说明,这个核函数可以将原始空间映射到无穷维空间。对于参数 ,如果选的很大,高次特征上的权重实际上衰减得非常快,实际上(数值上近似一下)相当于一个低维的子空间;反过来,如果选得很小,则可以将任意的数据映射为线性可分——当然,这并不一定是好事,因为随之而来的可能是非常严重的过拟合问题。不过,总的来说,通过调整参数 ,高斯核实际上具有相当高的灵活性,也是 使用最广泛的核函数 之一。

本题题目及解析来源:@刘炫320

链接:http://blog.csdn.net/column/details/16442.html

489、下列时间序列模型中,哪一个模型可以较好地拟合波动性的分析和预测。

A、AR模型

B、MA模型

C、ARMA模型

D、GARCH模型

正确答案是:D

解析:

AR模型是一种线性预测,即已知N个数据,可由模型推出第N点前面或后面的数据(设推出P点),所以其本质类似于插值。

MA模型(moving average model)滑动平均模型,其中使用趋势移动平均法建立直线趋势的预测模型。

ARMA模型(auto regressive moving average model)自回归滑动平均模型,模型参量法高分辨率谱分析方法之一。这种方法是研究平稳随机过程有理谱的典型方法。它比AR模型法与MA模型法有较精确的谱估计及较优良的谱分辨率性能,但其参数估算比较繁琐。

GARCH模型称为广义ARCH模型,是ARCH模型的拓展,由Bollerslev(1986)发展起来的。它是ARCH模型的推广。GARCH(p,0)模型,相当于ARCH(p)模型。GARCH模型是一个专门针对金融数据所量体订做的回归模型,除去和普通回归模型相同的之处,GARCH对误差的方差进行了进一步的建模。特别适用于波动性的分析和预测,这样的分析对投资者的决策能起到非常重要的指导性作用,其意义很多时候超过了对数值本身的分析和预测。

本题题目及解析来源:@刘炫320

链接:http://blog.csdn.net/column/details/16442.html

490、以下说法中错误的是()

A、SVM对噪声(如来自其他分部的噪声样本)具备鲁棒性

B、在adaboost算法中,所有被分错样本的权重更新比例不相同

C、boosting和bagging都是组合多个分类器投票的方法,二者都是根据单个分类器的正确率确定其权重

D、给定n个数据点,如果其中一半用于训练,一半用户测试,则训练误差和测试误差之间的差别会随着n的增加而减少的

正确答案是:C

解析:

A 软间隔分类器对噪声是有鲁棒性的。

B 请参考http://blog.csdn.net/v_july_v/ ... 18799

C boosting是根据分类器正确率确定权重,bagging不是。

D 训练集变大会提高模型鲁棒性。
已邀请:

要回复问题请先登录注册

返回顶部