BAT机器学习面试1000题(471~475题)


471、影响基本K-均值算法的主要因素有()

A、样本输入顺序

B、模式相似性测度

C、聚类准则

正确答案是: B

472、在统计模式分类问题中,当先验概率未知时,可以使用()

A、最小损失准则

B、最小最大损失准则

C、最小误判概率准则

正确答案是: B

473、如果以特征向量的相关系数作为模式相似性测度,则影响聚类算法结果的主要因素有( )

A、已知类别样本质量

B、分类准则

C、量纲

正确答案是: B

474、以下属于欧式距离特性的有()

A、旋转不变性

B、尺度缩放不变性

C、不受量纲影响的特性

正确答案是:A

475、以下( )不属于线性分类器最佳准则?

A、感知准则函数

B、贝叶斯分类

C、支持向量机

D、Fisher准则

正确答案是: B

解析:

线性分类器有三大类:感知器准则函数、SVM、Fisher准则,而贝叶斯分类器不是线性分类器。

感知准则函数 :准则函数以使错分类样本到分界面距离之和最小为原则。其优点是通过错分类样本提供的信息对分类器函数进行修正,这种准则是人工神经元网络多层感知器的基础。

支持向量机 :基本思想是在两类线性可分条件下,所设计的分类器界面使两类之间的间隔为最大,它的基本出发点是使期望泛化风险尽可能小。(使用核函数可解决非线性问题)

Fisher 准则 :更广泛的称呼是线性判别分析(LDA),将所有样本投影到一条远点出发的直线,使得同类样本距离尽可能小,不同类样本距离尽可能大,具体为最大化“广义瑞利商”。

根据两类样本一般类内密集,类间分离的特点,寻找线性分类器最佳的法线向量方向,使两类样本在该方向上的投影满足类内尽可能密集,类间尽可能分开。这种度量通过类内离散矩阵 Sw 和类间离散矩阵 Sb 实现。

来源:@刘炫320,链接:http://blog.csdn.net/column/details/16442.html
已邀请:

要回复问题请先登录注册

返回顶部