BAT机器学习面试1000题(491~495题)


491、你正在使用带有 L1 正则化的 logistic 回归做二分类,其中 C 是正则化参数,w1 和 w2 是 x1 和 x2 的系数。当你把 C 值从 0 增加至非常大的值时,下面哪个选项是正确的?

1.png


A、第一个 w2 成了 0,接着 w1 也成了 0

B、第一个 w1 成了 0,接着 w2 也成了 0

C、w1 和 w2 同时成了 0

D、即使在 C 成为大值之后,w1 和 w2 都不能成 0

正确答案是:C

解析:

答案是C。L1正则化的函数如下图,所以w1和w2可以为0。同时w1和w2是对称的,不会导致一个为0另一个不为0的状态。

492、在 k-均值算法中,以下哪个选项可用于获得全局最小?

A、尝试为不同的质心(centroid)初始化运行算法

B、调整迭代的次数

C、找到集群的最佳数量

D、以上所有

正确答案是:D

解析:

答案(D):所有都可以用来调试以找到全局最小。

493、假设你使用 log-loss 函数作为评估标准。下面这些选项,哪些是对作为评估标准的 log-loss 的正确解释。

A、如果一个分类器对不正确的分类很自信,log-loss 会严重的批评它

B、对一个特别的观察而言,分类器为正确的类别分配非常小的概率,然后对 log-loss 的相应分布会非常大

C、log-loss 越低,模型越好

D、以上都是

正确答案是:D

494、下面哪个选项中哪一项属于确定性算法?

A、PCA

B、K-Means

C、以上都不是

正确答案是:A

解析:

答案为(A):确定性算法表明在不同运行中,算法输出并不会改变。如果我们再一次运行算法,PCA 会得出相同的结果,而 k-means 不会。

495、两个变量的 Pearson 相关性系数为零,但这两个变量的值同样可以相关。这句描述是正确还是错误?

A、正确

B、错误

正确答案是:A

解析:

答案为(A):Pearson相关系数只能衡量线性相关性,但无法衡量非线性关系。如y=x^2,x和y有很强的非线性关系。
已邀请:

要回复问题请先登录注册

返回顶部