BAT机器学习面试1000题(591~595题)


591、以下哪种技术对于减少数据集的维度会更好?

A、删除缺少值太多的列

B、删除数据差异较大的列

C、删除不同数据趋势的列

D、都不是

正确答案是:A

解析:

如果列的缺失值太多(例如99%),那么可以删除这些列。

592、判断:降维算法是减少构建模型所需计算时间的方法之一。

A、真

B、假

正确答案是:A

解析:

降低数据维数将花费更少的时间来训练模型。

593、以下哪种算法不能用于降低数据的维数?

A、t-SNE

B、PCA

C、LDA

D、都不是

正确答案是:D

解析:

所有算法都是降维算法的例子。

594、判断:PCA可用于在较小维度上投影和可视化数据。

A、真

B、假

正确答案是:A

解析:

有时绘制较小维数据非常有用,可以使用前两个主要分量,然后使用散点图可视化数据。

595、最常用的降维算法是PCA,以下哪项是关于PCA的?

1.PCA是一种无监督的方法

2.它搜索数据具有最大差异的方向

3.主成分的最大数量<=特征能数量

4.所有主成分彼此正交

A、2、3和4

B、1、2和3

C、1、2和4

D、以上所有

正确答案是:D
已邀请:

要回复问题请先登录注册

返回顶部