【机器学习】中国大学慕课《机器学习》课后习题(二)(回归)
部分习题来自黄海广老师的慕课《机器学习》的课后习题,答案暂不公布,可以留言讨论。
课程链接:
https://www.icourse163.org/course/WZU-1464096179
回归部分习题
单选题
1. 以下哪组变量之间存在线性回归关系?( )
A. 正方形的边长与面积
B. 学生的性别与他的成绩
C. 儿子的身高与父亲的身高
D. 正三角形的边长与周长
2.回归问题和分类问题的区别是?( )
A. 回归问题有标签,分类问题没有
B. 回归问题输出值是连续的,分类问题输出值是离散的
C. 回归问题输出值是离散的,分类问题输出值是连续的
D. 回归问题与分类问题在输入属性值上要求不同
3. 以下说法错误的是?( )
A. 最小二乘法不需要选择学习率
B. 残差是预测值与真实值之间的差值
C. 正则项的目的是为了避免模型过拟合
D. 损失函数越小,模型训练得一定越好
4.哪些算法不需要数据归一化?( )
A. K-means
B. KNN
C. 决策树
D. SVM
5.以下哪些方法不能用于处理欠拟合?( )
A. 增加模型复杂度
B. 增加新的特征
C. 增大正则化系数
D. 对特征进行变换,使用组合特征或高维特征
6.以下哪些方法不能用于处理过拟合?( )
A. 增加数据属性的复杂度
B. 对数据进行清洗
C. 增大训练数据的量
D. 利用正则化技术
7.下列关于线性回归分析中的残差(Residuals)说法正确的是?( )
A. 残差均值总是小于零
B. 残差均值总是为零
C. 残差均值总是大于零
D. 以上说法都不对
8.为了观察测试 Y 与 X 之间的线性关系,X 是连续变量,使用下列哪种图形比较适合?( )
A. 直方图
B. 柱形图
C. 散点图
D. 以上都不对
9.假如你在训练一个线性回归模型,则:
1. 如果数据量较少,容易发生过拟合。
2. 如果假设空间较小,容易发生过拟合。
关于这两句话,下列说法正确的是?( )
A. 1 错误,2 正确
B. 1 和 2 都错误
C. 1 正确,2 错误
D. 1 和 2 都正确
10.关于特征选择,下列对 Ridge 回归和 Lasso 回归说法正确的是?( )
A. Ridge 回归适用于特征选择
B. Lasso 回归适用于特征选择
C. 两个都适用于特征选择
D. 以上说法都不对
11.构建一个最简单的线性回归模型需要几个系数(只有一个特征)?( )
A. 1 个
B. 2 个
C. 3 个
D. 4 个
12. 向量x=[1,2,3,4,-9,0]的L1范数是多少?( )
A. 1
B. 19
C. 6
D. √111
多选题
13. 以下哪些是使用数据规范化(特征缩放)的原因?( )
A. 它通过减少迭代次数来获得一个好的解,从而加快了梯度下降的速度
B. 它防止矩阵X^T X不可逆(奇异/退化)
C. 它通过降低梯度下降的每次迭代的计算成本来加速梯度下降
D. 它不能防止梯度下降陷入局部最优
14. 线性回归中,我们可以使用最小二乘法来求解系数,下列关于最小二乘法说法正确的是?( )
A.不需要选择学习率
B.当特征数量很多的时候,运算速度会很慢
C.不需要迭代训练
D.只适用于线性模型,不适合逻辑回归模型等其他模型
15. 欠拟合的处理主要有哪些方式:( )
A.添加新特征
B.增加模型复杂度
C.减小正则化系数
D.增大正则化系数
16. 假如使用一个较复杂的回归模型来拟合样本数据,使用 Ridge回归,调试正则化参数,来降低模型复杂度,若正则化系数较大时,关于偏差(bias)和方差(variance),下列说法正确的是?( )
A.偏差减小
B.偏差增大
C,方差减小
D.方差增大
判断题
17. 如果两个变量相关,那么它们一定是线性关系。( )
18. 过拟合的处理可以通过减小正则化系数。( )
19.随机梯度下降,每次迭代时候,使用一个样本。( )
20. L_2正则化往往用于防止过拟合,而L_1正则化往往用于特征选择。( )