模型评估
2024年12月19日大约 2 分钟
普通验证
就是将数据集分为训练集和测试集,训练集用于训练模型,测试集用于验证模型的准确性。
一般情况下,将数据集分为训练集和测试集的比例为7:3
或8:2
。
(K折)交叉验证
k折交叉验证将数据集分为k个数据块,每次取一个数据块作为测试集,其余的作为训练集,重复k次,最后取k次的平均值。
常用的交叉验证有四折交叉验证,十折交叉验证,留一交叉验证等。
四折交叉验证

通过四折交叉验证的流程,可以推出k折交叉验证的流程。

留一交叉验证
在k折交叉验证中,当k=n时,称为留一交叉验证。
也就是在极端情况下,将每一个样本都作为一个数据块,每次取一个样本作为测试集,其余的作为训练集。
视频
模型验证曲线
学习曲线
学习曲线展示了模型在训练集和验证集上的性能(如损失或准确率)随训练样本数量或训练轮次(epoch)的变化。
验证曲线
验证曲线展示了模型在验证集上的性能随某个超参数(如正则化系数、树的最大深度、学习率等)的变化。
学习曲线 vs 验证曲线
特性 | 学习曲线 | 验证曲线 |
---|---|---|
横轴 | 训练样本数量或训练轮次 | 超参数的取值 |
纵轴 | 损失或评估指标(如准确率) | 验证集上的性能指标(如准确率、损失) |
主要用途 | 判断欠拟合、过拟合,评估数据量影响 | 选择最优超参数,分析超参数的影响 |
关注点 | 训练集和验证集的性能对比 | 验证集性能随超参数的变化 |