模型评估

张一风2024年12月19日大约 2 分钟

普通验证

就是将数据集分为训练集和测试集，训练集用于训练模型，测试集用于验证模型的准确性。

一般情况下，将数据集分为训练集和测试集的比例为7:3或8:2。

k折交叉验证将数据集分为k个数据块，每次取一个数据块作为测试集，其余的作为训练集，重复k次，最后取k次的平均值。

常用的交叉验证有四折交叉验证，十折交叉验证，留一交叉验证等。

通过四折交叉验证的流程，可以推出k折交叉验证的流程。

在k折交叉验证中，当k=n时，称为留一交叉验证。
也就是在极端情况下，将每一个样本都作为一个数据块，每次取一个样本作为测试集，其余的作为训练集。

学习曲线展示了模型在训练集和验证集上的性能（如损失或准确率）随训练样本数量或训练轮次（epoch）的变化。

验证曲线展示了模型在验证集上的性能随某个超参数（如正则化系数、树的最大深度、学习率等）的变化。