就是将数据集分为训练集和测试集,训练集用于训练模型,测试集用于验证模型的准确性。
一般情况下,将数据集分为训练集和测试集的比例为7:3或8:2。
7:3
8:2
k折交叉验证将数据集分为k个数据块,每次取一个数据块作为测试集,其余的作为训练集,重复k次,最后取k次的平均值。
常用的交叉验证有四折交叉验证,十折交叉验证,留一交叉验证等。