推荐算法数据集划分方法

2024-11-29 22:01:49 数码硬件

数据划分的三种常见方式!

对于数据集的划分有三种方法:留出法,交叉验证法和自助法,下面挨个介绍

▶留出法

留出法 是直接将数据集 D 划分为两个互斥的集合,其中一个集合作为训练集 S,另一个作为测试集 T

我们需要注意的是在划分的时候要尽可能保证数据分布的一致性,即避免因数据划分过程引入额外的偏差而对最终结果产生影响。

版权说明: 本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。