基础知识
2024年11月24日大约 1 分钟
机器学习类型
分类问题
数据处理
归一化
归一化是指将数据集中的每个特征的最大值缩放到 1,最小值缩放到 0。
标准化
标准化其实就是z-score归一化,也就是说标准化其实是归一化的一种。
量纲是指数据的单位,比如长度、重量、时间等。
标准化是指将数据集中的每个特征的均值移动到 0,方差缩放到 1。 标准化的目的是消除特征之间的量纲差异,使得模型更容易学习到特征之间的关系。
对于一个特征
中心化
中心化是指将数据集中的每个特征的均值移动到 0。
中心化的目的是消除特征之间的偏差,使得模型更容易学习到特征之间的关系。
对于一个特征