数据质量管理 |
您所在的位置:网站首页 › 列举几种无量纲化方法公式 › 数据质量管理 |
1、去量纲
指是去除数据单位之间的不统一,将数据统一变换为无单位(统一单位)的数据集,也可以作为指标的权重,进行后续的加权计算。 2、数据归一化数据分标准化是将数据按比例缩放,使之落入一个小的特定区间,在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。 A、对一维数据的缩放有如下定义: 0-1归一化(normalization):(Xi-Xmax)/(Xmax-Xmin) 标准化(standardization):(Xi-均值)/方差 B、0-1归一化和标准化的本质:缩放和平移。线性变化得性质:线性变化不会改变原始数据的数值排序 C、0-1归一化和标准化的区别: 0-1归一化的缩放时拍扁统一到区间(仅由极值决定);标准化的缩放是更加弹性和动态的,和整体样本的分布有很大的关系。 0-1归一化:缩放仅仅跟最大和最小值得差别有关(输出范围在0-1) 标准化:缩放和每个点都有关系,通过方差体现出来。与归一化对比,标准化中所有数据点都有贡献(通过均值和标准差造成影响)。(输出范围在负无穷到正无穷) D、0-1归一化和标准化使用情况: 如果对输出数据结果范围有要求,用归一化; 如果数据较为稳定,不存在极端的最大最小值,用归一化; 如果数据存在异常值和较多噪音,用标准化,可以间接通过中心化避免异常值和极端值得影响。 E、归一化的好处: 提升模型的收敛速度;提升模型的精度 F、常见的数据归一化方法 0-1归一化;log函数转换(通过以10为底的log函数转化的方法实现归一化);atan函数转换(反正切函数) |
今日新闻 |
点击排行 |
|
推荐新闻 |
图片新闻 |
|
专题文章 |
CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭 |