负数如何归一化处理 您所在的位置:网站首页 minmax规范化公式 负数如何归一化处理

负数如何归一化处理

2023-08-31 20:31| 来源: 网络整理| 查看: 265

f171dac6602490189777e2a3ed44f10a.png

在进行数据分析时,数据具有单位是非常常见的,比如说GDP可以以亿作为单元,也可以以百万作为单位,那么此时就会出现由于单位问题导致的数字大小问题;这种情况对于分析可能产生影响,因此需要对其进行处理,但是处理的前提是不能失去数字的相对意义,即之前数字越大代表GDP越高,处理后的数据也不能失去这个特性,类似这样的处理我们统称为量纲化

也或者计算距离,数字1和2的距离可以直接相减得到距离值为1; 另外一组数据为10000和20000,两个数字直接相减得到距离值为10000。如果说距离数字越大代表距离越远,那么明显的10000大于1,但这种情况仅仅是由于数据单位导致的,而并非实际希望如何,因此就需要进行量纲化处理。

量纲化有很多种方式,但具体应该使用那一种方式,并没有固定的标准,而应该结合数据情况或者研究算法,选择最适合的量纲化处理方式,SPSSAU共提供12种量纲化处理方法,如下图。

e17c017a98b0c66de0666bfad08ccaee.png 1 量纲化基本说明

关于量纲化,其具体的公式计算如下,接下来会逐一说明。

b33c1807f198c8e37f49bf09734f1142.png 12种量纲化类型

备注:表格中,X表示某数据,Mean表示平均值,Std表示标准差;Min表示最小值,Max表示最大值,Sum表示求和,Sqrt表示开根号。

1) 标准化(S)

标准化是一种最为常见的量纲化处理方式。其计算公式为:(X-Mean)/ Std。

此种处理方式会让数据呈现出一种特征,即数据的平均值一定为0,标准差一定是1。针对数据进行了压缩大小处理,同时还让数据具有特殊特征(平均值为0标准差为1)。

在很多研究算法中均有使用此种处理,比如聚类分析前一般需要进行标准化处理,也或者因子分析时默认会对数据标准化处理。

比如聚类分析时,其内部算法原理在于距离大小来衡量数据间的聚集关系



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有