角度的均值与标准差(circular data/ directional statistics) |
您所在的位置:网站首页 › 360度是什么角度 › 角度的均值与标准差(circular data/ directional statistics) |
参考: 1. Directional statistics(Mardia)P14-19&29-30&47-50; 2. Biostatistical Analysis(2009 Zar)-5th edition P614-617; 3. CircStat: A MATLAB Toolbox for Circular Statistics(Philipp Berens);(这是一个MATLAB中实现的计算方向数据的一个工具包) 目录 正文: 数据预处理 方向数据的均值 角度坐标系的问题 python中求均值和标准差的代码实现 方向数据的中位数 方向数据方差 方向数据的标准差 1关于Wrapped Distribution(下文简称WD,wrapped:包裹、包装、覆盖) 2Wrapped Normal Distribution(姑且称之为:包裹正态分布) 以上文献如有需要,可留下邮箱分享与你。 这是Stack Overflow上的一个回答,也可以看看:Calculating Standard Deviation of Angles? 正文:最近因为做风的研究,需要衡量风向的一致性,就想转化到求角度的标准差。但是,当你去算得时候你就会发现,角度的标准差与平常的我们所算的标准差是不一样的。为行文方便,在本文中我把类似角度这样的数据(多是周期数据,如时间等)姑且称作——方向数据(directional statistics/ circular data),把其他数据(中学时就接触的那些算标准差的数据)称为——线性数据(data on the line)。 为了直观表示方向数据,最简单的就是把它放在圆上: 当我们想得到它的一些描述性数据(比如:均值、中位数、标准差等)时,最初的想法可能是在圆上的适当位置把圆断开,然后用惯常的线性数据方法去求取。这种方法非常依赖于断点的选择,为什么这样讲呢?比如,我们有一个数据集是:1°和359°,在0°处断开——得到均值是180°,标准差179°;在180°处断开——得到均值是0°,标准差1°。 从上面例子中,我们看到这个断点的选择对我们描述性数据的影响是多么大。当然,我认为这种选断点来处理数据的方法,在一些情况下可能是简单而有用的——比如上面的例子中,我想大家都会同意断点在180°处是合理的。 在Directional Statistics(Mardia&jupp, 2000)一书中,提出了一个适用更为广泛的方法,来求取方向数据的描述性数据。具体做法是将圆上的点,转化成平面上的单位向量,再进行后续处理。 数据预处理方向可以被视作单位向量x,或者等同于单位圆上的点。还有另外两种表示法:角度和单位复数。为单位圆指定初始方向和走向,就可以将单位圆上的点转化成角度θ或者单位复数z,以下是就是单位向量x的相关表示: (参看图3) 方向用角度来表示可视作固有方法,因为方向本身就被当作圆上的点;方向用复数来表示可视作一种嵌入式的方法,因为这时方向被当作了平面上特殊的点。在嵌入式的方法中,原本在圆上的数据分布被认为是集中分布在平面的单位圆上。 值得注意的是,方向用角度或者单位复数来表示时,数据的值依赖于初始方向和走向。一般情况下没有特别选定初始方向和走向,所以当你在处理同一数据集时,若选择了特殊的初始方向和走向,要注意数据的一致性。即是说,在方向数据领域,数据本身的属性——如离散性——与坐标无关。 方向数据的均值 假设我们有单位向量 因此 其中平均值长度 |
今日新闻 |
点击排行 |
|
推荐新闻 |
图片新闻 |
|
专题文章 |
CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭 |