恒星低质量光谱的连续谱拟合方法 您所在的位置:网站首页 拟谱方法 恒星低质量光谱的连续谱拟合方法

恒星低质量光谱的连续谱拟合方法

2024-07-11 08:29| 来源: 网络整理| 查看: 265

引言

由于望远镜各方面性能的提高, 使得天文学有了飞速的发展, 人类对宇宙的认识随之有了很大的提高。 国外的斯隆巡天项目(SDSS)和我国的LAMOST等大规模的巡天项目都可以从宇宙中观测到巨量的恒星光谱数据。 SDSS是目前为止最有影响力的光谱巡天项目之一[1]。 它的光谱获取能力很强, 利用2.5 m望远镜以及两个特殊的仪器, 每次曝光都可以获取600多个目标。 郭守敬望远镜[2](LAMOST)是我国2008年建成的大科学工程项目之一, 在第一年发布的2 204 860条光谱数据中达到质量标准的光谱数据只占到了不到50%。 截止到2015年6月, 先导巡天的3年正式巡天过程中, 信噪比小于10的低质量光谱也占到了15%左右[3]。 低质量光谱的主要特征是噪声大、 局部信噪比低、 连续谱异常以及谱线特征不明显等, 但是这些低质量光谱中存在着很多稀有天体、 未知天体等有价值的数据。 因此, 有必要对观测到的低质量光谱进行进一步的处理和数据挖掘。

恒星光谱主要由连续谱、 谱线和噪声组成。 通过谱线可以辨识恒星的化学成分和物理状态, 对光谱的后续研究有着重要的意义。 因此, 如何从原始光谱中提取谱线是我们进行恒星光谱研究的重要步骤。 将连续谱进行归一化是目前消除光谱中连续谱信息提取谱线的有效方法。

消除连续谱首先要进行连续谱的拟合。 目前连续谱拟合的主要方法有: 小波滤波、 中值滤波、 形态滤波以及多项式逼近等。 多项式逼近的方法实际就是多项式拟合。 多项式拟合比较简单, 所以本工作采用多项式拟合的方法[4]。 多项式拟合一般指的是用多项式函数逼近一个函数。 一般我们采用的是最小二乘法, 它通过最小化误差的平方和寻找数据的最佳函数匹配。 多项式拟合的主要问题就是基向量的选择, 基向量选择的好坏对最终的拟合光谱有着决定性影响。 在光谱拟合中的基向量指的是流量点[5]。 传统的多项式拟合的基向量(流量点)的选取主要是对部分点进行选取[4], 部分点的光谱多项式拟合特别是低质量光谱的拟合可能会造成信息失真。

针对上述问题, 提出了利用蒙特卡罗随机取点的方法, 能够对我们缺失的流量点进行模拟, 使得拟合出来的连续谱具有良好的精度和稳定性。

1 方法介绍

蒙特卡罗法(Monte Carlo method)是一种以统计学为基础建立起来的方法。 首先建立一个与问题相关的统计模型, 模型建立的准则是使所求问题的解正好是所建模型的数学期望或其他特征量; 其次通过多次试验统计出求解问题的发生概率, 利用第一步建立的统计模型, 求出所需要的参数; 再次对模拟结果进行分析总结, 验证系统的某些特性[7]。

理论上讲, 只要选择适当的流量点就可以对原始光谱的连续谱进行有效的拟合。 但由于光谱的流量点并不是都符合我们的标准, 只能选取其中的某些符合条件的流量点进行拟合。 蒙特卡罗随机算法在光谱处理上的应用[6]给处理上述问题提供了新的方法。 首先利用文献[5]中的规则和蒙特卡罗算法对流量点进行筛选, 其次利用最小二乘法对连续谱进行拟合, 最后向原始光谱中加入不同信噪比验证算法稳定性。

1.1 数据点模拟

将一条恒星光谱划分为若干个等宽的统计窗口, 在每一个窗口内根据上下限筛选出一定比例的流量点, 然后对未选中的点利用蒙特卡罗进行模拟, 模拟的步骤如下:

(1) 根据上下限(L, U), 对原始光谱点以统计窗为区间进行逐个筛选;

(2) 对未选取到的流量点利用蒙特卡罗在一定区间内进行模拟, 区间的间距就是D=U-L;

(3) 调用蒙特卡罗随机数发生器, 利用模拟的均匀分布在区间内产生随机数[8, 9]

F=L+(U-L)×Rand(1, 1)

(4) 对每一个窗口重复第二步, 直至重复的次数已达预定值;

(5) 对所有的随机数求平均值, 将这个平均值作为模拟的流量点值。

其中关于L和U指的是我们流量点的上下限, 它们的选取我们采用文献[5]中的规则, 上下限公式为

U=55+h(s)-h(0)50[h(100)-h(0)]L=45+h(s)-h(0)50[h(100)-h(0)](1)

1.2 多项式迭代拟合及归一化处理

对第一步获取的流量点进行低阶多项式拟合得到连续谱, 然后对连续谱进行多次迭代的归一化, 实现归一化拟合的优化。 设波长为W, 对应的流量为F, 波长的集合为WS, 对应的流量集合为FS, 其步骤如下:

(1)对波长WS和流量FS进行5阶多项式拟合, 利用最小二乘法得到连续谱FC, 然后对连续谱进行归一化Fn=FS/FC。

(2)对归一化的光谱进行异常点的剔除, 去掉[m-3s, m+3s]范围外的点, 其中m与s分别为FC的均值和标准差。

(3)重复步骤(1)和(2), 直到没有可去除的点为止[5]。

1.3 原始光谱加噪声处理

利用不同信噪比在原始光谱里面加入高斯白噪声模拟出低质量光谱, 利用本方法对低质量光谱进行拟合, 步骤如下:

(1) 对原始光谱的流量点进行插值;

(2) 产生均值为0, 标准差为1的正态分布随机数;

(3) 对第2步的随机数进行标准化

y=y-mean(y)y=y/sqrt(yy')

(4) 与第3步的随机数进行结合, 产生具有一定信噪比的噪声

y=y/(10snr/20)

(5) 产生服从N(f, y)正态分布的噪声

f=f+y

(6) 利用不同信噪比(文中选取SNR=1: 15)对第1步到第5步进行循环。

2 结果与讨论

如图2所示, 从SDSS光谱中随机抽选出了各种类型的光谱数据(M型除外, M型具有大量的分子吸收带)共1 426条进行了拟合。 图中左侧蓝色实线为原始光谱; 图中右侧红色实线为归一化光谱。 从图中可以看出本方法得出的光谱的归一化程度比较高, 对光谱进行了一个较好的拟合。

如图3所示, 图中选取图1中A类相对应的光谱依次加入信噪比(SNR)为1到5的高斯白噪声, 对低质量光谱进行模拟, 图中: 黑色代表原始光谱, 蓝色代表SNR=1, 绿色代表SNR=2, 红色代表SNR=3, 蓝绿代表SNR=4, 紫红代表SNR=5; 第一行和第三行代表不同信噪比的原始光谱, 第二行和第四行代表拟合的连续谱。

图1Fig.1Figure OptionViewDownloadNew Window 图1 方法流程图Fig.1 Method flow chart

图2Fig.2Figure OptionViewDownloadNew Window 图2 SDSS不同种类光谱的拟合结果Fig.2 The fitting results of different spectral types from SDSS

图3Fig.3Figure OptionViewDownloadNew Window 图3 不同信噪比的A类低质量光谱拟合Fig.3 Low-quality spectral fitting with different SNR of A-type

如图4所示, 图中选取了图1中相对应的各种类型的光谱, 利用本方法对原始光谱依次加入信噪比(SNR)为1到15的高斯白噪声, 对低质量光谱进行模拟。 从图中可以看出本方法对于A, B, O类的所有信噪比较低的低质量光谱的连续谱拟合有着很好的稳定性; 对于F, G和K类光谱在SNR为1到5的时候有一定的波动, 但是当SNR> 5之后也具有很好的稳定性。

图4Fig.4Figure OptionViewDownloadNew Window 图4 不同信噪比的低质量光谱拟合Fig.4 Low-quality spectral fitting with different SNRs3 结论

为了提高低质量连续谱拟合的精度和稳定性, 在国内外研究成果的基础上提出了利用蒙特卡罗模拟的方法对筛选缺失的流量点进行了随机模拟, 然后通过多项式逼近的方法对连续谱进行了拟合, 并且通过随机选取SDSS恒星光谱数据进行了验证。 结果表明本方法有较高的精度和较好的稳定性, 对于大规模处理低质量光谱有着独特的优越性。

The authors have declared that no competing interests exist.



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有