关于本博客的说明:本文为翻译文章,原文为 ‘Understanding Multiscale Entropy’ 由Narayan P Subramaniyam 发布在SAPIEN LABS,原文链接为https://sapienlabs.co/understanding-multiscale-entropy/


多尺度熵(Multiscale entropy, MSE)将样本熵扩展到多个时间尺度,以便在时间尺度不确定时提供额外的观察视角。样本熵的问题在于它没有很好地考虑到时间序列中可能存在的不同时间尺度。为了计算不同时间尺度下信号的复杂性,Costa等人(2002,2005)提出了多尺度熵。有关样本熵的相关知识请参考之前写的一篇博文https://blog.csdn.net/Cratial/article/details/79742363



多尺度熵的基本原理包括对时间序列进行粗粒化或下采样 - 主要是在越来越粗略的时间分辨率下分析时间序列。具体操作如下:

假设有以采样频率为1kHz采样得到的时间序列(原始时间尺度T为1 ms)

$$x_1,x_2,x_3,...... x_N$$

粗粒化( Coarse Graining)数据意味着对不同数量的连续点取平均值,以创建不同尺度(或分辨率)的信号.

1. 当scale为1时,粗粒化数据的结果就是原始时间序列.

2. 当scale为2时,粗粒化后的时间序列是通过计算两个连续时间点的平均值形成的,如下图(A)所示。即定义y1 = (x1 + x2)/2; y2 = (x3 + x4)/2,以此类推.

3. 当scale为3时,粗粒化时间序列为三个连续时间点的平均值构成,如下图(B)所示。即定义y1 = (x1 + x2 + x3)/3; y2 = (x4 + x5 + x6)/3,依此类推.







备注:示例程序来自Björn Herrmann的个人网站上有关多尺度熵的介绍,原博文对四种不同噪声信号的多尺度熵进行了详细分析,说明了采用传统的样本熵进行分析可能存在的问题,源代码下载地址在此. 在此对Doctor Björn所做贡献表示感谢!


% matlab 主程序 clear all; rand('seed',10) %% generate signals Sf = 1000; % Sampling frequency dur = 30; % Time duration y = colored_noise(Sf,dur,0); % white noise %% Plot time course t = (0:length(y)-1)/Sf; % time vector figure, set(gcf,'Color',[1 1 1]), hold on set(gca,'FontSize',12) plot(t,y,'-','Color',[0,0,0]) ylim([-3 3]) xlabel('Time (s)') ylabel('Amp. (a.u.)') title(['White' ' noise (1/f^{' num2str(0) '})']) %% Plot spectra [F xf] = spectra(y, Sf, Sf*10, @hann); figure, set(gcf,'Color',[1 1 1]), hold on set(gca,'FontSize',12) plot(xf,abs(F),'-','Color',[0,0,0]) % xlim([0 400]) ylim([-0.01 0.06]) xlabel('Frequency (Hz)') ylabel('Amplitude (a.u.)') title(['White ' 'noise (1/f^{' num2str(0) '})']) %% Compute MultiScale Entropy % [mse sf] = MSE_Costa2005(x,nSf,m,r) % % x - input signal vector (e.g., EEG signal or sound signal) % nSf - number of scale factors % m - template length (epoch length); Costa used m = 2 throughout % r - matching threshold; typically chosen to be between 10% and 20% of % the sample deviation of the time series; when x is z-transformed: % defined the tolerance as r times the standard deviation % % mse - multi-scale entropy % sf - scale factor corresponding to mse [mse,sf] = MSE_Costa2005(y,20,2,std(y)*0.15); %% Plot mse figure, set(gcf,'Color',[1 1 1]), hold on, pp = []; labfull = {}; set(gca,'FontSize',12) pp = plot(sf,mse,'-','Color',[0,0,0],'LineWidth',2); labfull = ['White' ' noise (1/f^{' num2str(0) '})']; ylim([0 3]) xlabel('Scale') ylabel('SampEn') title('Multi-scale entropy') legend(pp,labfull) legend('boxoff') 四、多尺度熵在脑电分析中的应用

由于MSE计算不同时间尺度下信号的熵,因此对于理解像EEG等生物信号在不同时间尺度下的复杂度变化十分有用. 熵与时间尺度的曲线可能会产生一个峰值,表明在该时间尺度下存在最大熵,该时间尺度可能具有更大的相关性。


在Partk等人[3]的另一项研究中,他们对正常受试者(Normal)、阿尔茨海默病患者(Severe AD)和轻度认知障碍(MCI)患者的脑电信号进行了MSE分析。结果再次显示,阿尔茨海默病(AD)患者脑电信号的复杂性降低,其熵值较低,如图所示。正常和MCI被试在尺度为6、7时具有局部最大熵值,之后熵值下降。他们的分析还表明,在时间尺度因子为1时,轻度认知障碍、阿尔茨海默病和正常受试者的样本熵在统计学上是无法区分的,因此,在这种情况下,样本熵或近似熵等熵指标无法区分健康受试者和病理受试者.





MSE只是简单地将样本熵度量扩展到不同的时间尺度,因此,基础参数m(比较的线段长度)和r(两个线段之间的距离度量)是相同的。在前面的博客文章中讨论过,这些参数对于MSE的性能非常重要。关于如何选择这些参数,并没有标准的指导准则。对于数据长度m, 研究表明在MSE应用中,需要保证每个时间尺度下有足够的数据量。Costa等人[5]的研究表明,当白噪声和 1/f 噪声的数据点减少时,样本熵的均值(超过30个尺度)会发散。特别是在 1/f 噪声情况下,由于其非平稳性,与白噪声相比,发散速度更快。要查看参数m,r和数据长度对样本熵的影响,请参阅我们之前的博客文章以及Costa等人关于这些问题的另一篇优秀文章[5].

关于r,需要记住的是,为了避免噪声对样本熵估计的显著贡献,r必须大于大部分的信号噪声。选择r的另一个标准是基于信号的动态特性(signal dynamics)。



