大气污染物监测数据不确定度评估方法体系建立及其对PMF源解析的影响分析

您所在的位置：网站首页 › 不确定度一般在什么范围进行 › 大气污染物监测数据不确定度评估方法体系建立及其对PMF源解析的影响分析

大气污染物监测数据不确定度评估方法体系建立及其对PMF源解析的影响分析

2024-07-17 16:09:02| 来源: 网络整理| 查看: 265

1 引言(Introduction)

源解析技术是通过环境污染物浓度监测对其来源进行定性或定量研究的主要技术, 在污染物控制管理中发挥了重要的指导作用(Wang et al., 2014; Zhang et al., 2017).受体模型法是目前源解析技术的常用方法之一(环境保护部, 2013), 以污染物质量守恒特性平衡分析为前提, 应用数学统计方法定量解析不同因子(通常识别为污染源)对污染物浓度的贡献.目前常用的受体模型主要包括化学质量平衡(Chemical Mass Balance, CMB)、正定矩阵因子分析(Positive Matrix Factorization, PMF)、主成分分析(Principal Component Analysis, PCA)、多元线性模型(Multi-linear Engine, ME)和Unmix等.

由于具有对源谱信息依赖程度低且能够解析出低贡献源等优势, PMF法得到了越来越广泛的应用(张延君等, 2015).在我国北京(Zhang et al., 2013; Tan et al., 2014; 梁林林等, 2015; 王琴等, 2015; Tian et al., 2016; Tao et al., 2016; Zikova et al., 2016)、上海(Cai et al., 2010; 边璐等, 2013; Wang et al., 2015; Fang et al., 2016)、广州(Gao et al., 2013, 2015; Huang et al., 2014)、香港(Friend et al., 2011; Yuan et al., 2013; Wang et al., 2017)等城市都已广泛开展了利用PMF法对大气污染物进行来源解析的研究.

在利用PMF法进行源解析的过程中, 监测数据的不确定度是其重要的输入文件, 在计算分析过程中起到非常关键的作用.某种化学组分数据的不确定度决定了其在PMF计算中的权重, 不确定度越低则其所占权重就越大.另外, PMF法中不确定度值将直接影响目标函数Q的取值, 而Q的取值将直接影响PMF模型中最理想结果的选择.因此, 不确定度值的准确性将直接影响到源解析结果的准确性, 如何准确地评估PMF输入数据的不确定度是源解析工作中重要内容之一.

数据的不确定度是指对研究变量的真值缺乏认识和了解, 可用置信区间或概率密度函数进行描述.不确定度取决于对研究对象相关信息掌握的情况, 可通过对数据的质量与数量及对数据来源过程和测试方法等的了解进行评价(郑君瑜等, 2013).源解析数据的不确定度主要来自于样品采集和化学成分测量的不确定度(即所用仪器带来的不确定度)及样品本身浓度存在的不确定度(主要是人为误差)等.理论上讲, 数据不确定度应利用平行采样的方法进行衡量, 通过对比多组数据以更为准确地评估测量值的误差分布(Hyslop et al., 2008; Yuan et al., 2013).但由于经济等条件的限制, 很多时候都不能实现平行采样.到目前为止, 对于非平行采样的监测数据不确定度估算尚无成熟的方法体系.在绝大部分源解析研究中, 其输入数据的不确定度主要通过借鉴前人的方法加以计算, 而缺乏对采用该方法的原因进行充分阐述.因此, 建立一套科学严谨的不确定度评估方法体系, 从而更准确地识别数据不确定度, 对于保证大气污染物源解析结果的准确性和科学性至关重要.

本研究采用香港荃湾地区1998—2008年PM10平行采样的数据, 通过3种常用的不确定度评估算法交互应用建立一套有效评估不确定度的方法体系, 并将利用该方法体系得到的源解析结果与利用平行采样的源解析结果进行对比, 评估该方法体系的可行性和优势.

2 材料与方法(Materials and methods) 2.1 数据来源

本研究采用的大气污染物数据为1998年1月—2008年12月在香港荃湾站点(22.37°N, 114.11°E)采集的PM10组分数据.PM10样品每6 d采集一次, 每次采样24 h, 两台采样器(Andersen Instrument, GA, USA)平行采集, 共收集可用样品662×2个, 检测出As、Be等27种化学组分.在PMF分析中, 将低于检出限的样品数超过总样品数50%的组分删除(Huang et al., 1999), 最终保留As、Cd、Pb、V、Ni、Al、Mn、Fe、Ca、Mg、Na+、Cl-、NH4+、NO3-、SO42-、K+、OC、EC共18种化学组分.其中, OC、EC是由热/光碳分析仪(Sunset Laboratory, OR, USA)测得, Al、Ca、Cd、Fe、Mg、Mn、Ni、Pb、V和Zn由等离子体原子发射光谱仪(ICP-AES)测得, As由流动注射分析-原子吸收仪(FIA-AA)测得, 水溶性离子SO42-、NO3-、Cl-、NH4+、Na+和K+由离子色谱仪(IC)测得.关于PM10组分测量更详细的信息请参考相关文献(Yu et al., 2004; Yuan et al., 2006).本研究利用一台采样器的监测数据建立不确定度评估方法体系, 并综合运用两台采样器的平行监测结果对不确定度评估方法体系的合理性进行评估.

2.2 PMF原理

PMF模型是由芬兰赫尔辛基大学的Dr. Paatero开发(Paatero et al., 1994; 1997).随着PMF2、PMF3、ME2、PMF5等版本的发布, 该模型已被广泛用于空气质量源解析的研究中.本次研究采用最新版本EPA PMF5.0模型, 本文只对其进行简单介绍, 详细介绍请参考其使用手册(EPA, 2014).

PMF模型不需要污染源的成分谱信息, 只需输入目标污染物各化学组分浓度及其不确定度即可完成计算.PMF的基本方程为：

(1)

式中, X为样品浓度矩阵(n×m, n为采集组分数, m为化学采集样品数)；G为因子(污染源)贡献矩阵(n×p, p为析出因子数)；F为因子的指纹谱矩阵；E是残差矩阵(n×m), 其中的数据元素由下式求得：

(2)

式中, xij、gik、fkj分别为X、G、F中的对应元素.在对G和F进行非负约束的同时, PMF对每个数据点的不确定度进行加权, 并通过公式(3)计算Q值, 可见数据不确定度越大, 其在计算中的权重越低.Q是PMF模型计算的判据之一, 只有当其逐步收敛时才可进一步分析.当Q值收敛至某设定值以下, 计算结束, 所求得的G和F矩阵即为源解析得出的因子贡献和因子谱.

(3)

式中, Sij为第i个样品中第j种化合物的不确定度, 其它各项含义同前.可以看出, 不确定度值Sij对Q的计算起着至关重要的作用, 其取值直接影响PMF源解析结果.

2.3 不确定度评估方法体系建立

目前的PMF源解析研究中通常只采用单一的不确定度计算方法.然而, 污染物不同化学组分的物理化学性质不同, 在进行仪器分析前经不同的实验前处理, 不同组分又经不同的仪器基于不同的分析原理进行测定, 这就使得每种组分不确定度的程度及来源存在差别.因此认为, 在不确定度的计算过程中, 应以某一种计算方法为基础, 并结合运用其它计算方法进行尝试, 最终得到最优的源解析结果, 这也是我们建立不确定度计算方法体系的理论基础.通过该方法体系, 可以在使用一种不确定度算法不能得到一个非常理想结果的情况下, 利用更多的不确定度算法对数据的不确定度进行持续优化, 从而提高源解析结果的准确性.

2.3.1 3种不确定度值算法比较

不确定度评估方法体系需要选取数种常用的不确定度计算方法作为出发点.本研究选取颗粒物源解析中3种常用的不确定度算法, 它们之间的异同见表 1.

表 1(Table 1) 表 1 3种不确定度值算法比较 Table 1 Comparison of three uncertainty algorithms 表 1 3种不确定度值算法比较 Table 1 Comparison of three uncertainty algorithms 序号算法相关参数参考文献 #1 ej:仪器检出限; Xij:组分浓度; dj:不确定度比例系数 Anttila et al., 1995; Liu et al., 2013; Cheng et al., 2014 #2 同上 Ito et al., 2004; Yao et al., 2016 #3 SD:标准偏差; cj:不确定度比例系数 Prendes et al., 1999;Xie et al., 1999

上述3种不确定度的计算方法可分为Uij=、Uij=a+b两种形式.参数a是与检出限、数据标准偏差等相关的参数, 与颗粒物浓度无关, 称为相加项(additive term), 而b则是与浓度相关的参数, 称为相乘项(multiplicative term).综合来讲, 算法1与算法2考虑了仪器检测特性和样品浓度对数据的不确定度值的影响, 前者表示误差递进, 而后者表示误差的直接相加.显然, 当a>>b或a < < b时, 算法1与算法2计算出的不确定度值相近, 而当a与b的值接近时, 两种算法计算结果差别较大.一般认为, a与b独立而不相关时, 建议选用算法1；当认为a与b之间是存在相关性时, 两者可以直接进行加和, 建议选用算法2(刘胜林, 2003).算法3中SD指的是数据的标准偏差, 反映的是数据的离散程度, 当SD较小时, 则表明数据较为稳定, 更可能接近于真实值, 则不确定度越小.

2.3.2 3种不确定度算法参数值确定

3种不确定度算法中参数的取值将直接影响到不确定度的大小.受体模型假设因子谱在分析时段保持不变, 因此, 对于实际情况下可能变化的组分, 如具有挥发性或有二次生成或损耗(如Cl-具有较强的挥发性, 则dj和cj赋值相对较大), 应给予相对较大的不确定度取值.另外, PMF计算中对于检出限上下的数据不确定度计算方法不同, 因此, 对于浓度接近检出限的组分也应给予较大的不确定度取值(如本研究中的As、Cd、Pb、V、Ni 5种组分).根据以上原则对分析化学组分分成两类(表 2), 分别将算法1和算法2中对应的dj值赋予0.1和0.25.算法3中数据的标准偏差实际上代表的是仪器误差, 并且当物质的浓度较小时则标准偏差偏离真值所占的比例就越大, 即cj值越大.据此对分析化学组分分成3类(表 2), 分别将对应的cj值赋予0.05、0.1和0.5.

表 2(Table 2) 表 2 算法1、算法2的dj值及算法3的cj值 Table 2 Values of dj in algorithm #1 and #2 and cj in algorithm #3 表 2 算法1、算法2的dj值及算法3的cj值 Table 2 Values of dj in algorithm #1 and #2 and cj in algorithm #3 组分 dj cj As 0.25 0.5 Cd 0.25 0.5 Pb 0.25 0.5 V 0.25 0.5 Ni 0.25 0.5 Al 0.1 0.1 Mn 0.1 0.1 Fe 0.1 0.1 Ca 0.1 0.1 Mg 0.1 0.1 Na+ 0.1 0.1 Cl- 0.25 0.5 NH4+ 0.1 0.1 NO3- 0.1 0.05 SO42- 0.1 0.05 K+ 0.1 0.1 OC 0.1 0.1 EC 0.1 0.1 3 结果与讨论(Results and discussion) 3.1 3种不确定度算法对应的源解析结果比较

为了能得到准确且更为全面的污染源个数, 在PMF源解析中依次尝试了设定4~9个因子, 最终发现利用3种不确定度算法的源解析最为合理的结果均为8个因子, 分别代表机动车、重油、新鲜海盐、老化海盐、扬尘源、二次硫酸盐、二次硝酸盐及生物质/煤燃烧污染源, 生物质燃烧和煤燃烧无法分开.利用3种不确定度算法解析的因子谱图见图 1.关于香港地区各污染源示踪物选取在之前的研究文献中已有详细说明(Guo et al., 2009;Cheng et al., 2010 ), 在此不再赘述.

图 1(Fig. 1) 图 1 利用算法1、2、3得到的8个因子谱图 Fig. 1 Eight-factor profiles obtained from the three algorithms for uncertainty calculation

尽管利用3种不确定算法都能得到8个因子, 但各因子的谱图存在一定差异.理论上讲, 每个因子的示踪物应该尽可能富集在单一因子中.比较而言, 算法2中各因子对应的示踪物的含量相对较多, 例如, 重油的V和Ni及新鲜海盐的Cl-在算法2所得的结果中较高, 因此, 利用算法2计算的不确定度所得的源解析结果相对更为准确.

3.2 不确定度评估方法体系的建立

利用3种不确定度算法得出的解析结果中, 生物质燃烧和煤燃烧均属于同一个因子, 这可能是由于两种排放源贡献的时间变化存在较强的共线性.因此, 需要继续对数据进行深入挖掘, 探究是否可以通过改善数据不确定度从而使生物质燃烧与煤燃烧能够分离为两个因子.如前所述, 利用算法2得到的源解析结果相对准确, 更适合作为基准结果对该批数据的不确定度进行评估.为了验证算法1和算法3中是否对某些化学组分的不确定度分析更加准确, 本文以算法2的结果为基准, 以生物质燃烧和煤燃烧的示踪物(K+、As、Cd、Pb)和图 1中利用3种不确定度算法得到的源谱图中组分浓度相对标准偏差超过10%的组分(Mn、Fe、Ca和Al)作为不确定度应改善的对象.将算法1和算法3中这8种组分的不确定度依次带入到算法2中, 如果源解析的结果有改善, 则保留算法1或算法3中该算法的不确定度值, 否则继续使用算法2的不确定度作为最佳结果.

首先利用算法1所计算的As的不确定度替换算法2中As的不确定度, 尽管可以得出9个因子, 但煤燃烧因子中的K+含量依然较高, 说明部分生物质燃烧依然与煤燃烧混合在一起(图 2).由于结果有所改善, 本文将算法2中As的不确定度值替换为算法1中As的不确定度值进行后续分析.然后, 将算法1所计算的Cd的不确定度替换算法2中Cd的不确定度, 结果并没有明显改善, 因此, 依然保留算法2中Cd的不确定度值.依照上面的方法依次将算法1和算法3中Pb、K+、Mn、Fe、Ca和Al的不确定度值替换算法2中对应元素的不确定度值, 最终经过16次的替换实验, 发现当算法2中Pb的不确定度换成算法1计算的不确定度值, 把算法2中K+的不确定度值换成算法3计算的不确定度值时, 结果有很大的改善, 即As、Cd、Pb的含量在煤燃烧因子中是最高的, 而K+在生物质燃烧因子中的含量也是最多的, 生物质燃烧和煤燃烧完全分离为两个因子, 具体如图 3所示.对于Mn、Fe、Ca和Al, 算法2已给出最优解析结果.表 3列出了这8种化学组分对应的最佳不确定度评估算法.

图 2(Fig. 2) 图 2 利用算法2得到的生物质/煤燃烧因子谱图(a)和将算法1中As的不确定度带入算法2中生物质燃烧和煤燃烧源谱图(b1和b2) Fig. 2 Biomass burning/coal combustion factor profile using algorithm #2(a) and biomass burning and coal combustion factor profiles when the uncertainty of As was estimated by algorithm #1(b1 and b2) 图 3(Fig. 3) 图 3 利用不确定度评估方法体系识别的生物质和煤燃烧源谱图 Fig. 3 Biomass burning and coal combustion factor profiles determined by uncertainty assessment framework 表 3(Table 3) 表 3 8种化学组分适宜的不确定度算法 Table 3 Best-fit uncertainty algorithm for eight fitting components 表 3 8种化学组分适宜的不确定度算法 Table 3 Best-fit uncertainty algorithm for eight fitting components 组分适宜算法 As、Pb #1 Cd、Al、Fe、Ca、Mn #2 K+ #3

图 4描述了利用该方法体系识别最佳源解析结果的分析流程.首先, 选取2、3个或更多的不确定度算法计算输入数据的不确定度.在利用所得的不确定度数据分别进行源解析后, 应考虑将多个不确定度算法综合使用以进一步提高源解析效果.首先通过对比N种不确定度算法对应的N种源解析结果的因子谱图, 选定相对最优源解析结果对应的算法(设为算法X)及需要改善不确定度的化学组分(设为m个), 然后将N-1个(排除最优结果对应的算法)算法中需改善组分的不确定度依次替换算法X中对应组分的不确定度, 并对比因子谱图观察源解析结果是否改善, 如解析结果得到改善, 将算法X中对应组分的不确定度替换, 如源解析结果未改善则继续使用算法X得到的该组分的不确定度, 最终经过(N-1)×m次实验, 得到对每个组分最为适合的不确定度算法及最理想的源解析结果.

图 4(Fig. 4) 图 4 不确定度方法体系流程图 Fig. 4 Flow chart of uncertainty assessment framework 3.3 不确定度评估方法体系源解析结果的评价 3.3.1 不确定度评估方法体系与平行采样解析因子谱比较

在应用不确定度评估方法体系识别最优源解析结果后, 利用平行采样数据所识别的不确定度的源解析结果对其进行评估.理论上讲, 平行采样通过对比多组数据可以更为准确地评估测量值的误差分布.Hyslop等(2008)和Yuan等(2013)对平行采样不确定度的计算方法进行了详细阐述.如图 5所示, 利用平行采样计算的不确定度进行PMF源解析, 同样可以解析出9个因子, 因子谱及因子贡献与方法体系解析结果基本相同.这一方面证实了平行采样是准确衡量不确定度的有效手段, 不必像利用单一采样方式那样通过多次试验找出适合的不确定度算法；另一方面也表明香港荃湾地区PM10确实是存在9个主要的贡献源, 生物质燃烧和煤燃烧污染源可以通过更准确地评估不确定度进行分离, 同时也表明能否对数据不确定度进行准确评估将直接影响到PMF源解析结果.

图 5(Fig. 5) 图 5 利用平行采样与不确定度方法体系解析出的因子谱图比较 Fig. 5 Comparison of factor profiles between parallel sampling and uncertainty assessment framework 3.3.2 不确定度评估方法体系与平行采样解析残差值比较

对残差(eij)进行频率分布检验也是评价PMF模型源解析结果的一种常用方法(Polissar et al., 1998).如果某组分的残差属于正态分布且标准偏差较小, 那么就表明PMF对该组分能够较完整的解析.从图 6可以看出, 除Mn以外, 利用方法体系解析的化学组分的残差分布都要比利用平行采样的化学组分的残差分布更加集中, 均值也更接近于0.这表明相比于平行采样, 利用方法体系得到的不确定度更为准确, 源解析结果也更为合理.

图 6(Fig. 6) 图 6 利用平行采样与不确定度评估方法体系解析出的化学组分残差图比较 Fig. 6 Comparison of frequency distributions of scaled residuals between parallel sampling and uncertainty assessment framework 3.4 不确定度评估方法体系与单一算法源解析比较

对数据不确定度进行调整的最终目的是为了提高源解析结果的准确性.如图 7所示, 利用方法体系得出的各污染源贡献率和残差贡献率都处于利用算法1、算法2、算法3得到的各污染源的贡献率范围之间, 这表明方法体系的源解析结果是比较可靠的, 没有出现异常值.另外, 利用常规方法只能得到生物质和煤燃烧污染源总的贡献占比为9.3%~14.6%, 利用方法体系则可以得到生物质燃烧和煤燃烧两个污染源的贡献率分别为11.4%和4.2%, 与常规方法所得的结果相差不大.另外, 该结果也表明相对于煤燃烧, 生物质燃烧在研究时段占比较高, 应该重点对生物质燃烧污染源进行防控.

图 7(Fig. 7) 图 7 利用不确定度评估方法体系与算法1、算法2、算法3得到的污染源贡献对比 Fig. 7 Comparison of source contributions between uncertainty assessment framework and algorithm #1, #2 and #3 4 结论(Conclusions)

1) 鉴于准确评估不确定度在PMF源解析中的重要性及大部分研究中监测数据不确定度信息缺乏的问题, 本研究建立了一套识别污染物组分监测数据不确定度的评估方法体系.通过与平行采样所得不确定度的源解析结果进行对比, 结果表明, 应用该方法体系可以更准确地评估监测数据的不确定度, 更精细地对污染物组分数据进行PMF源解析.

2) 以香港荃湾站点1998—2008年PM10组分监测数据源解析作为示范, 应用该方法体系可以将常规方法无法分离的生物质/煤燃烧因子分解成两个因子, 源解析残差值甚至小于平行采样方法解析结果的残差值, 应用该方法体系得到的因子贡献率均处于常规方法得出的因子贡献率之间.这些均说明应用该方法体系所得源解析结果的可靠性和全面性.

3) 本研究建立的不确定度方法体系流程简明, 可操作性强, 在监测数据缺乏不确定度相关信息时可以更有效地识别输入数据的不确定度, 以确保PMF源解析结果的科学性和准确性.

【本文地址】

公司简介

联系我们

今日新闻

点击排行

实验室常用的仪器、试剂和: 说到实验室常用到的东西，主要就分为仪器、试剂和耗

不用再找了，全球10大实验: 01、赛默飞世尔科技（热电）Thermo Fisher Scientif

三代水柜的量产巅峰T-72坦: 作者：寞寒最近，西边闹腾挺大，本来小寞以为忙完这

通风柜跟实验室通风系统有: 说到通风柜跟实验室通风，不少人都纠结二者到底是不

集消毒杀菌、烘干收纳为一: 厨房是家里细菌较多的地方，潮湿的环境、没有完全密

实验室设备之全钢实验台如: 全钢实验台是实验室家具中较为重要的家具之一，很多

图片新闻

实验室药品柜的特性有哪些: 实验室药品柜是实验室家具的重要组成部分之一，主要

小学科学实验中有哪些教学: 计算机计算器一般打孔器打气筒仪器车显微镜

实验室各种仪器原理动图讲: 1.紫外分光光谱UV分析原理：吸收紫外光能量，引起分

高中化学常见仪器及实验装: 1、可加热仪器：2、计量仪器：（1）仪器A的名称：量

微生物操作主要设备和器具: 今天盘点一下微生物操作主要设备和器具，别嫌我啰嗦

浅谈通风柜使用基本常识: 　众所周知，通风柜功能中最主要的就是排气功能。在

大气污染物监测数据不确定度评估方法体系建立及其对PMF源解析的影响分析

大气污染物监测数据不确定度评估方法体系建立及其对PMF源解析的影响分析

今日新闻

点击排行

推荐新闻

图片新闻

专题文章