自动剖面浮标观测资料质量控制探讨(下篇)

国际Argo计划的观测目标是在全球海洋上获取度分别为0.005℃和0.01的海水温度和盐度资料。由于目前海水盐度还无法从海洋中直接测量获得,需要采用海水电导率间接导出。而测量海水电导率的传感器只要受到轻微的物理变形或油污等污染物的影响,其测量值就可能产生较大偏差。

因此,要长期保持电导率传感器的高精度似乎并不现实,需要寻求其他合适的方法来尽可能提高浮标观测资料的质量。从Argo计划实施之初到现在,自动剖面浮标观测资料质量控制一直是国际Argo指导组(AST国际Argo资料管理小组(ADMT,以及各国Argo资料中心工作的重中之重。

为了满足读者对各国Argo资料中心,特别是中国Argo实时资料中心(亦称“杭州全球海洋Argo系统野外科学观测研究站”),是如何对自动剖面浮标观测资料进行质量控制工作的了解及其好奇心,本平台征得《西太平洋Argo实时海洋调查》一书(列入“十三五”国家重点出版物出版规划项目、深远海创新理论及技术应用丛书)著作者的同意,愿将该书中阐述的相关内容放在平台上与广大读者分享。

因原文篇幅较长,平台将其拆分为剖面浮标观测资料质量控制流程与实时质量控制(上)和剖面浮标观测资料延时质量控制(中),以及全球海洋Argo散点资料质量再控制(下)等3篇,做一全面、系统介绍。

全球海洋Argo散点资料质量再控制(下) 


自动剖面浮标观测资料质量控制探讨(下篇)


国际Argo计划自2000年实施以来,在40个国家和团体的共同努力下,已在全球海洋中布放了近12 000个自动剖面浮标(止2016年12月,累计获取了约160万条温、盐度剖面和部分涉及生物地球化学要素(如溶解氧、叶绿素、pH和硝酸盐等)的观测剖面。

目前,在海上正常工作的浮标已经接近4 000个,每年能提供约14万条观测剖面。随着岁月推移,全球Argo资料集的时间序列也在不断延长,Argo资料已经成为海洋与大气科学领域开展基础研究和业务化预测预报的主要数据源。

早在Argo计划实施之初,国际Argo组织就分别在美国和法国设立了两个全球Argo资料中心(GDAC),用来汇集和交换共享各Argo计划成员国布放的自动剖面浮标观测资料。目前,在世界上还只有9个国家(美国、法国、澳大利亚、英国、加拿大、日本、韩国、印度和中国)有能力向GDAC实时提交Argo资料。

这些国家的Argo资料中心,虽已按照ADMT要求和制定的实时质量控制规程,对提交的每条剖面做过质量控制,并采取统一的格式(NetCDF)进行交换共享。但是,各资料中心提交的数据质量还是参差不齐,究其原因可能与解码软件编写(需要浮标用户自行编程)有误、某批次浮标本身存在技术缺陷、用于实时质量控制的阈值选取过于宽泛,以及审核技术人员专业知识或实践经验不足,甚至忽视人工审核等有关。

况且,近些年来,随着传感器技术的发展,越来越多的自动剖面浮标加装了生物光学及生物地球化学传感器等,使得Argo资料集变得愈加复杂;有些Argo资料新用户更是不了解NetCDF格式的存储方式,导致用户在读取和使用数据时遇到了较大困难,阻碍了Argo资料在各国海洋与大气科学基础研究及业务化预测预报系统中的广泛应用。

为了国内Argo用户能获取准确的Argo资料,中国Argo实时资料中心安排科研人员准业务化收集整理由其他国家布放在全球海洋中的全部剖面浮标观测资料,经质量再控制后制作成全球海洋Argo散点资料集,并不定期地对该资料集进行更新,以互联网和光盘等形式免费提供。

需要指出的是,各国Argo资料中心在提交经实时(24 h内)质量控制的Argo数据同时,还会不定期地提交经延时(约3个月左右)模式质量控制的数据。对Argo数据的延时模式质量控制过程比较复杂,需要耗费较多的时间和人力资源,一些国家因缺少人手或经费,导致许多浮标虽已在海上工作了较长时间,但其观测资料却依然未能及时采取延时模式质量控制。不过,一旦经费有着落,这些资料中心也及时安排人员进行这项工作,故一些历史Argo资料随时都有可能被更新。

为此,中国Argo实时资料中心在制作或更新Argo散点资料集时,通常每次都会下载所有浮标的数据文件,而不是仅下载那些新浮标的观测数据。

1共享剖面数据中存在的主要问题

中国Argo实时资料中心在制作新版《全球海洋Argo散点资料集(V2.1)》(1997/07-2016/12)时,从法国海洋开发研究院(IFREMER)的GDAC服务器(ftp.ifremer.fr/ifremer/argo/)下载了1997年7月至2016年12月期间由各Argo成员国布放的近12 000个自动剖面浮标观测的全部剖面(约160万条)数据,除了常规的温、盐度和压力等物理海洋环境要素外,部分剖面还包含了生物地球化学要素(如溶解氧、叶绿素、pH和硝酸盐等)。

与此同时,绘制了每个浮标观测的温度瀑布图和温度垂直分布图、盐度瀑布图和盐度垂直分布图、T-S曲线和浮标漂移轨迹图等;有的还包含了溶解氧垂直分布图;也有的还带有多深度轴等。

通过对近12 000幅图件的逐一审核及客观分析,可以发现,大部分浮标观测的温度(占90%)、盐度(占89%)剖面都是比较好的,完全可以放心使用。但其中一些浮标(约1 330个)观测的T-S曲线底部略显发散状,虽然同样可以放心使用,不过也表明了在某些海域2 000×104 Pa深处的温、盐度变化还是比较可观的。当然,还有一部分浮标观测的剖面给出的信息就不那么放心了,必须经过校正后才能使用,有的甚至根本无法校正,只能从数据集中删除。

1)温度和盐度剖面异常

Argo资料中出现温、盐度异常的状况十分普遍,可能是由于传感器受到海面油污染、海水腐蚀及生物附着,甚至受电子器件老化或外界电子信号干扰所致,但也有可能是遇到不同性质的水团或者浮标漂移穿过海洋锋面时产生的自然现象。如何正确分辨Argo资料中存在的温、盐度异常是正常的自然现象,还是不正常的“故障”所致,需要通过专业技术人员做出判断。

如图1所示,该浮标位于北大西洋海域。从温、盐度垂直分布图中可以看出,绝大多数剖面温度都是随着深度增加而逐渐降低的,盐度则表现为表层低盐、次表层略高,之后随着深度增加盐度同样略有降低;但似乎只有一条温、盐度剖面出现异常情况,温度大约在1 300×104 Pa、盐度在500×104 Pa层都要比其他剖面低得多。

自动剖面浮标观测资料质量控制探讨(下篇)


图1  1901597号浮标信息监视效果(上图:温度垂直分布;中图:盐度垂直分布;下图左:T-S曲线;下图右:浮标漂移轨迹,红色圆点代表浮标布放位置;下同!)

显然,这样的低温、低盐状况有悖于常理(T-S曲线),通常需要找到该剖面并将对应的温、盐度数据质量控制标记由原来的“1”(代表“好数据”)修改为“4”(代表“坏数据”)

2)温度或盐度剖面底部异常

图2呈现的2901466号浮标处于北印度洋海域,其盐度在底部(1 000×104 Pa以深)出现很多异常偏大值,但并不是所有剖面都存在这种情况。尽管产生的原因不是十分清楚,但显然不是自然现象所致,需要对这些异常数据的质控标记做修改处理。

可以通过编写MATLAB脚本并结合设定的阈值(如1 000×104 Pa以下相邻层次盐度偏差大于0.08),来准确寻找这些存在盐度异常的文件,并将对应的盐度数据质量控制标记修改为“4”。 

自动剖面浮标观测资料质量控制探讨(下篇)


图2  2901466号浮标信息监视效果

3)温度异常

图3给出了处于北太平洋海域的5903452号浮标观测的结果。总体上看,除了在温度垂直分布和T-S曲线中,其中一条温度剖面出现异常外,其他剖面均表现得十分完美。显然,该异常剖面同样需要通过编写MATLAB脚本并结合设定的阈值,来准确寻找到存在该温度异常的文件,并将对应的温度数据质量控制标记修改为“4”。 


自动剖面浮标观测资料质量控制探讨(下篇)


图3  5903452号浮标信息监视效果

4)盐度异常

图4所示的5902509号浮标处于北太平洋海域,其中1条盐度剖面在约100 ×104 Pa深度上存在异常低值(<33.5),经查为第000号剖面,并将对应的异常低盐数据质量控制标记修改为“3”(代表“有可能被校正的坏数据”)或“4”。 


自动剖面浮标观测资料质量控制探讨(下篇)


图4  5902509号浮标信息监视效果

5)盐度偏移

Argo资料中存在盐度漂移或偏移现象十分普遍,一般发生在海上工作较长(约3 a以上)浮标的观测剖面中,通常由电导率传感器的电子器件老化或者受到海水腐蚀、生物附着所致。

所示的2900693号浮标处于北太平洋海域,在T-S曲线中可以明显看到,其中有1条剖面的盐度值从上到下均存在偏移误差,经查为第65号剖面,并将该剖面的盐度数据质控标记修改为“3”。对存在盐度漂移的浮标,通常在日后对Argo资料执行延时模式质量控制过程中,均可以得到较理想的校正结果。     


自动剖面浮标观测资料质量控制探讨(下篇)


图5  2900693号浮标信息监视效果

6)卫星定位异常

给出的1900586号浮标处于北印度洋海域。由图可见,该浮标观测的温、盐度剖面数据均十分正常,只有在漂移轨迹上发现了一个定位异常,显然该位置(8.7ºN,53.1ºE)与前后两个点比较存在明显错误,需要用线性插值方法来估算该剖面处的定位值,并将该插值得到的经、纬度写入文件。但若遇到第1条剖面或最后1条剖面处出现定位异常,由于目前还没有找到理想的外推方法,暂时只能将错误经、纬度用缺省值代替,分别为999.999和99.999。 

自动剖面浮标观测资料质量控制探讨(下篇)


图6  1900586号浮标信息监视效果

除此以外,有些浮标还会因传感器故障缺少盐度剖面(图),但温度剖面还是可以利用的;还有些浮标的温盐度剖面数少于5个的,这些浮标或许还只是刚刚布放的,若能得到确认的话,对这些剖面数据还是可以利用的但也有的可能是遇到了技术故障,对这些剖面就不建议使用了。 

自动剖面浮标观测资料质量控制探讨(下篇)


  2902547号浮标信息监视效果

再者,有些浮标观测的温、盐度剖面还带有双深度轴(图),对这样的浮标完全可以选择较好的那条温盐度剖面使用。还有些带溶解氧(图),甚至叶绿素、pH和硝酸盐传感器的浮标,其大部分温、盐度剖面数据都是好的,同样可以放心使用;但若发现温、盐度数据存在如上述类似异常状况的,只需分别修改对应的质量控制标记。 

自动剖面浮标观测资料质量控制探讨(下篇)


图8  5904686号浮标信息监视效果 

自动剖面浮标观测资料质量控制探讨(下篇)


图9  1901205号浮标信息监视效果

需要特别指出的是,Argo资料中绝大多数的观测剖面(占79%),其最大观测深度都会在2 000×104 Pa附近,但也有的剖面深度小于1 500×104 Pa(约占11%)或者1 000×104 Pa(约占7%),甚至浅于500×104 Pa(约占1%)。当然,还有一部分浮标为了节省电池能耗,其剖面观测深度会在2 000×104 Pa与1 000×104 Pa或者500×104 Pa间交替进行,即测量几个浅水剖面后再测量一个深水剖面(图10),如此循环往复,但又能全程掌控传感器的测量精度。

这样的测量过程可以说是对常规自动剖面浮标观测方式的一种创新,而且对温、盐度变化(在T-S图上表现为底部的曲线收敛)不是十分明显的海区,剖面观测深度选取1 500×104 Pa或者1 000×104 Pa也许无可厚非,但若在T-S图上发现底部的曲线呈发散状(图11),那么对这样的剖面数据就难以进行质量控制了,也就无法正确评估观测结果的好坏。

至于观测剖面浅于500×104 Pa深度的数据,中国Argo实时资料中心郑重建议“不要轻易使用”。 

自动剖面浮标观测资料质量控制探讨(下篇)


10  49070号浮标信息监视效果 

自动剖面浮标观测资料质量控制探讨(下篇)


11  69027号浮标信息监视效果

此外,还有一些问题浮标,如1 000×104 Pa层漏测温盐度数据,甚至仅有位置或者漂移轨迹,没有温、盐度剖面(图略)等,显然是由传感器故障或其他原因所致。对下载的Argo资料中存在这类问题的,直接做了删除处理。

2数据质量再控制

由上可见,虽然国际Argo资料管理小组(ADMT)已经制定了有关Argo资料的实时和延时模式质量控制规程,但各国Argo资料中心在具体执行时,由于投入的人力有限或者缺少具备专业知识的人员操作,更有甚者解码过程存在明显错误,导致提交至GDAC的Argo资料质量参差不齐,有些资料甚至无法用于科学研究。所以,在正式用于基础研究或业务化预测预报时,需要对从GDAC网站下载的Argo资料进行严格审核或质量再控制(图12 


自动剖面浮标观测资料质量控制探讨(下篇)


12  Argo散点资料质量再控制过程

由图12可见,Argo散点资料质量再控制过程主要包括以下两个步骤:

第一步由计算机自动检验完成。主要检验浮标有效的观测层数和观测时间,剔除那些观测层数过少或观测时间有误的剖面。通过编写的MATLAB脚本对所有数据文件内的数据进行自动读取,并提取质控标记为“1”的有效温、盐度和压力数据。当有效数据的层数少于10层时,则删除该数据文件;且当剖面观测时间小于1996年1月1日(自动剖面浮标问世之前)或者大于当前日期(用户下载数据文件之日)时,同样应删除该数据文件。

第二步须由人工审核完成。针对计算机无法自动检验出的数据质量问题,如存在明显错误或异常的数据,以及浮标漂移轨迹中存在的定位异常等,则需要通过绘制图件并由具备专业知识的技术人员,逐一检查审核。这些图件包括每个浮标观测的温度瀑布和温度垂直分布、盐度瀑布和盐度垂直分布、T-S曲线和浮标漂移轨迹等;有的还包含了溶解氧垂直分布;也有的还带有多深度轴等。

在人工审核每个浮标的图件、并发现某些剖面数据存在明显异常或错误时,通过MATLAB脚本查出这些异常或错误所在的文件名,而后打开该文件,进一步查看对应的数据项,直到找出异常数据的位置,修改对应于这些数据的质控标记,以此类推。

这一步通常不对存在明显异常或错误的数据做任何校正处理,只是将原来的质控标记“1”调整为“3”或“4”,以便提醒资料用户在利用该浮标或剖面时特别留意。一般情况下,建议用户尽量利用质控标记为“1”的数据。

最终,由中国Argo实时资料中心制作的《全球海洋Argo散点资料集(V2.1)》(1997/07-2016/12),从GDAC下载的剖面数量累计为1 678 299条,经质量再控制后保留的剖面总数为1 525 962条,约占全部剖面总量的91%(图13 


自动剖面浮标观测资料质量控制探讨(下篇)


13  19977月至201612期间每月Argo剖面数量分布(黑色:GDAC提供的剖面数量;绿色:经质量再控制后由CARDC提供的剖面数量)

其中,温度质控标记为“1”的观测数据约占温度观测数据总量的98.4%,盐度质控标记为“1”的约占盐度观测数据总量的97.5%。也就是说,在GDAC提供的所有剖面数据中,约89.4%的温度数据质量是好的,而质量好的盐度数据约占88.6%。

3、结束语

由于ADMT对于生物地球化学要素(如溶解氧、叶绿素、pH和硝酸盐等)还没有制定出完善的质量控制规程,而且一些国家的Argo资料中心也没有能力对这些生物地球化学要素进行质量控制(通常质控标记为“0”,表示“未进行质量控制”)。

目前,中国Argo实时资料中心也还没有配备相应的专业技术人员对这些观测要进行人工审核或质量再控制,完全保留了从GDAC网站下载的NetCDF文件中的原始数据。若用户需利用这些生物地球化学要素(如溶解氧、叶绿素、pH和硝酸盐等)开展基础研究或业务应用时,务必对这些观测数据自行开展质量控制或评估。

注:该文源自2019年由海洋出版社公开出版发行的《西太平洋Argo实时海洋调查》一书中的相关章节。平台转发时征得了原著一作同意,并做了稍许校正与修改;感兴趣的读者可以根据如下信息查阅原著:许建平、刘增宏、梅  山、李  睿、孙朝辉,西太平洋Argo实时海洋调查。北京:海洋出版社,2019。 


自动剖面浮标观测资料质量控制探讨(下篇)


特别提醒:关于“自动剖面浮标观测资料质量控制”议题探讨将告一段落,平台曾收到部分读者的反馈信息,希望能够研读并收藏《西太平洋Argo实时海洋调查》一书。经联系该书一作,表示尚有少量库存书籍,可以免费赠送感兴趣的读者。为此,将以读者在平台上最近一周的短信留言(请注明收件人姓名及详细邮寄地址、邮政编码等信息!)为准,先到先得,赠完为止。



分享到:
原文链接:,转发请注明来源!
「自动剖面浮标观测资料质量控制探讨(下篇)」评论列表

发表评论