分享自:

利用人工智能技术识别水污染特征并溯源的研究

期刊:science of the total environmentDOI:https://doi.org/10.1016/j.scitotenv.2019.07.246

研究报告

《Science of the Total Environment》于2019年发表了一篇题为“Exploring the application of artificial intelligence technology for identification of water pollution characteristics and tracing the source of water quality pollutants”的学术论文。文章的主要作者包括 Puze Wang、Jiping Yao、Guoqiang Wang 等,他们分别来自北京师范大学城市水文循环与海绵城市技术北京市重点实验室和亚洲理工学院工程与技术学院等研究机构。本文旨在探索人工智能技术在水体污染特征识别及污染源追踪中的应用。


研究背景与目的

该研究所属的学术领域为水环境科学与人工智能交叉领域。工业废水和意外泄漏释放到水体的污染物对环境和人类健康构成了严重威胁,而近年来水污染事件的数量不断增加。这些背景激发了研究者开发更精确与高效的工具,以便快速识别污染源。点源污染是污染物进入河流和水体的主要途径,追踪其污染源及特性对于水环境保护尤为关键。因此,本研究以山东省为研究区域,采用人工智能方法探索水污染特征识别与污染物源头追踪的新方法。

研究的目标包括以下几点: 1. 利用交叉相关方法识别河流流域中具有高相关性的水质指标。 2. 通过 Apriori 规则挖掘法识别频发的水质特征。 3. 跟踪对水质产生影响的主要工业污染源,并开发可靠的系统来准确识别水污染特征。


研究流程

研究的实验设计和工作流程十分严谨,分为以下几个步骤:

1. 研究区域与数据收集

研究区域选取了中国山东省,涉及包括半岛流域、海河流域等在内的五大河流流域。运用了山东省135个国家水质监测站在2008至2018年间监测的19种水质参数,包括常规污染物(如化学需氧量 CODmn、生化需氧量 BOD5、氨氮 NH3-N 等)、金属污染物(如铅 Pb、镉 Cd、六价铬 Cr6+等)及其他污染物(如挥发性酚、石油类)。同时,统计了山东省内25类主要污染工业的排放行为和污染特性。

为确保数据的准确性,研究对异常值(例如空值和错误值)进行了清理,同时构建了包含所有参数的数据集。


2. 交叉相关分析与水质地图制作

研究基于交叉相关法(Cross-correlation)分析了各水质指标之间的相关性关系。交叉相关的计算公式通过样本协方差和标准差的比值得出,值域在[-1, 1]之间。研究选取的关键阈值为0.3,数值大于0.3的水质参数被视为高度相关。

研究经由交叉相关法生成了不同流域的水质相关性地图。该地图揭示了研究区域中水质指标的时间与空间分布模式,并展示出高相关水质指标对污染特征描述的重要性。


3. 使用 Apriori 算法挖掘频繁项集

Apriori 是一种经典布尔关联规则挖掘算法。通过对水质监测数据进行深度分析,研究识别了不同监测站中常出现的频发水质指标组合。这些组合被分为四大类频繁项集(Frequent Itemsets 1-4),从中提取对水质有显著影响的指标。

分析结果表明,在海河流域,这些高频污染物多为重金属(如 Hg-tot、Zn、Se-tot 和 Cr6+),其主要来源是化工、金属冶炼及石化行业。而在黄河流域,主要污染物以六价铬和硫化物为主。


4. LSTM 算法在污染源追踪中的应用

研究首次将长短期记忆网络(Long Short-Term Memory, 简称 LSTM)引入水环境研究中。该网络是一种时间递归神经网络,能够捕捉水污染物浓度随时间变化的长时依赖效应。LSTM 模型将交叉相关生成的水质地图和工业污染数据作为输入,经过多层神经网络训练,准确预测了未来的主要污染工业分布。

一个四层神经网络被用于训练,包括三层 LSTM 网络和一层全连接层。通过反向传播算法调整权重,研究逐步优化了模型的预测准确率。


主要研究结果

1. 水质相关地图揭示污染特征

通过交叉相关分析生成的水质相关性地图展示了污染指标的时空分布特征。例如,化学需氧量(CODmn)、生化需氧量(BOD5)与氨氮(NH3-N)在各流域中普遍具有显著的正相关性(相关系数>0.3)。而重金属指标如铅(Pb)与镉(Cd)则表现出流域间的差异性相关特征。

2. 高频水质指标与频繁项集

根据 Apriori 规则挖掘,研究成功识别了每个流域的污染物组合。例如,海河流域的高频水质指标包括汞(Hg-tot)、六价铬(Cr6+)和锌(Zn),其高频污染来源为化工和冶炼企业。黄河流域的主要污染物为六价铬与硫化物,其分布更为分散。

3. LSTM 模型预测能力

通过对模型的训练和验证,发现 LSTM 对点源污染溯源具有较高的准确性,各流域预测精度均高于95%。这验证了人工智能技术在环境污染研究中的潜力。


研究意义与价值

本研究提出了一种新型人工智能方案,成功将大数据挖掘方法(如 Cross-correlation 和 Apriori)与 LSTM 网络结合,为水污染监测和污染源溯源提供了一种高效精确的解决方案。

该研究具有重要的学术价值: 1. 创新了水质污染特征与溯源分析方法,填补了长时依赖效应评估的研究空白。 2. 提供了处理污染物复杂时空关系的新工具,尤其是针对大规模工业点源污染的识别。

同时,研究在实际应用中也具有广阔的前景,包括: 1. 辅助政府制定水污染控制政策,提高监测精度。 2. 能够及时识别工业企业排放异常,帮助实现更精准的环境治理。


研究亮点

本研究的亮点如下: 1. 方法创新性:首次将 LSTM 引入水环境污染研究,结合交叉相关和频繁项集挖掘方法,形成了系统性溯源框架。 2. 地域特色:以山东省为研究区域,结合真实的监测数据与工业排放数据,确保模型结果的可靠性和实用性。 3. 多学科交叉:通过利用水环境科学和人工智能技术的整合方法,该研究实现了领域间成果的优化创新。


结论

这项研究展示了人工智能在水污染研究中的广阔应用潜力,为保护水环境提供了新的科学工具。未来,作者们还提到可以通过构建更全面的多维水质地图来进一步提升人工智能技术的实际适用性。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com