90 后学霸博士 8 年进击战:用机器学习为化工研究叠 BUFF

2023-11-19

本文首发自微信公众号:HyperAI超神经

内容一览:ScienceAI 作为近两年的技术热点,引起了业界广泛关注和讨论。本文将围绕 ScienceAdvances 的一篇论文,介绍如何利用机器学习,对燃煤电厂的胺排放量进行预测。

关键词:AI for Science   化学工程   胺排放

国际能源署公布的报告显示,2021 年全球能源相关的CO2 排放量较 2020 年增长 6%,达到 363 亿吨,创历史新高。

其中 CO2 排放量增幅最大的是发电和供热行业,增幅超过 9 亿吨,占全球 CO2 排放量增幅的 46%。控制并减少发电及供热行业 CO2 排放量刻不容缓。

2021 年各行业 CO2 排放量的年度变化

蓝色表示年度变化,红点表示净变化

查看 2021 全球 CO2 排放完整报告

碳捕捉:减少温室气体排放、实现变废为宝

在《中国电力行业碳达峰、碳中和的发展路径研究》中,行业专家给出了降低电力行业 CO2 排放量的三种改变措施:

1、大力发展风电、水电、核电等低碳电源,抛弃煤电、油电等高碳电源

2、对于燃煤电厂,用天然气、秸秆、生物质等低碳燃料,代替煤炭进行发电

3、利用碳捕捉技术,对燃煤电厂排放的 CO2 进行捕捉利用

其中,碳捕捉因为改造幅度小、想象空间大、具备变废为宝的能力,备受商业公司、能源公司以及电力行业科研院所的关注。

电厂中的碳捕捉设备

碳捕捉是指利用 CO2 和胺类物质发生反应,捕捉电厂释放到大气中的 CO2 并进行压缩,封存至枯竭的油田、天然气领域,或其他安全的地下场所,供后续石油开采、冶炼、汽车等产业利用。

然而,CO2 在与胺类物质发生反应的过程中,也会产生危害公共健康和生态系统的胺排放,有效监控并预测不同电厂的胺排放,成为碳捕捉的一大难点。

近日,由洛桑联邦理工学院和赫瑞瓦特大学组成的研究小组,开发出了一种机器学习方法,可依据电厂过往数据,更准确地预测碳捕捉过程中胺类有害气体的排放量。目前该论文已发表在 ScienceAdvances 上。

完整论文

论文详解:用机器学习技术解决化学问题

1、先导工场试验

碳捕捉工场非常复杂,因为过程模型 (process model) 通常侧重于捕捉 steady-state 运行。然而,当前和未来发电厂的设计和运行,需要考虑到可再生能源发电份额的增加,这种增加是间歇性的、不规律的,因此还需要考虑到 steady-state 之外运行的动态和多变量行为。

为了模拟未来电厂运行的间歇性,科研人员对德国 Niederaußem 发电厂先导工场 (pilot plant) 的捕获装置,进行了一系列压力测试,试图发现电厂间歇性运行与胺排放量的关系。

Niederaußem 燃烧后碳捕捉先导工场的简化流程示意图

实验虽然积累了大量捕捉工场行为的数据,但无法利用这些数据定性预测未来的胺排放,因为除压力测试外,实验过程中还存在另一变量--电厂专业人员的干预,以确保实验期间工场的安全运行。

2、获取数据集

先导工场实验中,科研人员每 5 分钟进行一次数据采集,积累了庞大的数据量,如何把这些数据转化成可供机器学习模型使用的数据集,成为研究重点。

科研人员的方法是把 time-dependent 过程及排放数据,表示成图像(数据矩阵),基于此创建预测模型,然后借助机器学习技术进行模式识别,预测胺排放。

在这种表示法中,工场在给定时间 t 定义了一个 state 特征向量 x(t),其中 p 元素表示过程变量(如烟气温度和水洗温度)。

取 t 个时间戳的工场 state 向量,得到一个 t × p 的矩阵。这个矩阵可以被看作是一个「图像」,与未来的排放曲线 y(t) 相连。

数据表示示意图

本实验中用到的数据可以看作一张「图像」,其中:

宽度=输入序列 (T) 的长度

高度=参数数量 p

颜色=参数 xj 在某个时间 ti 的值

接下来,将工场历史图像中的 pattern,与特定的未来排放进行联系。为此,科研人员采用了梯度增强的决策树模型,将描述不同参数和排放量的行 (row) 合并为一个长向量。用分位数损失 (quantile loss) 训练模型,以获得不确定性评估 (uncertainty estimate)。

评估不确定性时,科研人员采用了支持蒙特卡洛 dropout 的时间卷积神经网络 (temporal convolutional neural network) ,并在 note S8 中展示用这个模型获得的结果。

有了这个数据集,就可以借助数据科学方法,开发一个机器学习模型进行数据分析。

3、从机器学习中洞悉胺排放

接下来,就可以用机器学习模型进行以下预测:

1、未来排放量(实时):基于历史 & 当前的运行和排放,预测未来 x 小时的排放量是多少

2、数据的 Causal impact 分析:测量特定压力测试对胺排放的影响,需要一个 baseline,提供在没有压力测试情况下的胺排放

3、减少胺排放:用模型预测「假设」情况下的排放量,如降低水洗温度是否会对排放量产生影响

利用机器学习模型预测

未来 2 分钟、1 小时、2 小时的胺排放量

90 后学霸博士,深耕化学 8 年

本篇论文由洛桑联邦理工学院基础科学学院的 Berend Smit 教授和苏格兰赫瑞瓦特大学碳解决方案研究中心教授 Susana Garcia 共同领导的科研小组发布。

其中,开发机器学习方法,将胺排放问题转化为模式识别问题的学生,正是 Smit 教授小组的 90 后博士生 Kevin Maik Jablonka。

该论文的一作 Kevin Maik Jablonka

Kevin 本科就读于德国慕尼黑工业大学化学专业,2017 年本科毕业后,Kevin 进入瑞士洛桑联邦理工学院继续硕士和博士学习,在化学领域继续深造。

从 2014 年至 2022 年,Kevin 用了 8 年时间建立了对化学及化学工程的深刻理解,期间还通过对应用数据科学、机器学习的学习,将化学研究与人工智能进行融合,提升了化学工程领域研究的效率和准确度,是一位妥妥的 90 后学霸。

诚如多位化学领域的资深人士所说,机器学习在化学及过程工程 (process engineering) 领域,可能产生比计算机视觉领域更大的影响。

在 CV 应用场景中,模型学习的图像基本特征,往往与人类大脑感知图像的方式密切相关,如目标检测、人脸识别。

然而在工业场景中,人类往往缺乏对基本机制的了解,但通过机器学习,科研人员发现了从参数到目标观察物映射的基本规则,并对迄今无法预测的现象进行了预测。

在预测电厂胺排放这一案例中,机器学习超越传统方法,被认为是提供了一种观察复杂化学过程的全新视角,极有可能彻底改变未来燃煤电厂的运行方式。

人工智能将更多地应用于基础科学研究,为其提供动力、提升效率、加速科研成果落地。你如何看待 AI for Science 下半场的发展?它将带来哪些突破,又会面临怎样的挑战?欢迎留言分享你的观点和看法~

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

90 后学霸博士 8 年进击战:用机器学习为化工研究叠 BUFF 的相关文章

随机推荐

  • 【每日一练】79—CSS实现扫描二维码动画

    二维码的应用越来越普通 加个好友 付个款 做个核酸 想去一个地方 还要扫个场所码 总之 需要二维码的地方越来越多 因此 在这样的大环境里 如何让你的码与众不同 引人注意 就显得非常重要 今天我们就来练习一个二维码的动画效果 具体效果如下 看
  • html5自带属性验证表单必填

    html5自带属性验证表单必填 2014年02月25日 Html5 共 366字 字号 小 中 大 6条评论 阅读 6 515 次 为了防止恶意注册 通常会验证表单必填 实现方法以js为主 略微麻烦 今天才发现 html5如今已自带验证表单
  • 注册表常用键值意义

    HKEY CURRENT USER Software Policies Microsoft Internet Explorer Control Panel Internet Explorer选项类 HomePage dword 000000
  • IDEA下java程序的简单调试

    一 本次任务实现的是一个java的程序调试 首先本次进行调试的一个程序是实现从1累加到100的功能 是在IDEA下进行编写的 如图所示 将其运行之后得到的结果如图所示 把第12行的输出语句给取消掉注释之后再运行一次得到的结果如图所示 这里由
  • day15

    文章目录 一 平衡二叉树 二 回溯小难 二叉树的所有路径 三 左叶子之和 一 平衡二叉树 110 平衡二叉树 依旧是使用后序遍历来统计高度 递归过程中 发现某节点的左右子树的高度差超过了1 我们就直接返回 1 不返回节点的高度了 递归函数的
  • CentOS安装Docker详细步骤

    一 简介 Docker 是一个开源的应用容器引擎 让开发者可以打包他们的应用以及依赖包到一个可移植的镜像中 然后发布到任何流行的 Linux 或 Windows 操作系统的机器上 也可以实现虚拟化 容器是完全使用沙箱机制 相互之间不会有任何
  • ubuntu下搭建elasticsearch集群

    在Ubuntu 18 04 1 LTS搭建一个简单的elasticsearch集群demo 具体情况如下 集群名称 elasticsearch cluster demo 主节点 1个 node master one 数据节点 2个 node
  • 【芯片驱动】2. CMT2300A配合硬件测试(灵敏度和发射功率)的软件实现

    前言 在开发一款无线射频产品的时候 软件是一部分 硬件也是一部分 而决定无线收发性能的 首先是硬件的匹配电路 然后才到软件部分的优化 一款无线射频产品 首先需要先决定是在那个频率范围内 当然是国家允许的范围内 然后硬件则需要在基于这个频点范
  • 逻辑综合——工艺库

    一 库文件的设置 运行DC时需要用到的库文件有 目标库 target library 链接库 link library 符号库 symbol library 算术运算库 synthetic library 1 目标库 目标库是综合后电路网表
  • xml转义字符

    在mybatis在编写sql时不能在XML里直接使用 lt 或者是 gt 在这里需要使用转义字符替换 下面列举常用的xml转义对应 1 lt lt 小于号 2 gt gt 大于号 3 amp 和 4 apos 单引号 5 quot 双引号
  • 【前端知识点总结】Vue(一) 脚手架 及 ESlint

    Vue 前端攻城狮必备技能 1 什么是 Vue 渐进式 javacript 框架 渐进式 按需添加功能 逐渐集成 框架 拥有自己的语法规则 例 Vue 项目对其依赖很高 业务开发中如果选择了框架最好不要轻易更换框架 否则需要重构的地方很多
  • 软件版本详细对比alpha,beta,Gamma,RC,RT

    开源软件发布的时候 经常有alpha beta RC1 RC2 RC3等等 看得云里雾里 不知道啥意思 做了个简单总结 缩写 全称 中文意思 详细说明 功能与bug alpha 内测 开发团队内部测试的版本或者有限用户体验测试版本 功能不全
  • SylixOS IDE工具使用

    1 问题描述 使用RealEvo IDE 以下简称IDE 开发程序时 误操作输入错误的函数名称时 编译器不会报错 输入错误的函数名示例代码如程序清单1 1所示 程序清单 1 1 示例代码 include
  • 软件自动化测试对软件产品起到什么作用?有什么注意事项?

    自动化测试是把以人为驱动的测试行为转化为机器执行的一种过程 通常 在设计了测试用例并通过评审之后 由测试人员根据测试用例中描述的规程一步步执行测试 得到实际结果与期望结果的比较 一 软件自动化测试的作用 1 提高测试效率 自动化测试可以大幅
  • 小记MAC安装GIT

    MAC安装GIT教程 0 安装方式说明 MAC安装软件的时候 有一个很好用的工具 叫 homebrew 大家可以试一下 我这里采用下载安装包的方式进行 1 下载git 我这里就暂且选择git最新版本 2 36 1 正常情况下 我们一般不选择
  • 经典的笔试题解析《高质量C/C++编程》

    对于 高质量C C 编程 想必这个已经是早已成名的经典书籍了 在此 笔者借用两三个题目 解析下面代码 错误示列 请勿模仿 正确的代码 在后面部分 include
  • 快排 + 二分

    一直觉得快排跟二分很像 大家也都有很多变种 在此整理一下 快排的特点是 需要一个pivort 让左边比他大 右边比他小 反之亦然 每次排序都有一个数的位置被确定 两种写法其实是一种 经典partition写在一个函数里 class Solu
  • Flutter BottomNavigationBar组件(底部导航栏)

    Flutter BottomNavigationBar 组件 BottomNavigationBar 常见的属性 属性名 说明 items List 底部导航条按钮集合 页面集合 iconSize icon currentIndex 默认选
  • 单相逆变器第二课、DC/AC电路基础理论学习

    这周是真心忙 到现在才把DC AC单相部分的理论知识看完 但由于是第一次接触电力电子 写的不好的地方 大家轻喷 DC AC变换电路成为逆变 也就是直流电压 电流 向交流电压 电流 变化 先来看下电压型逆变器 电压型逆变器主要有三类 电阻负载
  • 90 后学霸博士 8 年进击战:用机器学习为化工研究叠 BUFF

    本文首发自微信公众号 HyperAI超神经 内容一览 ScienceAI 作为近两年的技术热点 引起了业界广泛关注和讨论 本文将围绕 ScienceAdvances 的一篇论文 介绍如何利用机器学习 对燃煤电厂的胺排放量进行预测 关键词 A