机器学习顶刊汇总:Nat. Sustain.、Sci. Adv.、Nano Energy、Adv. Sci.、CEJ等

1. 苏黎世联邦理工学院Nat. Sustain.: 机器学习用于监测全球发展援助
机器学习顶刊汇总:Nat. Sustain.、Sci. Adv.、Nano Energy、Adv. Sci.、CEJ等
发展援助在帮助发展中国家实现可持续发展目标(SDG)方面发挥着至关重要的作用,其监测为决策者资助SDG提供了重要证据。然而,现有的全球发展援助监测存在相当大的局限性,导致极其困难和昂贵。一个主要原因是全球援助体系结构高度分散,其中不同的捐助者为不同受援国的大量援助活动提供资金。
机器学习顶刊汇总:Nat. Sustain.、Sci. Adv.、Nano Energy、Adv. Sci.、CEJ等
为此,瑞士苏黎世联邦理工学院Malte Toetzke等人开发了一个机器学习框架,该框架能够根据经济合作与发展组织(OECD)的债权人报告系统(CRS)中提供的捐助者文字描述对发展援助活动进行全面而细致的分类。具体而言,数据包含在2000年至2019年间进行的约320万份援助活动的文字描述,由757个不同的捐助组织资助,总支出为3.2万亿美元。作者将这些活动的文字描述聚集成173个活动集群,其中70个活动集群涵盖了尚未进行实证分析的主题(如温室气体减排和孕产妇保健)。此外,该机器学习框架遵循自下而上的方法,在生成分类之前对所进行的援助活动的所有文本描述进行处理。这与现有监测中自上而下的方法形成鲜明对比,在这种方法中,标准化标签必须事先预先确定,然后分配给新的援助活动。
机器学习顶刊汇总:Nat. Sustain.、Sci. Adv.、Nano Energy、Adv. Sci.、CEJ等
图1. 机器学习框架生成的活动集群概览
该框架包含3个主要步骤:首先,输入是所有援助活动的文本描述,它们被嵌入到200维向量空间。在这个空间中,具有相似主题的活动描述彼此接近,而不同主题的活动描述则更远。其次,活动描述的文档嵌入被聚类以将具有相似主题的活动分组到同一类别中。最后,分析每个集群的内容并为集群提供名称。这种机器学习框架的自下而上方法带来了三个重大优势:首先,该框架确保了援助主题的准确表示,并使分类适应新兴主题(如青年赋权、小额信贷)。其次,该框架通过算法对数以百万计的个人援助活动进行分类,从而确保对援助活动的解释具有一致性。第三,该框架产生了高粒度的援助主题,因此可以更精确地分解发展援助。总之,这项研究在推进可持续发展领域的数据驱动分析方面迈出了重要的一步,可对全球援助活动进行更具成本效益、更细粒度和更全面的监测。
机器学习顶刊汇总:Nat. Sustain.、Sci. Adv.、Nano Energy、Adv. Sci.、CEJ等
图2. 分配给受援国发展援助的全球分布
Monitoring global development aid with machine learning, Nature Sustainability 2022. DOI: 10.1038/s41893-022-00874-z
2. 中科院/斯坦福大学Science子刊: 基于深度学习的噪声抑制改进地震监测
机器学习顶刊汇总:Nat. Sustain.、Sci. Adv.、Nano Energy、Adv. Sci.、CEJ等
城市地区的地震风险最高,因为人口密度高且基础设施广泛而脆弱。理想情况下,城市地区密集的地震监测工作将被用来描述对城市构成最直接威胁的断层系统。然而,人口和基础设施导致风险暴露程度高,也使地震监测难以进行,这是由于城市中产生的各种类型地震噪声和仪器部署的后勤困难造成的。
机器学习顶刊汇总:Nat. Sustain.、Sci. Adv.、Nano Energy、Adv. Sci.、CEJ等
为此,中科院地质与地球物理研究所赵亮研究员、美国斯坦福大学Gregory C. Beroza等人开发了一种基于深度学习的去噪算法并将其命名为UrbanDenoiser,以滤除在城市环境中记录的地震数据中存在的强噪声水平。其中,作者通过使用波形数据集训练深度神经网络来开发UrbanDenoiser,该数据集结合了来自城市长滩密集阵列的丰富噪声源和来自圣哈辛托农村密集阵列的高信噪比(SNR)地震信号。UrbanDenoiser的架构基于DeepDenoiser算法,但DeepDenoiser不能很好地推广到长滩数据集。本研究数据集包含80000个噪声样本和33751个信号样本并随机分为训练集、验证集和测试集,通过将信号训练集与从噪声训练集中随机选择的噪声样本重复组合并在窗口中随机移动波形。神经网络的输入是噪声波形的二维时频表示,预测目标是恢复信号和噪声的两个掩码,作者使用相同的程序为验证集生成地震波形并将其应用于网络的超参数微调。
机器学习顶刊汇总:Nat. Sustain.、Sci. Adv.、Nano Energy、Adv. Sci.、CEJ等
图1. 原始数据和去噪数据的地震定位结果
作为验证,作者将UrbanDenoiser应用于密集阵列和区域地震网络。对长滩密集阵列数据的应用表明,该算法能够使用大部分以前无法使用的地震数据进行地震分析,如以人为噪声为主的白天数据。基于去噪数据的地震定位结果显示出与原始数据不同的分布模式,这更新了对发震特征的认识。UrbanDenoiser对区域地震台网数据的应用表明,该算法可以提高不同震级地震的SNR且可从噪声数据中恢复地震信号,其中SNR底限接近0 dB。对于拉哈布拉地震序列,作者在去噪数据中观察到的检测数量大约是现有区域地震目录中检测列表的4倍。检测/定位结果仅包含地震事件,排除了大振幅非地震源。总之,这项研究表明,使用深度学习过滤噪声预处理后的地震检测和定位将有助于改进城市环境中的地震监测。
机器学习顶刊汇总:Nat. Sustain.、Sci. Adv.、Nano Energy、Adv. Sci.、CEJ等
图2. UrbanDenoiser在拉哈布拉地震序列区域地震网络中的应用
Toward improved urban earthquake monitoring through deep-learning-based noise suppression, Science Advances 2022. DOI: 10.1126/sciadv.abl3564
3. 白洋Nano Energy: 机器学习加速发现BaTiO3基陶瓷中的高性能压电催化剂
机器学习顶刊汇总:Nat. Sustain.、Sci. Adv.、Nano Energy、Adv. Sci.、CEJ等
压电催化已成为压电研究中的一个重要课题,尤其是在解决环境问题方面。然而,对纳米加工的依赖严重阻碍了对具有复杂成分设计的材料进行更高性能和大规模应用的研究。
机器学习顶刊汇总:Nat. Sustain.、Sci. Adv.、Nano Energy、Adv. Sci.、CEJ等
在此,北京科技大学白洋研究员等人使用机器学习(ML)策略有效地对具有出色压电响应的陶瓷粉末的广阔组成空间进行采样,预计这些陶瓷粉末会影响压电催化性能。其中,采用固态反应法合成的陶瓷属于多组分体系 (Ba1-x-yCaxSry) (Ti1-u-v-wZruSnvHfw)O3,目标特性为d33即压电系数。特征池由基本元素属性组成,如尺寸、电化学、原子序数和键长等。基于已建立的特征池,作者采用3个步骤来识别最相关的描述符,包括Pearson相关性分析、模型选择和使用绕封方法以提取拟合误差最小的描述符组合。最终,作者选择了误差最小的4个描述符,即八面体因子(μ)、Matyonov-Batsanov电负性(EN-MB)、价电子数与核电荷的比率(Vec/Z)及核心电子距离(Rdce)。此外,支持向量回归(SVR.rbf)算法在测试观察中具有最低的交叉验证误差,因而被用作首选的ML模型。
机器学习顶刊汇总:Nat. Sustain.、Sci. Adv.、Nano Energy、Adv. Sci.、CEJ等
图1. 压电系数d33的描述符选择
在建立回归模型作为代理模型后,作者结合模型的预测值和相关的不确定性来指导在广阔的搜索空间中搜索具有高d33的成分。当d33预测映射到相图中,成分-性质关系的含义变得非常清楚:最高d33倾向于出现在菱面体、斜方体和四方相并存的相界区域内,尤其是在菱面体相侧。最终,作者选择了具有相对较大d33和最少元素的(Ba0.95Ca0.05)(Ti0.9Sn0.1)O3,其烧结陶瓷具有605 ± 14 pC/N的高d33,与ML预测的633 ± 70 pC/N基本一致。机械研磨的陶瓷粉末具有优异的压电催化活性,RhB染料溶液的降解率为 (2.16 ± 0.28) × 10-2 min-1,这与之前报道的纳米颗粒的性能相当。总之,这项工作提供了对BaTiO3基陶瓷压电性质的进一步了解,并为寻找适合大规模应用的优质压电催化剂提供了有效的策略。
机器学习顶刊汇总:Nat. Sustain.、Sci. Adv.、Nano Energy、Adv. Sci.、CEJ等
图2. (Ba1-x Cax)(Ti0.9Sn0.1)O3的d33和压电催化活性
Accelerated discovery of high-performance piezocatalyst in BaTiO3-based ceramics via machine learning, Nano Energy 2022. DOI: 10.1016/j.nanoen.2022.107218
4. Adv. Sci.: 高通量随机击穿模拟+机器学习预测聚合物复合材料的储能性能
机器学习顶刊汇总:Nat. Sustain.、Sci. Adv.、Nano Energy、Adv. Sci.、CEJ等
聚合物介质电容器由于其高功率密度而广泛用于脉冲功率器件。由于纯聚合物的介电常数低,需要无机填料来改善其性能,填料的尺寸和介电性能会影响聚合物基复合材料的介电击穿。然而,仅通过实验不能完全得出填料对击穿强度的影响。
机器学习顶刊汇总:Nat. Sustain.、Sci. Adv.、Nano Energy、Adv. Sci.、CEJ等
在此,哈尔滨理工大学殷景华教授、冯宇副教授等人使用具有3个变量的综合随机击穿模型来研究填料对聚合物基复合材料击穿过程的影响,其中3个最重要的因素包括填料介电常数(εr)、填料尺寸(d)和填料含量(v)。作者基于两种代表性聚合物材料聚酰亚胺(PI)和聚偏二氟乙烯(PVDF),通过模拟具有不同 εrdv填料的聚合物基复合材料中击穿路径的演变分析了潜在的物理机制。在上述模拟结果的基础上,作者发现通过填料的3个变量d、vεr调节的阻塞效应、填充效应和介电匹配对聚合物基复合材料的介电击穿强度(Eb)具有显著影响。通过调整3个变量可以观察到聚合物基复合材料的击穿路径演变,从而得到以下一般规律:在特定范围内,填料d越大,填充状态越合适;填料的εr越接近基体,聚合物基复合材料的Eb改善越显著。
机器学习顶刊汇总:Nat. Sustain.、Sci. Adv.、Nano Energy、Adv. Sci.、CEJ等
图1. 调整三个变量来模拟PVDF复合材料的击穿路径演变
接下来,作者基于504组高通量随机击穿模拟的Eb结果建立机器学习数据库,以介电常数εr、尺寸d和填料含量v为变量构建可解释的机器学习模型。作者以12个原型函数和4个相互作用作为生成描述符,通过最小二乘回归(LSR)执行回归分析。决定系数的LSR被用作筛选描述符的标准,进行3轮筛选以获得关于Eb的最终预测表达式。然后将εr的经典公式与Eb预测表达式相结合,可得到聚合物基复合材料的储能密度(U)预测表达式。最后,作者制备了聚醚酰亚胺(PEI)/氧化铝(Al2O3)复合材料以验证预测,系统地进行了PEI/Al2O3复合材料的微观结构表征和性能测试。结果表明,U实验结果与预测的计算结果基本一致,这也验证了U的普适性和准确性预测。总之,该工作为研究人员开发具有高U值的聚合物介质电容器提供了便利和指导。
机器学习顶刊汇总:Nat. Sustain.、Sci. Adv.、Nano Energy、Adv. Sci.、CEJ等
图2. 研究聚合物基复合材料击穿强度的详细机器学习流程
Prediction of Energy Storage Performance in Polymer Composites Using High-Throughput Stochastic Breakdown Simulation and Machine Learning, Advanced Science 2022. DOI: 10.1002/advs.202105773
5. npj Comput. Mater.: 深度学习方法在材料科学中的最新进展和应用
机器学习顶刊汇总:Nat. Sustain.、Sci. Adv.、Nano Energy、Adv. Sci.、CEJ等
深度学习(DL)是材料数据科学中发展最快的主题之一,其应用领域包括原子数据、基于图像的数据、光谱数据和文本数据等。DL允许分析非结构化数据和自动识别特征,大型材料数据库的最新发展推动了DL方法在原子预测中的应用。相比之下,图像和光谱数据的进步在很大程度上利用了高质量正向模型及生成无监督DL方法支撑的合成数据。
机器学习顶刊汇总:Nat. Sustain.、Sci. Adv.、Nano Energy、Adv. Sci.、CEJ等
在此,美国国家标准与技术研究院Kamal Choudhary等人概述了深度学习(DL)方法中的一些基本原理,然后详细讨论了DL在原子模拟、材料成像、光谱分析和自然语言处理等领域的最新发展。首先,作者介绍了通用的机器学习概念。然后,详细介绍了神经网络、卷积神经网络、图神经网络、序列到序列模型、生成模型、深度强化学习及科学机器学习等DL方法。此外,需要材料科学特定考虑因素的成功DL应用的某些方面包括:1)获取大型、平衡和多样化的数据集(通常大约10000个数据点或更多),2)确定适当的DL方法和输入样本的适当向量或图形表示,3)选择与科学目标相关的适当绩效指标。作者讨论了一些材料科学的关键领域,其中DL已应用到存储库和数据集的可用链接,这些链接有助于工作的可重复性和可扩展性。
机器学习顶刊汇总:Nat. Sustain.、Sci. Adv.、Nano Energy、Adv. Sci.、CEJ等
图1. 光谱数据深度学习的示例应用
尽管DL方法在材料设计方面有各种令人着迷的机会,但也有一些局限性和挑战:(1)仅基于化学式的材料表示不考虑结构,这一方面使其更适合用于无法获得结构信息的新化合物,但另一方面也无法捕获相变等现象;(2)基于原子图的预测虽是完整的原子描述,但仅在散装材料上进行了测试。这强调了输入特征必须对输出标签具有预测性,且不能丢失关键信息;(3)在图像和光谱方面,大多数时候实验数据过于嘈杂,在应用DL之前需要进行大量操作;(4)DL的不确定性量化很重要,但该领域仅发表了少数作品,亟需提高其可解释性;(5)虽然训练-验证-测试拆分策略主要用于具有一定数量的图像分类任务,但对于回归模型可能不是最好的方法;(6)在自动实验室中实现闭环自主材料设计和合成过程,包括机器学习和实验组件,这仍是一个重要的技术挑战。
机器学习顶刊汇总:Nat. Sustain.、Sci. Adv.、Nano Energy、Adv. Sci.、CEJ等
图2. 基于深度学习的原子位点分类算法
Recent advances and applications of deep learning methods in materials science, npj Computational Materials 2022. DOI: 10.1038/s41524-022-00734-6
6. 刘建国/邢磊CEJ: 机器学习+多物理场模拟缓解PEM燃料电池中的氮气交叉
机器学习顶刊汇总:Nat. Sustain.、Sci. Adv.、Nano Energy、Adv. Sci.、CEJ等
质子交换膜(PEM)燃料电池阳极的氮气交叉(NGC)和积累是不可避免的,它会导致性能下降,甚至对功能部件造成不可逆的损害。为了缓解这个问题,研究人员建立了多物理场数值模型(MNM)来描述NGC行为并进一步指导实验研究。然而,为了获得抑制NGC并保持高性能的优化参数,在MSM上进行的网格搜索将花费无法承受的计算资源和时间。
机器学习顶刊汇总:Nat. Sustain.、Sci. Adv.、Nano Energy、Adv. Sci.、CEJ等
为此,南京大学刘建国教授、英国牛津大学访问学者邢磊研究员等人创新性地引入了机器学习辅助 MNM(MSM-ML)作为代理模型,其中比较了9种最先进的机器学习算法以极大地提高该工程问题的解决效率。其中,该模型主要包括4个部分:MNM的建立和验证、数据库构建、机器学习代理建模及多变量优化。首先,作者在商用软件平台COMSOL Multiphysics 5.5a上构建了二维稳态机理模型来描述PEM燃料电池中的NGC,并通过实验验证构建了一个包含6个参数的数据库,这些参数对电池电流密度和NGC有很大影响。其次,通过超参数自适应网格搜索对机器学习领域广泛使用的9种算法进行训练、优化,并通过SHAP进行解释。然后,通过算法竞争获得电流密度和NGC系数回归的最佳机器学习模型。最后,使用粒子群优化算法搜索6个研究参数的全局最优组合。
机器学习顶刊汇总:Nat. Sustain.、Sci. Adv.、Nano Energy、Adv. Sci.、CEJ等
图1. 每种算法的电流密度回归参数重要性及权重均值(WM)总结
作者将本研究的主要发现总结如下:a)N2的积累大大降低了PEM燃料电池的性能。经测量,最大电池功率密度损失为28.9%;b)NGC系数在6维参数空间的分布表明各参数对NGC的影响是非单调的。因此,有必要引入一些先进的策略来更快地进行全局优化;c)创新地分割参数空间以寻找和验证每个参数的局部机制,回归路径比较和参数重要性排序增强了机器学习模型的可靠性;d)在优化范围内,当相对湿度为100%、流道深度为2.32 mm、膜厚度为10µm、气体扩散层厚度为100 µm、运行压力为3.7 atm及运行温度为323 K时,可获得最佳适应度;e)经过开发的MNM-ML模型多变量优化后,NGC系数降低了49.5%,电池性能提高了20%。此外,计算时间从几个月减少到几天。总之,这种策略不仅可以用于缓解NGC,还可以扩展到系统级别的其他复杂优化任务。
机器学习顶刊汇总:Nat. Sustain.、Sci. Adv.、Nano Energy、Adv. Sci.、CEJ等
图2. 传统MNM方法和MNM-ML策略的比较
Comparison of state-of-the-art machine learning algorithms and data-driven optimization methods for mitigating nitrogen crossover in PEM fuel cells, Chemical Engineering Journal 2022. DOI: 10.1016/j.cej.2022.136064

原创文章,作者:v-suan,如若转载,请注明来源华算科技,注明出处:https://www.v-suan.com/index.php/2023/10/10/c83199e09b/

(0)

相关推荐

发表回复

登录后才能评论