(吾爱)React18+TS 通用后台管理系统解决方案落地实战
(吾爱)React18+TS 通用后台管理系统解决方案落地实战
download:https://www.51xuebc.com/thread-599-1-1.html
山体滑坡的发作遭到多种要素的综合影响,如地形、坡度、土壤、岩石等物质特征,以及气候、降雨、水文等环境条件。因而,相关预测不断以来都十分艰难。通常状况下,地质学家运用物理和统计模型来估量滑坡发作的风险。固然这些模型能够提供相当精确的预测,但锻炼物理模型需求大量的时间和资源,并不合适大范围应用。
近年来,研讨人员不断在锻炼机器学习模型用于预测山体滑坡,特别是深度神经网络 (Deep Neural Network, DNN)。DNN 作为一个高精度预测模型,在图像辨认、语音辨认、自然言语处置、计算生物、金融大数据等多个范畴效果显著,但它输入层和输出层之外有多层躲藏构造,缺乏可解释性,这种黑盒问题不断搅扰着研讨人员。
近期,加利福尼亚大学洛杉矶分校 (UCLA) 的研讨人员开发了一种可叠加神经网络 (Superposable Neural Network,SNN)。与 DNN 不同,SNN 能够将不同数据输入的结果分开,更好地剖析自然灾祸中的影响要素。SNN 模型在性能上优于物理和统计模型,并且到达了与最先进 DNN 类似的性能。目前,该研讨成果已发表在《Communications Earth & Environment》期刊上,标题为《Landslide susceptibility modeling by interpretable neural network》。
选取喜马拉雅山最东部滑坡数据
研讨人员经过数据剖析发现,2004-2016 年山体滑坡形成人员伤亡的状况集中发作在亚洲。喜马拉雅山最东部地域极易发作陡坡滑坡、极端降水、洪水等事情。 研讨人员经过将手动划定滑坡区域与半自动检测算法相分离,生成了喜马拉雅山最东部的滑坡清单(滑坡事情的记载或数据集)。在整个 4.19 × 109 平方米的研讨区域内,测绘滑坡总数为 2,289 处,面积范围为 900 至 1.96 × 106 平方米。
颜色代表海拔,黄色框表示 N-S (Dibang)、NW-SE(range front)和 E-W (Lohit) 方向的研讨区域。
插图表示喜马拉雅东部地域,黑框表示研讨区域,深灰色线表示国度边境(右上角)。
如上图所示,研讨人员在喜马拉雅山最东部选择了 3 个环境条件不同的地域(Dibang, Lohit 和 range front)测试 SNN 模型的性能和应用。下文中,Dibang、Lohit 和 range front 地域分别被称为 N-S、E-W 和 NW-SE。
模型开发:6 步锻炼一个 SNN
本研讨中,为了在保证准确度的同时,躲避 DNN 缺乏可解释性问题,研讨人员分离模型提取 (model extraction) 和基于特征的办法,生成了一种完整可解释的 additive ANN 优化框架。 Additive ANN 是广义加性模型 (generalized additive models, GAM) 的一种。模型提取办法旨在锻炼一个可解释的 student 模型来模拟 teacher 模型。基于特征的办法旨在剖析和量化每个输入特征的影响。
研讨人员将这种 additive ANN 架构称为 Superposable Neural Network (SNN) 优化。 不同于 DNN 是经过不同层之间的衔接来树立特征之间的互相依赖关系,SNN 是经过原始输入特征的乘积函数来树立特征之间的互相依赖关系,两者间的比照如下图所示:
x1,x2,…,xn 表示一组 n 个原始特征,χ1,χ2,…,χM 表示一组 M 个组合特征,Y 和 St 分别指 DNN 和 SNN 中的易发性结果。
在传统 DNN 中,特征经过网络中的衔接来表示和学习,这种依赖关系严密嵌入在网络构造中,非常复杂并且难以别离。而在 SNN 中,研讨人员事前找到并明白地将有助于输出的特征独立输入,每个神经元仅与一个输入相连。
图中显现,研讨人员采用了两个主要办法, 特征选择模型 (feature-selection model) 和多阶段锻炼 (multistage training)。 特征选择模型用于选择最相关的特征停止后续剖析和建模;多阶段锻炼则指锻炼过程分为多个阶段,每个阶段都有特定目的和锻炼战略,逐渐优化模型性能。
锻炼流程可总结为以下步骤:
多元多项式展开 (Multivariate polynomial expansion): 生成复合特征。
锦标排名 (Tournament ranking): 一种自动特征选择办法,用于找出与模型最相关的特征。
多阶段锻炼 (MST): 一种二阶深度学习技术,用于生成高性能的 teacher 网络。
分数学问蒸馏 (Fractional knowledge distillation): 用于别离每个特征对最终输出的奉献。
并行学问蒸馏 (Parallel knowledge distillation): 将规范的学问蒸馏技术单独应用于与每个特征对应的网络。
网络叠加 (Network superposition): 将与每个特征对应的单层网络兼并成一个 SNN。
实验结果
SNN 最高精确率超 99%
依据模型锻炼中运用的最高级别的复合特征,研讨人员将 SNN 分为 3 个不同级别的模型,即 Level-1、Level-2 和 Level-3。 实验标明,Level-3 SNN 精确率能到达 SOTA teacher DNN 的 99% 以上,Level-2 SNN 精确率则超越 98%。思索到两者间精确率的差距很小,研讨人员假定 Level-2 SNN 的可解释性关于剖析来说是足够的。
接下来研讨人员将 Level-1 和 Level-2 SNN 与 SOTA DNN teacher 模型(MST,基于二阶优化的 DNN),以及传统办法(LogR 及 LR)停止比拟, 一切办法均应用于相同的区域并运用相同的数据,结果如下图所示。
MST: SOTA DNN Teacher 模型
LogR: 逻辑回归 (传统办法)
LR: 似然比(传统办法)
如图所示,SNN 与 MST 模型性能相当,且优于常用的传统模型。 3 个研讨区域的均匀值计算,Level-1 和 Level-2 SNN 的 AUROC 分别为 0.856 和 0.890。Level-2 SNN 的 AUROC 比 LogR (AUROC = 0.848) 和 LR (AUROC = 0.823) 高出约 8%。
AUROC (area under the receiver operating characteristic): 用于评价分类模型的性能指标。AUROC 越接近 1,模型性能越好。
SNN 具备完整可解释性
SNN 是一个完整可解释的模型,其可解释性程度可与线性回归相媲美。
研讨人员将研讨区域分为滑坡 (ld) 和非滑坡 (nld) 区域。SNN 提供了个体特征对易发性确实切奉献,使量化各特征对滑坡易发性的影响成为可能。经过计算个体特征在 ld 与 nld 区域间的差别,能够肯定滑坡的主要控制要素及其相对奉献。
MAP_Slope(均匀年降水量和斜坡的乘积)、NEE_Slope(极端降雨事情数量和斜坡的乘积)、Asp*Relief(坡向和部分送风的乘积)及 Asp(坡向)在一切三个区域中都有较大的影响。
(a, d): N-S 研讨区域;(b, e): NW-SE 研讨区域;(c, f): E-W 研讨区域。
(a–c) 中的条形图按降序表示各特征在滑坡 (ld) 和非滑坡 (nld) 区域中的差别大小;(d–f) 中的饼图表示各特征对滑坡 (ld) 和非滑坡 (nld) 区域的均匀影响。
均匀年降水量 (MAP)、极端降雨事情数量 (NEE)、坡向 (Asp)、海拔 (Elev)、均匀曲率 (CurvM)、到河道的间隔 (DistC)、一切断层 (DistF) 和主锋面逆冲和裂痕带 (DistMFT),以及部分送风 (Relief)。
星号 * 表示两个特征的代数乘法。
由于 SNN 独有的才能,研讨人员能够别离出主要控制特征的空间散布及其部分影响。
a-c: 主要特征的空间散布。
d-f: 气候与坡度对易发性的影响。
(a, d): N-S 研讨区域;(b, e): NW-SE 研讨区域;(c, f): E-W 研讨区域。
气候影响较大的中央呈蓝色,坡度影响较大的中央呈红色。
均匀年降水量 (MAP)、极端降雨事情数量 (NEE)、坡向 (Asp)、海拔 (Elev)、均匀曲率 (CurvM)、部分送风 (Relief)。
星号 * 表示两个特征的代数乘法。
如上图 d-f 所示,在 N-S、NW-SE 及 E-W 区域中,分别大约 74%、54% 和 54% 的地点受气候特征(如极端降雨事情数量、均匀年降水量和坡向)的影响水平大于坡度的影响水平,在图中表现为蓝色面积大于红色,标明了气候特征在控制喜马拉雅最东部地域山体滑坡的重要性。 由于沿喜马拉雅山脉向东降水率逐步增加,喜马拉雅山脉东部地域垂直气候变化显著。这种气候梯度很可能影响喜马拉雅山脉东部地域的滑坡易发性。
SNN 打破滑坡预测难题
本研讨作者 Louis Bouchard 和 Seulgi Moon 都是 UCLA 的副教授,Khalid Youssef 在 UCLA 停止博士后研讨,Kevin Shao 为 UCLA 地球、行星和空间科学博士研讨生。
Kevin Shao 谈到 「深度神经网络 (DNN) 能够提供精确的滑坡发作可能性,但无法肯定哪些详细的变量会惹起滑坡发作及其缘由。」共同第一作者 Khalid Youssef 指出 「问题在于 DNN 的各个网络层在学习过程中不时互相影响,因而将其结果剖析分明是不可能的。该研讨希望可以分明地将不同数据输入的结果别离出来,使其在肯定影响自然灾祸的最重要要素方面愈加有用。」
「相似于用尸检来肯定死因,肯定滑坡确实切触发要素总是需求田野丈量和土壤、水文和气候条件的历史记载,如降雨量和强度,这些数据在像喜马拉雅山脉这样的偏僻地域很难获取。但是 SNN 能够肯定关键变量并量化它们对滑坡易发性的奉献。」 Seulgi Moon 教授说到。Louis Bouchard 则表示 「不像 DNN 需求强大的计算机效劳器来停止锻炼,SNN 的体积小到能够在苹果手表上运转。」
研讨人员方案将他们的工作拓展到世界上其他容易发作滑坡的地域,例如加利福尼亚州。 在加州,频繁的山火和地震招致滑坡风险加剧,而 SNN 能够协助开发早期预警系统,综合思索多种信号并预测其他一系列地表风险。