为了更快速且准确地预测边坡稳定性,许多学者开始探索机器学习方法在边坡稳定性分析中的应用,其中支持向量机、随机森林等模型被证实在预测边坡稳定性方面有较高的准确率。已有研究证明了混合机器学习模型能综合多个机器学习模型的优点,从而提高预测精度,但也暴露出混合模型可解释性较差和过拟合风险较高等问题。为克服混合机器学习模型的缺点,启发式算法开始被应用于优化机器学习模型。相比混合机器学习模型,启发式算法通过其独特的元启发式搜索机制,在非凸、多峰及高维优化空间中展现出更强的全局搜索能力,显著提升了算法对超参数搜索空间的探索效率,这一特性使其能够突破局部最优限制,为机器学习模型遴选出更具泛化能力的超参数配置,进而实现模型预测精度与鲁棒性的同步提升。
常春藤算法(IVY)是一种新开发的生物启发算法,该算法取自常春藤植物的生长模式,模拟了常春藤种群的有序协调增长和扩散进化的过程。武汉科技大学黄诗冰团队采用IVY对随机森林、决策树、多层感知器、支持向量机4种机器学习模型的超参数进行优化,并通过准确率、召回率、查准率、F1值、特异度和AUC值对优化后模型性能进行评价分析,比选出边坡稳定性预测的最佳机器学习模型,并进一步探究IVY相比传统启发式算法的优势与不足。
数据集的建立与处理
构建数据集时首先要选取合适的特征,选取的特征应该在满足反映评估对象特性的同时避免冗余。从边坡几何形态来看,坡高和坡角影响边坡自重和应力分布,是影响边坡稳定性的重要因素;从边坡自身物理力学性质看,岩土体的诸多强度参数反映了边坡内在力学性质与边坡稳定性之间的关系,尤其是粘聚力和内摩擦角在岩土工程领域被广泛使用;重度也是边坡岩土体重要的物理参数,它直接影响影响边坡的自重,较大的重度会增加边坡的总负荷,增加边坡失稳的风险;从诱发边坡失稳的外界条件看,水是诱发边坡失稳最常见的外界因素,可通过孔隙水压比反映水对边坡稳定性的影响。研究中选取以上6个参数作为数据集的特征参数,并收集了392个边坡案例构建数据集,其中表现为稳定的边坡有201个,表现为失稳的边坡有191个。
各特征的小提琴图
预测模型建立
IVY模拟了常春藤植物的生长和在种群中的传播过程。算法首先创建一组位置随机的常春藤植物种群,种群中的每个个体代表一个可能的解。个体通过目标函数评估其适应度,适应度(或越低,由目标函数决定),表示个体解越优。常春藤种群中的个体会选择最接近且最强的相邻个体作为自我改进对象,在优化机器学习模型时,常春藤植物借助最强邻居向光源攀爬的过程实际上就是超参数借助相邻最佳超参数向全局最优超参数靠近的过程。
首先建立机器学习模型,然后IVY会随机生成一组初始化种群,初始种群中每个常春藤个体的位置则决定了机器学习模型的初始超参数组合。机器学习模型在获得初始超参数组合后将对模型进行训练、测试和评价,评价指标值(如准确率等)将作为适应度传递给初始种群。初始种群将根据个体适应度的高低进行排序,保留适应度高的个体,淘汰适应度低的个体,这一过程也是淘汰较差超参数组合的过程。在淘汰适应度较差的个体后,种群将围绕适应度高的个体进行传播与变异,生成新的个体,从而完成种群的更新。种群更新产生更优秀个体意味着机器学习模型获得了更优的超参数组合,机器学习模型将根据更优的超参数组合再次进行训练、测试和评价。重复上述过程,直至达到最大迭代次数,整个过程中产生的最大适应度个体的位置就是最佳的超参数组合。
VY优化机器学习模型流程
实践结果
每个机器学习模型在经过常春藤算法优化之后准确率都得到了提升,分别提高了8.4%、8.81%、18.76%和23.56%,其中随机森林在优化后准确率最高,达到了90.68%;支持向量机的准确率提升幅度最大,从优化前的59.49%提升到了83.05%,共提升23.56%;随机森林在优化后除召回率和AUC值外,另外4个指标都得到了明显提升,表明随机森林的整体预测能力得到了增强;决策树在优化后召回率有所下降,而其他5个指标都得到了提升,表明决策树在经过IVY优化后,牺牲了一部分预测稳定边坡的能力,但模型的整体性能得到了提升,尤其是预测失稳边坡的能力得到了大幅增强;多层感知器召回率也有所下降,但其他指标的提升十分明显,尤其是查准率和特异度得到了大幅度的增长,表明模型在优化前偏向于预测稳定边坡,但经过优化后,模型的性能在整体得到提升的同时变得更加均衡;支持向量机在优化后每个指标都得到了提升,说明其性能在优化后得到了全面增强;优化后随机森林算法的准确率、召回率、F1值和AUC值均高于另外3种模型,查准率和特异度也处于较高水平,说明随机森林算法更适合预测边坡稳定性。
4种模型优化前后指标对比
结 论
(1)利用常春藤算法对4种机器学习模型进行优化,每个机器学习算法在经过常春藤算法优化后准确率都得到了提升,其中随机森林在优化后准确率最高,达到了90.68%;支持向量机的准确率提升幅度最大,从优化前的59.49%提升到了83.05%,提升了23.56%。表明常春藤算法能够有效提高机器学习预测边坡稳定性的准确率。
(2)优化后随机森林模型的准确率、召回率、F1值和AUC值均高于另外3种模型,查准率和特异度也处于较高水平,各项指标的均衡发展表明其能够精准平衡边坡稳定性预测的敏感性与可靠性,是当前数据条件下的最优预测模型。
(3)经IVY优化后的随机森林准确率和PSO相同,高于GA,并且IVY在优化随机森林时能够比PSO和GA更快收敛,表明IVY在优化随机森林模型时整体效果优于PSO和GA这2种传统启发式算法,为解决机器学习超参数优化问题提供了新途径。
原文下载
蔡玉林,黄诗冰,徐剑波,等.基于常春藤算法优化机器学习模型预测边坡稳定性的研究[J/OL].金属矿山,1-11.
作者简介
黄诗冰
教授,博士生导师,武汉科技大学城市建设学院院长。兼任全国非煤矿山安全生产专家,中国岩石力学与工程学会极地专委会常务委员,湖北省地下工程学会常务理事,《金属矿山》杂志青年编委等。长期从事寒区岩土工程、工程地质灾害防治以及固废资源化利用等方面研究。主持国家自然科学基金项目3项(面上项目2项)、湖北省杰出青年基金项目1项、武汉市自然科学基金特区计划项目1项。作为第一作者或通讯作者发表SCI/EI论文50余篇,其中中科院一、二区论文近40篇,授权发明专利13件。入选了湖北省“楚天学子”,2024年全球前2%顶尖科学家榜单和中国知网高被引学者TOP1%榜单。
《金属矿山》简介
《金属矿山》由中钢集团马鞍山矿山研究总院股份有限公司和中国金属学会主办,主编为中国工程院王运敏院士,现为北大中文核心期刊、中国科技论文统计源期刊(中国科技核心期刊)、中国精品科技期刊(F5000顶尖学术论文来源期刊)、中国百强报刊、RCCSE中国核心学术期刊(A)、中国期刊方阵双百期刊、国家百种重点期刊、华东地区优秀期刊,被美国化学文摘(CA)、美国剑桥科学文摘(CSA)、波兰哥白尼索引(IC)、日本科学技术振兴机构数据库(JST)等世界著名数据库收录。主要刊登金属矿山采矿、矿物加工、机电与自动化、安全环保、矿山测量、地质勘探等领域具有重大学术价值或工程推广价值的研究成果,优先报道受到国家重大科研项目资助的高水平研究成果。根据科技部中国科技信息研究所发布的《2024中国科技期刊引证报告(核心版)》,《金属矿山》核心总被引频次位列26种矿业工程技术学科核心期刊第1位;根据中国知网发布的《中国学术期刊影响因子年报》(2024版),《金属矿山》学科影响力位居73种矿业期刊第9位。
供稿:曾文旭
编排:戴颖熠
审核:王小兵
声明:本文系转载自互联网,请读者仅作参考,并自行核实相关内容。若对该稿件内容有任何疑问或质疑,请立即与铁甲网联系,本网将迅速给您回应并做处理,再次感谢您的阅读与关注。
不想错过新鲜资讯?
微信"扫一扫"