Professional Documents
Culture Documents
(12)发明专利申请
(10)申请公布号 CN 113326661 A
(43)申请公布日 2021.08.31
(21)申请号 202110674747 .5
(71)申请人 广西路桥工程集团有限公司
地址 530000 广西壮族自治区南宁市良庆
区平乐大道21号
(51)Int .Cl .
G06F 30/27 (2020 .01)
G06K 9/62 (2006 .01)
G06N 20/20 (2019 .01)
(54)发明名称
一种基于RS-XGBoost的隧道超前钻探定量
解译方法及设备
(57)摘要
本发明涉及隧道工程领域, 特别是一种基于
RS‑XGBoost的隧道超前钻探定量解译方法及设
备。本发明通过对待挖掘隧道进行随机采样, 获
取待挖掘隧道的钻探数据并进行初步处理后, 将
其输入到预先搭建的RS‑XGBoost模型进行定量
解译, 输出定量解译结果。通过结合XGBoost机器
学习模型强大的非线性数据分析性能以及RS随
机搜索高效的超参数寻优能力, 在保证了隧道不
良地质体识别与分类的准确度的前提下大大降
低了模型建立的难度, 也避开了人工调参的不良
影响; 同时提出以不良地质体类型作为机器学习
模型解译结果, 以对隧道较为常见、危害性较强
CN 113326661 A
的几类不良地质体作为定量智能解译结果, 并根
据解译结果及时调整开挖方式及支护措施, 进而
指导隧道现场施工。
CN 113326661 A 权 利 要 求 书 1/2 页
1 .一种基于RS‑XGBoost的隧道超前钻探定量解译方法, 其特征在于,包括:
S1: 对待挖掘隧道进行随机采样, 获取待挖掘隧道的钻探数据并进行初步处理; 所述钻
探数据包括钻进速度、 推进力、 扭矩与旋转速度;
S2: 将初步处理后的钻探数据输入到预先搭建的RS‑XGBoost模型进行定量解译, 并输
出定量解译结果, 所述定量解译结果包括较完整~较破碎、 破碎~极破碎和软泥填充;
其中, 所述RS‑XGBoost模型是通过RS算法对XGBoost模型训练优化后得到的模型。
2 .根据权利要求1所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法, 其特征
在于, 当所述定量解译结果为软泥填充时, 进行进一步划分:
相邻解译单元解译出软泥填充时输出为泥质填充溶洞;
相邻解译单元未解译出软泥填充时输出为软弱夹层;
其中, 所述解译单元为定量解译时的基础单位。
3 .根据权利要求2所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法, 其特征
在于, 所述RS‑XGBoost模型的搭建包括以下步骤:
S21: 录入样本数据并进行标注, 构成标注样本数据; 所述标注为所述样本数据对应的
定量解译结果;
其中, 所述样本数据包括若干条地质数据, 每条所述地质数据包括若干项定量指标, 所
述定量指标包括深度、 钻进速度、 稳压、切削力、推进力、 扭矩和/或旋转速度;
S22:对所述标注样本数据进行预处理;
S23: 将预处理后的标注样本数据输入XGBoost模型, 并通过RS算法对所述XGBoost模型
进行模型训练, 输出RS‑XGBoost模型。
4 .根据权利要求3所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法, 其特征
在于, 所述步骤S23中模型训练具体包括以下步骤:
S231:设置所述XGBoost模型中超参数的取值范围;
S232: 将预处理后的标注样本数据输入XGBoost模型, 在所述取值范围内通过随机搜索
算法对所述XGBoost模型进行超参数寻优, 并获取模型性能评价指标值及对应的超参数;
S233: 当寻优次数小于预设值时, 返回步骤S231;当寻优次数大于或等于预设值时, 进
入步骤S234;
S234: 从所述模型性能评价指标值中选出模型性能评价指标值最高的值, 并将模型性
能评价指标值最高的值对应的超参数作为所述XGBoost模型的优选超参数。
5 .根据权利要求4所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法, 其特征
在于, 步骤S231中所述超参数包括弱评估器数量、最大深度、 学习率、样本权重与随机抽样
样本比例。
6 .根据权利要求3‑5任一所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法,
其特征在于, 在所述步骤S21中对所述定量指标进行相关性分析, 得到优选定量指标; 所述
优选定量指标包括钻进速度、 推进力、扭矩与旋转速度。
7 .根据权利要求6所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法, 其特征
在于, 所述步骤S22中的预处理包括以下步骤:
a: 通过删除所述标注样本数据中的上升段数据进行数据降噪, 所述上升段数据为超前
钻探的钻机未达到稳定状态时采集的数据;
2
CN 113326661 A 权 利 要 求 书 2/2 页
b: 遍历降噪后标注样本数据的缺失值, 并通过所述缺失值对应指标数据的均值对所述
缺失值进行填充, 得到降噪补缺后的数据;
c: 以预设的分割间距将降噪补缺后的数据等距分割为若干段落;
d: 计算等距分割后每个段落中各个优选定量指标的二级指标; 其中,
所述二级指标包
括各个优选定量指标的均值与方差;
e: 采用标准差法对所述二级指标进行数据标准化。
8 .根据权利要求7所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法, 其特征
在于, 所述步骤c中预设的所述分割间距为[0 .5m ,1 .5m]。
9 .根据权利要求7所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法, 其特征
在于, 去除相关性低的所述二级指标, 得到优选的二级指标为: 钻进速度均值、钻进速度方
差、推进力均值、 扭矩均值、 扭矩方差与旋转速度均值。
10 .一种基于RS‑XGBoost的隧道超前钻探定量解译设备, 包括:至少一个处理器;以及
与所述至少一个处理器通信连接的存储器; 其中,
所述存储器存储有可被所述至少一个处
理器执行的指令, 所述指令被所述至少一个处理器执行, 以使所述至少一个处理器能够执
行权利要求1‑9中任一项所述的方法。
3
CN 113326661 A 说 明 书 1/16 页
一种基于RS‑XGBoost的隧道超前钻探定量解译方法及设备
技术领域
[0001] 本发明涉及隧道工程领域,
特别是一种基于RS‑XGBoost的隧道超前钻探定量解译
方法及设备。
背景技术
[0002] 进入21世纪以来, 伴随着我国交通运输行业的高速发展, 公路隧道的建设规模也
日益庞大。根据数据统计, 截至2020年底,全国公路隧道21316处、 2199 .93万延米,
其中特长
隧道1394处、 623 .55万延米, 长隧道5541处、963 .32万米,
已成为目前世界上公路隧道规模
最大、 数量最多、 发展速度最快的国家。在隧道整体建设逐渐向大埋深、长洞线方向转变的
过程中, 选址远、 高应力、 强岩溶、 高水压、构造复杂等特点也逐步凸显, 各类不良地质体造
成当前隧道施工阶段灾害频发。
[0003] 超前地质预报作为探明隧道地质条件, 进而确保隧道施工安全的重要技术手段一
直是隧道建设发展的研究重点。 目前传统的超前地质预报方法主要包括地质雷达、 地震波、
红外探测等各类物探方法和超前钻探法, 各种方法在操作便捷性、 占 用掌子面时间、 预报准
确率等方面的各具优势, 具体如表1所示:
[0004] 表1隧道常用超前地质预报方法
[0005]
[0006]
由表1可以看出,
[0007] 就隧道超前不良地质体的识别方面,常规的物探方法均存在一定
的局限性,而超前钻探法通过对掌子面前方围岩进行钻进(即通过隧道打孔机对待挖掘隧
4
CN 113326661 A 说 明 书 2/16 页
道进行采样) , 能最直观的反映掌子面前方的真实地质信息。但目前研究的钻探数据解译工
作主要依赖技术人员结合现场实际钻进情况进行开展, 虽然钻机搭载的随钻测量系统可实
时记录并提供各项钻进参数, 但只是作为解译参考, 并未被充分利用。该种解译方式未跳脱
经验判断的范畴, 较为粗糙,是一种"伪定量"解译。
[0008] 随着大数据、 计算机技术等信息化技术的发展, 机器学习的理念已逐步渗入各个
领域, 为数据分析提供了新的思路。近些年开始有研究者将机器学习的方法引入到隧道超
前地质预报中以用于定量解译, 已分别在地质雷达、 TSP中取得了一定的成果。
[0009] 但现有研究仍然普遍存在两个问题: 一是大多以围岩等级或地层属性作为预测结
果, 因为目前常用的围岩等级是一个比较大的概念, 不同的不良地质体、 不同的地层岩性都
可能是同一个围岩等级, 且围岩等级基本是在隧道设计阶段就定好的, 导致经常与现场实
际开挖情况不一致, 虽然预测准确度较高, 但对于隧道施工指导意义作用有限; 二是传统的
机器学习模型超参数较少, 人工调参基本可以满足需求, 但准确率低;现有XGBoost模型理
论性能优异, 准确率高,但需要调节的超参数众多, 人工调参无法充分发挥模型性能。
发明内容
[0010] 本发明的目的在于克服现有技术中所存在的上述不足, 提供一种基于RS‑XGBoost
的隧道超前钻探定量解译方法。
[0011] 为了实现上述发明目的, 本发明提供了以下技术方案:
[0012] 一种基于RS‑XGBoost的隧道超前钻探定量解译方法, 包括:
[0013] S1:
对待挖掘隧道进行随机采样, 获取待挖掘隧道的钻探数据并进行初步处理; 所
述钻探数据包括钻进速度、 推进力、 扭矩与旋转速度;
[0014] S2:
将初步处理后的钻探数据输入到预先搭建的RS‑XGBoost模型进行定量解译,
并输出定量解译结果, 所述定量解译结果包括较完整~较破碎、 破碎~极破碎和软泥填充;
[0015] 其中, 所述RS‑XGBoost模型是通过RS算法对XGBoost模型训练优化后得到的模型。
本发明通过结合XGBoost机器学习模型强大的非线性数据分析性能以及RS随机搜索高效的
超参数寻优能力, 构建RS‑XGBoost隧道超前钻探不良地质体定量解译模型, 并高效的搜寻
出能够充分发挥XGBoost模型性能的超参数组合, 进而在保证了隧道不良地质体识别与分
类的准确度的前提下大大降低了模型建立的难度, 也避开了人工调参的不良影响; 同时提
出以不良地质体类型作为机器学习模型解译结果, 以对隧道较为常见、危害性较强的三类
不良地质体(较完整~较破碎、 破碎~极破碎、 软泥填充)作为定量智能解译结果, 并根据解
译结果及时调整开挖方式及支护措施, 进而指导隧道现场施工。即本发明涉及的不良地质
体类型是一个确定的概念, 更加适合现场施工, 指导作用更强。
[0016] 作为本发明的优选方案, 当所述定量解译结果为软泥填充时, 进行进一步划分:
[0017] 相邻解译单元解译出软泥填充时输出为泥质填充溶洞;
[0018] 相邻解译单元未解译出软泥填充时输出为软弱夹层;
[0019] 其中, 所述解译单元为定量解译时的基础单位。本发明通过将软泥填充进一步划
分为软弱夹层和泥质填充溶洞, 告诉现场施工人员前方有软泥填充的岩体, 是存在软弱夹
层还是有溶洞, 更加适合现场施工, 指导作用更强。
[0020] 作为本发明的优选方案, 所述RS‑XGBoost模型的搭建包括以下步骤:
5
CN 113326661 A 说 明 书 3/16 页
6
CN 113326661 A 说 明 书 4/16 页
附图说明
[0048] 图1为本发明实施例1所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法
的流程示意图;
[0049] 图2为本发明实施例1所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法
的超前钻探地质预报流程图;
7
CN 113326661 A 说 明 书 5/16 页
[0050] 图3为本发明实施例1所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法
的中四类不良地质体示意图;
[0051] 图4为本发明实施例1所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法
的钻探定量指标相关性热力图;
[0052] 图5为本发明实施例1所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法
中钻进速度均值的分布散点图;
[0053] 图6为本发明实施例1所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法
中扭矩均值的分布散点图;
[0054] 图7为本发明实施例1所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法
中钻进速度方差的分布散点图;
[0055] 图8为本发明实施例1所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法
中旋转速度方差的分布散点图;
[0056] 图9为本发明实施例1所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法
中推进力均值的分布散点图;
[0057] 图10为本发明实施例1所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法
中旋转速度均值的分布散点图;
[0058] 图11为本发明实施例1所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法
中推进力方差的分布散点图;
[0059] 图12为本发明实施例1所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法
中扭矩方差的分布散点图;
[0060] 图13为本发明实施例1所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法
中XGBoost模型分类预测示意图;
[0061] 图14为本发明实施例1所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法
中GS与RS寻参示意图;
[0062] 图15为本发明实施例1所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法
中RS‑XGBoost不良地质体预测模型流程图;
[0063] 图16为本发明实施例1所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法
中预测集预测标签分布图;
[0064] 图17为本发明实施例2所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法
中YK73+506~YK73+491钻探数据图;
[0065] 图18为本发明实施例2所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法
中ZK73+570~ZK73+560钻探数据图;
[0066] 图19为本发明实施例3所述的一种基于RS‑XGBoost的隧道超前钻探定量解译设备
的结构示意图。
具体实施方式
[0067] 下面结合试验例及具体实施方式对本发明作进一步的详细描述。但不应将此理解
为本发明上述主题的范围仅限于以下的实施例, 凡基于本发明内容所实现的技术均属于本
发明的范围。
8
CN 113326661 A 说 明 书 6/16 页
[0068] 实施例1
[0069] 一种基于RS‑XGBoost的隧道超前钻探定量解译方法, 包括:
[0070] S1: 通过超前钻探技术对待挖掘隧道进行随机采样, 获取待挖掘隧道的钻探数据
并进行初步处理; 所述钻探数据包括钻进速度、推进力、扭矩与旋转速度四项定量指标; 所
述初步处理包括:
[0071] a: 通过删除上升段数据对输入数据进行数据降噪, 所述上升段数据超前钻探的钻
机未达到稳定状态时采集的数据, 优选为0~0 .5m的数据;
[0072] b: 遍历输入数据中的缺失值, 并通过所述缺失值对应指标数据的均值对所述缺失
值进行填充;
[0073] c: 以预设的分割间距将降噪补缺后的所述输入数据等距分割为若干段落;
[0074] d: 计算等距分割后每个段落中各个定量指标的二级指标; 其中,所述二级指标包
括各个定量指标的均值与方差;
[0075] e: 采用标准差法对所述二级指标进行数据标准化。
[0076] S2: 将初步处理后的钻探数据输入到预先搭建的RS‑XGBoost模型进行定量解译,
并输出定量解译结果, 所述定量解译结果包括较完整~较破碎、 破碎~极破碎和软泥填充;
[0077] 当所述定量解译结果为软泥填充时, 进行进一步划分:
[0078] 相邻解译单元解译出软泥填充时输出为泥质填充溶洞; 相邻解译单元未解译出软
泥填充时输出为软弱夹层; 所述解译单元为定量解译时的基础单位。
[0079] 在解译出四种不良地质体后, 施工方可根据解译报告, 对各不良地质体段落进行
围岩等级划分, 在各等级围岩前期所制定的开挖与支护措施基础上, 可提前准备如下的支
护加强措施:
[0080] (1)当定量解译结果为较完整~较破碎与破碎~极破碎时, 解译后优选的施工步
骤如下:
[0081] ①施作超前及径向注浆小导管: 开挖前在掌子面周边及开挖后的围岩径向按一定
角度将小导管打入地层中, 借助注浆泵的压力使浆液通过小导管渗透, 扩散到地层空隙或
裂隙终, 以改善岩体的破碎程度, 提高岩体的物理力学性能。
[0082] ②及时初喷: 破碎岩体开挖后极易发生掉块以及塌方, 应注意及时初喷。
[0083] (2)当定量解译结果为软弱夹层时, 解译后优选的施工步骤如下:
[0084] ①短进尺开挖: 减小围岩暴露面积, 缩短围岩暴露实践, 避免坍塌,应采取短进尺
进行开挖。
[0085] ②减弱爆破强度: 严格控制炮眼装药量, 采用光面爆破,周边眼间距控制在30~
40cm, 光面层厚度控制在65~70cm左右。
[0086] (3)当定量解译结果为泥质填充溶洞时, 解译后优选的施工步骤如下:
[0087] ①采用分部开挖: 当溶洞出现在隧道一侧, 应先开挖该侧, 待初期支护完成后再开
挖另一侧。
[0088] ②严格控制开挖循环长度, 每循环炮眼钻孔宜多打眼、 打浅眼, 且控制爆破振动。
[0089] ③溶洞揭露后, 进一步勘察溶洞规模、 溶腔大小等信息, 根据现场情况采取下一步
措施。
[0090] 所述RS‑XGBoost模型包括以下搭建流程:
9
CN 113326661 A 说 明 书 7/16 页
[0091] S21:
输入标注后的样本数据;
[0092] S211:数据来源
[0093] 本次模型建立采用某隧道的样本数据, 为分离式隧道, 隧道总体由北至南先后穿
越南北向的 沟谷和东西向的岩溶石峰 ,左线起迄里程ZK72+040~ZK73+660 , 隧道长度
1620m; 右线起迄里程YK72+060~YK73+660, 隧道长度1600m, 设计路面高程250~280m, 均为
长大隧道。 隧道工程地质条件较为复杂, 围岩等级主要为Ⅳ~Ⅴ级, 为中风化~强风化砂岩
夹泥岩, 溶洞发育且多为泥质填充。
[0094] 现场使用Casagrande的C6‑2型多功能履带式钻机进行超前钻探作业并基于钻探
数据及现场情况进行地质预报, 如图2所示。根据前期已积累的超前钻探地质预报数据进行
样本数据的收集, 共收集地质数据8893条, 隧道长度累计约160米, 涉及到的数据标签包括
较完整~较破碎岩体、 破碎~极破碎岩体及软泥填充(较完整~较破碎、 破碎~极破碎是岩
2
石完整程度的定性评价指标, 其对应的定量指标是Kv=(vpm/vpr) , 其中,vpm是岩体纵波速
度, vpr是岩石纵波速度, Kv范围在0~1之间, 其中较完整~较破碎为0 .35~0 .75, 破碎~极
破碎是0~0 .35; 软泥填充是一个地质概念, 是指在连续的岩石中间夹有软泥层, 根据填充
的范围, 又可分为软弱夹层和泥质溶洞填充)且在预报过程中根据软泥填充范围又可分为
软弱夹层及泥质填充溶洞, 即基于该样本数据可以对四类不良地质体(如图3所示)进行定
量解译研究工作。
[0095] S212:钻探数据结构及特点
[0096] 在超前钻探过程中, 系统随进尺变化进行随机采样, 每米采集样本数据约50条, 所
述样本数据包括若干条地质数据, 每条所述地质数据共包括七项定量指标 , 分别为深度
(Depth)、钻进速度(Drillingrate)、 稳压(Retainingpressure)、切削力(Toolforce)、
推进
力(Thrust pressure)、扭矩(Torque)与旋转速度(Rotation)。通过对样本数据进行结构分
析, 其主要具备以下三个特点:
[0097] (1)采样阶段性: 采样过程整体具有较强的连续性, 同时呈现出明显阶段划分, 及
钻探采样开始的上升段及采样过程中的稳定段, 其中上升段通常集中在0~0 .5m的进尺范
围内, 具体参数意义涉及空钻及初喷混凝土钻探, 对不良地质体的定量解译无参考意义。
[0098] (2)数据非线性: 定量指标呈现较为明显的非线性相关。
[0099] (3)离散程度大: 钻进速度、 扭矩与旋转速度指标的具体采样参数都表现出了较大
的离散性, 具体的离散程度与不同不良地质体的钻探密切相关。
[0100] S213:一级指标相关性分析
[0101] 除了定性对数据进行特点分析, 定量的指标相关性分析也必不可少。为了提高训
练集数据质量, 降低数据分析维度, 提高模型准确率, 需要对钻探过程中涉及到的定量指标
进行相关性分析, 以探明各指标之间的相关性并去除相关性较高的指标。
[0102] 本方法通过运用Scikit‑learn中的pandas及matplotlib库, 将收集到的原始样本
数据导入后, 对七项一级指标进行相关性分析, 结果如下图4所示。
[0103] 根据图4的内容, 可以解读出, 深度(Depth)与稳压(Retaining pressure)、 钻进速
度(Drillingrate)与切削力(Tool force)具有较高的相关性, 相关性系数分别为0 .89(正
相关)与‑0 .54(负相关)。 同时考虑到深度取值本身对不良地质体类别的解译无意义, 最后
为降低模型训练时间成本, 同时参考相关文献, 剔除深度、 稳压与切削力, 以钻进速度、 推进
10
CN 113326661 A 说 明 书 8/16 页
力、 扭矩与旋转速度四项作为钻探定量解译的一级指标。
[0104] S22: 对标注样本数据进行预处理;
[0105] S221: 数据降噪: 根据钻机的作业情况与定量数据特征, 可将钻探一个完整的循环
段具体分为上升段和稳定段, 上升段由于钻机未达到稳定状态, 其钻进数据通常视作无意
义, 该段的深度范围通常为0~0 .5m。因此本方法在数据分割前需要剔除上升段数据, 通过
将标注样本数据中的上升段(0~0 .5m)数据剔除, 达到数据降噪的目的。
[0106] S222: 缺失值填充: 在钻探系统对指标定量数据进行采集时, 有时会因为机手的操
作导致个别指标的数据少量缺失 ,针对这种数据缺失的情况 ,采用Scikit‑learn中的
impute .SimpleImputer模块进行缺失值的填充 ,具体选取参数为“strategy”中输入
“mean”,即采用训练集中该指标数据的均值进行填充, 以确保该训练集标注样本数据的完
整性。
[0107] S223: 数据等距分割: 为了避免出现用隧道“面”解译结果推定隧道一“段”区间内
真实情况的错误, 采用数据等距分割的方式将训练集标注样本数据分割为若干段落, 并以
分割好的段落为单位进行二级指标的挖掘与计算。
[0108] 数据等距分割: 完成数据降噪与缺失值填充后, 进行标注样本数据的等距分割, 数
据分割间距d定为0 .5m, 原因主要为以下两点:
[0109] ①当分割间距d<0 .5m, 分割间距过小,
钻机在作业过程中, 由于机械系统及机手操
作的原因, 会不可避免的导致样本数据比实际数据偏高或偏低, 且无法通过降噪进行剔除,
分割间距过小会增加对这些异常数据的考虑权重, 导致预测结果与实际不符;
[0110] ②当分割间距d>0 .5m, 分割间距过大,
在工程地质条件较为复杂的隧道中, 围岩情
况常常在1m或更大距离的范围内发生改变, 如较破碎过渡到破碎甚至极破碎, 过大的分割
间距会造成忽略该分割间距内占比低于50%的不良地质体, 导致预测结果与实际不符。
[0111] S224:二级指标计算:
[0112] 在完成数据分割后, 为了深度挖掘钻进数据所对应的各类不良地质体的数据特征
及规律, 对指标各自分割段落内的数据进行二次计算, 形成二级指标作为机器学习模型训
练集的指标体系。通过对标注样本数据的特征进行分析, 本发明确定选取均值与方差作为
二级指标:
[0113] (1)均值: 不同不良地质体的数字钻进数据都存在一定的取值范围, 均值是该取值
范围的重要体现, 且通过取均值的方式可以降低分割间距内异常数据对整体真实数据的影
响, 从而提高预测结果的准确率。
[0114] 均值 按下式(1)进行计算:
[0115]
[0116] 式中, n为样本个数,
xn为第n个样本。
[0117] (2)方差:钻探数据受围岩、机械等客观因素影响,都会在采样过程中出现不同程
度的振幅, 即离散程度, 该离散程度在各类不良地质体中表现得尤为突出, 如较完整围岩的
样本数据相较于均值离散程度小, 破碎围岩的样本数据相较于均值离散程度大,通过取方
差的方式可以较为科学合理的反映各类不良地质体的样本数据离散程度, 从而提高预测结
果的准确率。
11
CN 113326661 A 说 明 书 9/16 页
[0118] 方差 按下式(2)进行计算。
[0119]
[0122]
[0123] S225:
数据标准化
[0124] 机器模型训练集中数据取值范围的巨大差距往往会对模型预测效果产生影响, 为
了避免这种情况的发生, 通常需要进行数据标准化。
当数据(x)按均值(μ)中心化后,
再按标
12
CN 113326661 A 说 明 书 10/16 页
13
CN 113326661 A 说 明 书 11/16 页
的样本单位与根据一级指标所创造的二级指标。为了达到这个目的, 首先将降噪后的, 由四
个一级指标组成的, 不同不良地质体的样本数据以0 .5m进行等距分割, 以段落为样本单位
代替之前的以断面(采集点)为样本单位。之后, 计算每个指标在各0 .5m范围内的自身的均
值和方差(理由在前期资料已叙述)作为二级指标, 将所有计算出的二级指标收集组成训练
集。为了说明这样做的效果, 绘制了8张散点图,有效证明了该种数据处理方式可以有效的
对不同不良地质体类型进行区分, 这位机器学习模型的训练与学习提供了质量极高的数据
集, 为高效区分各类不良地质体创造了条件。
[0135] S23: 搭建RS‑XGBoost模型:
[0136] ①XGBoost模型概述及原理:
[0137] XGBoost模型本质上是一种基于梯度提升决策树的改进算法, 它可以有效地构建
增强树并且并行运行, 该模型的具备计算复杂度低、运行速度快、准确度高等特点。其中目
(t)
标函数Obj 最是衡量XGBoost模型好坏的一个重要的指标, 其最小值越小, 就认为该模型
的表现越好。
[0138] 目标函数如公式(4)所示:
[0139]
[0140] 式中:
n表示导入第k棵树的数据总量,
第一项代表传统的损失函数,
衡量真实标签
yi 和预测值 之间的差异,
第二项代表模型的复杂度,
使用树模型的某种变换Ω表示,
这个
变化代表了一个从树的结构来衡量树模型复杂度的式子, 展开如式(5)所示。
2
[0141] Ω(f )=γT+λ||ω|| /2 (5)
k
[0142] 式中: γ、
λ表示模型复杂度的系数, T表示模型决策树叶子节点个数。
[0143] 为了求解目标函数, 可以使用泰勒展开对式(4)进行运算, 结果如式(6)所示:
[0144]
[0145] 同时,
定义公式(7):
[0146]
[0147] 得到Obj(t)的计算公式(8):
将公式(7)代入公式(6),
[0148]
14
CN 113326661 A 说 明 书 12/16 页
15
CN 113326661 A 说 明 书 13/16 页
[0161]
16
CN 113326661 A 说 明 书 14/16 页
[0165]
17
CN 113326661 A 说 明 书 15/16 页
18
CN 113326661 A 说 明 书 16/16 页
19
CN 113326661 A 说 明 书 附 图 1/13 页
图1
图2
20
CN 113326661 A 说 明 书 附 图 2/13 页
图3
21
CN 113326661 A 说 明 书 附 图 3/13 页
图4
22
CN 113326661 A 说 明 书 附 图 4/13 页
图5
图6
23
CN 113326661 A 说 明 书 附 图 5/13 页
图7
图8
24
CN 113326661 A 说 明 书 附 图 6/13 页
图9
图10
25
CN 113326661 A 说 明 书 附 图 7/13 页
图11
图12
26
CN 113326661 A 说 明 书 附 图 8/13 页
图13
图14
27
CN 113326661 A 说 明 书 附 图 9/13 页
图15
28
CN 113326661 A 说 明 书 附 图 10/13 页
图16
29
CN 113326661 A 说 明 书 附 图 11/13 页
图17
30
CN 113326661 A 说 明 书 附 图 12/13 页
图18
31
CN 113326661 A 说 明 书 附 图 13/13 页
图19
32