CN113326661A 一种基于RS-XGBoost的隧道超前钻探定量解译方法及设备

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 113326661 A
(43)申请公布日 2021.08.31
(21)申请号 202110674747 .5
(22)申请日 2021 .06 .17
(71)申请人广西路桥工程集团有限公司
地址 530000 广西壮族自治区南宁市良庆
区平乐大道21号
(72)发明人彭浩梁铭宋冠先朱孟龙

解威威马文安马必聪周邦鸿
钟华杨康张亚飞
(74)专利代理机构四川力久律师事务所 51221

代理人冯精恒
(51)Int .Cl .
G06F 30/27 (2020 .01)
G06K 9/62 (2006 .01)
G06N 20/20 (2019 .01)
权利要求书2页说明书16页附图13页
(54)发明名称
一种基于RS-XGBoost的隧道超前钻探定量
解译方法及设备
(57)摘要
本发明涉及隧道工程领域，特别是一种基于
RS‑XGBoost的隧道超前钻探定量解译方法及设
备。本发明通过对待挖掘隧道进行随机采样，获
取待挖掘隧道的钻探数据并进行初步处理后，将
其输入到预先搭建的RS‑XGBoost模型进行定量
解译，输出定量解译结果。通过结合XGBoost机器
学习模型强大的非线性数据分析性能以及RS随
机搜索高效的超参数寻优能力，在保证了隧道不
良地质体识别与分类的准确度的前提下大大降
低了模型建立的难度，也避开了人工调参的不良
影响；同时提出以不良地质体类型作为机器学习
模型解译结果，以对隧道较为常见、危害性较强
CN 113326661 A
的几类不良地质体作为定量智能解译结果，并根
据解译结果及时调整开挖方式及支护措施，进而
指导隧道现场施工。
CN 113326661 A 权利要求书 1/2 页
1 .一种基于RS‑XGBoost的隧道超前钻探定量解译方法，其特征在于，包括：
S1：对待挖掘隧道进行随机采样，获取待挖掘隧道的钻探数据并进行初步处理；所述钻
探数据包括钻进速度、推进力、扭矩与旋转速度；
S2：将初步处理后的钻探数据输入到预先搭建的RS‑XGBoost模型进行定量解译，并输
出定量解译结果，所述定量解译结果包括较完整～较破碎、破碎～极破碎和软泥填充；
其中，所述RS‑XGBoost模型是通过RS算法对XGBoost模型训练优化后得到的模型。
2 .根据权利要求1所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法，其特征
在于，当所述定量解译结果为软泥填充时，进行进一步划分：
相邻解译单元解译出软泥填充时输出为泥质填充溶洞；
相邻解译单元未解译出软泥填充时输出为软弱夹层；
其中，所述解译单元为定量解译时的基础单位。
在于，所述RS‑XGBoost模型的搭建包括以下步骤：
S21：录入样本数据并进行标注，构成标注样本数据；所述标注为所述样本数据对应的
定量解译结果；
其中，所述样本数据包括若干条地质数据，每条所述地质数据包括若干项定量指标，所
述定量指标包括深度、钻进速度、稳压、切削力、推进力、扭矩和/或旋转速度；
S22：对所述标注样本数据进行预处理；
S23：将预处理后的标注样本数据输入XGBoost模型，并通过RS算法对所述XGBoost模型
进行模型训练，输出RS‑XGBoost模型。
在于，所述步骤S23中模型训练具体包括以下步骤：
S231：设置所述XGBoost模型中超参数的取值范围；
S232：将预处理后的标注样本数据输入XGBoost模型，在所述取值范围内通过随机搜索
算法对所述XGBoost模型进行超参数寻优，并获取模型性能评价指标值及对应的超参数；
S233：当寻优次数小于预设值时，返回步骤S231；当寻优次数大于或等于预设值时，进
入步骤S234；
S234：从所述模型性能评价指标值中选出模型性能评价指标值最高的值，并将模型性
能评价指标值最高的值对应的超参数作为所述XGBoost模型的优选超参数。
在于，步骤S231中所述超参数包括弱评估器数量、最大深度、学习率、样本权重与随机抽样
样本比例。
6 .根据权利要求3‑5任一所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法，
其特征在于，在所述步骤S21中对所述定量指标进行相关性分析，得到优选定量指标；所述
优选定量指标包括钻进速度、推进力、扭矩与旋转速度。
在于，所述步骤S22中的预处理包括以下步骤：
a：通过删除所述标注样本数据中的上升段数据进行数据降噪，所述上升段数据为超前
钻探的钻机未达到稳定状态时采集的数据；
2
CN 113326661 A 权利要求书 2/2 页
b：遍历降噪后标注样本数据的缺失值，并通过所述缺失值对应指标数据的均值对所述
缺失值进行填充，得到降噪补缺后的数据；
c：以预设的分割间距将降噪补缺后的数据等距分割为若干段落；
d：计算等距分割后每个段落中各个优选定量指标的二级指标；其中，
所述二级指标包
括各个优选定量指标的均值与方差；
e：采用标准差法对所述二级指标进行数据标准化。
在于，所述步骤c中预设的所述分割间距为[0 .5m ,1 .5m]。
在于，去除相关性低的所述二级指标，得到优选的二级指标为：钻进速度均值、钻进速度方
差、推进力均值、扭矩均值、扭矩方差与旋转速度均值。
10 .一种基于RS‑XGBoost的隧道超前钻探定量解译设备，包括：至少一个处理器；以及
与所述至少一个处理器通信连接的存储器；其中，
所述存储器存储有可被所述至少一个处
理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执
行权利要求1‑9中任一项所述的方法。
3
CN 113326661 A 说明书 1/16 页
一种基于RS‑XGBoost的隧道超前钻探定量解译方法及设备
技术领域
[0001] 本发明涉及隧道工程领域，
特别是一种基于RS‑XGBoost的隧道超前钻探定量解译
方法及设备。
背景技术
[0002] 进入21世纪以来，伴随着我国交通运输行业的高速发展，公路隧道的建设规模也
日益庞大。根据数据统计，截至2020年底，全国公路隧道21316处、 2199 .93万延米，
其中特长
隧道1394处、 623 .55万延米，长隧道5541处、963 .32万米，
已成为目前世界上公路隧道规模
最大、数量最多、发展速度最快的国家。在隧道整体建设逐渐向大埋深、长洞线方向转变的
过程中，选址远、高应力、强岩溶、高水压、构造复杂等特点也逐步凸显，各类不良地质体造
成当前隧道施工阶段灾害频发。
[0003] 超前地质预报作为探明隧道地质条件，进而确保隧道施工安全的重要技术手段一
直是隧道建设发展的研究重点。目前传统的超前地质预报方法主要包括地质雷达、地震波、
红外探测等各类物探方法和超前钻探法，各种方法在操作便捷性、占用掌子面时间、预报准
确率等方面的各具优势，具体如表1所示：
[0004] 表1隧道常用超前地质预报方法
[0005]
[0006]
由表1可以看出，
[0007] 就隧道超前不良地质体的识别方面，常规的物探方法均存在一定
的局限性，而超前钻探法通过对掌子面前方围岩进行钻进(即通过隧道打孔机对待挖掘隧
4
CN 113326661 A 说明书 2/16 页
道进行采样) ，能最直观的反映掌子面前方的真实地质信息。但目前研究的钻探数据解译工
作主要依赖技术人员结合现场实际钻进情况进行开展，虽然钻机搭载的随钻测量系统可实
时记录并提供各项钻进参数，但只是作为解译参考，并未被充分利用。该种解译方式未跳脱
经验判断的范畴，较为粗糙，是一种"伪定量"解译。
[0008] 随着大数据、计算机技术等信息化技术的发展，机器学习的理念已逐步渗入各个
领域，为数据分析提供了新的思路。近些年开始有研究者将机器学习的方法引入到隧道超
前地质预报中以用于定量解译，已分别在地质雷达、 TSP中取得了一定的成果。
[0009] 但现有研究仍然普遍存在两个问题：一是大多以围岩等级或地层属性作为预测结
果，因为目前常用的围岩等级是一个比较大的概念，不同的不良地质体、不同的地层岩性都
可能是同一个围岩等级，且围岩等级基本是在隧道设计阶段就定好的，导致经常与现场实
际开挖情况不一致，虽然预测准确度较高，但对于隧道施工指导意义作用有限；二是传统的
机器学习模型超参数较少，人工调参基本可以满足需求，但准确率低；现有XGBoost模型理
论性能优异，准确率高，但需要调节的超参数众多，人工调参无法充分发挥模型性能。
发明内容
[0010] 本发明的目的在于克服现有技术中所存在的上述不足，提供一种基于RS‑XGBoost
的隧道超前钻探定量解译方法。
[0011] 为了实现上述发明目的，本发明提供了以下技术方案：
[0012] 一种基于RS‑XGBoost的隧道超前钻探定量解译方法，包括：
[0013] S1：
对待挖掘隧道进行随机采样，获取待挖掘隧道的钻探数据并进行初步处理；所
述钻探数据包括钻进速度、推进力、扭矩与旋转速度；
[0014] S2：
将初步处理后的钻探数据输入到预先搭建的RS‑XGBoost模型进行定量解译，
并输出定量解译结果，所述定量解译结果包括较完整～较破碎、破碎～极破碎和软泥填充；
[0015] 其中，所述RS‑XGBoost模型是通过RS算法对XGBoost模型训练优化后得到的模型。
本发明通过结合XGBoost机器学习模型强大的非线性数据分析性能以及RS随机搜索高效的
超参数寻优能力，构建RS‑XGBoost隧道超前钻探不良地质体定量解译模型，并高效的搜寻
出能够充分发挥XGBoost模型性能的超参数组合，进而在保证了隧道不良地质体识别与分
类的准确度的前提下大大降低了模型建立的难度，也避开了人工调参的不良影响；同时提
出以不良地质体类型作为机器学习模型解译结果，以对隧道较为常见、危害性较强的三类
不良地质体(较完整～较破碎、破碎～极破碎、软泥填充)作为定量智能解译结果，并根据解
译结果及时调整开挖方式及支护措施，进而指导隧道现场施工。即本发明涉及的不良地质
体类型是一个确定的概念，更加适合现场施工，指导作用更强。
[0016] 作为本发明的优选方案，当所述定量解译结果为软泥填充时，进行进一步划分：
[0017] 相邻解译单元解译出软泥填充时输出为泥质填充溶洞；
[0018] 相邻解译单元未解译出软泥填充时输出为软弱夹层；
[0019] 其中，所述解译单元为定量解译时的基础单位。本发明通过将软泥填充进一步划
分为软弱夹层和泥质填充溶洞，告诉现场施工人员前方有软泥填充的岩体，是存在软弱夹
层还是有溶洞，更加适合现场施工，指导作用更强。
[0020] 作为本发明的优选方案，所述RS‑XGBoost模型的搭建包括以下步骤：
5
CN 113326661 A 说明书 3/16 页
[0021] S21：录入样本数据并进行标注，构成标注样本数据；所述标注为所述样本数据对

应的定量解译结果；
[0022] 其中，所述样本数据包括若干条地质数据，每条所述地质数据包括若干项定量指
标，所述定量指标包括深度、钻进速度、稳压、切削力、推进力、扭矩和/或旋转速度；
[0023] S22：对所述标注样本数据进行预处理；
[0024] S23：将预处理后的标注样本数据输入XGBoost模型，并通过RS算法对所述XGBoost
模型进行模型训练，输出RS‑XGBoost模型。
[0025] 作为本发明的优选方案，所述步骤S23中模型训练具体包括以下步骤：
[0026] S231：
设置所述XGBoost模型中超参数的取值范围；
[0027] S232：将预处理后的标注样本数据输入XGBoost模型，在所述取值范围内通过随机
搜索算法对所述XGBoost模型进行超参数寻优，并获取模型性能评价指标值及对应的超参
数；
[0028] S233：当寻优次数小于预设值时，返回步骤S231；当寻优次数大于或等于预设值
时，进入步骤S234；
[0029] S234：从所述模型性能评价指标值中选出模型性能评价指标值最高的值，并将模
型性能评价指标值最高的值对应的超参数作为所述XGBoost模型的优选超参数。本发明通
过RS算法进行自动寻优，并在预设寻优次数后，从中选取模型性能评价指标值最高的模型
作为输出，进而在减少了模型训练调整的难度的同时极大的保证了模型的准确度。
[0030] 作为本发明的优选方案，步骤S231中所述超参数包括弱评估器数量、最大深度、学
习率、样本权重与随机抽样样本比例。
[0031] 作为本发明的优选方案，在所述步骤S21中对所述定量指标进行相关性分析，得到
优选定量指标；所述优选定量指标包括钻进速度、推进力、扭矩与旋转速度。本发明通过对
定量指标的数据进行相关性分析，去除了所述样本数据中相关性较高的定量指标，在不影
响模型准确度的前提下极大的降低了模型训练的计算量，进而也极大的减少了模型训练的
时间成本。
[0032] 作为本发明的优选方案，所述步骤S22中的预处理包括以下步骤：
[0033] a：通过删除所述标注样本数据中的上升段数据进行数据降噪，所述上升段数据为
超前钻探的钻机未达到稳定状态时采集的数据；
[0034] b：遍历降噪后标注样本数据的缺失值，并通过所述缺失值对应指标数据的均值对
所述缺失值进行填充，得到降噪补缺后的数据；
[0035] c：以预设的分割间距将降噪补缺后的数据等距分割为若干段落；
[0036] d：计算等距分割后每个段落中各个优选定量指标的二级指标；其中，所述二级指
标包括各个优选定量指标的均值与方差；
[0037] e：采用标准差法对所述二级指标进行数据标准化。本发明通过在预处理时剔除无
解译价值的上升段数据以及填充了稳定段中的缺失数据，提高了数据质量；并通过数据分
割步骤，在保证了预测准确度的前提下，避免了用隧道“面”解译结果推定隧道“段”真实结
果的情况，使后续输出结果更加直观可靠；同时本发明通过计算二级指标，准确反映了各类
不良地质体在各个段落内的数据特征，为后续计算提供了良好的数据基础。
[0038] 作为本发明的优选方案，所述步骤c中预设的所述分割间距为[0 .5m ,1 .5m]。本发
6
CN 113326661 A 说明书 4/16 页
明通过将分割间距设置为[0 .5m ,1 .5m]，在保证了预测准确度的前提下尽可能的提升了本

发明的预测精度。
[0039] 作为本发明的优选方案，去除相关性低的所述二级指标，得到优选的二级指标为：
钻进速度均值、钻进速度方差、推进力均值、扭矩均值、扭矩方差与旋转速度均值。
[0040] 一种基于RS‑XGBoost的隧道超前钻探定量解译设备，包括：至少一个处理器；以及
与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处
理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执
行上述中任一项所述的方法。
[0041] 与现有技术相比，本发明的有益效果：
[0042] 1 .本发明通过结合XGBoost机器学习模型强大的非线性数据分析性能以及RS随机
搜索高效的超参数寻优能力，构建RS‑XGBoost隧道超前钻探不良地质体定量解译模型，并
高效的搜寻出能够充分发挥XGBoost模型性能的超参数组合，进而在保证了隧道不良地质
体识别与分类的准确度的前提下大大降低了模型建立的难度，也避开了人工调参的不良影
响；以对隧道较为常见、危害性较强的三类不良地质体(较完整～较破碎、破碎～极破碎、软
泥填充)作为定量智能解译结果，并根据解译结果及时调整开挖方式及支护措施，进而指导
隧道现场施工。即本发明涉及的不良地质体类型是一个确定的概念，更加适合现场施工，指
导作用更强。
[0043] 2 .本发明通过将软泥填充进一步划分为软弱夹层和泥质填充溶洞，告诉现场施工
人员前方有软泥填充的岩体，是存在软弱夹层还是有溶洞，更加适合现场施工，指导作用更
强。
[0044] 3 .本发明通过RS算法进行自动寻优，并在预设寻优次数后，从中选取模型性能评
价指标值最高的模型作为输出，进而在减少了模型训练调整的难度的同时极大的保证了模
型的准确度。
[0045] 4 .本发明通过对定量指标的数据进行相关性分析，去除了所述样本数据中相关性
较高的定量指标，在不影响模型准确度的前提下极大的降低了模型训练的计算量，进而也
极大的减少了模型训练的时间成本。
[0046] 5 .本发明通过在预处理时剔除无解译价值的上升段数据以及填充了稳定段中的
缺失数据，提高了数据质量；并通过数据分割步骤，在保证了预测准确度的前提下，避免了
用隧道“面”解译结果推定隧道“段”真实结果的情况，使后续输出结果更加直观可靠；同时
本发明通过计算二级指标，准确反映了各类不良地质体在各个段落内的数据特征，为后续
计算提供了良好的数据基础。
[0047] 6 .本发明通过将分割间距设置为0 .5m，在保证了预测准确度的前提下尽可能的提
升了本发明的预测精度。
附图说明
[0048] 图1为本发明实施例1所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法
的流程示意图；
的超前钻探地质预报流程图；
7
CN 113326661 A 说明书 5/16 页
的中四类不良地质体示意图；
的钻探定量指标相关性热力图；
中钻进速度均值的分布散点图；
中扭矩均值的分布散点图；
中钻进速度方差的分布散点图；
中旋转速度方差的分布散点图；
中推进力均值的分布散点图；
中旋转速度均值的分布散点图；
中推进力方差的分布散点图；
中扭矩方差的分布散点图；
中XGBoost模型分类预测示意图；
中GS与RS寻参示意图；
中RS‑XGBoost不良地质体预测模型流程图；
中预测集预测标签分布图；
中YK73+506～YK73+491钻探数据图；
中ZK73+570～ZK73+560钻探数据图；
[0066] 图19为本发明实施例3所述的一种基于RS‑XGBoost的隧道超前钻探定量解译设备
的结构示意图。
具体实施方式
[0067] 下面结合试验例及具体实施方式对本发明作进一步的详细描述。但不应将此理解
为本发明上述主题的范围仅限于以下的实施例，凡基于本发明内容所实现的技术均属于本
发明的范围。
8
CN 113326661 A 说明书 6/16 页
[0068] 实施例1
[0069] 一种基于RS‑XGBoost的隧道超前钻探定量解译方法，包括：
[0070] S1：通过超前钻探技术对待挖掘隧道进行随机采样，获取待挖掘隧道的钻探数据
并进行初步处理；所述钻探数据包括钻进速度、推进力、扭矩与旋转速度四项定量指标；所
述初步处理包括：
[0071] a：通过删除上升段数据对输入数据进行数据降噪，所述上升段数据超前钻探的钻
机未达到稳定状态时采集的数据，优选为0～0 .5m的数据；
[0072] b：遍历输入数据中的缺失值，并通过所述缺失值对应指标数据的均值对所述缺失
值进行填充；
[0073] c：以预设的分割间距将降噪补缺后的所述输入数据等距分割为若干段落；
[0074] d：计算等距分割后每个段落中各个定量指标的二级指标；其中，所述二级指标包
括各个定量指标的均值与方差；
[0075] e：采用标准差法对所述二级指标进行数据标准化。
[0076] S2：将初步处理后的钻探数据输入到预先搭建的RS‑XGBoost模型进行定量解译，
并输出定量解译结果，所述定量解译结果包括较完整～较破碎、破碎～极破碎和软泥填充；
[0077] 当所述定量解译结果为软泥填充时，进行进一步划分：
[0078] 相邻解译单元解译出软泥填充时输出为泥质填充溶洞；相邻解译单元未解译出软
泥填充时输出为软弱夹层；所述解译单元为定量解译时的基础单位。
[0079] 在解译出四种不良地质体后，施工方可根据解译报告，对各不良地质体段落进行
围岩等级划分，在各等级围岩前期所制定的开挖与支护措施基础上，可提前准备如下的支
护加强措施：
[0080] (1)当定量解译结果为较完整～较破碎与破碎～极破碎时，解译后优选的施工步
骤如下：
[0081] ①施作超前及径向注浆小导管：开挖前在掌子面周边及开挖后的围岩径向按一定
角度将小导管打入地层中，借助注浆泵的压力使浆液通过小导管渗透，扩散到地层空隙或
裂隙终，以改善岩体的破碎程度，提高岩体的物理力学性能。
[0082] ②及时初喷：破碎岩体开挖后极易发生掉块以及塌方，应注意及时初喷。
[0083] (2)当定量解译结果为软弱夹层时，解译后优选的施工步骤如下：
[0084] ①短进尺开挖：减小围岩暴露面积，缩短围岩暴露实践，避免坍塌，应采取短进尺
进行开挖。
[0085] ②减弱爆破强度：严格控制炮眼装药量，采用光面爆破，周边眼间距控制在30～
40cm，光面层厚度控制在65～70cm左右。
[0086] (3)当定量解译结果为泥质填充溶洞时，解译后优选的施工步骤如下：
[0087] ①采用分部开挖：当溶洞出现在隧道一侧，应先开挖该侧，待初期支护完成后再开
挖另一侧。
[0088] ②严格控制开挖循环长度，每循环炮眼钻孔宜多打眼、打浅眼，且控制爆破振动。
[0089] ③溶洞揭露后，进一步勘察溶洞规模、溶腔大小等信息，根据现场情况采取下一步
措施。
[0090] 所述RS‑XGBoost模型包括以下搭建流程：
9
CN 113326661 A 说明书 7/16 页
[0091] S21：
输入标注后的样本数据；
[0092] S211：数据来源
[0093] 本次模型建立采用某隧道的样本数据，为分离式隧道，隧道总体由北至南先后穿
越南北向的沟谷和东西向的岩溶石峰，左线起迄里程ZK72+040～ZK73+660 ，隧道长度
1620m；右线起迄里程YK72+060～YK73+660，隧道长度1600m，设计路面高程250～280m，均为
长大隧道。隧道工程地质条件较为复杂，围岩等级主要为Ⅳ～Ⅴ级，为中风化～强风化砂岩
夹泥岩，溶洞发育且多为泥质填充。
[0094] 现场使用Casagrande的C6‑2型多功能履带式钻机进行超前钻探作业并基于钻探
数据及现场情况进行地质预报，如图2所示。根据前期已积累的超前钻探地质预报数据进行
样本数据的收集，共收集地质数据8893条，隧道长度累计约160米，涉及到的数据标签包括
较完整～较破碎岩体、破碎～极破碎岩体及软泥填充(较完整～较破碎、破碎～极破碎是岩
2
石完整程度的定性评价指标，其对应的定量指标是Kv＝(vpm/vpr) ，其中，vpm是岩体纵波速
度， vpr是岩石纵波速度， Kv范围在0～1之间，其中较完整～较破碎为0 .35～0 .75，破碎～极
破碎是0～0 .35；软泥填充是一个地质概念，是指在连续的岩石中间夹有软泥层，根据填充
的范围，又可分为软弱夹层和泥质溶洞填充)且在预报过程中根据软泥填充范围又可分为
软弱夹层及泥质填充溶洞，即基于该样本数据可以对四类不良地质体(如图3所示)进行定
量解译研究工作。
[0095] S212：钻探数据结构及特点
[0096] 在超前钻探过程中，系统随进尺变化进行随机采样，每米采集样本数据约50条，所
述样本数据包括若干条地质数据，每条所述地质数据共包括七项定量指标，分别为深度
(Depth)、钻进速度(Drillingrate)、稳压(Retainingpressure)、切削力(Toolforce)、
推进
力(Thrust pressure)、扭矩(Torque)与旋转速度(Rotation)。通过对样本数据进行结构分
析，其主要具备以下三个特点：
[0097] (1)采样阶段性：采样过程整体具有较强的连续性，同时呈现出明显阶段划分，及
钻探采样开始的上升段及采样过程中的稳定段，其中上升段通常集中在0～0 .5m的进尺范
围内，具体参数意义涉及空钻及初喷混凝土钻探，对不良地质体的定量解译无参考意义。
[0098] (2)数据非线性：定量指标呈现较为明显的非线性相关。
[0099] (3)离散程度大：钻进速度、扭矩与旋转速度指标的具体采样参数都表现出了较大
的离散性，具体的离散程度与不同不良地质体的钻探密切相关。
[0100] S213：一级指标相关性分析
[0101] 除了定性对数据进行特点分析，定量的指标相关性分析也必不可少。为了提高训
练集数据质量，降低数据分析维度，提高模型准确率，需要对钻探过程中涉及到的定量指标
进行相关性分析，以探明各指标之间的相关性并去除相关性较高的指标。
[0102] 本方法通过运用Scikit‑learn中的pandas及matplotlib库，将收集到的原始样本
数据导入后，对七项一级指标进行相关性分析，结果如下图4所示。
[0103] 根据图4的内容，可以解读出，深度(Depth)与稳压(Retaining pressure)、钻进速
度(Drillingrate)与切削力(Tool force)具有较高的相关性，相关性系数分别为0 .89(正
相关)与‑0 .54(负相关)。同时考虑到深度取值本身对不良地质体类别的解译无意义，最后
为降低模型训练时间成本，同时参考相关文献，剔除深度、稳压与切削力，以钻进速度、推进
10
CN 113326661 A 说明书 8/16 页
力、扭矩与旋转速度四项作为钻探定量解译的一级指标。
[0104] S22：对标注样本数据进行预处理；
[0105] S221：数据降噪：根据钻机的作业情况与定量数据特征，可将钻探一个完整的循环
段具体分为上升段和稳定段，上升段由于钻机未达到稳定状态，其钻进数据通常视作无意
义，该段的深度范围通常为0～0 .5m。因此本方法在数据分割前需要剔除上升段数据，通过
将标注样本数据中的上升段(0～0 .5m)数据剔除，达到数据降噪的目的。
[0106] S222：缺失值填充：在钻探系统对指标定量数据进行采集时，有时会因为机手的操
作导致个别指标的数据少量缺失，针对这种数据缺失的情况，采用Scikit‑learn中的
impute .SimpleImputer模块进行缺失值的填充，具体选取参数为“strategy”中输入
“mean”，即采用训练集中该指标数据的均值进行填充，以确保该训练集标注样本数据的完
整性。
[0107] S223：数据等距分割：为了避免出现用隧道“面”解译结果推定隧道一“段”区间内
真实情况的错误，采用数据等距分割的方式将训练集标注样本数据分割为若干段落，并以
分割好的段落为单位进行二级指标的挖掘与计算。
[0108] 数据等距分割：完成数据降噪与缺失值填充后，进行标注样本数据的等距分割，数
据分割间距d定为0 .5m，原因主要为以下两点：
[0109] ①当分割间距d<0 .5m，分割间距过小，
钻机在作业过程中，由于机械系统及机手操
作的原因，会不可避免的导致样本数据比实际数据偏高或偏低，且无法通过降噪进行剔除，
分割间距过小会增加对这些异常数据的考虑权重，导致预测结果与实际不符；
[0110] ②当分割间距d>0 .5m，分割间距过大，
在工程地质条件较为复杂的隧道中，围岩情
况常常在1m或更大距离的范围内发生改变，如较破碎过渡到破碎甚至极破碎，过大的分割
间距会造成忽略该分割间距内占比低于50％的不良地质体，导致预测结果与实际不符。
[0111] S224：二级指标计算：
[0112] 在完成数据分割后，为了深度挖掘钻进数据所对应的各类不良地质体的数据特征
及规律，对指标各自分割段落内的数据进行二次计算，形成二级指标作为机器学习模型训
练集的指标体系。通过对标注样本数据的特征进行分析，本发明确定选取均值与方差作为
二级指标：
[0113] (1)均值：不同不良地质体的数字钻进数据都存在一定的取值范围，均值是该取值
范围的重要体现，且通过取均值的方式可以降低分割间距内异常数据对整体真实数据的影
响，从而提高预测结果的准确率。
[0114] 均值按下式(1)进行计算：
[0115]
[0116] 式中， n为样本个数，
xn为第n个样本。
[0117] (2)方差：钻探数据受围岩、机械等客观因素影响，都会在采样过程中出现不同程
度的振幅，即离散程度，该离散程度在各类不良地质体中表现得尤为突出，如较完整围岩的
样本数据相较于均值离散程度小，破碎围岩的样本数据相较于均值离散程度大，通过取方
差的方式可以较为科学合理的反映各类不良地质体的样本数据离散程度，从而提高预测结
果的准确率。
11
CN 113326661 A 说明书 9/16 页
[0118] 方差按下式(2)进行计算。
[0119]
[0120] 在对某隧道进行钻探的过程中，所收集的8893条原始钻探样本数据经过等距分割

与二级指标计算后，形成的机器学习模型训练集共有数据324条，其中较完整～较破碎有
116条，占比 35 .80％，破碎～极破碎有107条，占比 33 .03％，软泥填充有101条，
占比
31 .17％，三类不良地质体各自占比基本均衡。同时，为使机器学习模型准确对各类不良地
质体进行解译判别，需要对数据集分类标签进行设置并编码。按照较完整～较破碎、破碎～
极破碎与软泥填充的顺序将标签依次编码为“0”、 “1”、
“2”。具体训练集数据见表2所示。
[0121] 表2超前钻探数据训练集
[0122]
[0123] S225：
数据标准化
[0124] 机器模型训练集中数据取值范围的巨大差距往往会对模型预测效果产生影响，为
了避免这种情况的发生，通常需要进行数据标准化。
当数据(x)按均值(μ)中心化后，
再按标
12
CN 113326661 A 说明书 10/16 页
准差(σ)缩放，数据就会服从为均值为0，方差为1的正态分布(即标准正态分布) ，这个过程

就叫做数据标准化，公式(3)所示：
*
[0125] x ＝(x‑μ)/σ (3)
[0126] 在Scikit‑learn中，使用preprocessing .StandardScaler来实现这个功能。
同时，
为了验证0 .5m作为等距分割间距的科学性与合理性，并对数据集指标进行进一步的筛选与
降维，选取训练集数据中三类不良地质体各100条数据绘制散点图进行分析说明，结果如图
5‑图12所示。
[0127] 由图5‑图12可以看出，三类不良地质体的四项指标均值表现出不同程度的聚类现
象，其中以钻进速度均值、推进力均值及扭矩均值最为明显。在四项指标的方差方面，钻进
速度方差与扭矩方差分别在破碎～极破碎围岩及较完整～较破碎围岩上体现出了一定程
度的区分，说明通过0 .5m等距分割后计算均值与方差两个二级指标较为有效的对所需要解
译的三类不良地质体进行分类。但同时推进力方差与旋转速度方差数据重叠度较高，为优
化训练集数据质量，提高机器模型对各类不良地质体的预测准确率，将推进力方差与旋转
速度方差两项训练集指标剔除。
[0128] 下表为本发明通过多次实验获取的选用不同分割间距以及指标体系进行训练时，
预测模型的准确度(ACC)：
[0129] 表3分割间距优选方案
[0130]
分割方式(m) 指标体系(指标个数) ACC(％)
0 一级指标(7) 75 .2
0 筛选后一级指标(4) 77 .6
0 .25 二级指标(8) 93 .3
0 .5 二级指标(8) 96 .1
1 二级指标(8) 94 .2
1 .5 二级指标(8) 93 .8
2 二级指标(8) 86 .7
0 .25 筛选后二级指标(6) 93 .9
0 .5 筛选后二级指标(6) 97 .8
1 筛选后二级指标(6) 96 .5
1 .5 筛选后二级指标(6) 95 .7
2 筛选后二级指标(6) 88 .9
[0131] ACC(准确率)＝(TP+TN)/(TP+TN+FP+FN)，
[0132] 式中： TP＝正例预测正确的个数， FP＝负例预测错误的个数，TN＝负例预测正确的
个数， FN＝正例预测错误的个数。
[0133] 根据表3可知，以0 .5m为分割间距，同时以筛选后二级指标(6)作为指挥体系时准
确度最高，故本发明选择该方案进行计算。
[0134] 本发明预处理步骤是针对超前钻探数据特征进行的数据处理手段，目的是为了将
不同不良地质体类型进行有效区分。超前钻探样本数据可视化后可以明显发现，不同不良
地质体的数据都具有明显的离散性，若直接以原始采集点(断面)为单位导入机器学习模
型，必然导致分类准确率降低。因此，原有的一级指标及样本采集单位不适用，应该形成新
13
CN 113326661 A 说明书 11/16 页
的样本单位与根据一级指标所创造的二级指标。为了达到这个目的，首先将降噪后的，由四
个一级指标组成的，不同不良地质体的样本数据以0 .5m进行等距分割，以段落为样本单位
代替之前的以断面(采集点)为样本单位。之后，计算每个指标在各0 .5m范围内的自身的均
值和方差(理由在前期资料已叙述)作为二级指标，将所有计算出的二级指标收集组成训练
集。为了说明这样做的效果，绘制了8张散点图，有效证明了该种数据处理方式可以有效的
对不同不良地质体类型进行区分，这位机器学习模型的训练与学习提供了质量极高的数据
集，为高效区分各类不良地质体创造了条件。
[0135] S23：搭建RS‑XGBoost模型：
[0136] ①XGBoost模型概述及原理：
[0137] XGBoost模型本质上是一种基于梯度提升决策树的改进算法，它可以有效地构建
增强树并且并行运行，该模型的具备计算复杂度低、运行速度快、准确度高等特点。其中目
(t)
标函数Obj 最是衡量XGBoost模型好坏的一个重要的指标，其最小值越小，就认为该模型
的表现越好。
[0138] 目标函数如公式(4)所示：
[0139]
[0140] 式中：
n表示导入第k棵树的数据总量，
第一项代表传统的损失函数，
衡量真实标签
yi 和预测值之间的差异，
第二项代表模型的复杂度，
使用树模型的某种变换Ω表示，
这个
变化代表了一个从树的结构来衡量树模型复杂度的式子，展开如式(5)所示。
2
[0141] Ω(f )＝γT+λ||ω|| /2 (5)
k
[0142] 式中： γ、
λ表示模型复杂度的系数， T表示模型决策树叶子节点个数。
[0143] 为了求解目标函数，可以使用泰勒展开对式(4)进行运算，结果如式(6)所示：
[0144]
[0145] 同时，
定义公式(7)：
[0146]
[0147] 得到Obj(t)的计算公式(8)：
将公式(7)代入公式(6)，
[0148]
[0149] 以上述公式为原理， XGBoost模型的分类预测示意图如图13所示。

[0150] ②RS超参数快速寻优
[0151] 调节模型超参数取值，以提高模型性能是机器学习极为重要的一环，人为调参伴
随着超参数数量的增加，很难找到最佳的超参数组合，因此需要借助自动超参数寻优工具。
14
CN 113326661 A 说明书 12/16 页
目前，常用的自动调参主要有网格搜索(Grid Search CV， GS) 和随机搜索(Randomized

Search CV， RS)两种。二者简单示意如图14所示。
[0152] 图中，绿色曲线为g(x) ，黄色曲线为h(y) ，目标函数为f(x ,y)＝g(x)+h(y) ，求f(x ,
y) max。其中由于g(x)数值上要明显大于h(y) ，因此f(x ,y)＝g(x)+h(y)≈g(x) ，即在求解f
(x ,y) max的过程中， g(x)为重要超参数， h(y)为非重要超参数。
[0153] 左图为网格搜索，其原理是在参数空间内进行遍历，直至找出最佳的超参数组合，
右图为随机搜索，两个图都在划定的参数空间内进行了9次搜索。根据f(x ,y)＝g(x)+h(y)
≈g(x)，左图实际探索了3个点， f(x ,y) max＝A，而右图实际探索了9个点， f(x ,y) max＝B。显然
右图更可能找到目标函数的最大值，即引入随机因素在某些情况下可以提高寻优效率。
[0154] 在随机搜索和网格搜索中，所有影响模型的参数都是同时搜索，且二者探索的是
完全相同的参数空间，参数设置的结果非常相似。但限于网格搜索的运行机制，当超参数个
数大于三个且搜索精度较高时，运行成本将指数提高，此时综合搜索效果与运行时间双重
因素，随机搜索会是更佳的选择。
[0155] ③RS‑XGBoost模型性能评估：
[0156] 综合集成算法、弱评估器及其它运行过程， XGBoost模型可供调节的超参数超过20
个，根据重要程度，选取其中的n_estimators(弱评估器数量) 、max_depth(最大深度) 、
learning_rate(学习率)、min_child_weight(样本权重)与subsample(随机抽样样本比
例)。首先根据随机搜索搜索算法的规则，结合XGBoost算法特点，划定网格搜索空间，即各
超参数的取值范围及搜索精度。在超参数寻优过程中，以Accuray(准确率)为评估指标不断
的调整网格搜索空间，最终得到最优参数组合，并带入XGBoost算法模型提高预测性能。
[0157] RS‑XGBoost模型流程示意如图15所示，调整RS超参数组合寻优的思路，调整后的
流程为利用RS进行寻优时，每一次寻优都对搜索网格进行人为调整，寻优次数一直循环到
第十次(十次基本已经可以找到各个网格空间下的最优超参数组合，本次寻优次数设置为
十) ，第十次后循环终止。由于每次寻优RS都会生成一个模型性能评价指标gard .best_
score，因此只需要确定这十次寻优过程中的gard .best_score最大值，就可以确定最优超
参数组合。
[0158] 其中，本发明所述XGBoost模型利用RS进行寻优时也可根据需要，为了能够达到预
设的准确度而为寻优过程设置结束条件。该方案可应用于对精确度要求较低且需要减少模
型训练的情形，也可运用于对精确度有明确要求的情形。
[0159] 根据XGBoost模型超参数取值的特点，选取XGBoost模型中常用的五项超参数(n_
estimators、 max_depth、learning_rate、 min_child_weight与subsample)选取用于运算的
超参数组合优选方案，每个所述优选方案的准确度如表4所示。
[0160] 表4超参数组合优选方案
15
CN 113326661 A 说明书 13/16 页
[0161]
[0162] 本发明为提高准确率，选择准确率最高的方案，即选择n_estimators、 max_depth、

learning_rate、
min_child_weight与subsample五项超参数的方案，此时所构建的网格搜
索空间依次为(10， 100，1)、(5，
10，1)、(0 .1，
1，0 .1)、(0 .1，1，
0 .1)与(0 .1，
1，0 .1)，其中括号
内前两个值为超参数的搜索范围，第三个值为搜索精度。此外，在每次搜索后还设置5折交
叉验证，以确保所选取超参数组合的真实性和有效性。将训练集划分为学习集70％，预测集
30％，最终模型准确率为97 .8％，预测情况如图16所示(所述训练集的划分比例根据实际需
要设置，所述学习集用于训练模型，所述预测集用于检验模型准确率)。
[0163] 为了评估XGBoost模型性能，将XGBoost模型与其他模型在默认超参数取值状态下
的模型性能进行了对比。其最终结果如表5所示。
[0164] 表5 XGBoost模型与其他模型的效果对比表(模型默认不调参)
16
CN 113326661 A 说明书 14/16 页
[0165]
[0166] 其中： DT为决策树(Decision Tree) ；RF为随机森林(Random Forest) ； SVM为支持

向量机(SupportVector Machine)；
ANN为人工神经网络(Artificial Neural Network)。
[0167] Accuracy(准确率)＝(TP+TN)/(TP+TN+FP+FN)；
[0168] Precision(精确率)＝TP/(TP+FP)；
[0169] Recall(召回率)＝TP/(TP+FN)；
[0170] F1‑Score(F值)＝(2×Precision×Recall)/(Precision+Recall)；
TP、
TN、FP以及
FN说明如表6所示：
[0171] 表6 TP、 TN、FP以及FN说明
[0172]
预测为正样本预测为负样本
标签为正样本 TP(TruePositive对的正样本) FN(falseNegative错的负样本)
标签为负样本 FP(FalsePositive错的正样本) TN(trueNegative对的负样本)
[0173] 同时，为了评估RS‑XGBoost模型性能，在构建网格搜索空间进行随机搜索寻优后，
还对GS在此搜索空间下的寻优结果，以及XGBoost默认超参数取值状态下的模型性能进行
了对比。最终结果如表7所示。
[0174] 表7 RS‑XGBoost模型性能评估表
[0175]
序号模型超参数取值运行时间(s) 准确率(％)
1 XGBoost (10，6，
1， 1，1) 3 92 .5
2 GS‑XGBoost (70，5，
0 .4，0 .6，0 .2) 1347 96 .6
3 RS‑XGBoost (68，7，
0 .75，0 .3，0 .55) 11 97 .8
[0176] 注：上述模型运行环境为Win 10系统、Intel(R)i7‑6700HQ CPU@2 .6GHz、16 GB
RAM，编辑器为JupyterLab，基于Python 3 .8，所述XGBoost模型的超参数取值为模型默认取
值，所述GS‑XGBoost模型以及所述RS‑XGBoost模型的超参数取值分别为通过GS算法和RS算
法寻优后的取值。
[0177] 通过表3可以看出， RS‑XGBoost模型的准确率最高，为97 .8％，此时的超参数组合
按照n_estimators、 max_depth、learning_rate、 min_child_weight与subsample的顺序为
(68， 7，
0 .75，
0 .3，
0 .55) ，
GS‑XGBoost的准确率与之较为接近，为96 .6％， XGBoost模型默认
超参数取值情况下准确率最低，仅为92％。同时，在运行时间方面， GS‑XGBoost运行时间高
达1347秒，大幅多余其它两种模型。综合准确率与运行时间， GS‑XGBoost模型性能最佳。
[0178] 实施例2
[0179] 本实施例为采用实施例1建立模型进行实际预测的实例。为了对RS‑XGBoost隧道
不良地质体预测模型在超前钻探地质预报中的实际解译效果进行检验，本实施例选取依托
工程某隧道中具有代表性的两个预报实例进行说明，通过对比预报中人工解译结论与实际
17
CN 113326661 A 说明书 15/16 页
开挖结果，验证该模型的合理性与实用性。需要说明的是，在解译过程中，标签“2”(软泥填

充)在“0”(较完整～较破碎)与“1”(破碎～及破碎)中独立，可解译为“软弱夹层”，连续出现
则可解译为“软泥充填型溶洞”。
[0180] ①工程实例A
[0181] 选取某隧道YK73+506～YK73+491段共15米作为验证样本。该段在超前钻探地质预
报报告中的解译结果为： 5～6m疑似软泥充填型溶洞， 6～14m围岩较完整～较破碎， 14～20m
疑似软泥充填型溶洞，钻探图像如图17所示。
[0182] RS‑XGBoost模型解译结果如下表8所示。
[0183] 表8 YK73+507～YK73+491超前钻探RS‑XGBoost解译结果
[0184]
深度(m) 解译标签解译结果
5～5 .5 2 泥质填充溶洞
5 .5～13 0 较完整～较破碎
13～13 .5 1 破碎～极破碎
13 .5～14 2 软弱夹层
14～15 .5 1 破碎～极破碎
15 .5～20 2 泥质填充溶洞
[0185] ②工程实例B
[0186] 选取某隧道ZK73+570～ZK73+560段共10米作为验证样本。该段在超前钻探地质预
报报告中的解译结果为： 0～2m疑似泥质填充溶洞， 2～8m围岩较完整～破碎并伴有软弱夹
层， 8～10m软泥充填型溶洞。钻探图像如图18所示。
[0187] RS‑XGBoost模型解译结果如下表9所示。
[0188] 表9 YK73+507～YK73+491超前钻探RS‑XGBoost解译结果
[0189]
深度(m) 解译标签解译结果
0～2 2 泥质填充溶洞
2～3 0 较完整～较破碎
3～3 .5 2 软弱夹层
3 .5～5 0 较完整～较破碎
5～5 .5 1 破碎～极破碎
5 .5～6 2 软弱夹层
6～7 .5 1 破碎～极破碎
7 .5～10 2 泥质填充溶洞
[0190] ③模型解译结果分析：
[0191] 将工程案例A与工程案例B的报告人工解译结果与RS‑XGBoost模型定量解译结果
进行对比，可以得知，凭借RS‑XGBoost模型在训练集上的优异性能，在实际应用且不对样本
数据进行过多降噪的前提下，定量解译结果与人工解译结果二者保持了较高的一致性，尤
其是在较完整～较破碎围岩及泥质填充溶洞的预测方面，具备较高的准确率，总体满足超
前地质预报工程应用的要求。
[0192] ④实验结论：
[0193] (1)本发明针对隧道超前钻探数据的定量解译问题，通过对钻探样本数据进行定
18
CN 113326661 A 说明书 16/16 页
性与定量分析，以钻进速度(Drilling rate)、推进力(Thrust pressure)、

扭矩(Torque)与
旋转速度(Rotation)作为不良地质体分类预测的一级指标体系，并在此基础上通过等距数
据分割、二级指标计算等数据预处理方法提高训练集质量，同时结合XGBoost机器学习模型
强大的非线性数据分析性能以及RS随机搜索高效的超参数寻优能力，构建RS‑XGBoost隧道
超前钻探不良地质体定量解译模型，最终该模型在预测集上的表现优异，预测准确率高达
97 .8％。
[0194] (2)为评估RS‑XGBoost模型性能，以Accuray为评估指标，将模型分别于XGBoost默
认模型以及基于网格搜索的GS‑XGBoost模型进行对比。对比结果显示，综合模型运行时间
及模型准确率， RS‑XGBoost表现最优。
[0195] (3)通过将RS‑XGBoost模型应用于实际隧道工程的超前钻探地质预报中，结果表
明RS‑XGBoost模型可以提供较为精细的钻探数据解译结果供技术人员参考，且解译结果基
本满足隧道对于不良地质体的预报需求，可以在很大程度上指导隧道施工。
[0196] 实施例3
[0197] 如图19所示，一种基于RS‑XGBoost的隧道超前钻探定量解译设备，包括至少一个
处理器，以及与所述至少一个处理器通信连接的存储器；所述存储器存储有可被所述至少
一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器
能够执行前述实施例所述的一种基于RS‑XGBoost的隧道超前钻探定量解译方法。所述输入
输出接口可以包括显示器、键盘、鼠标、以及USB接口，用于输入输出数据；电源用于为电子
设备提供电能。
[0198] 本领域技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序
指令相关的硬件来完成，前述的程序可以存储于计算机可读取存储介质中，该程序在执行
时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器
(Read OnlyMemory，ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
[0199] 当本发明上述集成的单元以软件功能单元的形式实现并作为独立的产品销售或
使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实施例的技
术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算
机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人
计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述
的存储介质包括：移动存储设备、 ROM、
磁碟或者光盘等各种可以存储程序代码的介质。
[0200] 以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精
神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。
19
CN 113326661 A 说明书附图 1/13 页
图1
图2
20
CN 113326661 A 说明书附图 2/13 页
图3
21
CN 113326661 A 说明书附图 3/13 页
图4
22
CN 113326661 A 说明书附图 4/13 页
图5
图6
23
CN 113326661 A 说明书附图 5/13 页
图7
图8
24
CN 113326661 A 说明书附图 6/13 页
图9
图10
25
CN 113326661 A 说明书附图 7/13 页
图11
图12
26
CN 113326661 A 说明书附图 8/13 页
图13
图14
27
CN 113326661 A 说明书附图 9/13 页
图15
28
CN 113326661 A 说明书附图 10/13 页
图16
29
CN 113326661 A 说明书附图 11/13 页
图17
30
CN 113326661 A 说明书附图 12/13 页
图18
31
CN 113326661 A 说明书附图 13/13 页
图19
32

CN113326661A 一种基于RS-XGBoost的隧道超前钻探定量解译方法及设备

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

CN113326661A 一种基于RS-XGBoost的隧道超前钻探定量解译方法及设备

Uploaded by

Copyright:

Available Formats

(19)中华人民共和国国家知识产权局

(22)申请日 2021 .06 .17

(72)发明人彭浩梁铭宋冠先朱孟龙

(74)专利代理机构四川力久律师事务所 51221

权利要求书2页说明书16页附图13页

[0021] S21：录入样本数据并进行标注，构成标注样本数据；所述标注为所述样本数据对

明通过将分割间距设置为[0 .5m ,1 .5m]，在保证了预测准确度的前提下尽可能的提升了本

[0120] 在对某隧道进行钻探的过程中，所收集的8893条原始钻探样本数据经过等距分割

准差(σ)缩放，数据就会服从为均值为0，方差为1的正态分布(即标准正态分布) ，这个过程

[0149] 以上述公式为原理， XGBoost模型的分类预测示意图如图13所示。

目前，常用的自动调参主要有网格搜索(Grid Search CV， GS) 和随机搜索(Randomized

[0162] 本发明为提高准确率，选择准确率最高的方案，即选择n_estimators、 max_depth、

[0166] 其中： DT为决策树(Decision Tree) ；RF为随机森林(Random Forest) ； SVM为支持

开挖结果，验证该模型的合理性与实用性。需要说明的是，在解译过程中，标签“2”(软泥填

性与定量分析，以钻进速度(Drilling rate)、推进力(Thrust pressure)、

You might also like

CN113326661A 一种基于RS-XGBoost的隧道超前钻探定量解译方法及设备

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

CN113326661A 一种基于RS-XGBoost的隧道超前钻探定量解译方法及设备

Uploaded by

Copyright:

Available Formats

(19)中华人民共和国国家知识产权局

(22)申请日 2021 .06 .17

(72)发明人 彭浩 梁铭 宋冠先 朱孟龙

(74)专利代理机构 四川力久律师事务所 51221

权利要求书2页 说明书16页 附图13页

[0021] S21：录入样本数据并进行标注， 构成标注样本数据； 所述标注为所述样本数据对

明通过将分割间距设置为[0 .5m ,1 .5m]， 在保证了预测准确度的前提下尽可能的提升了本

[0120] 在对某隧道进行钻探的过程中， 所收集的8893条原始钻探样本数据经过等距分割

准差(σ)缩放， 数据就会服从为均值为0， 方差为1的正态分布(即标准正态分布) ， 这个过程

[0149] 以上述公式为原理， XGBoost模型的分类预测示意图如图13所示。

目前， 常用的自动调参主要有网格搜索(Grid Search CV， GS) 和随机搜索(Randomized

[0162] 本发明为提高准确率， 选择准确率最高的方案， 即选择n_estimators、 max_depth、

[0166] 其中： DT为决策树(Decision Tree) ；RF为随机森林(Random Forest) ； SVM为支持

开挖结果， 验证该模型的合理性与实用性。需要说明的是， 在解译过程中，标签“2”(软泥填

性与定量分析， 以钻进速度(Drilling rate)、 推进力(Thrust pressure)、

You might also like

(72)发明人彭浩梁铭宋冠先朱孟龙

(74)专利代理机构四川力久律师事务所 51221

权利要求书2页说明书16页附图13页

[0021] S21：录入样本数据并进行标注，构成标注样本数据；所述标注为所述样本数据对

明通过将分割间距设置为[0 .5m ,1 .5m]，在保证了预测准确度的前提下尽可能的提升了本

[0120] 在对某隧道进行钻探的过程中，所收集的8893条原始钻探样本数据经过等距分割

准差(σ)缩放，数据就会服从为均值为0，方差为1的正态分布(即标准正态分布) ，这个过程

目前，常用的自动调参主要有网格搜索(Grid Search CV， GS) 和随机搜索(Randomized

[0162] 本发明为提高准确率，选择准确率最高的方案，即选择n_estimators、 max_depth、

开挖结果，验证该模型的合理性与实用性。需要说明的是，在解译过程中，标签“2”(软泥填

性与定量分析，以钻进速度(Drilling rate)、推进力(Thrust pressure)、