正韵律厚油层水平井开发能量补充方式优化研究
-
摘要: 受储层非均质性和油水重力分异作用的影响,正韵律厚油层的顶部剩余油相对富集。近年来针对正韵律厚油层顶部剩余油实施水平井调整挖潜取得了较好的效果,但逐渐表现出地层能量不足、产液量下降快等问题。以目前行列井网的孤岛中一区Ng53单元为例,建立精细油藏地质模型,利用数值模拟技术对水平井的能量补充方式进行了优化。在水平井投产同期和水平井投产一段时间两种情况下对老水井的注水方式、新钻注水井以及老油井的转注方式等能量补充方式进行了优化,结果表明,在两种情况下水井排水井隔井单注上部油层能够取得较好的开发效果,而且水平井的能量补充越早,开发效果越好。这对改善正韵律厚油层水平井的开发效果具有重要的指导作用。
-
井漏是钻井过程中经常遇到的井下复杂情况[1]。钻井液频繁漏失不但会延长钻井周期,甚至会引起井喷等更严重的钻井事故。传统的井漏监测方法依靠人工监测录井参数实现,但录井参数的变化具有缓慢、细微的特点,导致监测结果及时性差、准确率低。近年来,随着大数据与人工智能在油气田开发领域中的应用[2],基于机器学习的钻井风险识别方法[3–7]受到越来越多的关注。由于钻井风险识别所用的录井参数皆为时序数据,具备时序信息处理能力的长短期记忆(long short-term memory, LSTM)网络[8–10]被应用于风险识别。然而,井漏样本数量较少,且与正常工况下的数据量不平衡,使模型倾向于将识别结果划分到多数样本的类别[11],识别准确率不高。与上述方法相比,利用正常样本训练的自编码器(auto-encoder, AE)成为解决钻井风险识别问题的新途径。传统自编码器在网络异常检测[12]、轴承故障诊断[13]、轨迹异常检测[14]等方面取得了良好的应用效果,但其处理时间序列的能力不足,无法有效提取录井参数的变化特征。集成学习(ensemble learning)通过融合多个单一学习器的识别结果,降低了单一学习器因过度学习局部特征导致的误报、漏报,能够获得更好的泛化能力和更优的识别结果。目前,集成学习已经与卷积神经网络[15]、支持向量机[16]、循环神经网络[17]相结合,用来提升模型的分类与预测性能。
基于上述考虑,为了在井漏样本数量不足条件下准确识别井漏,笔者提出了集成LSTM-AE的井漏智能识别方法。利用LSTM网络作为自编码器的隐含层,构建包含不同隐藏层神经元数目的多个LSTM-AE模型,通过重构得分筛选出具有较好性能的LSTM-AE模型作为基识别器,对多个基识别器的重构误差与阈值进行加权集成,提升井漏识别的准确率,实验结果验证了提出方法的有效性。
1. 时间序列重构原理
1.1 LSTM网络时间序列处理原理
LSTM网络作为循环神经网络(recurrent neural network,RNN)的变种,通过改变门控状态来控制传输状态,解决了RNN网络存在的梯度消失的问题,目前已成为处理时间序列数据的标准方法[18]。LSTM网络由遗忘门、输入门和输出门组成(见图1)。
遗忘门的任务是接收上一时刻的记忆并决定所要保留和遗忘的部分,输入门对输入进行选择性记忆,输出门决定将要输出的信息,遗忘门、输入门、输出门的计算公式分别为:
f_t=\sigma\left(\boldsymbol{W}_{\mathrm{fh}}h_{t-1}+\boldsymbol{W}_{\mathrm{fx}}x_t+\boldsymbol{W}_{\mathrm{fc}}c_{t-1}+\boldsymbol{b}_{\mathrm{f}}\right) (1) i_t=\sigma\left(\boldsymbol{W}_{\text{ih}}h_{t-1}+\boldsymbol{W}_{\mathrm{ix}}x_t+\boldsymbol{W}_{\mathrm{ic}}c_{t-1}+\boldsymbol{b}\mathrm{_i}\right)\quad (2) {o_t} = \sigma\left( {{{\boldsymbol{W}}_{{\mathrm{oh}}}}{h_{t - 1}} + {{\boldsymbol{W}}_{{\mathrm{ox}}}}{x_t} + {{\boldsymbol{W}}_{{\mathrm{oc}}}}{c_t} + {{\boldsymbol{b}}_{\mathrm{o}}}} \right) \quad (3) 式中:
{f_t} ,{i_t} 和{o_t} 分别为遗忘门、输入门和输出门;{h_{t - 1}} 为上一时刻的输出;{x_t} 为当前时刻的输入;{c_t} ,{c_{t - 1}} 分别为当前时刻与上一时刻记忆单元的存储信息;{{\boldsymbol{W}}_{{\mathrm{fh}}}} ,{{\boldsymbol{W}}_{{{\mathrm{fx}}} }} 和{{\boldsymbol{W}}_{{{\mathrm{fc}}} }} 为遗忘门的权重参数矩阵;{{\boldsymbol{W}}_{{\text{ih}}}} ,{{\boldsymbol{W}}_{{\mathrm{ix}}}} 和{{\boldsymbol{W}}_{{\mathrm{ic}}}} 为输入门的权重参数矩阵;{{\boldsymbol{W}}_{{\mathrm{oh}}}} ,{{\boldsymbol{W}}_{{\mathrm{ox}}}} 和{{\boldsymbol{W}}_{{\mathrm{oc}}}} 为输出门的权重参数矩阵;{{\boldsymbol{b}}_{{\mathrm{f}}} } ,{{\boldsymbol{b}}_{\mathrm{i}}} 和{{\boldsymbol{b}}_{\mathrm{o}}} 为网络偏置参数矩阵;\sigma 表示sigmoid函数。输入门的值接近于1时,即接收全部当前候选记忆单元的值;遗忘门的值接近于1时,即拒绝接收当前候选记忆单元的值,最终的输出则是由输出门和当前单元状态共同决定。LSTM层选择性地接收当前信息,有效获取数据序列内部的长时相关性,具备处理时间序列的能力。当前记忆单元、候选记忆单元、当前时刻输出的公式分别为:
{c_t} = {c_{t - 1}}{f_t} + {z_t}{i_t} (4) {z_t} = \tanh \left( {{{\boldsymbol{W}}_{{\mathrm{zy}}}}{h_{t - 1}} + {{\boldsymbol{W}}_{{\mathrm{zx}}}}{x_t} + {{\boldsymbol{b}}_{\mathrm{z}}}} \right) (5) {h_t} = {o_t}\tanh ({c_t}) (6) 式中:
{{\boldsymbol{W}}_{{\mathrm{zy}}}} 和{{\boldsymbol{W}}_{{\mathrm{zx}}}} 为记忆单元的权重参数矩阵;{{\boldsymbol{b}}_{\mathrm{z}}} 为网络偏置参数矩阵;{h_t} 为当前时刻的输出;{z_t} 为当前候选记忆单元。1.2 LSTM-AE时间序列重构原理
传统自编码器(auto-encoder, AE)由输入层、隐含层、输出层构成。在训练阶段,通过对正常样本进行重构训练,使自编码器熟悉正常样本的数据分布规律,实现对正常样本特征的提取。为了提升传统自编码器的时序处理能力,使用LSTM层代替传统自编码器中的全连接层,构建LSTM-AE网络,其结构如图2所示。LSTM-AE对时间序列重构的过程由编码器(encoder)与解码器(decoder)实现。位于输入层与隐含层之间的编码器在高维空间对输入时间序列的特征进行提取,并编码为低维空间特征,编码阶段实际是一个保留部分特征的数据压缩过程,可以描述为:
h = \eta \left( {{{\boldsymbol{W}}_1}X + {{\boldsymbol{b}}_1}} \right) (7) 式中:
{{\boldsymbol{W}}_1} 和{{\boldsymbol{b}}_1} 分别为编码器中LSTM层的权重与偏置矩阵;h 为编码后处于隐含层的低维特征;\eta 为神经元间的激活函数;X 为输入的时间序列。解码器位于隐含层与输出层之间,将根据隐含层的低维空间特征,使其重新映射回高维空间,输出与输入具有相同维度的时间序列,从而完成了时间序列的重构,过程可以描述为:
Y = \eta \left( {{{\boldsymbol{W}}_2}h + {{\boldsymbol{b}}_2}} \right) (8) 式中:
{{\boldsymbol{W}}_2} 和{{\boldsymbol{b}}_2} 分别为解码器中LSTM层的权重与偏置矩阵;Y 为编码后得到的时间序列。训练LSTM-AE的目的是通过不断更新编码器与解码器的权重与偏置,最小化损失,使最终输出的时间序列与输入的时间序列相同,在实现对样本序列无损重构的同时,使模型学习到正常样本的特征。重构损失L的计算公式为:
{{L}} = ||Y - X|{|^2} (9) 2. 集成LSTM-AE的井漏识别方法
集成LSTM-AE模型对正常样本中的监测参数变化特征进行学习后,当测试样本中的监测参数特征与正常样本中的监测参数特征差别较大时,测试样本的重构误差较高,模型将测试样本判别为井漏样本。因此,需先选取变化规律能反映井漏特征的监测参数,再对数据进行预处理后输入模型。
2.1 监测参数选取
井漏发生的机理较为复杂,单一参数的变化并不能唯一确定井漏的发生,因此需要结合多个监测参数的变化对井漏进行识别[19]。当井漏发生时,随着钻井液从井筒沿着漏失通道进入地层,环空中钻井液的上返速度降低,造成环空摩阻减小,导致立管压力降低[20],并且在入口流量没有显著变化的情况下,出口流量减少;最后,部分钻井液流入地层导致上返至地面的钻井液减少,钻井液池中钻井液的体积减小。因此,选择钻井液池中钻井液体积、出口流量百分比、立管压力作为集成LSTM-AE模型的输入参数。
2.2 数据预处理
为了降低噪声与不同参数间的数值范围对数据的影响,采用滤波与归一化的方法对钻井数据进行预处理。
2.2.1 钻井数据滤波
在钻井数据的采集过程中,数据不可避免地存在许多噪声及急剧变化的跳变点,这些干扰对于LSTM-AE模型提取正常样本中监测参数的全局特征有较大的影响,因此需要使用滤波的方法减少这类因素的干扰。
SG 滤波是平滑时间序列数据滑动窗口的一种加权平均算法,其加权系数是通过一个滤波窗口内给定高阶多项式的最小二乘拟合得到,SG滤波的公式为:
{y}_{j}^{\ast }=\frac{\displaystyle\sum _{i=-n}^{{n}}{a}_{i}{y}_{j+i}}{m} (10) 式中:
{{y}}_j^ * 为时间序列拟合后的值;{{y}} 为原始的时间序列;{a_i} 为滤波系数;m 为卷积数目;n为滤波窗口大小,与多项式的阶数共同决定最终的滤波效果。2.2.2 钻井数据归一化
为了降低监测参数之间特征尺度及量纲不同对自编码器提取监测参数特征的影响,通常需要进行归一化处理,常用的数据归一化方法为最大−最小值归一化,其计算公式为:
x'{{ = }}\frac{{x{{ - }}\min (x)}}{{\max (x) - \min (x)}} (11) 式中:x为当前值;
x' 为归一化后得到的值;\min (x) 和\max (x) 分别表示一组数据中的最小值、最大值。2.3 LSTM-AE的集成过程
在训练阶段,LSTM-AE模型学习到正常样本的特征,根据测试样本重构误差与阈值的大小关系判断测试样本是否为井漏样本;但LSTM-AE模型会过度学习训练样本中的局部特征而遗漏掉对其他特征的学习,使识别准确率降低。针对这一问题,提出了基于重构得分的模型筛选方法,从多个LSTM-AE模型中筛选出识别性能较好的基识别器,使用集成学习的方法集成多个基识别器对井漏进行组合判别。由于不同基识别器对样本特征的学习存在差异,被单一模型遗漏掉的特征可被其他模型学习到,弥补了单一模型特征学习能力的不足,提升井漏识别的准确性。集成LSTM-AE模型的建立分为以下3步:
1)LSTM-AE模型训练。将正常样本集划分为训练集
{D_1} 与测试集{D_2} ,设置k个结构不同的LSTM-AE模型。训练阶段,使用训练集{D_1} 对k个LSTM-AE模型分别进行训练,得到每个样本的重构误差,并将第k个LSTM-AE模型的误差阈值设定为:{T_k} = {Q_k} (12) 式中:
{Q_k} 为第k个LSTM-AE模型对{D_1} 的所有重构误差的95%分位数;{T_k} 为第k个LSTM-AE模型的误差阈值。2)基识别器筛选。根据每一个自编码器的误差阈值
{Q_n} ,其重构得分计算公式为:S_k=\frac{1}{2}\mathrm{ln}\left\lceil {\frac{1-Q_k}{Q_k}} \right\rceil (13) 式中:
{S_k} 为其重构得分。重构得分越高,代表模型在训练时的损失越小,一定程度上表示模型的重构效果较好。取得分最高的p个LSTM-AE模型作为基识别器,对
{S_p} 进行归一化,得到每个子LSTM-AE模型的最终权重矩阵S为:{\boldsymbol{S}} = \left[ {{S_1},{S_2},...,{S_p}} \right] (14) 式中:
{S_p} 为第p个基识别器所占的权重。3)井漏判别。将正常样本测试集
{D_2} 与井漏样本测试集{D_3} 输入基识别器中,分别得到一组重构误差,最终测试集中第i个样本集成后的重构误差{e_i} 为每个基识别器的重构误差的加权和:{e_i} = {S_1}{e_{1i}} + {S_2}{e_{2i}} + ... + {S_p}{e_{pi}} (15) 式中:
{e_i} 为第i个序列集成后的重构误差;{e_{pi}} 为第p 个基识别器对第i个序列的重构误差。最终的误差阈值T为每个基识别器的误差阈值的加权和:
T = {S_1}{T_1} + {S_2}{T_{2}} + \ldots + {S_p}{T_p} (16) 式中:
{T_p} 为第p个基识别器的误差阈值;T 为最终的误差阈值。若{e_i} \leqslant T ,则被模型判断为正常钻进状态;若{e}_{i}>T ,则模型给出井漏报警。3. 井漏识别试验结果与分析
3.1 LSTM-AE井漏识别模型的搭建
3.1.1 数据来源与样本集划分
本次试验中所使用的数据集来源于国内具有井漏记录的18口井,对数据集中的时间序列使用长度为20、步长为1的滑动窗口共生成6 000个数据样本,滑动窗口所生成的样本包含了时间序列的趋势变化信息,满足了井漏识别的实时性,其中正常样本用于模型的训练与测试,而井漏样本只用于模型的测试,每一个样本包含钻井液池中钻井液体积、出口流量百分比和立管压力各20个数据点,滑动窗口过程如图3所示。
按照9∶1,8∶2,7∶3和6∶4等4种常用比例划分训练集与测试集,对模型进行训练与测试,对比不同测试集模型的识别准确率。测试结果表明,当训练集与测试集比例为8∶2时,识别准确率最高,达到了84.5%。因此,按照8∶2的比例对样本进行划分,用于训练的正常样本为4 000个,用于测试的正常样本与井漏样本各1 000个。
3.1.2 模型训练
为了训练出多个性能不同的LSTM-AE模型,根据传统自编码器结构对称的特点,在4层LSTM层组成的模型中,使用第二层LSTM层将输入样本特征降维至低维空间,前2层LSTM层的作用是逐步将数据量压缩,避免直接降维导致特征大量丢失,后2层LSTM层通过将数据扩充实现重构。为了保证在降维的同时实现数据量的压缩,第二层LSTM层神经元数量需小于前一层LSTM层的神经元数,在此条件下,通过改变第二层LSTM层的神经元数,特征降维后所保留的特征产生了变化,因此具有构建多个不同识别效果的LSTM-AE模型的可能。构建第二层LSTM层神经元数为2~15个、其他参数均相同的14个LSTM-AE模型,对所有LSTM-AE模型进行训练,并根据重构得分筛选出基识别器,重构得分高的前6个LSTM-AE模型的重构结果见表1。从表1可以看出,当神经元数量为12与11时,模型性能最好。因此,优先选择神经元数量为12与11的LSTM-AE模型进行集成。
表 1 不同神经元数量LSTM-AE模型重构结果的对比Table 1. Comparison of reconstruction performance of LSTM-AE with different numbers of neurons序号 LSTM层神经元数 误差阈值 重构得分 1 12 0.019 3.95 2 11 0.045 3.05 3 4 0.060 2.74 4 3 0.071 2.57 5 6 0.074 2.51 6 15 0.076 2.49 3.2 集成结果与对比分析
3.2.1 评价指标
采用准确率、误报率和漏报率对模型性能进行评估[21]。此外,采用查准率、查全率比较本文方法与其他智能方法的性能,计算公式分别为:
{{ P }} = \frac{{{N_{{\mathrm{TP}}}}}}{{{N_{{\mathrm{TP}}}} + {N_{{\mathrm{FP}}}}}} (17) {{ R }} = \frac{{{N_{{\mathrm{TP}}}}}}{{{N_{{\mathrm{TP}}}} + {N_{{\mathrm{FN}}}}}} (18) 式中:P为查准率;R为查全率;
{N_{{\mathrm{TP}}}} 为实际为井漏且判别为井漏的样本数;{N_{{\mathrm{TN}}}} 为实际为正常且判别为正常的样本数;{N_{{\mathrm{FP}}}} 为实际为正常但判别为井漏的样本数;{N_{{\mathrm{FP}}}} 为实际为井漏但判别为正常的样本数。3.2.2 集成结果与对比试验
根据重构得分的高低,优先选取重构得分较高的LSTM-AE模型作为基识别器,基识别器数量过多时,集成后的模型会包含重构效果不好的基识别器,最终识别的准确率不会有提升,所以选取2~6个基识别器进行集成测试。对效果最好的单一基识别器模型与不同个数基识别器集成的LSTM-AE模型的漏报率、误报率、准确率进行对比,结果如图4所示。基识别器数量过多时,漏报率较高,导致识别准确率下降;基识别器数量为3时,集成效果最好,准确率达到了94.7%,与识别效果最好的单一基识别器相比,准确率提高了4.6 百分点。
为了进一步评估本模型的性能,选取4种智能识别方法与集成LSTM-AE模型进行对比,结果见表2。由表2可知,在样本数量不平衡的条件下,SVM等井漏识别方法趋向于把测试样本划分为正常样本,尽管误报率略低,但查全率、准确率均低于集成后LSTM-AE模型,验证了井漏样本不足条件下本文方法的有效性。
表 2 不同模型井漏识别结果的对比Table 2. Comparison of lost circulation recognition results of different models方法 误报率,% 查全率,% 查准率,% 准确率,% 集成LSTM-AE 2.6 97.1 92.3 94.7 LSTM 3.9 95.8 90.3 93.4 SVM 1.0 98.7 79.0 89.0 随机森林 1.4 98.8 85.1 92.0 决策树 7.8 91.0 82.6 87.4 3.2.3 案例分析
根据某井的记录日志,该井发生井漏前后监测参数的变化如图5所示,现场于78 min即监测到此井钻井液池中钻井液的体积减少了1.0 m3,给出了井漏报警。
选择得分最高的3个LSTM-AE模型作为基识别器,采用各基识别器与集成后的模型对图5中井漏样本进行识别,结果如图6所示(图6中,绿线与红线分别为现场标定的正常钻进状态与发生井漏的时间段),现场报警时间在第58 min。
从图6可以看出,基识别器1的重构误差于46 min超出阈值,给出风险报警,比现场记录的报警时间提前了12 min,但该模型对参数变化过于敏感,在27~35 min时出现了误报;基识别器2未出现误报的情况,于55 min给出预警,比现场记录的报警时间提前了3 min;基识别器3于48 min报警,但随后出现漏报的情况,表明该模型对监测参数的异常变化不够敏感;集成LSTM-AE未出现误报与漏报的情况,于48 min给出预警,比现场记录的报警时间提前了10 min。可见,集成后的模型在能够及时给出风险预警的同时,还能够减少误报的情况,实现了各基识别器的优势结合。
4. 结论与建议
1)针对因井漏样本数量少导致的传统智能模型识别准确率低的问题,提出了基于集成LSTM-AE的井漏智能识别方法,能够实现对正常样本与井漏样本的区分。与单一模型相比,集成LSTM-AE模型能够有效降低误报率和漏报率。
2)集成LSTM-AE模型的识别准确率优于LSTM、SVM等方法的识别结果,验证了集成LSTM-AE模型在井漏样本数量不足条件下对井漏识别的有效性。
3)井漏发生时,往往伴随着多个钻井参数的联动变化,建议后续通过优选监测参数,进一步提升LSTM-AE模型对井漏的识别准确率。
-
期刊类型引用(17)
1. Wendong Yang,Xiang Zhang,Bingqi Wang,Jun Yao,Pathegama G.Ranjith. Experimental study on the physical and mechanical properties of carbonatite rocks under high confining pressure after thermal treatment. Deep Underground Science and Engineering. 2025(01): 105-118 . 必应学术
2. 范翔宇,蒙承,张千贵,马天寿,李柱正,王旭东,张惊喆,赵鹏斐,邓健,周桂全. 超深地层井壁失稳理论与控制技术研究进展. 天然气工业. 2024(01): 159-176 . 百度学术
3. 黄崇辉,石广远,范东阳,全美荣,黄世强,蔡敬耀,郝鹏. 耐高温型聚合物压裂液体系研制与性能评价. 油气田地面工程. 2024(03): 36-41+48 . 百度学术
4. 仇常凯,蒋凯,王兵. 克拉苏构造带超深盐下大斜度井钻井关键技术. 石油钻采工艺. 2024(01): 45-52 . 百度学术
5. 闫家,梁健,王文,王瑜,张凯,张恒春,曹龙龙,吴纪修,王志刚. 深井高速涡轮钻配套同径取心技术研究. 钻探工程. 2024(04): 23-30 . 百度学术
6. 王春华,孙则鑫,丁扬扬,王立朝,许博文,张海涛,王昶皓. 塔东区块庆玉1井超深井优快钻井技术. 石油矿场机械. 2024(05): 59-65 . 百度学术
7. 徐力群,李洪涛,杨桃,杜河山,邹林兵. 控压放水技术在超高压超强蠕变软泥岩钻井中的应用. 石油工业技术监督. 2024(10): 43-47 . 百度学术
8. 翁炜,吴烁,贺云超,蔺文静,冯美贵,甘浩男,李晓东. 高温硬岩受控钻进新技术、新方法及应用. 地学前缘. 2024(06): 120-129 . 百度学术
9. 崔富凯,曹宇光,倪红坚,张恒. 基于冲击振动疲劳分析的自动垂钻与多维减振联合提速系统冲击频率优选. 中国科技论文. 2023(04): 443-448+468 . 百度学术
10. 刘湘华. 基于正交试验法的高温封隔器镶齿卡瓦优化. 石油机械. 2023(07): 96-103 . 百度学术
11. 杨宏伟,李军,刘金璐,柳贡慧,高旭,赵轩刚. 影响控压放水施工效果的关键参数模拟研究. 石油钻探技术. 2022(02): 85-91 . 本站查看
12. 赵欣,孙昊,邱正松,黄维安,徐加放,钟汉毅. 复合盐层多元协同稳定井壁钻井液技术. 深圳大学学报(理工版). 2022(06): 668-674 . 百度学术
13. 滕学清,刘洪涛,李宁,王天博,汝大军,董仁. 塔里木博孜区块超深井自动垂直钻井难点与技术对策. 石油钻探技术. 2021(01): 11-15 . 本站查看
14. 周建平,杨战伟,徐敏杰,王丽伟,姚茂堂,高莹. 工业氯化钙加重胍胶压裂液体系研究与现场试验. 石油钻探技术. 2021(02): 96-101 . 本站查看
15. 宗世玉,邹林兵,史方,苗冬,杨桃,王卫阳. 塔里木盆地库车山前盐膏层钻井技术应用. 石油工业技术监督. 2021(10): 14-16+29 . 百度学术
16. 王涛,和鹏飞,宫吉泽,葛俊瑞. 东海深井超深井定向钻完井关键技术. 石油钻采工艺. 2020(05): 578-582 . 百度学术
17. 马鸿彦,郑邦贤,陈景旺,郭劲松,宋晓健,李和清. 杨税务潜山超深超高温井安全优快钻井技术. 石油钻采工艺. 2020(05): 573-577 . 百度学术
其他类型引用(5)
计量
- 文章访问数: 2984
- HTML全文浏览量: 34
- PDF下载量: 2997
- 被引次数: 22