2. 中海石油天津分公司渤海石油研究院, 天津 300452;
3. 中国石化东北油气分公司开发处, 吉林长春 130062
2. Tianjin Bohai Oilfield Institute, CNOOC, Tianjin, 300452, China;
3. Department of Field Development, Sinopec Northeast Oil & Gas Company, Changchun, Jilin, 130062, China
CO2驱油技术在国外已是一项比较成熟的提高采收率技术,国外多以CO2混相驱为主,而国内油田多为陆相沉积,胶质、沥青质含量较高,造成CO2混相压力较高,CO2在地层中难以达到混相。目前国内已实施的CO2驱项目以CO2非混相驱为主[1,2,3]。同时,国内油田无论在地质条件上还是管理模式上都与国外油田有很大区别,盲目利用国外CO2驱效果预测方法对国内油田CO2非混相驱进行效果预测存在很多问题。因此,对CO2非混相驱效果预测方法开展深入研究具有十分重要的意义。目前关于CO2非混相驱效果预测方面的研究较少。2011年王涛[4]在考虑油藏地质因素的基础上利用人工神经网络方法对CO2驱的采收率进行了预测,并与数值模拟结果进行了对比,虽取得了不错的效果,但人工神经网络方法训练样本较少时容易出现过度拟合以及陷入局部最优等问题。2012年吴晓东等人[5]采用数值模拟手段,借鉴Vogel建立溶解气驱油井产能方程的方法建立了CO2驱油井的产能预测模型,该模型仅从地质角度出发对CO2驱的效果进行预测。总的来说,以上两种方法均主要针对CO2混相驱效果进行预测,对CO2非混相驱情况考虑较少。支持向量机拥有可靠的数学理论基础,它不仅简单易行,而且可以有效避免机器学习中常见的大数定律及局部最优等问题,是一种支持小样本、非线性数据的机器学习方法。近年来,随着支持向量机理论的发展,它在解决函数拟合、数据预测等方面的问题时所展现出的诸多优点逐渐引起了石油工作者的关注,并被逐步应用到石油勘探、储层识别、产量预测等方面[6,7,8,9,10,11,12,13,14]。为此,笔者考虑影响CO2非混相驱效果的油藏地质因素及工程因素,结合国内已实施CO2非混相驱项目的实际效果,建立了一种基于支持向量机的CO2非混相驱效果预测方法。
1 支持向量机方法的原理 1.1 支持向量机的基本理论1995年V.Vapnik等人[15]第一次提出了支持向量机(support vector machine,SVM)理论,其在解决小样本以及非线性等问题中具有许多其他算法所不具备的优势,并且支持向量机理论在函数拟合、数据预测等一些其他机器学习问题中进行了推广应用。统计学习理论作为支持向量机的理论基础,可以使支持向量机理论有效避免大数定律、概率测度等一些一直困扰机器学习方法的问题,从而形成一套针对小样本数据问题的全新理论体系。同时,统计学习理论还提供了一个解决有限样本学习问题的统一构架,可以有效避免人工神经网络等其他机器学习方法中常出现的局部最小、过学习和欠学习、网络结构选择等问题。支持向量机在模型训练过程中采用了升维处理和线性化的思想,即在训练过程中通过对样本数据进行升维处理以求寻找到一个既具有一定分类精度,又在平面两侧拥有最大空白区域的超平面,从而在理论上实现对线性可分数据的最优分类。
1.2 支持向量机回归模型将支持向量机用于解决回归问题称为支持向量机回归,支持向量机回归包括线性回归和非线性回归两种形式。对于支持向量机线性回归,当给定样本集S={(xi,yi)}(i=1,2,…,N)以及大于0的允许误差ε后,在原始空间Rn中存在一个超平面f(x)=(ω,x)+b(ω∈Rn,b∈Rn),使样本集S中任意样本(xi,yi)满足|yi-f(xi)|≤ε((xi,yi)∈S)。对于支持向量机非线性回归,当在原始空间Rn中,不能将给定的样本集S线性分离时,则需要将样本集S中的数据通过一个非线性映射φ(x)=(φ1(x),φ2(x),…,φn(x),…)映射到另一个高维特征空间H中进行处理,使映射后的φ(x)在高维特征空间H中可以实现线性回归,然后再将在特征空间H中回归后的φ(S)返回到原始空间Rn中。支持向量机非线性回归的对偶优化问题的具体算法为:
式中:αi和α*i为每个样本对应的Lagrange乘子对;ε为允许误差;(xi,yi)为给定的样本;C为惩罚因子,C值越大则对拟合出现偏差的惩罚越大;K(xi,xj)为引入到SVM算法中的核函数。常见的核函数有Linear核函数、Polynomial核函数、Radial basis function(RBF)核函数和Sigmoid核函数,其表达式分别为:
核函数可以通过选择满足Mercer定理的函数来确定。通过核函数可以避免计算非线性映射φ,从而使函数回归过程绕过特征空间而直接在输入空间上求取。所以,支持向量机非线性回归问题的具体求解步骤为:
1 ) 选择合适的核函数,使K(xi,xj)=〈φ(xi),φ(xj)〉;
2) 对非线性回归的对偶优化问题(式(1))进行求解,得到αi,α*i;
3 ) 用下式计算b:
4) 构造非线性回归函数:
2 支持向量机预测模型的建立 2.1 影响因素的确定影响CO2非混相驱效果的因素有很多,主要分为地质因素和工程因素。经过对国内油田CO2非混相驱项目资料的整理分析,并结合前人经验[16,17,18], 最终选取剩余地层压力与混相压力之比(p/pmm)、孔隙度、渗透率、油藏中深、地层平均有效厚度、地层温度、原油相对密度、含油饱和度、原油黏度、渗透率变异系数、注采比、注入速度和水气交替注入比等13个因素作为SVM模型的输入参数,选取试验区平均单井日增油量作为SVM模型的输出参数。
2.2 模型的建立目前国内大多数油田CO2非混相驱还处于现场试验阶段,还未进行大规模应用。笔者将搜集到的国内10个CO2驱项目的基本参数作为CO2非混相驱效果预测样本集(见表 1),其中8个项目为CO2非混相驱项目。CO2在原油中的混相程度是影响CO2驱效果的首要因素,为使所建模型能够充分考虑混相程度对CO2非混相驱效果的影响,特在预测样本集中引入了2个CO2混相驱项目(濮城油田和草舍油田),使模型在训练及检验过程中充分考虑混相程度的影响,以提高模型预测的准确性。选取表 1中前7个样本作为学习样本,用以建立SVM模型,选取另外3个样本作为测试样本,以检验所建SVM模型的准确性。
试验区 | 平均单 井日增 油/t | p/pmm | 渗透率/ mD | 孔隙度, % | 油藏中 深/m | 地层温 度/℃ | 原油 黏度/ (mPa·s) | 平均有效 厚度/m | 密度/(g ·cm-3) | 含油饱 和度,% | 渗透率 变异系数 | 注采比 | 注入速 度/(t ·d-1) | 水气交替 注入比 |
芳48 | 0.60 | 0.703 4 | 1.40 | 12.80 | 1 880 | 85.9 | 6.60 | 9.2 | 0.815 0 | 50.0 | 0.746 7 | 0.200 0 | 50.00 | 0 |
红87-2 | 0.20 | 0.706 9 | 0.24 | 9.40 | 2 200 | 98.0 | 1.76 | 12.4 | 0.836 3 | 54.0 | 0.754 0 | 0.250 0 | 40.00 | 0 |
储家楼 | 0.96 | 0.834 4 | 241.00 | 21.30 | 2 850 | 104.0 | 3.58 | 15.0 | 0.796 6 | 35.0 | 0.980 0 | 0.333 3 | 64.11 | 1.00 |
树101 | 1.50 | 0.787 5 | 1.06 | 10.65 | 2 120 | 108.0 | 3.60 | 10.3 | 0.855 4 | 53.2 | 0.800 0 | 0.533 3 | 50.00 | 0 |
高89-4 | 2.40 | 0.801 7 | 4.70 | 12.50 | 2 900 | 126.0 | 1.59 | 10.6 | 0.738 6 | 62.5 | 0.765 5 | 0.166 7 | 47.50 | 0 |
草舍 | 2.20 | 1.092 7 | 24.77 | 14.08 | 3 020 | 119.0 | 12.83 | 17.0 | 0.810 0 | 51.9 | 0.980 0 | 0.500 0 | 25.00 | 0 |
黑59 | 2.50 | 0.896 9 | 4.50 | 14.00 | 2 450 | 98.9 | 8.30 | 7.2 | 0.854 6 | 53.8 | 0.810 0 | 0.263 2 | 35.00 | 0 |
濮城 | 2.10 | 1.093 4 | 361.00 | 25.80 | 2 493 | 82.5 | 1.82 | 4.4 | 0.858 0 | 43.3 | 0.800 0 | 0.250 0 | 40.00 | 1.37 |
富14 | 1.14 | 0.967 6 | 854.00 | 23.40 | 2 090 | 76.0 | 2.43 | 6.1 | 0.820 0 | 36.0 | 0.746 7 | 0.142 9 | 45.87 | 1.28 |
萨南(葡) | 0.83 | 0.573 2 | 1 628.00 | 27.60 | 1 140 | 49.0 | 9.80 | 9.2 | 0.868 0 | 49.6 | 0.610 0 | 0.444 4 | 112.00 | 3.00 |
为了避免不同因素的量纲对SVM输出结果的影响,需对每个影响因素的数据进行归一化处理,归一化公式为:
式中:R′为归一化后的试验区参数;Ri为试验区i因素的属性值;Rimax为试验区i因素在n个样本中的最大值。选取前7组数据进行SVM模型训练,利用濮城、富14、萨南3个试验区的数据进行检验。
以均方差(mean squared error,MSE)作为评定各CO2驱项目相对误差的指标,均方差的计算式为:
利用Matlab软件的Libsvm-FarutoUltimate工具箱对SVM模型进行训练。训练时使用ε-SVR函数模型,核函数选用RBF核函数。ε-SVR模型的建立过程实际上是对模型中所涉及参数的寻优过程,训练的主要参数为惩罚因子C、核函数的宽度参数γ和控制误差ε。目前并没有统一的参数训练方法,主要的训练方法有经验法[12]、网格搜索法[13,14]、贝叶斯框架法[19]等。笔者在训练过程中利用遗传算法对模型中涉及到的参数进行优化,具体方法为[20]:
1 ) 设定允许控制误差ε的大小,并根据经验选定惩罚因子C和核函数宽度参数γ的变化范围;
2) 利用遗传算法优选范围内的C和γ,使用优选后的C和γ对支持向量机模型进行训练并对检验样本进行预测,最终选择预测精度最高的一组C和γ;
3 ) 缩小C和γ的变化范围重复步骤2);
4) 继续缩小C和γ的变化范围,直至得到最优的模型参数。
在利用遗传算法进行优化寻优的过程中,将均方差作为个体的适应度来进行评价。经过不断尝试,最终得到的最优惩罚因子C为21.956 8,最优的γ为0.319 96,控制误差为0.01。
利用训练好的SVM模型对训练样本进行拟合检验,结果如图 1所示。
从图 1可以看出,训练样本数据预测点与样本点非常接近,误差均在2%以内,表明预测值与样本值符合程度较好,体现出SVM具有较强的学习能力。
利用优化的参数建立SVM模型对濮城、富14、萨南等3个试验区的平均单井日增油量进行预测,结果见表 2。
试验区 | 平均增油量/(t·d-1) | 相对误差,% | |
实测 | 预测 | ||
注:C=21.956 8,γ=0.319 96,ε=0.01。 | |||
濮城 | 2.10 | 2.2161 | 5.53 |
富14 | 1.14 | 1.171 6 | 2.77 |
萨南 | 0.83 | 0.899 9 | 8.42 |
由表 2可知,预测结果与实测结果最大相对误差为8.42%,最小相对误差为2.77%,平均相对误差5.57%,符合CO2非混相驱效果预测要求,说明利用支持向量机方法对CO2非混相驱效果进行预测是可行的。
最优惩罚因子C的选择对SVM模型的准确程度影响很大,若C取值过大,对训练样本的拟合效果很好,但是对新样本的泛化能力较差,此时会发生严重的过学习现象;若C取值很小,会发生严重的欠学习现象。所以,在不影响预测精度的前提下,训练过程中应使C尽量小,以保证训练的支持向量机模型具有一定的泛化能力[15]。目前支持向量机模型训练过程中对C的取值范围并没有明确规定,经调研发现,应用于不同研究领域中支持向量机模型的C多处于20~1 000,上文所建立SVM模型的最终优选惩罚因子C较小,为21.956 8,可以说明上文所建立的CO2非混相驱效果预测SVM模型在保证预测精度符合要求的前提下,预测的结果具有一定的普遍性。
3 现场试验效果预测腰英台油田为低孔隙、特低渗透油藏,平均渗透率1.9 mD,孔隙度12.1%,储层原始含水饱和度较高,油水同层发育,油井自然产能低,水驱采收率仅9.9%[21]。腰英台油田腰西区块CO2非混相驱试验区平均油藏深度2 020 m,平均有效厚度5.5 m,地层温度97.8 ℃,原油黏度1.91 mPa·s,原油相对密度0.78,渗透率变异系数0.92,试验区注气前含油饱和度41%,地层压力8.9 MPa。经试验测定该区块CO2混相压力为26.63 MPa,地层压力与混相压力之比为0.33,属于CO2非混相驱。2011年4月腰英台油田DB33井区第一批试验井组(前5排)开始实施CO2非混相驱,试验区共有采油井30口,注气井7口,注入速度47.5 t/d,分别实施2种CO2注入方式,其中2口注入井按水气比1∶1交替注入,其余5口注入井连续注入CO2,2012年8月后2口交替注入井转为连续注水井,连续注CO2井转为水气交替注入井,水气注入比1∶1。
第一批试验井组水驱产油量符合指数递减规律(见图 2),递减指数n=0.5。截至2013年11月30日,试验区CO2非混相驱累计采油960 d,与水驱相比累计增油12 669.21 t,平均单井日增油0.440 t。
将DB33井区前5排井组CO2非混相驱的参数输入到训练好的SVM模型中,对DB33井区前5排井组CO2非混相驱平均单井日增油量进行预测,结果为0.445 7 t,与实际平均单井日增油量相比,相对误差仅为1.30%,说明利用支持向量机方法对CO2非混相驱效果进行预测具有可行性和有效性。
4 结论及建议1) 基于支持向量机的CO2非混相驱油效果预测方法的预测精度高、简单且具有普遍性,可以有效预测CO2非混相驱效果。
2 ) CO2非混相驱油效果受诸多因素影响,要得到更加准确的预测效果,需要对影响CO2非混相驱效果的因素进行详细分析,以便为建立预测模型时确定影响因素提供依据。
[1] |
祝春生,程林松.低渗透油藏CO2驱提高原油采收率评价研究[J].钻采工艺,2007,30(6):55-57,60. Zhu Chunsheng,Cheng Linsong.Research on CO2 flooding in low permeability reservoir[J].Drilling & Production Technology,2007,30(6):55-57,60. |
[2] |
唐人选,唐小立,秦红祥.注CO2混相驱油藏合理采收率确定[J].石油钻探技术,2012,40(3):112-115. Tang Renxuan,Tang Xiaoli,Qin Hongxiang.Determination of reasonable recovery ratio with CO2 miscible flooding in reservoir[J].Petroleum Drilling Techniques,2012,40(3):112-115. |
[3] | Yin D,Li Y,Zhao D,et al.Long core simulation of advanced CO2 injection in ultra-low permeability reservoir:the Fifth International Conference on Computational and Information Sciences,Shiyang,June 21-23,2013[C]. |
[4] |
王涛.人工神经网络在CO2驱采收率预测中的应用[J].特种油气藏,2011,18(4):77-79. Wang Tao.Application of artificial neural network in recovery factor forecast of carbon dioxide flooding[J].Special Oil & Gas Reservoirs,2011,18(4):77-79. |
[5] |
吴晓东,尚庆华,刘长宇,等.一种CO2驱油井产能预测方法及其应用[J].石油钻采工艺,2012,34(1):72-74. Wu Xiaodong,Shang Qinghua,Liu Changyu,et al.A productivity prediction method for CO2 flooding well and its application[J].Oil Drilling & Production Technology,2012,34(1):72-74. |
[6] |
肖京男,汪志明,魏建光,等.改进LSSVM在水平井产能预测中的应用[J].石油钻探技术,2010,38(6):95-98. Xiao Jingnan,Wang Zhiming,Wei Jianguang,et al.Application of LSSVM improved horizontal well productivity prediction[J].Petroleum Drilling Techniques,2010,38(6):95-98. |
[7] |
郭永恒.随钻测井曲线预测及更新方法研究[J].石油钻探技术,2010,38(6):25-28. Guo Yongheng.Prediction and update of LWD curve while drilling[J].Petroleum Drilling Techniques,2010,38(6):25-28. |
[8] |
钟仪华,张志银,朱海双.特高含水期油田产量预测新方法[J].断块油气田,2011,18(5):641-644. Zhong Yihua,Zhang Zhiyin,Zhu Haishuang.A new method to predict production of oilfields in ultrahigh water-cut stage[J].Fault-Block Oil & Field,20l1,18 (5):641-644. |
[9] |
白晓虎,姜汉桥,王硕亮,等.油田开发动态指标多步预测模型研究[J].断块油气田,2010,17(3):345-347. Bai Xiaohu,Jiang Hanqiao,Wang Shuoliang,et al.Multi-step forecasting model of dynamic index for oilfield development[J].Fault-Block Oil & Field,20l0,17 (3):345-347. |
[10] |
陈民锋,白晓虎,郑伟,等.基于支持向量机的早期聚合物驱动态预测研究[J].断块油气田,2012,19(2):199-202. Chen Minfeng,Bai Xiaohu,Zheng Wei,et al.Development index prediction of early polymer flooding based on support vector machine[J].Fault-Block Oil & Field,20l2,19 (2):199-202. |
[11] |
肖冬生,乔东生.低阻油层识别新方法及其应用[J].断块油气田,2010,17(4):509-512. Xiao Dongsheng,Qiao Dongsheng.New method for identifying low resistivity reservoirs and its application[J].Fault-Block Oil & Field,20l0,17 (4):509-512. |
[12] |
袁士宝,蒋海岩,鲍丙生,等.基于支持向量机的火烧油层效果预测[J].石油勘探与开发,2007,34(1):104-107. Yuan Shibao,Jiang Haiyan,Bao Bingsheng,et al.Effect prediction of in-situ combustion based on support vector machine[J].Petroleum Exploration and Development,2007,34(1):104-107. |
[13] |
李春锦,闫云聚.基于支持向量机的中国石油需求量预测研究[J].西安石油大学学报:自然科学版,2013,28(2):103-106. Li Chunjin,Yan Yunju.Prediction of China's oil demand based on support vector machine[J].Journal of Xi'an Shiyou University:Natural Science,2013,28(2):103-106. |
[14] |
杨磊,王化增,陈子凌.基于支持向量机的油气储量价值等级评价[J].中国石油大学学报:自然科学版,2012,36(3):192-196. Yang Lei,Wang Huazeng,Chen Ziling.Assessing value classification of oil and gas reserve based on support vector machine[J].Journal of China University of Petroleum:Edition of Natural Science,2012,36(3):192-196. |
[15] | Vapnik V.The nature of statistical learning theory[M].New York:Springer Verlag,1995. |
[16] |
郑云川.注气提高采收率候选油藏筛选方法及其应用研究[D].南充:西南石油学院石油工程学院,2003. Zheng Yunchuan.Gas injection EOR screening candidate reservoirs method and its application [D].Nanchong:Southwest Petroleum Institute,School of Petroleum Engineering,2003. |
[17] | Rivas O,Embid S,Bolvar F.Ranking reservoirs for carbon dioxide flooding processes[R].SPE 23641,1994. |
[18] |
雷怀彦,龚承林,官宝聪.注CO2混相驱油藏筛选新方法[J].中国石油大学学报:自然科学版,2008,32(1):72-76. Lei Huaiyan,Gong Chenglin,Guan Baocong.New screening method for reservoir by CO2 injection miscible flooding[J].Journal of China University of Petroleum:Edition of Natural Science,2008,32(1):72-76. |
[19] |
杨佳佳,姜琦刚,陈永良,等.基于最小二乘支持向量机和高分辨率遥感影像的大尺度区域岩性划分[J].中国石油大学学报:自然科学版,2012,36(1):60-67. Yang Jiajia,Jiang Qigang,Chen Yongliang,et al.Lithology division for large-scale region segmentation based on LS-SVM and high resolution remote sensing images[J].Journal of China University of Petroleum:Edition of Natural Science,2012,36(1):60-67. |
[20] | Talbi H,Draa A,Batouche M.A new quantum-inspired genetic algorithm for solving the traveling salesman problem[C]// Proceedings of the IEEE International Conference on Industrial Technology,2004.[S.L.]:IEEE,2004:1192-1197. |
[21] |
廖海婴.腰英台DB34井区CO2驱替油藏数值模拟研究[J].西安石油大学学报:自然科学版,2010,25(5):50-53. Liao Haiying.Numerical simulation of oil displacement with carbon dioxide in DB34 well block,Yaoyingtai Oilfield[J].Journal of Xi'an Shiyou University:Natural Science,2010,25(5):50-53. |