1 s2.0 S092041052100499X Main

Machine Translated by Google
Tạp chí Khoa học và Kỹ thuật Dầu khí 205 (2021) 108838
Danh sách nội dung có sẵn tại ScienceDirect
Tạp chí Khoa học và Kỹ thuật Dầu khí
trang chủ tạp chí: www.elsevier.com/locate/petrol
Mạng thần kinh lai CNN-BiLSTM với cơ chế chú ý để dự đoán nhật ký giếng
b
, Diêm Trường Lưu , Mân Đường
Một Một Một
Liqun Shan a,* , Minh Dương , Tuyết Viễn Bạch
Một
Đại học Dầu khí Đông Bắc, Đại Khánh, Trung Quốc
b
Đại học bang Westfield, Westfield, Hoa Kỳ
THÔNG TIN BÀI VIẾT TRỪU TƯỢNG
Từ khóa: Khai thác giếng là một phương pháp quan trọng để mô tả sự hình thành và đánh giá tài nguyên trong thăm dò và
nhật ký giếng phát triển dầu, khí tự nhiên, khoáng sản, nước ngầm và năng lượng nhiệt dưới bề mặt, cũng như nghiên cứu địa
CNN
kỹ thuật và môi trường. Tuy nhiên, vấn đề thiếu hụt dữ liệu ghi nhật ký giếng luôn tồn tại vì nhật ký giếng chỉ
BiLSTM
có thể được đo thông qua quá trình khoan bao gồm các thử nghiệm thực địa tốn kém và tốn thời gian. Để giải quyết
Cơ chế chú ý
vấn đề này, bộ nhớ ngắn hạn dài hai chiều (BiLSTM), cơ chế chú ý và mạng thần kinh chuyển đổi (CNN) đã được
Sự dự đoán
kết hợp để xây dựng mạng thần kinh lai nhằm dự đoán các nhật ký giếng bị thiếu.
Kiến trúc được đề xuất là một cấu trúc gồm hai nhánh. Một nhánh sử dụng CNN để nắm bắt các đặc tính không gian
của nhật ký giếng và nhánh còn lại tiến hành lựa chọn tính năng bằng cách sử dụng BiLSTM hai lớp với cơ chế chú
ý. Các mối tương quan không gian-thời gian từ hai nhánh được hợp nhất để dự báo nhật ký giếng mục tiêu. Hiệu
suất của phương pháp đề xuất được đánh giá trong một bể chứa rất không đồng nhất tại mỏ dầu Gangdong ở Trung
Quốc. Trong các thí nghiệm của chúng tôi, sáu mô hình đã được đào tạo và sử dụng để tạo ra các bản ghi giếng
tổng hợp bao gồm các bản ghi neutron bù (CNL), âm thanh (AC), thế tự phát (SP), tia gamma (GR), mật độ (DEN) và
điện trở suất hình thành ( RT). Hơn nữa, các mô hình học máy truyền thống, CNN, BiLSTM và các mô hình điểm chuẩn
học sâu khác đã được phát triển để so sánh với các mô hình đã trình bày. Kết quả cho thấy phương pháp đề xuất
đạt được độ chính xác dự đoán cao hơn vì nó tính đến thông tin không gian-thời gian của nhật ký giếng.
1. Giới thiệu Gowida và cộng sự, 2019, 2020; Ông và cộng sự, 2020; Onalo và cộng sự, 2018;
Santoso và cộng sự, 2019). Chun và cộng sự. cung cấp một cách tiếp cận hợp lý để
Việc khai thác giếng ghi lại hoạt động hình thành địa chất dọc theo lỗ khoan dự báo các đường cong ghi nhật ký độ thấm và độ xốp từ các bản ghi giếng hiện có
(Avseth và cộng sự, 2013; Chang và cộng sự, 1997; Feng và cộng sự, 2018). Điều cực bằng cách xây dựng mô hình mạng lưới thần kinh lan truyền ngược (BPNN) (Fung và
kỳ quan trọng là thu được các quan sát ghi nhật ký giếng để thiết lập các mô hình WongEren, 1997). Để nâng cao hiệu suất dự đoán, thuật toán di truyền đã được giới
địa chất chính xác, mô tả các đặc tính hình thành và dòng chảy của một hồ chứa, thiệu để tối ưu hóa các siêu tham số của mạng thần kinh nhân tạo (ANN) để tái
cải thiện việc đánh giá hồ chứa và tăng cường các chiến lược thời gian thực để thiết nhật ký tốt (Mo và cộng sự, 2015). Rolon và cộng sự. đã tạo ra các nhật ký
khoan, hoàn thiện và sản xuất giếng tối ưu ( Ellis và Singer, 2007; Obiora và giếng tổng hợp bằng cách sử dụng mạng thần kinh hồi quy chung (GRNN) và đạt được
cộng sự, 2016). Tuy nhiên, do hạn chế về chi phí hoặc vấn đề về lỗ khoan, đường hiệu suất tốt hơn bằng cách so sánh phương pháp được đề xuất với hồi quy bội
cong khai thác cụ thể có thể không được đo ở mọi giếng khoan hoặc có chất lượng (Rolon et al., 2009). Người ta đã chứng minh rằng nhiệm vụ dự đoán ghi nhật ký
kém dọc theo toàn bộ độ sâu giếng hoặc không có sẵn ở các khoảng độ sâu quan tâm. đặc biệt phù hợp với ANN. Tuy nhiên, ANN thông thường có một số thiếu sót đã biết
Chúng tôi mong muốn dự đoán các đường cong ghi nhật ký bị thiếu từ các nhật ký trong quá trình đào tạo, chẳng hạn như cực tiểu cục bộ kém, hiệu suất tổng quát
giếng có sẵn dựa trên các phương pháp học sâu. hóa kém và tốc độ hội tụ chậm, làm hạn chế hiệu suất dự đoán của nhật ký giếng
(Gharbi và Mansoori, 2005) .
Một số nghiên cứu đã cố gắng sử dụng công nghệ máy học để ước tính các nhật
ký giếng bị thiếu như nhật ký âm thanh (AC), nhật ký mật độ (DEN) và tia gamma
(GR) từ các nhật ký giếng có sẵn (Bukar et al., 2019 ; Để giải quyết những vấn đề này của ANN, mạng lưới niềm tin sâu sắc (DBN)
* Đồng tác giả.

Địa chỉ email: liqun.shan.liu@gmail.com (L. Sơn).
https://doi.org/10.1016/j.petrol.2021.108838 Nhận ngày
21 tháng 12 năm 2020; Nhận ở dạng sửa đổi ngày 20 tháng 3 năm 2021; Được chấp nhận ngày 15 tháng 4 năm 2021 Có
sẵn trực tuyến ngày 25 tháng 4 năm 2021
0920-4105/© 2021 Elsevier BV Mọi quyền được bảo lưu.

L. Shan và cộng sự.

lớp BiLSTM với cơ chế chú ý. Bởi vì BiLSTM có thể nắm bắt các phụ thuộc theo ngữ
cảnh hai hướng, BiLSTM có thể nắm bắt thông tin theo ngữ cảnh của nhật ký giếng
dọc theo độ sâu; tuy nhiên, nó không có khả năng trích xuất thông tin mong muốn
nhất từ thông tin ngữ cảnh đã thu thập. Việc trích xuất các tính năng lý tưởng
nhất có thể cải thiện độ chính xác của dự báo. Cơ chế chú ý được giới thiệu để
đặt ma trận trọng số chú ý nhằm thu được các tính năng mong muốn nhất từ thông tin
theo ngữ cảnh đã lấy. Hơn nữa, các mô hình học máy truyền thống, CNN, BiLSTM và
các mô hình điểm chuẩn học sâu khác đã được phát triển để so sánh với các mô hình
đã trình bày.
2. Phương pháp luận
Hình 1. Kiến trúc CNN 1-D điển hình. 2.1. Mạng lưới thần kinh tích chập (CNN)
phương pháp được giới thiệu để hiện thực hóa dự đoán log độ xốp (Duan et al., CNN là một mạng lưới thần kinh sâu nổi tiếng được đề xuất bởi LeCun (LeCun và
2018). DBN có những ưu điểm độc đáo trong việc khởi tạo ma trận trọng số của mạng cộng sự, 1989). CNN một chiều (1-D) được sử dụng trong nghiên cứu của chúng tôi
và có thể rút ngắn đáng kể thời gian đào tạo. Akin-nikawe và cộng sự. nhận thấy vì hạt tích chập chỉ quét dọc theo hướng sâu của đường cong ghi nhật ký (Cheng và
rằng rừng ngẫu nhiên (RF) vượt trội hơn ANN (Akin-nikawe et al., 2018). Họ đã sử cộng sự, 2020). Hình 1 minh họa kiến trúc của CNN 1-D điển hình. CNN bao gồm một
dụng ANN, máy vectơ hỗ trợ (SVR), rừng ngẫu nhiên (RF), cây quyết định (DT) và lớp tích chập, lớp tổng hợp và lớp được kết nối đầy đủ (Zang và cộng sự, 2020; Liu
tăng cường độ dốc (GB) để tạo dữ liệu ghi nhật ký thông thường từ nhật ký giếng và Guo, 2019).
hiện có. Ngoài ra, họ cũng dự đoán các đường cong ghi nhật ký độc đáo bao gồm nhật CNN nắm bắt các tính năng tiềm ẩn từ dữ liệu đầu vào bằng cách thực hiện các phép
ký cường độ nén không giới hạn (UCS) và nhật ký quang điện (PE) vì nhật ký USC cần toán tích chập và hoạt động gộp. Sau đó, các tính năng được trích xuất sẽ được
tiến hành các thí nghiệm lõi đắt tiền và nhật ký PE thường không được đo trong hợp nhất và đưa vào một lớp được kết nối đầy đủ. Cuối cùng, một số hàm kích hoạt
quá trình khoan. Sau khi so sánh các thuật toán này, họ kết luận rằng RF vượt trội được sử dụng để đưa tính phi tuyến vào đầu ra của nơ-ron.
hơn các thuật toán khác.
Lớp tích chập là một phần thiết yếu của CNN (Li và cộng sự, 2016).
Các phương pháp học máy truyền thống này có hiệu quả trong việc dự báo các đường Mỗi lớp tích chập sở hữu nhiều nhân tích chập, được tích hợp với thông tin đầu
cong ghi nhật ký giếng bị thiếu, nhưng chúng cần nhiều thời gian để tiến hành kỹ vào để nắm bắt các tính năng ẩn và hình thành bản đồ tính năng. Các bản đồ đặc
thuật tính năng để đạt được hiệu suất dự đoán tốt. trưng đi qua chức năng kích hoạt phi tuyến tính để tạo ra đầu ra của lớp chập.
Xét về những ưu điểm của deep learning (DL) trong trích xuất đặc trưng, Lớp tích chập có thể được biểu diễn như sau:
nhiều nhà nghiên cứu đã sử dụng các thuật toán DL, chẳng hạn như mạng nơ ron
perceptron nhiều lớp (MLP), mạng nơ ron tích chập (CNN), bộ nhớ ngắn hạn dài
ci = f(wi * xi + bi) (1)
(LSTM). ) và LSTM hai chiều (BiLSTM), để tạo ra các bản ghi giếng tổng hợp (Li và
cộng sự, 2019; Kim và cộng sự, 2020). Ouadfeul và Aliouane đã thực hiện MLP để dự quần què
trong đó xi biểu thị đầu vào của lớp chập. ci là tôi đầu ra
đoán trạng thái thạch từ dữ liệu nhật ký giếng (Ouadfeul và Aliouane, 2015). Kanfar *
bản đồ đặc trưng, wi là ma trận trọng đại diện cho sản phẩm chấm, bi là
và cộng sự. đã thiết kế một mô hình tích chập thời gian dựa trên sự khởi đầu để dự
số, vectơ thiên vị và f( ) đại diện cho hàm kích hoạt. Hàm đơn vị tuyến tính
báo nhật ký giếng trong quá trình khoan (Kanfar và cộng sự, 2020a). Phương pháp
được chỉnh lưu (ReLU) được lựa chọn rộng rãi làm hàm kích hoạt của CNN. Về mặt
của họ nhằm mục đích thu được cả thông tin tần số cao và tần số thấp của dữ liệu
toán học, ReLU được định nghĩa là:
khoan.
Các dự đoán dựa trên phương pháp của họ không chỉ nắm bắt các xu hướng địa chất ci = f(hi) = max(0, hi) (2)
mà còn giống hệt nhau về mặt vật lý về đặc điểm địa chất và nhật ký âm thanh. Mạng
DL được đề cập trước đây được phát triển để dự báo đường cong ghi nhật ký giếng trong đó hi là thành phần của bản đồ đặc trưng thu được từ các phép toán tích
có thể xử lý hiệu quả các thành phần dư thừa của nhật ký giếng. Tuy nhiên, CNN chỉ chập.
có thể tạo ánh xạ điểm-điểm từ các phép đo ghi nhật ký đầu vào đến các phép đo ghi Chức năng của hoạt động gộp là cắt giảm kích thước của bản đồ đặc trưng và
nhật ký đầu ra. ngăn chặn việc trang bị quá mức. Max pooling là một trong những phương pháp gộp
Tính chất của đá thường có xu hướng thay đổi theo độ sâu, điều này rất quan trọng được sử dụng nhiều nhất. Điều này được thực hiện bằng cách tính giá trị tối đa
trong nghiên cứu địa chất. của một khu vực được chỉ định trong bản đồ đặc trưng theo các phương trình. (3) và (4).
Mạng thần kinh tái phát (RNN) xem xét đầu vào bên trong từ bước trước và đầu
γ(ci, ci 1) = max(ci, ci 1) (3)
vào bên ngoài, do đó xu hướng thay đổi theo thời gian có thể được nắm bắt bằng kỹ
thuật RNN. Zhang và cộng sự. coi nhật ký giếng là một chuỗi dữ liệu và thiết kế mô (4)
pi = γ(ci, ci 1) + βi
hình bộ nhớ ngắn hạn dài (LSTM) (LSTM là một loại RNN) để dự đoán toàn bộ đường
cong khai thác giếng hoặc nhật ký giếng bị thiếu (Zhang và cộng sự, 2018) ; tuy trong đó γ( ) là hàm lấy mẫu con gộp tối đa. βi là độ lệch. pi biểu thị đầu ra
nhiên, mô hình không đánh giá thông tin hình dạng cục bộ của các bản ghi giếng. của lớp maxpooling. Cuối cùng, các bản đồ đặc trưng thu được thông qua các hoạt
Phạm và cộng sự. đã sử dụng LSTM hai chiều (BiLSTM) được tích hợp với các mạng động tích chập và gộp được đưa đến lớp được kết nối đầy đủ và sau đó lớp sẽ tính
thần kinh được kết nối đầy đủ để đưa ra dự đoán chính xác về nhật ký AC từ độ xốp toán vectơ đầu ra cuối cùng, như hiển thị bên dưới:
neutron, nhật ký GR và nhật ký DEN (Phạm và cộng sự, 2020). Phương pháp đề xuất
của họ cải thiện hiệu suất dự đoán bằng cách kết hợp hình dạng cục bộ của các bản
yi = f(tipi + δi) (5)
ghi giếng liên quan đến các mặt cắt địa chất khác nhau.
trong đó yi đại diện cho vectơ đầu ra cuối cùng, δi là độ lệch và ti là ma trận
Trong nghiên cứu này, chúng tôi mong muốn trích xuất các mối tương quan không
trọng số.
gian-thời gian từ các nhật ký hiện có để dự báo nhật ký giếng mục tiêu. Chúng tôi
phát triển một kiến trúc mới kết hợp CNN và BiLSTM với cơ chế chú ý để dự đoán
nhật ký chính xác. Kiến trúc mới này là một cấu trúc gồm hai nhánh. Một nhánh sử 2.2. Mạng LSTM hai chiều
dụng CNN để nắm bắt các đặc tính không gian của nhật ký giếng và nhánh còn lại
tiến hành lựa chọn tính năng bằng cách sử dụng hai- LSTM thông thường chỉ có thể sử dụng bối cảnh trước đó
2

2.3. Cơ chế chú ý
Gần đây, mạng lưới thần kinh dựa trên cơ chế chú ý đã chứng tỏ sự
thành công trong nhiều nhiệm vụ (Povey và cộng sự, 2018; Vaswani và
cộng sự, 2017; Shen và cộng sự, 2017). Trong mạng BiLSTM có cơ chế
chú ý, phương thức chú ý tận dụng trạng thái ô cuối cùng của BiLSTM
hoặc để căn chỉnh với trạng thái ô của đầu vào ở bước hiện tại bằng
cách sử dụng trạng thái ẩn của BiLSTM. Sau đó, mối tương quan giữa
trạng thái đầu ra và các trạng thái trung gian ứng viên này được tính
toán. Trong quá trình học, thông tin liên quan có thể được làm nổi
bật và thông tin không liên quan có thể bị loại bỏ để nâng cao tính
Hình 2. Kiến trúc của BiLSTM. chính xác và hiệu quả của dự đoán. Đầu ra A của lớp chú ý trong mạng
BiLSTM chú ý được hình thành theo các phương trình sau. (7)–(9):
(Hochreiter và Schmidhuber, 1997; Schuster và Paliwal, 1997). Để truy
cập thông tin tầm xa, Graves và Schmidhuber (2005) đã đề xuất LSTM hai
M = tính(Y) (7)
chiều (BiLSTM) để nắm bắt tốt hơn các phụ thuộc theo ngữ cảnh hai
hướng (Graves và Schmidhuber, 2005). Kiến trúc hai chiều có thể trích
α = softmax( wT
một M) (số 8)
xuất thông tin theo ngữ cảnh từ cả hai hướng cùng lúc với các lớp ẩn
phía trước và các lớp ẩn phía sau. Kiến trúc BiLSTM được hiển thị
A = YαT (9)
trong Hình 2.
Trong hình 2, ht và ht lần lượt là đầu ra của các lớp ẩn tiến và lùi. Đầu trong đó Y là ma trận và biểu thị các đặc điểm được mô hình BiLSTM
ra của lớp chuyển tiếp và các chuỗi ẩn được tính toán lặp lại bằng cách sử thu thập, chẳng hạn như ma trận Y = [y1, y2, …, yt] nêu trên . α
dụng các đầu vào theo trình tự có thứ tự từ bước 1 đến bước t, trong khi là một vectơ và biểu thị trọng số chú ý đối với các đối tượng Y.
đầu ra của lớp lùi và các chuỗi ẩn được lặp lại từ bước t đến 1. Đầu ra trận hệ số trọng số chuyển vị của lớp chú ý. wa là T biểu thị ma
của lớp chuyển tiếp và các chuỗi ẩn được lặp lại từ bước t đến 1. lớp chuyển tiếphoạt động.
và lớp lùi, ht và ht , được tính toán bằng LSTM tiêu chuẩn.

3. Mô hình lai CNN-BiLSTM-AT đề xuất và các chỉ số đánh giá
Lớp BiLSTM tạo ra một vectơ đầu ra, Y, trong đó mỗi phần tử được tính
toán theo biểu thức. (6).
Trong phần này, kiến trúc mô hình được sử dụng trong nghiên cứu này được mô tả
(6)
yt = σ ( ht, ̅ ht ) và bốn số liệu được chọn để đánh giá mô hình đề xuất.
trong đó hàm σ được sử dụng để ghép hai ht và ht trình tự. Hàm 3.1. Kiến trúc của mô hình CNN-BiLSTM-AT
σ có thể là hàm tính tổng, hàm nhân, hàm nối hoặc hàm trung bình.
Đầu ra cuối cùng của lớp BiLSTM có thể được biểu thị dưới dạng Bằng cách coi các giá trị của nhật ký giếng dọc theo độ sâu là các
vectơ, Y = [y1, y2,…, yt], trong đó phần tử cuối cùng, yt , là giá chuỗi có thứ tự, BiLSTM trở thành một phương pháp lý tưởng để xây dựng
trị ghi giếng dự báo cho độ sâu tiếp theo khi BiLSTM được sử dụng các đường cong ghi nhật ký giếng tổng hợp, bởi vì nó không chỉ có khả
để thực hiện dự đoán nhật ký tốt. năng thu thập thông tin từ một chuỗi dữ liệu mà còn truyền bá thông tin từ
Hình 3. Kiến trúc của CNN-BiLSTM-AT được đề xuất.
3
L. Shan và cộng sự. Tạp chí Khoa học và Kỹ thuật Dầu khí 205 (2021) 108838
Bảng 1
Đặc điểm của nhật ký giếng từ bộ dữ liệu.
CHIỀU SÂU CAL CN CNL CÁI HANG GR M2R1 M2R3 M2R6 M2R9
Nghĩa là 1300.288 22.402 36.165 39.862 2.224 90.402 3.273 3.425 3.477 3.513
tiêu chuẩn 298.499 0,500 5.647 7.010 0,091 12.298 1.859 1.917 1.963 1,992
Tối 783.375 21.303 16.368 18,195 1.961 55.203 1,527 1,559 1,575 1,602
thiểu 5% 835.063 21.65 27.950 30,37 2.046 67.888 1,823 1,936 1,955 1,973
25% 1041.813 22.046 32.09 34.917 2.176 83.509 2.173 2.305 2.329 2.353
50% 1300,25 22.385 35.472 38.708 2.238 91.384 2,534 2.703 2.742 2.769
75% 1558.813 22.684 39.766 43.876 2.286 98,36 3,534 3.756 3.823 3,855
95% 1765.563 23.231 46.356 52.813 2.353 109.518 7.584 7.605 7.710 7.818
Tối đa 1817,25 25.976 63.341 94.224 2,43 166.467 15.381 16.008 16.573 17.068
ML1 ML2 RA04 RA25 RA45 RMSL RT RXO SP AC
Nghĩa là 2.423 2,898 3.877 4.316 3.739 4.032 3,572 3.372 65.749 396.914
tiêu chuẩn 0,778 1.166 2.329 2.627 1.944 2.390 2.056 1.907 9.557 41.261
tối thiểu 1.517 1,585 1,795 1.960 1.830 2.137 1.608 1.543 43.250 266.685
5% 1.752 1.869 2.119 2.440 2.137 2.486 1,990 1.899 49.490 334.831
25% 1.977 2.163 2.488 2.833 2,513 2.774 2.378 2.258 60.049 366.640
50% 2.187 2.453 2.909 3.407 2.918 3.124 2.804 2.643 64.550 395.536
75% 2,554 3,204 4.199 4.672 4.155 4.239 3.923 3,681 72.593 424.391
95% 4,026 5,362 9.152 9.406 8.253 8.523 8.033 7,621 83.748 466.895
Tối đa 11.311 13:29 16.049 23.868 13.636 104.588 17,82 15.905 89.041 547.203
độ sâu liền kề với sự phụ thuộc độ sâu hạn. Đồng thời, giới thiệu đơn vị có 100 nơ-ron và chức năng kích hoạt softmax . Các tính năng
những ưu điểm của CNN và cơ chế chú ý trong việc trích xuất các đặc được trích xuất từ BiLSTM được đưa đến lớp chú ý, sau đó được thêm
trưng trừu tượng. Kiến trúc của phương pháp CNN-BiLSTM-AT được đề vào đầu ra của thiết bị được kết nối đầy đủ. Lớp chú ý được theo sau
xuất được minh họa trong Hình 3. Kiến trúc này là cấu trúc của hai bởi một đơn vị dày đặc. Đầu ra của lớp chú ý được chuyển đến đơn vị
nhánh, trong đó một nhánh sử dụng CNN để nắm bắt các thuộc tính của dày đặc có 100 nơ-ron.
nhật ký giếng và nhánh còn lại thực hiện các lựa chọn tính năng bằng Các đầu ra từ nhánh CNN và nhánh BiLSTM-AT được kết hợp trước
cách sử dụng BiLSTM hai lớp với cơ chế chú ý. Các đặc điểm từ hai khi đưa vào lớp dày đặc cuối cùng với 1 nơ-ron. Hàm kích hoạt của
nhánh được nối và đưa vào lớp dày đặc cuối cùng để tạo ra các dự đoán lớp dày đặc là tanh. Cuối cùng, Y dự đoán được lấy từ mô hình CNN-
mục tiêu. BiLSTM-AT.
Đối với các phép đo ghi nhật ký giếng, ma trận chuỗi X được xác định dọc theo
độ sâu có thể được biểu thị bằng phương trình. (10).

3.2. Chỉ số đánh giá
x1
1
x2
1 xn1 Trong các thử nghiệm của chúng tôi, bốn số liệu dự đoán được tính toán
x1
2 x2
2 xn2 để đánh giá hiệu suất của kết quả dự đoán của nhật ký giếng, đó là sai số
bình phương trung bình gốc (RMSE), sai số phần trăm tuyệt đối trung bình
X = (10)
x1 x2 xn (MAPE), sai số tuyệt đối trung bình (MAE) và hệ số tương quan cá nhân ( PCC)
Tôi Tôi Tôi
(Biber và cộng sự, 1998). Các số liệu đánh giá này cho thấy độ lệch trong dự
đoán của các mô hình được đề xuất. Chúng được định nghĩa là
d
x1 d
x2 xnd ̅
1
RMSE = m (11)
[ yod ypd ]2
trong đó tập xd = (x1 x2

d, d , , xn d) là giá trị thuộc tính của n giếng ghi tại
√ N d=1
độ sâu d. Tập xn = (xn1, xn2, xn

, tôi ,,…, xn d) là các giá trị của một
1 yod ypd
đường cong khai thác giếng nhất định dọc theo độ sâu, như GR, CNL, SP, v.v. Y = (y1, y2, MAE = m (12)
tôi
d=1 ôi
, yi,…, yd) là số đo của nhật ký giếng dự báo. X và Y lần lượt
là đầu vào và đầu ra của mô hình CNN-BiLSTM-AT.
1 yod ypd
Trong nhánh CNN, X được cung cấp cho các toán tử tích chập. Toán tử BẢN ĐỒ = 100 × (13)
m
tôi ôi
d=1
tích chập 1-D trượt 128 bộ lọc có cùng kích thước cửa sổ là 1 trên các
chuỗi theo chiều sâu để nắm bắt các đặc điểm tiềm ẩn ở mức độ thấp từ
nhật ký giếng thô. Sau đó, thao tác gộp tối đa được tiến hành để giảm m
d=1 ( yod yo )( ypd yp )
kích thước của bản đồ đối tượng. Hoạt động bỏ học được sử dụng để ngăn
PCC = ̅ ̅
̅ (14)
tôi
chặn việc trang bị quá mức CNN. ReLU được sử dụng làm hàm kích hoạt phi √ d=1 ( yod yo )2
√
m
d=1 ( ypd yp )2
tuyến của lớp này. Cuối cùng, một lớp làm phẳng được sử dụng để thay
đổi hướng kích thước và một lớp dày đặc với 100 nơ ron được sử dụng
trong đó m là số điểm trên đường cong ghi giếng, yo là dữ liệu đo
để thực hiện thao tác tuyến tính.
được, yo là giá trị trung bình của yo, yp là dữ liệu dự đoán và
Trong nhánh BiLSTM-AT, BiLSTM hai lớp ghi lại thông tin theo ngữ
yp là giá trị trung bình của yp. RMSE biểu thị độ lệch chuẩn giữa
cảnh từ nhật ký giếng ban đầu. Mỗi BiLSTM với 50 đơn vị ô không chỉ
dự đoán của mô hình và nhật ký thực tế. MAE có thể mô tả sự khác
học kiến thức từ số hạng trước của điểm ghi hiện tại mà còn thu được
biệt trung bình giữa kết quả dự đoán và kết quả đo thực tế. MAPE
kiến thức từ số hạng tiếp theo của chuỗi nhật ký hiện tại, do đó, các
thể hiện độ chính xác dưới dạng phần trăm. PCC có thể mô tả sự
tính năng được BiLSTM lấy có thể được coi là hai cách biểu diễn khác
phụ thuộc tuyến tính giữa các phép đo dự báo và thực tế của các
nhau của nhật ký giếng . Trong lớp BiLSTM, hàm tanh được chọn làm hàm
bản ghi giếng. Trong số các số liệu này, RMSE, MAPE và MAE nhỏ
kích hoạt phi tuyến. Trong lớp chú ý, cơ chế chú ý có thể làm nổi bật
hơn cho thấy mô hình có hiệu suất tốt hơn, trong khi giá trị PCC
các tính năng chính của đường cong ghi nhật ký để giảm ảnh hưởng của
lớn hơn cho thấy mô hình có hiệu suất tốt hơn.
các tính năng không chính trong nhật ký giếng. Lớp chú ý bao gồm một
Mục tiêu của việc dự đoán nhật ký giếng dựa trên mạng lai CNN-
lớp được kết nối đầy đủ
BiLSTM-AT là giảm thiểu sai số giữa giá trị thực và giá trị giếng khoan.
4

Hình 4. Sự hội tụ của các lỗi trên tập dữ liệu huấn luyện và xác nhận.
5

Bảng 2 4.2. Tập dữ liệu
Sai số dự đoán trung bình và độ lệch chuẩn trên dữ liệu thử nghiệm.
Người mẫu RMSE MAE BẢN ĐỒ Tổng cộng có 37 giếng từ khu vực nghiên cứu bao gồm bộ dữ liệu cho nghiên cứu
này. Mỗi giếng trong bộ dữ liệu có 20 thuộc tính ghi nhật ký, bao gồm âm thanh
Mô hình cho CNL 2,3140±0,0485 1,6553±0,0382 4,7606±0,1473
(AC), điện thế tự phát (SP), thước cặp (CAL), neutron (CN), mật độ (DEN), điện trở
Mô hình cho GR 4,0614±0,0380 3,0989±0,0477 3,4654±0,0749
vùng đỏ bừng (RXO), tia gamma tự nhiên (GR) , điện trở suất hình thành (RT), nhật
Mô hình cho AC 10,3855±0,2017 7,8516±0,1822 2,2481±0,0598
ký neutron bù (CNL), ghi nhật ký cảm ứng độ phân giải cao (M2R1, M2R3, M2R6 và
Mô hình cho SP 2,8519±0,0890 2,3836±0,0698 2,9900±0,0871
M2R9), microlog 1 (ML1), microlog 2 (ML2), thế năng 0,4m (RA04), Điện thế 2,5m
Mô hình cho DEN 0,0110±0,0027 0,0087±0,0032 0,3834±0,1427
(RA25), điện thế 4,5m (RA45), điện trở suất tập trung vi cầu (RMSL) và độ sâu
Mô hình cho RT 0,0683±0,0146 0,1771±0,0091 6,1559±0,0613
(DEPTH). Điều đó có nghĩa là, dựa trên phương pháp đề xuất, toàn bộ tập hợp đường
cong ghi nhật ký giếng có thể được tạo tổng hợp cho 37 giếng này.
nhật ký dự đoán ở mọi độ sâu. Trong toàn bộ quá trình học tập, RMSE được đặt làm
chức năng mục tiêu của mạng CNN-BiLSTM-AT.

Điều quan trọng là phải thực hiện tiền xử lý dữ liệu để cải thiện độ chính xác
của dự đoán dữ liệu, bao gồm làm sạch, chuẩn hóa và chuẩn hóa dữ liệu.
4. Thí nghiệm và kết quả
Làm sạch dữ liệu: Làm sạch dữ liệu nhằm mục đích cải thiện chất lượng dữ liệu
Để đánh giá hiệu quả của phương pháp đề xuất, một bộ dữ liệu bao gồm 152.969
của nhật ký giếng. Năm giếng trong khu vực nghiên cứu trước tiên được lựa chọn
mẫu đã được thu thập từ một hồ chứa rất không đồng nhất tại mỏ dầu Gangdong ở
bởi các kỹ sư chuyên nghiệp, sau đó các thông tin ngoại lệ và tiếng ồn sẽ bị loại
Trung Quốc. Phương pháp này được kiểm tra dựa trên dự đoán về log neutron bù
bỏ bằng phương pháp thay thế trung bình và trực quan hóa biểu đồ phân tán (Barducci
(CNL), âm học (AC), thế tự phát (SP), tia gamma (GR), mật độ (DEN) và điện trở suất
và cộng sự, 2007).
hình thành (RT) từ 19 log khác các thuộc tính tương ứng.
Tiêu chuẩn hóa: Tiêu chuẩn hóa dữ liệu được sử dụng để giảm các lỗi hệ thống
của nhật ký giếng được quan sát bởi các thiết bị đo lường khác nhau tại các thời
Tất cả các nghiên cứu thử nghiệm đều được thực hiện trong môi trường biên dịch
điểm khác nhau. Nó có thể giữ cho tất cả các nhật ký giếng tuân theo cùng một tiêu
Python 3.8 bằng máy trạm deep learning với RTX 2080 Ti. Tất cả các mô hình trí tuệ
chuẩn. Trong khi đó, chuẩn hóa dữ liệu có tác động đẩy nhanh quá trình đào tạo và
nhân tạo đều được phát triển bằng TensorFlow (Abadi và cộng sự, 2016).
ngăn chặn sự bùng nổ độ dốc của mạng lưới thần kinh (Hrynaszkiewicz, 2010).
Chuẩn hóa: Chuẩn hóa dữ liệu là cần thiết để đảm bảo rằng
4.1. Khu vực nghiên cứu các mô hình sẽ được đào tạo thành công vì nó có thể tạo ra dữ liệu chất lượng cao
có thể làm đầu vào cho bất kỳ thuật toán học tập nào. Dữ liệu ghi nhật ký có nhiều
Để đánh giá dự đoán nhật ký giếng bằng phương pháp đề xuất trong nghiên cứu giá trị, vì vậy chúng cần được điều chỉnh theo cùng một phạm vi giá trị để tăng
này, nhật ký giếng được thu thập từ Mỏ dầu Gangdong ở Trung Quốc. Khu vực nghiên tốc quá trình học. Trong các thử nghiệm của chúng tôi, các chuỗi đầu vào được chia
cứu chủ yếu tập trung ở vùng lân cận đới cấu trúc đứt gãy cấp hai Beidagang ở giữa tỷ lệ thành phạm vi 0–1 vì hàm sigmoid được sử dụng làm hàm kích hoạt của các đơn
hệ tầng Huanghua. Lớp mục tiêu của khu vực làm việc chủ yếu bao gồm hệ tầng vị gating trong BiLSTM.
Minghuazhen và hệ tầng Guantao của Thượng Đại học. Dữ liệu nhật ký giếng rời rạc được chuẩn hóa thành [0,1] theo biểu thức. (15).
(xo x)
Minghuazhen đã tạo ra một lòng sông uốn khúc. Các thân cát kênh được phân bố thành xi = (15)
các dải trên mặt phẳng và độ dày của một lớp cát đơn lẻ thường là 3–16 m. Hệ tầng (xmax xmin)
Guantao là một trầm tích sông phân nhánh, với các dòng sông một lớp phân bố ở các
trong đó xi là các giá trị chuẩn hóa của đường cong log giếng ở độ sâu d, xmin là
khu vực tiếp giáp.
giá trị tối thiểu, xmax biểu thị giá trị tối đa.
Các thân cát kênh có chiều rộng lớn và độ dày 6–20 m.
Sau khi tiền xử lý dữ liệu, tập dữ liệu với tổng số mẫu là 152.969 được hình
Thành phần đầu tiên của phía đông là trầm tích châu thổ, các thể cát phát triển
thành trong nghiên cứu điển hình. Đặc điểm của các mẫu nhật ký giếng được thể hiện
theo hướng tây bắc - đông nam. Tướng sông đơn thân cát và kết cấu kiến trúc bên
trong Bảng 1. 8792 mẫu nhật ký giếng trong giếng Gang-11-11 được dành riêng để xác
trong rất phức tạp.
minh phương pháp đề xuất của chúng tôi. Chúng tôi sử dụng 90% mẫu còn lại làm tập
Thạch học trong hệ tầng Minghuazhen bao gồm đá sa thạch trung bình màu xám
huấn luyện. Các mô hình dự đoán các loại nhật ký giếng đã được đào tạo và các siêu
xanh, xám xanh, bột kết, sa thạch mịn, đá bùn màu đỏ nâu, bột kết sét và đá bùn
tham số của mô hình được xác định bằng cách sử dụng phương pháp xác thực chéo 10
bột. Các phép đo điện dọc theo độ sâu có dạng hình chuông và hình chuông có răng.
lần (Arlot và Celisse, 2010). Trong giai đoạn huấn luyện, dựa trên phương pháp
Nó thể hiện một đặc tính của chu kỳ tích cực. Thạch học trong hệ tầng Guantao chủ
xác thực chéo 10 lần, dữ liệu từ tập huấn luyện được chia thành 10 phần và tập
yếu bao gồm sa thạch màu trắng xám, bột kết màu xám, sa thạch kết tụ màu vàng nâu,
thứ mười được lấy làm tập xác thực để kiểm tra mô hình.
sa thạch mịn, sa thạch trung bình, sa thạch thô, đá bùn màu xám xanh và đỏ tím.
Chín phần còn lại được lấy làm tập huấn luyện để huấn luyện mô hình. Trong giai
đoạn đánh giá, 8792 mẫu từ Gang-11-11 đã được đưa vào mô hình đã huấn luyện và sẽ
Kênh dọc được chồng lên nhau qua nhiều thời kỳ để tạo ra lớp cát dày với kích
thu được dự đoán.
thước hạt tương đối thô. Nhiều cát và ít bùn tồn tại trên mặt cắt, do đó các tín
hiệu điện xuất hiện dưới dạng sự kết hợp của các đường cong hình bánh răng và hộp
số có biên độ thấp. Ở những vùng bồi lắng không phải kênh chính, lớp cát tương 4.3. Kết quả thí nghiệm
đối mỏng, đá bùn được thêm vào dày lên nên các đường cong có vẻ là sự kết hợp giữa
đường cong hình chuông hộp và đường cong hình hộp. Trong các thử nghiệm của chúng tôi, sáu mô hình đã được đào tạo và sử dụng để
dự báo nhật ký giếng bao gồm CNL, DEN, AC, SP, GR và RT. Tốc độ hội tụ trong quá
Phân tích lõi đá khu vực nghiên cứu cho thấy độ xốp cơ bản nằm trong khoảng từ trình tối ưu hóa các siêu tham số cho từng mô hình, được biểu thị bằng lỗi RMSE
20% đến 40%, độ xốp trung bình của đặc tính vật lý vỉa là 31,18%. Độ thấm của tính trên tập dữ liệu huấn luyện và xác thực, được mô tả trong Hình 4. Như được hiển
chất vật lý hồ chứa chủ yếu nằm trong khoảng từ 20mD đến 6575mD. Hệ số biến thiên thị trong Hình 4, các hàm mất mát của các mô hình được đề xuất cho trường hợp mỏ
khả năng thấm xấp xỉ bằng 0,9, điều đó cho thấy các đặc điểm vỉa chứa và tính chất dầu có thể nhanh chóng giảm và trở nên ổn định, điều đó có nghĩa là các mô hình
vật lý của khu vực nghiên cứu bị chi phối bởi tính không đồng nhất cơ học mạnh mẽ được huấn luyện tốt và có thể được sử dụng để dự đoán các bản ghi giếng bị thiếu.
của đá.
Kết quả dự đoán trung bình và độ lệch chuẩn là 30
6

Hình 5. Các phép đo so với dự đoán bằng CNN-BiLSTM-AT.
7
Hình 5. (tiếp theo).
số 8

Bảng 3 Như đã đề cập trong phần giới thiệu, nhiều mô hình cơ sở học máy
So sánh mô hình CNN-BiLSTM-AT với các mô hình học máy cổ điển để dự đoán nhật cổ điển được sử dụng trong các vấn đề dự báo nhật ký giếng, như DT,
ký giếng CNL. SVR, RF và ANN. Trong số các phương pháp này, MLP đã trở thành một
2) So sánh với các mô hình dựa trên deep learning phương pháp phổ biến để dự báo nhật ký giếng và dựa trên cây và SVR
Người mẫu RMSE MAE BẢN ĐỒ là các kỹ thuật rất hiệu quả để dự đoán nhật ký giếng. Những thuật
DT 8.1663±0.1901 5,2052±0,0533 9,6921±0,1485 toán cổ điển này được thực hiện để tạo ra các bản ghi giếng tổng hợp
SVR 7,9725±0,0623 4,7361±0,0882 9,3777±0,0437 trong các thí nghiệm của chúng tôi. Khi phát triển mô hình SVR, hàm
RF 6,0063±0,1912 3,6439±0,1056 8,0978±0,0291 cơ sở xuyên tâm (RBF) được chọn làm hàm hạt nhân. Khi xây dựng mô
MLP 6,9704±0,1580 3,7460±0,0979 8,1036±0,0887 hình RF, 150 cây được phát triển và không có giới hạn về độ sâu tối
CNN-BiLSTM-AT 2,3140±0,0485 1,6553±0,0382 4,7606±0,1473 đa của cây. Đối với phương pháp MLP, mô hình MLP bao gồm hai lớp ẩn
với 500 nút trong mỗi lớp. Các siêu tham số của các mô hình này được
tối ưu hóa thông qua phương pháp tìm kiếm dạng lưới và phương pháp
các thử nghiệm độc lập của từng mô hình theo từng cài đặt được báo xác thực chéo 10 lần.
cáo trong Bảng 2. Mô hình CNN-LSTM-AT để dự đoán nhật ký giếng CNL đạt Lấy dự đoán của nhật ký CNL làm ví dụ, chúng tôi đã thực hiện 30
được RMSE, 2.3140, MAE, 1.6553 và MAPE, 4.7606 tốt nhất. Để dự báo thử nghiệm độc lập cho từng mô hình theo từng cài đặt. Bảng 3 trình
đường cong ghi nhật ký GR, mô hình CNN-LSTM-AT được huấn luyện để đạt bày ba số liệu đánh giá, RMSE, MAE và MAPE, thu được từ các thuật
được RMSE, 4.0614, MAE, 3.0989 và MAPE, 3.4654 tốt nhất. Khi tạo nhật toán DT, SVR, RF, MLP và CNN-BiLSTM-AT cho các dự đoán CNL. Số độ trễ
ký giếng AC tổng hợp tốt nhất, chúng tôi đã thu được RMSE, 10,3885, thời gian đầu vào trong thử nghiệm này được đặt thành 1. Trong số các
MAE, 7,8516 và MAPE, 2,2481. Mô hình CNN-LSTM-AT để dự đoán nhật ký SP thuật toán học máy cổ điển, RF hoạt động tốt hơn nhiều, với MAE trung
đạt RMSE, 2,8519, MAE, 2,3836 và MAPE, 2,9900 tốt nhất. Để dự báo bình là 3,6439, so với phương pháp SVR và phương pháp DT, nhờ cơ
đường cong ghi DEN, mô hình CNN-LSTM-AT được huấn luyện để đạt RMSE, chế biểu quyết đa số của phương pháp RF. MLP có MAE trung bình là
0,0110, MAE, 0,0087 và MAPE, 0,3834 tốt nhất. Khi tạo nhật ký giếng RT 3,7460 hoạt động rất gần với mô hình RF. CNN-BiLSTM-AT được đề xuất
tổng hợp tốt nhất, chúng tôi đã thu được RMSE, 0,0683, MAE, 0,1771 và của chúng tôi đạt được MSE trung bình là 1,6553, rõ ràng là vượt trội
MAPE, 6,1559. so với MSE thu được bằng cách sử dụng các phương pháp MLP và RF. Cấu
Hình 5 hiển thị các phép đo và dự đoán của các bản ghi giếng CNL, trúc lai của CNN, BiLSTM và cơ chế chú ý có thể là nguyên nhân. Từ
DEN, AC, SP, GR và RT trên tập dữ liệu thử nghiệm bằng phương pháp việc so sánh giữa các thuật toán này, mô hình CNN-BiLSTM-AT được đề
CNN-BiLSTM-AT được đề xuất. Từ những số liệu này, chúng ta có thể xuất rõ ràng là vượt trội hơn so với các mô hình học máy truyền thống
thấy rằng, đối với việc dự đoán các nhật ký CNL, DEN, AC, GR và RT, được phát triển trong thử nghiệm này.
phương pháp được đề xuất có thể đạt được sự phù hợp tốt giữa các CNN-BiLSTM-AT, một loại thuật toán học sâu, được đề xuất nhằm mục
phép đo dự đoán và thực tế, đồng thời PCC lớn hơn 0,9534 . Từ Hình đích dự đoán nhật ký giếng và do đó, các mô hình học sâu khác có khả
5(e), có thể thấy khi chúng tôi tạo ra các bản ghi giếng SP tổng hợp năng dự đoán đường cong ghi nhật ký giếng được phát triển để so sánh
bằng phương pháp CNN-BiLSTM-AT, PCC là 0,9534. Đường cong dự đoán với mô hình đề xuất trong này. phần. BiLSTM và CNN sâu tiêu chuẩn
không thể nắm bắt hoàn toàn xu hướng của dữ liệu đo được. Đó là do được so sánh vì mô hình đề xuất bao gồm BiLSTM và CNN. LSTM và RNN
khu vực nghiên cứu có các hồ chứa rất không đồng nhất, đại diện cho tiêu chuẩn bổ sung lớp mạng thần kinh sâu được kết nối đầy đủ cũng
điều kiện địa chất phức tạp nên khó có được các dự đoán hoàn toàn đang được nghiên cứu. Để đo lường mức độ ảnh hưởng của cơ chế chú ý
nhất quán với các phép đo thực tế. Tuy nhiên, đối với các ứng dụng đến dự đoán nhật ký giếng, mô hình BiLSTM đa lớp kết hợp cơ chế chú ý
địa chất, thông tin có giá trị được lưu trữ theo xu hướng thay đổi (BiLSTM-AT) cũng được phát triển trong thí nghiệm này.
của đường cong khai thác giếng và phép đo đơn lẻ ở mỗi độ sâu ít ảnh
hưởng đến lĩnh vực kỹ thuật thực tế. Bằng cách so sánh các giá trị đo Xem xét ảnh hưởng của các nút nơ-ron ẩn và độ sâu của mạng lưới
được và giá trị dự đoán, CNN-LSTM-AT có thể dự đoán chính xác xu hướng thần kinh, cụ thể là các siêu tham số của các mô hình, tất cả các mô
của các bản ghi giếng không thể thiếu để đáp ứng nhu cầu kỹ thuật dầu hình được triển khai trong phần này đều thực hiện thuật toán di truyền
khí. Những dự đoán nhật ký giếng này rất hữu ích để thiết lập các mô để tối ưu hóa các siêu tham số này. Bảng 4 cho thấy kết quả so sánh
hình địa chất chính xác hơn, cải thiện độ chính xác đánh giá hồ chứa trung bình của 30 lần chạy của từng mô hình trong mỗi cài đặt. Các
và tối ưu hóa các chiến lược khoan và hoàn thiện giếng. tiêu đề theo chiều ngang của bảng biểu thị số lượng lớp mạng thần
kinh của từng mô hình học sâu. Có tính đến ảnh hưởng của số lượng lớp
của mạng lưới thần kinh, mỗi mô hình deep learning được phát triển
4.4. So sánh với các mô hình cơ sở
trong nghiên cứu này đều đạt được hiệu suất tốt nhất ở một số lớp cụ
thể và các chỉ số đánh giá của chúng có điểm số khác nhau với số lớp
Trong phần này, chúng tôi so sánh kết quả dự đoán nhật ký giếng
từ một đến bốn . Khi mô hình CNN-BiLSTM-AT dùng để dự đoán đường cong
bằng phương pháp CNN-BiLSTM-AT được đề xuất với kết quả dự đoán bằng
ghi nhật ký CNL có một lớp CNN và hai lớp BiLSTM thì nó đạt được hiệu
phương pháp học máy truyền thống và mô hình trí tuệ nhân tạo dựa trên
suất tốt nhất.
học sâu.
CNN-BiLSTM-AT được đề xuất vượt trội hơn các thuật toán học sâu
khác ở mọi loại lớp. Khi CNN-BiLSTM-
1) So sánh với các phương pháp học máy truyền thống
Bảng 4
So sánh mô hình CNN-BiLSTM-AT với các mô hình dựa trên DL để dự đoán nhật ký giếng CNL.
Người mẫu Số lớp
N = 1 N = 2 N = 3 N = 4
MAE BẢN ĐỒ MAE BẢN ĐỒ MAE BẢN ĐỒ MAE BẢN ĐỒ
RNN 1.9421 5.8554 2,0127 6.1105 2.0989 6.4484 2.3773 7.3708

CNN 1.7097 4.9150 1.8831 5.6449 1.8472 5.4715 2.3594 7.4427
LSTM 1.7900 5.3032 1.7688 5.2002 1,9928 6.0474 2,2482 7,0075
BiLSTM 1.7493 5.1356 1.7762 5.2179 1,8788 5.6173 2,0122 6,1144
BiLSTM-AT 1.7490 5.1321 1.7606 5.1755 1.7826 5.2438 1.9782 6.4138
CNN-BiLSTM-AT 1.6857 4.8332 1.6553 4.7606 1.6919 4.8733 1.6910 4.8649
9

Hình 6. Cờ lỗi của dự đoán nhật ký giếng CNL từ các thuật toán học sâu.
AT có hai lớp, nó mang lại MAE trung bình tốt nhất là 1,6553 và MAPE lần lượt là 1,7493 và 1,7490. Cần lưu ý rằng, đối với trường hợp một
trung bình là 4,7606. Các lỗi kiểm tra của mô hình RNN, CNN, LSTM, lớp, các mô hình RNN, CNN, BiLSTM và BiLSTM-AT có hiệu suất tốt nhất
BiLSTM và BiLSTM-AT đa lớp đều lớn hơn so với mô hình CNN-BiLSTM-AT. trong nghiên cứu trường hợp của chúng tôi được trình bày trong Bảng
Chúng mang lại MAE trung bình tốt nhất là 1,9421, 1,7097, 1,7688, 4. Nó chỉ ra rằng các mô hình mạng thần kinh một lớp có thể đủ tốt cho chụp
10
các tính năng, nhưng cấu trúc mạng thần kinh lai của CNN-BiLSTM-AT phù hợp hơn để dự 6. Kết luận
đoán nhật ký giếng mục tiêu.
Hình 6 cho thấy tác dụng của RNN, CNN, LSTM, BiLSTM, BiLSTM-AT và CNN-BiLSTM-AT Bài viết này nhằm mục đích giải quyết vấn đề thiếu đường cong khai thác giếng.
trong việc dự đoán nhật ký CNL. So với các phép đo từ mỏ dầu, các dự đoán từ sáu mô hình Chúng tôi đã đề xuất một phương pháp dự đoán nhật ký tốt dựa trên sự tích hợp của mạng
học sâu có mức độ phù hợp cao, điều này cho thấy phương pháp học sâu có thể dự báo nơ ron tích chập và bộ nhớ ngắn hạn dài hai chiều với cơ chế chú ý. Một nghiên cứu
chính xác xu hướng thay đổi của các đường cong CNL mục tiêu. Cờ lỗi màu đỏ trong Hình điển hình với mô hình học tập đề xuất đã được thực hiện trên dữ liệu từ một hồ chứa rất
6 biểu thị các dự đoán sử dụng phương pháp RNN có cờ lỗi lớn nhất. Độ chính xác dự báo không đồng nhất tại mỏ dầu Gangdong ở Trung Quốc. Hiệu suất dự đoán của các mô hình
của nhật ký giếng thu được bằng phương pháp LSTM và BiLSTM đã được nâng cao. Bằng được xác nhận. Phương pháp đề xuất có thể được mở rộng sang các mỏ dầu khác vì những
cách sử dụng kết hợp thuật toán BiLSTM và cơ chế chú ý, độ chính xác dự đoán nhật ký mô hình được đào tạo này có khả năng tạo ra các nhật ký giếng bị thiếu một cách hiệu
giếng rõ ràng đã được cải thiện hơn nữa. Độ chính xác dự đoán của phương pháp CNN quả từ bất kỳ khu vực quan tâm nào bằng cách điều chỉnh các siêu tham số. Dự đoán chính
không kém gì kết quả sử dụng mô hình BiLSTM. Phương pháp CNN-BiLSTM-AT đề xuất đạt xác của nhật ký giếng cho phép các kỹ sư địa chất hiểu rõ hơn về quá trình hình thành
được mức độ phù hợp cao nhất. Do đó, CNN-BiLSTM-AT có thể là một công cụ mạnh mẽ để dự và cải thiện việc thiết kế các chiến lược khoan và hoàn thiện, từ đó giảm chi phí và
đoán việc ghi nhật ký giếng như vậy nâng cao năng suất trong phát triển dầu khí.
trình tự. Tuyên bố của tác giả tín dụng
5. Thảo luận
Liqun Shan: Khái niệm hóa, Phương pháp luận, Viết – bản thảo gốc, Yanchang Liu:
Điều tra, Phân tích chính thức, Xác thực, Tối thiểu
Các nghiên cứu hiện tại trong việc dự báo nhật ký giếng bị thiếu bằng cách sử dụng Tang: Tài nguyên, Tiền xử lý ngày, Ming Yang: Quản lý dữ liệu,
máy học/học sâu chưa xem xét đồng thời các đặc điểm không gian và đặc điểm thời gian, Viết-Nhận xét và Chỉnh sửa, Xueyuan Bai: Visualization
chúng tôi đã trình bày một mạng lưới thần kinh lai dựa trên CNN và BiLSTM với cơ chế
chú ý trong
Tuyên bố về lợi ích cạnh tranh
nghiên cứu này. CNN tập trung vào việc nắm bắt các đặc tính không gian của nhật ký
giếng, BiLSTM trích xuất các đặc điểm thời gian và cơ chế chú ý được sử dụng để tập
Các tác giả tuyên bố rằng họ không có lợi ích tài chính hoặc mối quan hệ cá nhân
trung vào việc củng cố thông tin quan trọng.
cạnh tranh nào có thể ảnh hưởng đến công việc được báo cáo trong bài viết này.
Các mối tương quan không gian-thời gian từ CNN và BiLSTM với cơ chế chú ý được hợp
nhất để đáp ứng dự đoán nhật ký giếng mục tiêu.
Phương pháp CNN-BiLSTM-AT được sử dụng để triển khai các dự đoán về nhật ký giếng CNL,
Nhìn nhận
DEN, AC, SP, GR và RT. Thông qua phương pháp CNN-BiLSTM-AT, tất cả các hàm mất mát có
thể nhanh chóng giảm và trở nên ổn định, nghĩa là các mô hình đã được huấn luyện tốt và
Nghiên cứu này được hỗ trợ bởi Số thành lập Quỹ Đại học Dầu khí Đông Bắc số
có thể được sử dụng để dự đoán. Đối với tất cả sáu đường cong ghi, PCC thu được lớn
2018GP2D-04 và số 2018QNQ-06. Chúng tôi xin chân thành cảm ơn những ý kiến hữu ích của
hơn 0,9534. Các kết quả thử nghiệm cho thấy phương pháp đề xuất có thể đạt được mức
người biên tập và những người đánh giá ẩn danh.
độ phù hợp tốt giữa nhật ký giếng dự đoán và thực tế.
Phương pháp tự động sản xuất nhật ký giếng dựa trên CNN-BiLSTM-AT được đề xuất
Người giới thiệu
trong nghiên cứu này có thể giảm chi phí phát triển dầu khí ở một mức độ nhất định.
Trong quá trình phát triển dầu khí độc đáo, số lượng lớn các bản ghi giếng có thể giúp
Abadi, M., Barham, P., Chen, J., Chen, Z., Davis, A., Dean, J., và cộng sự, 2016. TensorFlow: A
các kỹ sư nâng cao hiểu biết về quá trình hình thành, giúp giảm chi phí trong các cụm Hệ thống học máy quy mô lớn.
thủng trong quá trình hoàn thiện giếng (PARSHALL, 2015). Phương pháp học sâu được đề Akinnikawe, O., Lyne, S., Roberts, J., 2018. Tạo nhật ký giếng tổng hợp bằng kỹ thuật
học máy. Trong: Trong Kỷ yếu của Hội nghị Công nghệ Tài nguyên Độc đáo lần
xuất để tạo nhật ký giếng tổng hợp cũng có thể được mở rộng để dự đoán đường cong ghi
thứ 6, Houston, TX, Hoa Kỳ, tháng 7.
nhật ký thời gian thực với sự trợ giúp của dữ liệu khoan thời gian thực, có thể giúp Arlot, S., Celisse, A., 2010. Khảo sát các quy trình xác thực chéo để lựa chọn mô hình.
ban quản lý lựa chọn chiến lược tốt hơn trong quá trình khoan thời gian thực, đặc biệt Thống kê. Sống sót. 4, 40–79.
Avseth, P., và cộng sự, 2013. Mô hình vật lý đá về dịch chuyển thời gian 4D và dịch chuyển thời gian
là đối với giếng định hướng và giếng sản xuất (Kanfar et al., 2020b). Ngoài ra, các mô
các công cụ phái sinh sử dụng dữ liệu nhật ký giếng-một cuộc trình diễn ở Biển Bắc. Địa vật lý. Tiềm
hình đã đào tạo của chúng tôi có thể được sửa đổi để sử dụng trong bất kỳ lĩnh vực nào năng. 61 (2), 380–390. https://doi.org/10.1111/j.1365-2478.2012.01134.x.
được quan tâm bằng cách điều chỉnh các siêu tham số. Đối với một giếng mới khoan nhất Barducci, A., Guzzi, D., Marcoionni, P., và cộng sự, 2007. Đánh giá biên độ tiếng ồn trong
hình ảnh viễn thám sử dụng phương pháp tiếp cận mặt phẳng bit và biểu đồ phân tán [J]. IEEE Trans.
định, mọi đường cong ghi nhật ký giếng cần thiết đều có thể được tổng hợp tự động dựa
Geosci. Rem. Thượng nghị sĩ 45 (8), 2665–2675. https://doi.org/10.1109/tgrs.2007.897421.
trên tất cả các loại nhật ký giếng có sẵn xung quanh giếng mới và mạng CNN-BiLSTM-AT đã
Biber, D., Conrad, S., Reppen, R., 1998. Ngôn ngữ học Corpus (Nghiên cứu ngôn ngữ
được đào tạo. Chi phí thấp và hiệu quả của việc sản xuất nhật ký giếng dựa trên kỹ Cấu trúc và cách sử dụng) || Các biện pháp thống kê của các hiệp hội từ vựng, tập. 7. Đại học Cambridge,
trang 265–268. https://doi.org/10.1017/CBO9780511804489.

thuật học sâu giúp có thể sử dụng phương pháp học sâu trên quy mô lớn, thuận lợi cho
Bukar, I., Adamu, MB, Hassan, U., 2019. Phương pháp học máy để dự đoán nhật ký siêu âm. ngày 5 tháng 8).
việc đánh giá và phân tích ở cấp độ hình thành và lưu vực.
Hiệp hội kỹ sư dầu khí https://doi.org/10.2118/ 198764-MS.
Chang, H.-C., Chen, H.-C., Fang, J.-H., 1997. Xác định thạch học từ nhật ký giếng với mạng
lưới thần kinh bộ nhớ kết hợp mờ. Có thể IEEE Trans. Geosci. Rem. Thượng nghị sĩ 35
(3), 773–780.
Trong tương lai, chúng tôi sẽ tiến hành điều tra về tính không chắc chắn của mô Cheng, Hengda, Chen, Huanxin, Li, Zhengfei, Cheng, Xiangdong, 2020. Tập hợp mô hình chẩn
hình dự đoán. Kết quả phân tích độ không đảm bảo sẽ cung cấp giá trị xác suất có trọng đoán CNN 1-D cho các lỗi sạc môi chất lạnh của hệ thống VRF trong điều kiện
sưởi ấm. Xây dựng năng lượng. 224, 110256.
số của các dự đoán, giúp đưa ra quyết định tối ưu dựa trên kiến thức không hoàn hảo,
Duan, Youxiang và cộng sự, 2018. Nghiên cứu và ứng dụng DBN để giải thích nhật
đo lường rủi ro hoặc độ phân tán của kết quả và tiết lộ giá trị của thông tin đối với ký giếng. J. Ứng dụng. Khoa học. 36 (4), 689–697.
các biến chính, do đó, phân tích độ không đảm bảo có thể cung cấp thông tin về độ bền Ellis, DV, Singer, JM, 2007. Ghi nhật ký giếng cho các nhà khoa học trái đất. Berlin/
Heidelberg, tái bản lần thứ hai. Springer, Đức, ISBN 978-1-4020-3738-2.
của mô hình và độ tin cậy của kết quả dự đoán (Ghahramani, 2015; Feng, 2020, 2021; Feng
Feng, R., 2020. Phân loại thạch học dựa trên hệ thống kết hợp giữa mạng lưới thần kinh nhân tạo và mô hình
và cộng sự, 2021). Ngoài ra, kết quả có độ chắc chắn cao có thể mang lại niềm tin lớn Markov ẩn. Địa vật lý. J. Int. 221 (3), 1484–1498.
hơn cho những người thực hành trong lĩnh vực dầu khí. Feng, R., 2021. Cải thiện khả năng phân tích độ không đảm bảo trong việc phân loại nhật ký giếng bằng máy
học bằng thuật toán chia tỷ lệ. J. Xăng dầu. Khoa học. Anh. 196, 2021,107995.
Feng, R., Luthi, SM, Gisolf, D., Angerer, E., 2018. Xác định thạch học hồ chứa bằng các trường ngẫu nhiên
Markov ẩn dựa trên mô hình hỗn hợp Gaussian. Tháng 11 IEEE Trans.
Geosci. Rem. Thượng nghị sĩ 56 (11), 6663–6673.
11

Feng, R., Grana, D., Balling, N., 2021. Định lượng độ không chắc chắn trong việc phát hiện lỗi bằng Liu, Gang, Guo, Jiabao, 2019. LSTM hai chiều với cơ chế chú ý và lớp chập để phân loại văn bản.
cách sử dụng mạng thần kinh tích chập. Địa vật lý. https://doi.org/10.1190/geo2020- 0424.1. Máy tính thần kinh 337, 325–338.
Mo, X., Zhang, Q., Li, X., 2015. Tái thiết đường cong ghi nhật ký giếng dựa trên mạng lưới thần
Fung, Chun Che, Wong, Kok Wai, Eren, H., 1997. Mạng lưới thần kinh nhân tạo mô-đun để dự đoán các đặc kinh di truyền. Tháng 8 ở Proc. Quốc tế thứ 12 Conf. Kiến thức về hệ mờ Khám phá (FSKD) 1015–
tính vật lý dầu từ dữ liệu nhật ký giếng. Giao dịch của IEEE về Thiết bị và Đo lường 46 (6), 1021.
1295–1299. https://doi.org/10.1109/ IMTC.1996.507317. Obiora, Daniel N., và cộng sự, 2016. Đánh giá đặc điểm hồ chứa và sự hình thành của “Mỏ Hoàng gia trên
bờ”, Đồng bằng Nam Niger sử dụng dữ liệu nhật ký giếng địa vật lý. J. Địa chất.
Ghahramani, Z., 2015. Học máy xác suất và trí tuệ nhân tạo. Thiên nhiên 521, 452–459. https://doi.org/ Sóc. Ấn Độ 87 (5), 591–600. https://doi.org/10.1007/s12594-016-0433-6.
10.1038/nature14541. Onalo, David, Adedigba, Chủ nhật, Khan, Faisal, James, Lesley A., Butt, Stephen, 2018.
Gharbi, RBC, Mansoori, GA, 2005. Giới thiệu về trí tuệ nhân tạo Mô hình điều khiển dữ liệu để dự đoán nhật ký giếng âm. J. Xăng dầu. Khoa học. Anh. 170, 1022–1037.
ứng dụng trong thăm dò và khai thác dầu khí J. Xăng dầu. Khoa học. Anh. 49 (3–4), Ouadfeul, SA, Aliouane, L., 2015. Dự đoán tổng lượng carbon hữu cơ trong khí đá phiến
93–96. các hồ chứa từ giếng ghi lại dữ liệu bằng cách sử dụng mạng lưới thần kinh perceptron đa lớp với
Gowida, A., Elkatatny, S., Abdulraheem, A., 2019. Ứng dụng thần kinh nhân tạo thuật toán huấn luyện Levenberg Marquardt: ứng dụng vào đá phiến Barnett. Ả Rập J. Khoa học.
mạng để dự đoán mật độ khối hình thành trong khi khoan. Vật lý thiên văn 60, 660–674. Anh. 40 (11), 3345–3349. https://doi.org/10.1007/s13369-015-1685-y.
Gowida, A., Elkatatny, S., Al-Afnan, S., Abdulraheem, A., 2020. Các mô hình trí tuệ nhân tạo tính Parshall, J., 2015. Dữ liệu khoan cung cấp giải pháp cho chi phí ghi giếng ngang. J. Xăng dầu.
toán mới để tạo nhật ký mật độ khối hình thành tổng hợp trong khi khoan. Tính bền vững 12, 686. Technol. 67 (8), 35–38.
Pham, Nam, Wu, Xinming, Naeini, Ehsan Zabihi, 2020. Dự đoán nhật ký giếng bị thiếu bằng cách sử dụng
Graves, A., Schmidhuber, J., 2005. Phân loại âm vị theo khung với Lstm hai chiều và các kiến trúc mạng mạng bộ nhớ ngắn hạn dài tích chập. Tháng 7 Địa vật lý 85 (Số 4), 1JA-
thần kinh khác. Mạng lưới thần kinh. 18 (5–6), 602–610. Z18.
He, X., Santoso, R., Hoteit, H., 2020. Ứng dụng học máy để xây dựng các mô hình liên tục tương Povey, D., Hadian, H., Ghahremani, P., Li, K., Khudanpur, S., 2018. Lớp tự chú ý có giới hạn thời gian
đương từ các mô hình gãy xương rời rạc có độ phân giải cao. Trong: Trình bày tại Hội nghị dành cho ASR. Trong: Hội nghị quốc tế của IEEE về Âm học, Xử lý giọng nói và tín hiệu (ICASSP),
Công nghệ Dầu khí Quốc tế, Dhahran, Ả Rập Saudi, 13 - 15 tháng 1. IPTC-20040-MS. https:// Calgary, AB, 2018, trang 5874–5878. https://doi.org/ 10.1109/ICASSP.2018.8462497.
doi.org/10.2523/IPTC-20040-MS.
Hochreiter, S., Schmidhuber, J., 1997. Trí nhớ ngắn hạn dài. Máy tính thần kinh. 9 (8), Rolon, L., Mohaghegh, SD, Ameri, S., Gaskari, R., Mcdaniel, B., 2009. Sử dụng mạng thần kinh nhân tạo
1735–1780. để tạo ra nhật ký giếng tổng hợp. Tháng 11 J. Nat. Khí khoa học. Anh. 1 (4–5), 118–133.
Hrynaszkiewicz, Iain, 2010. Lời kêu gọi đóng góp vào Ghi chú Nghiên cứu của BMC nhằm thúc đẩy thực tiễn
tốt nhất trong việc chuẩn hóa, chia sẻ và xuất bản dữ liệu. BMC Res. Chú thích 3(1), 235–237. Santoso, R., He, X., Hoteit, H., 2019. Ứng dụng machine learning để xây dựng
https://doi.org/10.1186/1756-0500-3-235. mô hình mô phỏng từ sự hình thành vết nứt có độ phân giải cao. Trong: Trình bày tại Hội nghị &
Kanfar, R., Shaikh, O., Yousefzadeh, M., Mukerji, T., 2020a. ngày 13 tháng 1). Dự đoán nhật ký giếng Triển lãm Dầu khí Quốc tế Abu Dhabi, Abu Dhabi, UAE, ngày 11 - 14 tháng 11. SPE-197439-MS. https://
theo thời gian thực từ dữ liệu khoan bằng cách sử dụng học sâu. Hội nghị công nghệ dầu khí doi.org/10.2118/197439-MS.
quốc tế. https://doi.org/10.2523/IPTC-19693-MS. Schuster, M., Paliwal, KK, 1997. Mạng lưới thần kinh tái phát hai chiều. IEEE Trans.
Kanfar, R., Shaikh, O., Yousefzadeh, M., Mukerji, T., 2020b. Nhật ký giếng thời gian thực Quá trình tín hiệu. 45, 2673–2681.
Dự đoán từ việc khoan dữ liệu bằng cách sử dụng Deep Learning. Trong: Bài trình bày tại Hội Shen, Tao, Chu, Tianyi, Long, Guodong, Jiang, Jing, Pan, Shirui, Zhang, Chengqi, 2017.
nghị Công nghệ Dầu khí Quốc tế, Dhahran, Vương quốc Ả Rập Saudi, tháng 1 năm 2020. https:// Disan: mạng lưới tự chú ý định hướng để hiểu ngôn ngữ không cần rnn/cnn.
doi.org/10.2523/IPTC-19693-MS. CoRR, abs/1709. http://arxiv.org/abs/1709.04696.
Canada, Geofluids Kim, Sungil, Kim, Kwang Hyun, Min, Baehyun, Lim, Jungtek, Lee, Kyungbook, Vaswani, Ashish, Shazeer, Noam, Parmar, Niki, Uszkoreit, Jakob, Jones, Llion,
2020. Tạo dữ liệu nhật ký mật độ tổng hợp bằng thuật toán học sâu tại Golden Field ở Gomez, Aidan N., Kaiser, Lukasz, Polosukhin, Illia, 2017. Tất cả những gì bạn cần là chú ý.
Alberta, ID bài viết 5387183, p. 26. Những tiến bộ trong Hệ thống xử lý thông tin thần kinh, trang 6000–6010.
LeCun, Y., Boser, B., Denker, JS, Henderson, D., Howard, RE, Hubbard, W., Jackel, L. Zang, Haixiang, Liu, Ling, Sun, Li, Cheng, Lilin, Wei, Zhinong, Sun, Guoqiang, 2020.
D., 1989. Lan truyền ngược áp dụng cho Nhận dạng mã Zip viết tay 1 (4), 541–551. Dự báo bức xạ ngang toàn cầu ngắn hạn dựa trên mô hình CNN-LSTM lai với các mối tương quan về
không gian và thời gian. Thay mới. Năng lượng 160, 26–41.
Li, Y., Hao, Z., Lei, H., 2016. Khảo sát mạng lưới thần kinh tích chập. J. Máy tính. ứng dụng. 9 (36), Zhang, Dongxiao, Chen, Yuntian, Jin, Meng, 2018. Tạo nhật ký giếng tổng hợp thông qua
2508–2515. mạng lưới thần kinh tái phát. Xăng dầu. Khám phá. Dev. 45 (4), 69–79.
Li, Y., Sun, R., Horne, R., 2019. Học sâu để phân tích lịch sử dữ liệu tốt. ngày 23 tháng 9). Hiệp hội
kỹ sư dầu khí https://doi.org/10.2118/196011-MS.
12

1 s2.0 S092041052100499X Main

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

1 s2.0 S092041052100499X Main

Uploaded by

Copyright:

Available Formats

Machine Translated by Google

Danh sách nội dung có sẵn tại ScienceDirect

Tạp chí Khoa học và Kỹ thuật Dầu khí

trang chủ tạp chí: www.elsevier.com/locate/petrol

Liqun Shan a,* , Minh Dương , Tuyết Viễn Bạch

THÔNG TIN BÀI VIẾT TRỪU TƯỢNG

(Gharbi và Mansoori, 2005) .

* Đồng tác giả.

https://doi.org/10.1016/j.petrol.2021.108838 Nhận ngày

sẵn trực tuyến ngày 25 tháng 4 năm 2021

0920-4105/© 2021 Elsevier BV Mọi quyền được bảo lưu.

L. Shan và cộng sự.

2. Phương pháp luận

L. Shan và cộng sự.

2.3. Cơ chế chú ý

và lớp lùi, ht và ht , được tính toán bằng LSTM tiêu chuẩn.

Hình 3. Kiến trúc của CNN-BiLSTM-AT được đề xuất.

Đặc điểm của nhật ký giếng từ bộ dữ liệu.

độ sâu có thể được biểu thị bằng phương trình. (10).

trong đó tập xd = (x1 x2

độ sâu d. Tập xn = (xn1, xn2, xn

L. Shan và cộng sự.

L. Shan và cộng sự.

Bảng 2 4.2. Tập dữ liệu

chức năng mục tiêu của mạng CNN-BiLSTM-AT.

Kết quả dự đoán trung bình và độ lệch chuẩn là 30

L. Shan và cộng sự.

Hình 5. Các phép đo so với dự đoán bằng CNN-BiLSTM-AT.

Hình 5. (tiếp theo).

L. Shan và cộng sự.

Người mẫu Số lớp

MAE BẢN ĐỒ MAE BẢN ĐỒ MAE BẢN ĐỒ MAE BẢN ĐỒ

RNN 1.9421 5.8554 2,0127 6.1105 2.0989 6.4484 2.3773 7.3708

L. Shan và cộng sự.

đoán nhật ký giếng mục tiêu.

trình tự. Tuyên bố của tác giả tín dụng

nhất để đáp ứng dự đoán nhật ký giếng mục tiêu.

trang 265–268. https://doi.org/10.1017/CBO9780511804489.

Geosci. Rem. Thượng nghị sĩ 56 (11), 6663–6673.

L. Shan và cộng sự.

You might also like