You are on page 1of 21

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH

TRƯỜNG ĐẠI HỌC BÁCH KHOA


KHOA KỸ THUẬT ĐỊA CHẤT VÀ DẦU KHÍ

ĐỒ ÁN MÔN HỌC
XÁC SUẤT THỐNG KÊ

ĐỒ ÁN PHÂN TÍCH DỮ LIỆU VỀ ĐỘ THẤM, ĐỘ RỖNG, ĐỊA


CHẤN VÀ SỰ PHÓNG ĐẠI CHIỀU CAO TRÊN BẢN ĐỒ TRONG
GIẾNG DẦU KHÍ

Giảng viên hướng dẫn: TS. Đặng Thương Huyền


Sinh viên thực hiện, MSSV: Nguyễn Minh Toàn 2115030
Phạm Quang Trường 2115152
Nguyễn Ngọc Thu Ngân 2114152

Thành phố Hồ Chí Minh – 2023

1
Mục lục

LỜI CẢM ƠN.....................................................................................................................3


HOẠT ĐỘNG: Phân tích dữ liệu độ rỗng, độ thấm, địa chấn và sự phóng đại độ
cao theo chiều dọc trên bản đồ trong giếng dầu khí....................................................4
1. Giới thiệu về môn học và thông số trong giếng dầu khí....................................4
1.1 Giới thiệu môn học
1.2 Giới thiệu về thông số trong giếng dầu khí
2. Phương pháp thống kê và Xử lí số liệu bằng R Studio......................................4
2.1 Phương pháp thống kê
2.2 Xử lí số liệu bằng R Studio
3. Kết luận..................................................................................................................6
PHẦN CODE R STUDIO............................................................................................29

2
LỜI CẢM ƠN
Để làm được bài báo cáo này thì đầu tiên nhóm em xin gửi lời cảm ơn sâu sắc và
chân thành đến với cô Đặng Thương Huyền, người đã hướng dẫn chúng em tận tình, góp
ý và củng cố trong suốt quá trình thực hiện đồ án môn học này. Vì không có những lời
nhắc nhở, chỉ bảo, góp ý thẳng thắn của Cô thì tụi em khó lòng hoàn thành tốt bài báo cáo
này.

Lời cảm ơn chân thành và sâu sắc xin được gửi đến tập thể Giảng viên giảng dạy tại
khoa Kỹ thuật Địa Chất & Dầu Khí, trường đại học Bách khoa TP.HCM, đã giảng dạy
truyền đạt cho bọn em những kiến thức chuyên ngành, đóng góp những ý kiến mang tính
chuyên môn cao, quí giá để tụi em hoàn thành hình ảnh tổng quan nhất về con đường tụi
em đã chọn và là nguồn kiến thức cơ sở để em thực hiện đồ án.

Với sự giúp đỡ và đồng hành cùng nhau trong lúc khó khăn, em cũng được gửi
những lời cảm ơn chân thành đến với các bạn trong nhóm đã không ngại khó khăn để
hoàn thành đồ án này.

Nội dung và hình thức của bài báo cáo lần này được thực hiện dựa trên nền tảng
kiến thức cơ sở của chúng em. Bên cạnh đó còn có sự tìm tòi, học hỏi và tham khảo để
hạn chế sai sót ít nhất có thể, mong rằng còn những khuyết điểm nào sẽ được mọi người
ân cần chỉ dạy, góp ý.

Lời cuối em xin cảm ơn và kính chúc các quý thầy cô cùng các bạn luôn dồi dào sức khỏe
và gặt hái được nhiều thành công trong công việc lẫn đời sống.

Nguyễn Minh Toàn

Phạm Quang Trường

Nguyễn Ngọc Thu Ngân

3
HOẠT ĐỘNG: PHÂN TÍCH DỮ LIỆU VỀ ĐỘ THẤM, ĐỘ
RỖNG, ĐỊA CHẤN VÀ SỰ PHÓNG ĐẠI CHIỀU CAO TRÊN
BẢN ĐỒ TRONG GIẾNG DẦU KHÍ

1. Giới thiệu

1.1 Giới thiệu môn học

Thống kê toán là bộ môn toán học nghiên cứu quy luật của các hiện tượng ngẫu nhiên có
tính chất số lớn trên cơ sở thu nhập và xử lý các số liệu thống kê (các kết quả quan sát).
Nội dung chủ yếu của thống kê toán là xây dựng các phương pháp thu thập và xử lý các
số liệu thống kê nhằm rút ra các kết luận khoa học và thực tiễn, dựa trên những thành tựu
của lý thuyết xác suất.

Việc thu thập, sắp xếp, trình bày các số liệu của tổng thể hay của một mẫu được gọi là
thống kê mô tả. Còn việc sử dụng các thông tin của mẫu để tiến hành các suy đoán, kết
luận về tổng thể gọi là thống kê suy diễn.

Thống kê được ứng dụng vào mọi lĩnh vực. Một số ngành đã phát triển thống kê ứng dụng
chuyên sâu trong ngành như thống kê trong xã hội học, trong y khoa, trong giáo dục học,
trong tâm lý học, trong kỹ thuật, trong sinh học, trong phân tích hóa học, trong thể thao,
trong hệ thống thông tin địa lý, trong xử lý hình ảnh…

Trong quá trình tìm kiếm, thăm dò và khai thác Dầu khí thì việc nghiên cứu các thông số
của vỉa chứa và sự tác động qua lại giữa chúng là rất quan trọng. Chúng có tác động trực
tiếp đến quá trình di chuyển và tích tụ dầu khí, đồng thời nó là một phần không thể thiếu
trong quá trình khai thác.

4
1.2 Giới thiệu về thông số trong giếng dầu khí

Trong công tác thăm dò và khai thác dầu khí, cần nghiên cứu đặc tính của đá chứa dầu để
đánh giá tiềm năng và khả năng khai thác của mỏ. Bốn thông số quan trọng cần xem xét
gồm Độ rỗng (Porosity), Độ thấm (Permeability), Địa chấn (Seismic), và Phóng đại Độ
cao (Vertical Exaggeration).

 Độ rỗng (Porosity): tỉ lệ giữa phần lỗ rỗng hay khoảng trống (thường chứa không khí,
nước hay dầu) nằm trong một khối đất đá so với tổng thể tích của khối đá đó.

Độ rỗng, biểu thị bằng ϕ, là tỷ lệ giữa thể tích của khoảng trống hay lỗ rỗng trong một
khối vật liệu so với tổng thể tích của khối đó. Giá trị độ rỗng thường được diễn đạt
dưới dạng số từ 0 đến 1 hoặc dưới dạng tỉ lệ phần trăm từ 0% đến 100%. Khái niệm
này phổ biến trong nhiều lĩnh vực như khoa học Trái Đất, xây dựng, sản xuất, khoa
học vật liệu, luyện kim, gốm sứ, y dược, và nhiều lĩnh vực khác.

Độ rỗng trở thành một yếu tố quan trọng trong việc đánh giá tính chất và hiệu suất
của vật liệu, đặc biệt là trong lĩnh vực khoan dầu khí và sản xuất công nghiệp. Ở
những ngành này, khả năng lưu trữ chất lỏng và truyền dẫn nhiệt của vật liệu trở nên
đặc biệt quan trọng. Đánh giá độ rỗng mang lại thông tin quan trọng về khả năng chứa
lưu chất và đồng thời ảnh hưởng đến hiệu suất và hiệu quả của các quá trình sản xuất
và khai thác.

 Độ thấm (Permeability): một đại lượng đặc trưng cho khả năng cho phép chất lưu
(lỏng và khí) đi xuyên qua mà không làm thay đổi cấu trúc của chất ấy.

Trong lĩnh vực khoa học trái đất, độ thấm thường được áp dụng để mô tả khả năng
của một chất liệu trong việc cho phép hay ngăn chặn chất lỏng hoặc khí thông qua nó.
Được đo lường bằng lượng chất lỏng hoặc khí có thể đi qua một diện tích đơn vị của
chất liệu trong một khoảng thời gian cụ thể, độ thấm thường được sử dụng rộng rãi
trong ngành địa chất để mô tả khả năng của đất hoặc đá để cho phép nước hoặc khí đi
qua.

Trong nghiên cứu về các quá trình địa chất như dòng chảy nước ngầm hoặc lưu vực
chứa dầu và khí đốt, độ thấm giúp xác định khả năng truyền dẫn và phân phối chất
5
lỏng trong môi trường đất đá. Điều này cung cấp thông tin quan trọng để hiểu và dự
đoán các hiện tượng như dòng chảy nước ngầm và sự phân bố của dầu và khí trong
tầng đất.

Các thuộc tính thấm của các chất liệu địa chất không chỉ hữu ích trong việc dự đoán
các lớp đất có khả năng chứa và giữ nước ngầm mà còn trong việc đánh giá và xác
định tầng đất có khả năng lưu trữ dầu và khí đốt. Điều này làm tăng khả năng ứng
dụng của độ thấm trong nhiều lĩnh vực khác nhau của nghiên cứu và quản lý tài
nguyên địa chất.

 Địa chấn (Seismic): là một kỹ thuật thăm dò sử dụng sóng âm (seismic wave) để
nghiên cứu cấu trúc bên trong của Trái đất. Địa chấn được sử dụng trong ngành dầu
khí để tìm kiếm dầu và khí. Địa chấn là một phương pháp quan trọng trong nghiên
cứu địa chất, đặc biệt là khi sử dụng sóng địa chấn. Công nghệ Seismic đã đóng góp
đáng kể vào việc hiểu biết về cấu trúc và tính chất của đất đai và thành quảng, mang
lại những tiến bộ lớn trong ngành công nghiệp khai thác dầu mỏ và tài nguyên địa
chất.
 Phóng đại Độ cao trên bản đồ (Vertical Exaggeration): kỹ thuật hiển thị các mô hình
địa chất 3D, cho phép phóng đại chiều cao so với kích thước nằm ngang để làm nổi
bật các chi tiết.

6
2. Phương pháp thống kê và Xử lí số liệu bằng R Studio

2.1 Phương pháp thống kê

Hồi quy bội chính là một phương pháp thống kê để thiết lập mối quan hệ giữa
một biến phụ thuộc và một nhóm tập hợp các biến độc lập. Mô hình với một
biến phụ thuộc với hai hoặc nhiều biến độc lập được gọi là hồi quy bội (hay còn
gọi là hồi quy đa biến). Ví dụ: Chi tiêu của hộ gia đình về thực phẩm phụ thuộc
vào quy mô hộ gia đình, thu nhập, vị trí địa lý,…; Tỷ lệ tử vong trẻ em của một
quốc gia phụ thuộc vào thu nhập bình quân đầu người, trình độ giáo dục,…;
Lương của một người phụ thuộc vào chức vụ, kinh nghiệm, độ tuổi,…

Lý thuyết

Đặt giả thiết

Thu thập số liệu

Thiết lập mô hình

Ước lượng tham số - Sự phù hợp của mô hình

↓ ↓

Yes No

↓ ↓
7
Dự báo và đưa ra quyết định Tìm mô hình khác

2.1. Phương trình tổng quát

Y^ x , x , x = B0 + B1 X 1+ B2 X 2
0 1 2

Bảng ANOVA:

Nguồn sai số Bậc tự Tổng số bình Bình phương Giá trị


do phương trung bình thống kê
Hồi quy k SSR SSR MSR
MSR¿ k F = MSE

Sai số N–k–1 SSE MSE =


SSE
N −k −1
Tổng cộng N-1 SST = SSR + SSE

2.2. Giá trị thống kê


a. Giá trị R bình phương

Giá trị R2 được hiệu chỉnh (Adjusted R Square)

2 SSR kF
R= =
SST ( N−k−1 ) +kF

b. Độ lệch chuẩn

S=
√ SSE
(N −k −1)
(S ≤ 0.30là khá tốt )

2.3. Trắc nghiệm thống kê


a. Trong trắc nghiệm t:

H0: β i = 0 “Các hệ số hồi quy không có ý nghĩa”


8
H0: β i ≠ 0 “Có ít nhất vài hệ số hồi quy có ý nghĩa”

Bậc tự do của giá trị t: γ =N −k −1

|B i−β i|
t=
√S 2
n

2
2 S
S=
∑ (X i− X )2
n

b. Trong trắc nghiệm F

H0: β i = 0 “Phương trình hồi quy không thích hợp”

H1: β i ≠ 0 “Phương trình hồi quy thích hợp” với ít nhất vài hệ số β i

Bậc tự do của các giá trị F: v1 = 1, v2 = N – k – 1

2.2 Xử lí số liệu bằng RSTUDIO

Đọc dữ liệu:
- Đọc tệp tin:
XSTK <- read_excel("C:/Users/nowfa/OneDrive/Máy tính/XSTK.xlsx")
- Lưu dữ liệu với tên well_data
well_data<-XSTK
Làm sạch dữ liệu
Liệt kê các biến có trong well_data
names(well_data)<-c("Well","X","Y","Z","Por","Per","Seis","Vertical Exaggeration")
names(well_data)
Kết quả:

- Trích dữ liệu con và lưu với tên new_Org và trả kết quả phần đều tiên của dữ liệu
new_Org

9
Nhập:

new_Org <- data.frame(well_data[,c(1,2,3,4,5,6,7,8)])

head(new_Org)

Kết quả:

- Kiểm tra và xuất ra các vị trí chứa giá trị khuyết của các biến trong new_Org
- Nhập:
apply(is.na(new_Org),2,which)

Tính toán số liệu:

Tính các giá trị thống kê mô tả và xuất dưới dạng bảng:

- Tính trung bình của các biến liên tục X, Y, Z, Por, Per, Seis,Vertical Exaggeration ,
và lưu vào biến tên mean
mean <- apply(well_data[,c(1,2,3,4,5,6,7)],2,mean)
- Tính trung vị của các biến liên tục X, Y, concentration, transect.length và lưu vào
biến tên median
median <- apply(well_data[,c(1,2,3,4,5,6,7)],2,median)
- Tính độ lệch chuẩn của các biến liên tục liên tục X, Y, Z, Por, Per, Seis,Vertical
Exaggeration và lưu vào biến tên sd
sd <- apply(well_data[,c(1,2,3,4,5,6,7)],2,sd)
- Tính giá trị lớn nhất của các biến liên tục X, Y, Z, Por, Per, Seis,Vertical
Exaggeration và lưu vào biến tên max
max <- apply(well_data[,c(1,2,3,4,5,6,7)],2,max)
- Tính giá trị nhỏ nhất của các biến liên tục X, Y, Z, Por, Per, Seis,Vertical
Exaggeration và lưu vào biến tên min
10
min <- apply(well_data[,c(1,2,3,4,5,6,7)],2,min)
- Tạo bảng thể hiện các giá trị thống kê mô tả cho các biến liên tục và lưu với tên
descriptive
descriptive=data.frame(mean,median,sd,max,min)
- Hiện bảng descriptive

- Vẽ đồ thị phân phối cho biến Por


hist(new_Org$Por,xlab = "Por",main = "Histogram of Por",labels = T)\

- Vẽ đồ thị phân phối của biến Per


hist(new_Org$Per,xlab = "Per",main = "Histogram of Per",labels = T)

11
- Vẽ đồ thị phân phối của biến Seis
hist(new_Org$Seis,xlab = "Seis",main = "Histogram of Seis",labels = T)

- Vẽ phân phối của biến Por theo biến X,Y,Z


pairs(Por~X,main = "Pairs of Por for each category of X value",data = new_Org)
pairs(Por~Y,main = "Pairs of Por for each category of Y value",data = new_Org)
pairs(Por~Z,main = "Pairs of Por for each category of Z value",data = new_Org)
12
Nhận xét:

Xây dựng các mô hình hồi quy tuyến tính:

Ta xét mô hình hồi quy tuyến tính với biến Por là biến phụ thuộc và các biến x,
y ,z là các biến độc lập.
13
- Xây dựng mô hình hồi quy tuyến tính bội m1
m1=lm(Por ~ X + Y + Z, data=new_Org)
- Thống kê kết quả tính toán mô hình m1

summary(m1)

14
Nhận xét:

- Xây dựng mô hình tuyến tính bội m2 nhận các giá trị không có giá trị thống kê trong
mô hình m1
m2=lm(Por ~ X + Y, data=new_Org)
- Thống kê kết quả tính toán mô hình m2
summary(m2)

Ta xét mô hình hồi quy tuyến tính với biến Per là biến phụ thuộc và các biến x,y,z là
các biến độc lập

- Xây dựng mô hình tuyến tính bội m3

m3=lm(Per ~ X+Y+Z, data=new_Org)

- Thống kê kết quả tính toán mô hình m3


summary(m3)

15
- Xây dựng mô hình tuyến tính bội m4 nhận các giá trị không có giá trị thống kê trong
mô hình m3

m4=lm(Per ~ X+Y, data=new_Org)

- Thống kê kết quả tính toán mô hình m4


summary(m4)

16
Ta xét mô hình hồi quy tuyến tính với biến Seis là biến phụ thuộc và các biến x,y,z là
các biến độc lập

- Xây dựng mô hình tuyến tính bội m5

m5=lm(Seis ~ X+Y+Z, data=new_Org)

- Thống kê kết quả tính toán mô hình m5

summary(m5)

- Xây dựng mô hình tuyến tính bội m6 nhận các giá trị không có giá trị thống kê trong
mô hình m5
m6=lm(Seis ~ X+Y, data=new_Org)
- Thống kê kết quả tính toán mô hình m6
summary(m6)

17
- Phân tích phương sai cho hai mô hình tuyến tính m1 và m2
anova(m1,m2)

Nhận xét:?

- Phân tích phương sai cho hai mô hình tuyến tính m3 và m4


anova(m3,m4)

Nhận xét:?

- Phân tích phương sai cho hai mô hình tuyến tính m5 và m6

18
anova(m5,m6)

Nhận xét:?

- Đồ thị sai số hồi quy và giá trị dự báo của mô hình m1


plot(m1,which = 1)

- Đồ thị sai số hồi quy và giá trị dự báo của mô hình m3


plot(m3,which = 1)

19
- Đồ thị sai số hồi quy và giá trị dự báo của mô hình m5
plot(m5,which = 1)

20
3. Kết luận

21

You might also like