You are on page 1of 37

Xác Suất Thống Kê Nhóm BD02 – HK231

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH


TRƯỜNG ĐẠI HỌC BÁCH KHOA TP.HCM
KHOA KHOA HỌC ỨNG DỤNG
NĂM HỌC : 2023-2024
⁌…….⸎…….⁍

BÁO CÁO BÀI TẬP LỚN


MÔN: XÁC SUẤT THỐNG KÊ

Đề tài: SỬ DỤNG MÔ HÌNH HỒI QUY TUYẾN TÍNH ĐỂ


DỰ ĐOÁN ĐỘ NHÁM CỦA SẢN PHẨM IN 3D

GVHD : Nguyễn Kiều Dung

NHÓM : BD02

STT HỌ VÀ TÊN MSSV LỚP KHOA


1 Nguyễn Trung Nguyên 2114232 L04 TTĐTBDCN
2 Vũ Trần Ngọc Hiếu 2113367 L02 TTĐTBDCN
3 Đinh Hữu Vĩnh Châu 2012712 L04 TTĐTBDCN
4 Hoàng Thị Ái Thanh 1915087 L01 TTĐTBDCN
5 Nguyễn Xuân Dũng 2113071 L02 TTĐTBDCN

Thành phố Hồ Chí Minh, 12/2023


1

Thành phố Hồ Chí Minh, 12/2023


Xác Suất Thống Kê Nhóm BD02 – HK231

1
Xác Suất Thống Kê Nhóm BD02 – HK231

MỤC LỤC
ĐỀ TÀI………………………………………………………………………….4
CHƯƠNG I. KIẾN THỨC NỀN ....................................................................... 5
1.Hồi quy tuyến tính đa biến .............................................................................. 5
1.1. Hàm hồi quy tổng thể (PRF - Population Regression Function) ................ 5
1.2. Hàm hồi quy mẫu (SRF - Sample Regression Function): .......................... 6
1.3. Các giả thiết của phương pháp bình phương nhỏ nhất cho mô hình hồi quy
tuyến tính đa biến .................................................................................................. 6
1.3.1.Hàm hồi quy là tuyến tính theo các tham số ........................................ 6
1.3.2.Kỳ vọng của các yếu tố ngẫu nhiên ui bằng 0 ...................................... 6
1.3.3.Các sai số có phương sai bằng nhau ................................................... 7
1.3.4.Các sai số của phân phối chuẩn .......................................................... 7
1.4. Độ phù hợp của mô hình ............................................................................. 7
1.5. Khoản tin cậy và kiểm định các hệ số hồi quy ........................................... 8
2.Kiểm định……………………………………………………………………..9
2.1. Kiểm định với giả thiết đối với i ................................................................. 9
2.2. Kiểm định phân phối chuẩn ........................................................................... 9
2.2.1. Kiểm định phân phối chuẩn bằng biểu đồ ........................................ 10
2.2.2. Kiểm định phân phối chuẩn bằng Q -Q plot ..................................... 10
2.3. Phân tích sâu ANOVA ................................................................................. 11
CHƯƠNG II. TIỀN XỬ LÝ DỮ LIỆU VÀ THỐNG KÊ TẢ ....................... 12
1.Tiền xử lý số liệu ............................................................................................. 12
1.1. Đọc dữ liệu ................................................................................................ 12
1.2. Khai báo hai biến “infill_pattern” và “material” là dạng phân loại.......... 12
1.3. Xử lý định dạng dữ liệu, thay đổi các giá trị chuỗi thành số .................... 13
1.4. Xử lý dữ liệu khuyết ................................................................................. 13
2. Thống kê tả .................................................................................................... 14
2.1. Tóm tắt dữ liệu ............................................................................................. 14
2.2. Biểu đồ dữ liệu ............................................................................................. 14
2.2.1. Biểu đồ dữ liệu cho biến phụ thuôc “roughness”............................. 14
2.2.2. Biểu đồ dữ liệu cho biến độc lập “layer_height”, “wall_thickness”,
“infill_density”, “nozzle_temp”, “bed_temp”, “print_speed”, “fan_speed”
..................................................................................................................... 15

2
Xác Suất Thống Kê Nhóm BD02 – HK231

2.3. Biểu đồ phân phối của biến phụ thuộc roughness theo từng nhóm phân loại
của các biến độc lập ............................................................................................ 22
2.4.Biểu đồ tương quan giữa các biến ................................................................. 25
CHƯƠNG III. XÂY DỰNG MÔ HÌNH HỒI QUY CHO BIẾN PHỤ
THUỘC ROUGHNESS ............................................................. 26
1.Mô hình hồi quy thứ nhất - model_1 ............................................................ 26
2.Mô hình hồi quy thứ hai – model_2.............................................................. 28
3.Sữ dụng phân tích sâu anova để so sánh model_1 và model_2 ................. 30
4.Kiểm tra giả định của mô hình hồi quy đa biến .......................................... 30
CHƯƠNG IV. DỰ BÁO ĐỘ NHÁM – THẢO LUẬN – MỞ RỘNG .......... 33
1.Dự báo độ nhám ............................................................................................. 33
2.Thảo luận mở rộng ......................................................................................... 34
Code và nguồn dữ liệu ...................................................................................... 36
Tài liệu tham khảo ............................................................................................ 36

3
Xác Suất Thống Kê Nhóm BD02 – HK231

ĐỀ TÀI
Sử Dụng Mô Hình Hồi Qui Tuyến Tính Để Dự Đoán Độ Nhám Của
Sản Phẩm In 3D
Tập tin “data.csv” là một bộ dữ liệu được xuất phát từ nghiên cứu của khoa Cơ
khí Đại học TR/Selcuk. Mục đích của nghiên cứu là xác định mức độ ảnh hưởng
của các thông số điều chỉnh trong máy in 3d đến chất lượng in, độ chính xác và
độ bền. Dữ liệu gốc được lấy bởi:
https://www.kaggle.com/datasets/afumetto/3dprinter/. Dữ liệu này để phân tích
các nhân tố ảnh hưởng đến độ nhám của sản phẩm in 3d. Chi tiết về bộ dữ liệu
như sau:
Ta có các biến chính:
Layer_height: Độ dày của mỗi lớp in ( mm )
Infill_pattern: Mẫu lõi in
Nozzle_temperature: Nhiệt độ của đầu in ( C 0 )
Print_speed: Tốc độ in ( mm / s )
Infill_density: Mật độ lõi in (%)
Wall_thickness: Độ dày của thành vách in ( mm )
Material: Vật liệu in 3D được sử dụng
Fan_speed: Tốc độ quạt làm mát (%)
Bed_temperature: Nhiệt độ của bàn in ( C 0 )
Roughness: Độ nhám (  m )
Yêu cầu:
Đọc dữ liệu (Import data): “data.scv”
Làm sạch dữ liệu (Data cleaning): NA (dữ liệu khuyết)
Làm rõ dữ liệu (Data visualization):
Chuyển đổi biến (nếu cần thiết)
Thống kê mô tả: Trình bày một số phương pháp thống kê mẫu dạng
bảng và vẽ đồ thị.
Thống kê suy diễn: Trình bày một số phương pháp thống kê và đưa
ra kết quả cho tổng thể.
Nêu những ưu điểm, hay kết quả mới cũng như những hạn chế của các
phương pháp đã dùng trong đề tài. Từ đó đưa ra những đề nghị mở rộng.

4
Xác Suất Thống Kê Nhóm BD02 – HK231

CHƯƠNG I. KIẾN THỨC NỀN


1. Hồi quy tuyến tính đa biến
Trong thống kê, khi muốn nghiên cứu thống kê mối liên hệ phụ thuộc của một biến
ngẫu nhiên (gọi là biến phụ thuộc) vào một hay nhiều biến ngẫu nhiên khác (gọi là các
biến độc lập), với ý tưởng ước lượng được giá trị trung bình trên tổng thể của biến phụ
thuộc theo giá trị của các biến độc lập, dựa theo mẫu đã được biết trước, người ta sẽ sử
dụng phương pháp hồi quy tuyến tính, có công thức tổng quát như sau:
Y = 1 + 2 X 2 + 3 X 3 + ... + k X k + u
Trong đó:
Y : Biến phụ thuộc
X i : Biến độc lập
1 : Hệ số tự do (Hệ số chặn)
i : Hệ số hồi quy riêng
u : số hạng sai số
Hồi quy tuyến tính là một phương pháp để dự đoán giá trị biến phụ thuộc Y dựa
trên giá trị của biến độc lập X . Phần chúng ta nghiên cứu sẽ là hồi quy tuyến tính đa
biến, dự báo một biến phụ thuộc theo nhiều biến độc lập X .
1.1. Hàm hồi quy tổng thể (PRF - Population Regression Function)
Với Y là biến phụ thuộc X 2 , X 3 , X 4 ,..., X k _klà biến độc lập, Y là ngẫu nhiên
và có một phân phối xác suất nào đó.
 E (Y | X 2 , X 3 , X 4 ,..., X k ) = 1 giá trị xác định

Do vậy, F ( X 2 , X 3 , X 4 ,..., X k ) = E (Y | X 2 , X 3 , X 4 ,..., X k ) là hàm hồi quy tổng

thể của Y theo X 2 , X 3 , X 4 ,..., X k

(
Với một cá thể i  E X 2,i , X 3,i , X 4,i ,..., X k ,i , Yi )
Ta có: Yi  F ( X 2 , X 3 , X 4 ,..., X k )  ui = Yi − F

Do vậy: Yi = E (Y | X 2 , X 3 , X 4 ,..., X k ) + ui

Hồi quy tổng thể PRF:


Y = E (Y | X ) + U

5
Xác Suất Thống Kê Nhóm BD02 – HK231

E (Y | X ) = F ( X )

1.2. Hàm hồi quy mẫu (SRF - Sample Regression Function):


Do không biết tổng thể, nên chúng ta không biết giá trị trung bình tổng thể của biến
phụ thuộc là đúng ở mức độ nào. Do vậy chúng ta phải dựa vào dữ liệu mẫu để ước

lượng. Trên một mẫu có n cá thể, gọi Yˆ = Fˆ ( X 2 , X 3 ,..., X k ) là hồi quy mẫu.

( )
Với một cá thể Yi  Fˆ X 2,i , X 3,i ,..., X k ,i sinh ra ei − Yi − Fˆ ( X 2 , X 3 ,..., X k ) ; ei
gọi là phần dư SRF.
Ta có hàm hồi quy mẫu tổng quát được viết dưới dạng như sau:

Yˆ1 = ˆ1 + ˆ2 X 2,1 + ˆ3 X 3,1 + ..... + ˆk X k ,1


Phần dư sinh ra: ei = yi − yˆi
Ký hiệu ˆm là ước lượng  m
Chúng ta trông đợi ˆm là ước lượng không chênh lệch của  m hơn nữa phải là một
ước lượng hiệu quả.
Ước lượng SRF: chọn một phương pháp nào đó để ước lượng các tham số của F qua

việc tìm các tham số của F̂ và lấy giá trị quan sát của các tham số này làm giá trị xấp
xỉ cho tham số của F.
1.3. Các giả thiết của phương pháp bình phương nhỏ nhất cho mô hình hồi quy
tuyến tính đa biến
1.3.1.Hàm hồi quy là tuyến tính theo các tham số
Điều này có nghĩa là quá trình thực hành hồi quy trên thực tế được miêu tả bởi mối
quan hệ dưới dạng:
y = 1 + 2 X 2 + 3 X 3 + 4 X 4 + .... + k X k + u
Hoặc mối quan hệ thực tế có thể được viết lại ví dụ như dưới dạng lấy logarit cả hai vế.
1.3.2.Kỳ vọng của các yếu tố ngẫu nhiên ui bằng 0
Trung bình tổng thể sai số là bằng 0. Điều này có nghĩa là có một số giá trị sai số
mang dấu dương và một số sai số mang dấu âm. Do hàm xem như là đường trung bình

6
Xác Suất Thống Kê Nhóm BD02 – HK231

nên có thể giả định rằng các sai số ngẫu nhiên trên sẽ bị loại trừ nhau ở mức trung bình
trong tổng thể.
1.3.3.Các sai số có phương sai bằng nhau
Tất cả giá trị u được phân phối giống nhau với cùng phương sai  2 , sao cho

( )
Var ( ui ) = E u12 =  2

1.3.4.Các sai số của phân phối chuẩn


Điều này rất quan trọng khi phát sinh khoảng tin cậy và thực hiện kiểm định giả
thuyết trong những phạm vi mẫu là nhỏ. Nhưng khi phạm vi mẫu lớn hơn, điều này trở
nên không mấy quan trọng.
1.4. Độ phù hợp của mô hình
Để có thể biết mô hình giải thích được như thế nào hay bao nhiêu % biến động của
biến phụ thuộc, người ta sử dụng R2 .
Ta có:

 ( yi − y )
2
: TSS-Total Sum of Squares

 ( yˆi − y ) : ESS-Explained Sum of Squares


2

  ˆJ −  J  
P  −t   ( n − k )    P  t   ( n − k )  = 1 −  : RSS-Residual Sum of Squares

  
2

 ( )
Se ˆJ  
 2

Ta có thể viết: TSS = ESS + RSS


Ý nghĩa của các thành phần:
TSS là tổng bình phương của tất cả các sai lệch giữa các giá trị quan sát Yi và giá trị
trung bình.
ESS là tổng bình phương của tất cả các sai lệch giữa các giá trị của biến phụ thuộc
Y nhận được từ hàm hồi quy mẫu và giá trị trung bình của chúng. Phần này đo độ chính
xác của hàm hồi quy.
RSS là tổng bình phương của tất cả các sai lệch giữa các giá trị quan sát Y và các giá
trị nhận được từ hàm hồi quy.
TSS được chia thành 2 phần: một phần do ESS và một phần do RSS gây ra.
ESS RSS
R 2 được xác định theo công thức: R 2 = =1−
TSS TSS
7
Xác Suất Thống Kê Nhóm BD02 – HK231

Tỷ số giữa tổng biến thiên được giải thích bởi mô hình cho tổng bình phương cần
được giải thích được gọi là hệ số xác định, hay là trị thống kê “good of fit”. Từ định
nghĩa R 2 chúng ta thấy R 2 đo tỷ lệ hay số % của toàn bộ sai lệch Y với giá trị trung
bình được giải thích bằng mô hình. Khi đó người ta sử dụng R 2 để đo sự phù hợp của
hàm hồi quy: 0  R2  1
R2 cao nghĩa là mô hình ước lượng được giải thích được một mức độ cao biến động
của biến phụ thuộc.
Nếu R 2 = 1 , nghĩa là đường hồi quy giải thích 100% thay đổi của y.
Nếu R2 = 0 , nghĩa là mô hình không đưa ra thông tin nào về sự thay đổi của biến
phụ thuộc Y.
1.5. Khoản tin cậy và kiểm định các hệ số hồi quy
Mục đích của phân tích hồi quy không phải chỉ suy đoán về 1 + 2 + ... + k mà
còn phải kiểm tra bản chất phụ thuộc. Do vậy cần phải biết phân bố xác suất của
1 + 2 + ... + k . Các phân bố này phụ thuộc vào phân bố của các ui .
Với các giả thiết OLS, ui có phân phối N ( 0, 2 ) . Các hệ số ước lượng tuân theo
phân phối chuẩn:

ˆ (
N ˆJ , Se ( ˆJ ) )
ˆJ −  J
T (n − k )
Se ˆJ( )
Ước lượng phương sai sai số dựa vào các phần dư bình phương tối thiểu. Trong

đó k là số hệ số có trong phương trình hồi quy đa biến: 


 ei2
ˆ = n−k
2

Uớc lượng 2 phía, ta tìm được t   ( n − k ) thỏa mãn:



 2 

  ˆ −   
P −t   ( n − k ) 
  J J
 P t   ( n − k )  = 1 − 

 2
  
 Se ˆJ
 ( )
 2
  


Khoảng tin cậy 1-𝛼 của 𝛽𝐽 là:

8
Xác Suất Thống Kê Nhóm BD02 – HK231

   
 ˆ − t   ( n − k )  ˆ 
Se   J   ;  ˆJ + t   ( n − k )  ˆ 
Se   J  
 J      
  2   

 2  
2. Kiểm định
2.1. Kiểm định với giả thiết đối với  i
Kiểm định ý nghĩa thống kê của các hệ số hồi quy có ý nghĩa hay không: kiểm định
rằng biến giải thích có thực sự ảnh hưởng đến biến phụ thuộc hay không, nói cách khác
là hệ số hồi quy có ý nghĩa thống kê hay không.
Có thể đưa ra giả thiết nào đó đối với  j , chẳng hạn  j =  j . Nếu giả thiết này
ˆJ −  J
đúng thì: T = T (n − k )
( )
Se ˆJ

Bảng 1. Bảng tóm tắt giả thuyết và miền bác bỏ tương ứng

Loại giả thuyết Giả thuyết H 0 Giả thuyết H1 Miền bác bỏ

Hai phía  j =  j  j   j t = t
;n−k
2

Phía bên ngoài  j   j  j   j t  t


;n−k
2

Phía bên trái  j   j  j   j t  t


;n−k
2

Ta có thể sử dụng giá trị P-value: P-value < mức ý nghĩa thì bác bỏ giả thiết H 0 .

Kiểm định  j

Giả thuyết H 0 :  j = 0  x j không tác động.

Giả thuyết H1 :  j  0  x j có tác động.

 j  0  x j có tác động ngược.


 j  0  x j có tác động thuận

2.2. Kiểm định phân phối chuẩn


Trong phân tích thống kê, phần lớn các phép tính dựa vào giả định biến số phải là
một biến số phân phối chuẩn (Normal Distribution). Do đó, một trong những việc quan

9
Xác Suất Thống Kê Nhóm BD02 – HK231

trọng khi xem xét dữ kiện là phải kiểm định giả thiết phân phối chuẩn của một biến số.
Khi chúng ta muốn kiểm định sự khác nhau của 2 phân nhóm hay trong việc phân tích
các mô hình hồi quy, thì luôn có một giả thiết rất quan trọng đó là các biến phân tích
phải có phân phối chuẩn.

2.2.1. Kiểm định phân phối chuẩn bằng biểu đồ


Dựa vào biểu đồ Histogram với đường cong biểu diễn cho phân phối chuẩn: xét
thấy có sự trùng khớp thì biến sẽ tuân theo phân phối chuẩn và ngược lại nếu không có
sự trùng khớp thì ta nói biến không tuân theo phân phối chuẩn.

Hình 1. Biểu đồ Histogram

2.2.2. Kiểm định phân phối chuẩn bằng Q -Q plot


Biểu đồ Q-Q plot có thể cho ta thấy được những giá trị quan sát đa phần có nằm
trên đường thẳng kì vọng của phân phối chuẩn hay không. Nếu đã phần không nằm trên
đường kì vọng thì ta nói biến đó không tuân theo phân phối chuẩn.

Hình 2. Biểu đồ Q-Q plot

10
Xác Suất Thống Kê Nhóm BD02 – HK231

2.3. Phân tích sâu ANOVA


Mục đích của phân tích phương sai là kiểm định giả thuyết H 0 rằng trung bình
của các tổng thể bằng nhau. Sau khi phân tích và kết luận, có hai trường hợp xảy ra là
chấp nhận giả thuyết H 0 hoặc bác bỏ giả thuyết H 0 . Nếu chấp nhận giả thuyết H 0 thì

phân tích kết thúc. Nếu bác bỏ giả thuyết H 0 , ta kết luận trung bình của các tổng thể
không bằng nhau. Vấn để tiếp theo là phân tích sâu hơn để xác định nhóm (tổng thể)
nào khác nhóm nào, nhóm nào có trung bình lớn hơn hay nhỏ hơn.
Có nhiều phương pháp để tiếp tục phân tích sâu ANOVA khi bác bỏ giả thuyết
H0. Trong phần này chỉ để cập đến 1 phương pháp thông dụng đó là phương pháp Tukey,
phương pháp này còn được gọi là kiểm định HSD (Honestly Significant Differences).
Nội dung của phương pháp này là so sánh từng cặp các trung bình nhóm ở mức
ý nghĩa α nào đó cho tất cả các cặp kiểm định có thể để phát hiện ra những nhóm khác
nhau. Nếu có k nhóm nghiên cứu, và chúng ta so sánh tất cả các cặp nhóm thì số lượng
cặp cần phải so sánh là tổ hợp chập 2 của k nhóm.
k! k ( k − 1)
Ck2 = =
2!( k − 2 )! 2
Ví dụ ta có 3 nhóm thì số cặp so sánh trong kiểm định HSD là 3 cặp
 H 0 :1 = 2  H1 :1  2

Vậy số giả thuyết cần kiểm định là:  H 0 : 2 = 3  H1 : 2  3
 H :1 = 3  H :1  3
 0 1

MSW
Giá trị giới hạn Tukey sẽ được tính theo công thức: T = qa ,k ,n−k
ni
Trong đó:
qa ,k ,n−k : giá trị tra bảng phân phối kiểm định Tukey ở mức ý nghĩa alpha
với bật tự do k và n-k, với n là tổng số quan sát của mẫu.
MSW là trung bình chênh lệch bình phương trong nội bộ nhóm.
Tiêu chuẩn kiểm định để bác bỏ giả thuyết H 0 khi độ lệch tuyệt đối giữa các
cặp trung bình mẫu lớn hơn hay bằng T giới hạn.

11
Xác Suất Thống Kê Nhóm BD02 – HK231

CHƯƠNG II. TIỀN XỬ LÝ DỮ LIỆU VÀ THỐNG KÊ TẢ


1. Tiền xử lý số liệu

1.1. Đọc dữ liệu


Chúng tôi đi tiến hành đọc dữ liệu data từ đề tài bằng lệnh read.csv

Hình 3. Code và Đọc dữ liệu từ file excel “data.csv”

Nhận xét: Sau khi thực hiện lệnh read.csv, chúng tôi thấy rằng bộ dữ liệu có 12
biến trong đó mỗi biến có 50 giá trị trong đó có hai biến phân loại “infill_pattern” và
“material” có kiểu dữ liệu charactor.

1.2. Khai báo hai biến “infill_pattern” và “material” là dạng phân loại
Chúng ta đi đến bước tiếp theo là khai báo dạng phân loại cho hai biến có kiểu
dữ liệu charactor bằng lệnh factor và dùng lệnh head để xem các dữ liệu ở đầu của bộ
dữ liệu data.

Hình 4. Code và Kết quả khai báo 2 biến phân loại “infill_pattern” và “material”

12
Xác Suất Thống Kê Nhóm BD02 – HK231

Nhận xét: Kết quả đã khai báo thành công 2 biến “infill_pattern” và “material” là biến
phân loại.

1.3. Xử lý định dạng dữ liệu, thay đổi các giá trị chuỗi thành số
Việc chuyển đổi các giá trị chuỗi thành số trong bảng thống kê có một số lý do
quan trọng. Việc gán số cho vật liệu pla giúp phân tích loại và nhận biết các biến danh
mục khác nhau.
Trong bộ dữ liệu này chúng ta thấy có hai cột giá trị chuỗi cần biến đổi là cột
“material” và cột “infill_pattern”. Ở cột material chúng ta sẽ gán chuỗi là vật liệu “abs”
cho số 0 và “pla” cho số 1, tương tự ở cột “infill_pattern” chúng ta gán “grid” cho số 0
và “honeycomb” cho số 1.

Hình 5. Code và Kết quả chuyển “abs, grid” là số 0, “pla, honeycomb” là số 1

Nhận xét: Ở cột “material’ giá trị đã thay đổi thành 0 và 1 tương ứng với vật liệu
abs và pla, tương tự ở cột “infill_pattern” số 0 tương ứng với “grid” và số 1 tương ứng
với “honeycomb”.

1.4. Xử lý dữ liệu khuyết

Hình 6. Code và Kết quả kiểm tra số dữ liệu khuyết

Nhận xét: Dựa vào kết quả chúng tôi kết luận bộ dữ liệu này không có dữ liệu
khuyết.

13
Xác Suất Thống Kê Nhóm BD02 – HK231

2. Thống kê tả

2.1. Tóm tắt dữ liệu


Chúng tôi sẽ hiển thị tổng quan về sữ liệu bằng cách dữ dụng lệnh summary(df)

Hình 7. Tóm tắt dữ liệu của df

2.2. Biểu đồ dữ liệu


2.2.1. Biểu đồ dữ liệu cho biến phụ thuộc “roughness”

Hình 8. Code and Boxplot, Histogram of roughness

14
Xác Suất Thống Kê Nhóm BD02 – HK231

Hình 9. Tóm tắt dư liệu biến roughness

Nhận xét: Nhìn vào biểu đồ boxplot của biến roughness (độ nhám) ta có
thể thấy các giá trị dữ liệu phân bố ở vùng 90  m - 140  m , điểm thất nhất nằm
ở khoảng 20  m và điểm cao nhất là khoảng hơn 350  m . Điều tương tự cũng
được thể hiện rõ ở biểu đồ histogram, các giá trị từ 50  m -200  m lặp lại khá cao
khoảng trên 8 lần. Rất phù hợp với kết quả khi chúng ta dùng lệnh summary để
thực hiện tóm tắt dữ liệu.
2.2.2. Biểu đồ dữ liệu cho biến độc lập “layer_height”, “wall_thickness”,
“infill_density”, “nozzle_temp”, “bed_temp”, “print_speed”, “fan_speed”
2.2.2.1. Biểu đồ dữ liệu cho biến độc lập “layer_height”

Hình 10. Code and Boxplot, Histogram of layer_height

Hình 11. Tóm tắt dữ liệu của biến layer_height

15
Xác Suất Thống Kê Nhóm BD02 – HK231

Nhận xét: Khi xem xét biểu hai biểu đồ boxplot và histogram có thể thấy rằng
các giá trị của biến nằm trong khoảng 0 mm - 0.2 mm , có phân bố chủ yếu trong
vùng từ 0.05 mm - 0.15 mm . Điều này phù hợp với kết quả mà chúng ta thu được
khi sử dụng tóm tắt dữ liệu của biến layer_height.
2.2.2.2. Biểu đồ dữ liệu cho biến độc lập “wall_thickness”

Hình 12. Code and Boxplot, Histogram of wall_thickness

Hình 13. Tóm tắt dữ liệu của biến wall_thickness

Nhận xét: Nhìn vào biểu đồ ta có thể thấy các giá trị của biến
wall_thickness phân bố chủ yếu ở khoảng từ 3 mm - 7 mm , cũng có thể biết được
giá trị lớn nhất là 10 mm , tần suất xuất hiện của các giá trị từ 0 mm - 2 mm là cao
nhất với khoảng 10 lần. Kết quả trên phù hợp với kết quả khi ta dùng lệnh
summary để tóm tắt dữ liệu.

16
Xác Suất Thống Kê Nhóm BD02 – HK231

2.2.2.3. Biểu đồ dữ liệu cho biến độc lập “infill_density”

Hình 14. Code and Boxplot, Histogram of infill_density

Hình 15. Tóm tắt dữ liệu của biến infill_density

Nhận xét: Nhìn vào biểu đồ ta có thể thấy các giá trị của biến infill_density
phân bố chủ yếu ở khoảng có giá trị từ 10% - 90%, tần suất xuất hiện cao nhất là
các giá trị từ 40% - 50% với 10 lần lặp lại. Như vậy có thể thấy kết quả ở biểu đồ
boxplot và histogram là hoàn toàn phù hợp với kết quả mà lệnh tóm tắt dữ liệu
summary thực hiện.

17
Xác Suất Thống Kê Nhóm BD02 – HK231

2.2.2.4. Biểu đồ dữ liệu cho biến độc lập “nozzle_temp”

Hình 16. Code and Boxplot, Histogram of nozzle_temp

Hình 17. Tóm tắt dữ liệu của biến nozzle_temp

Nhận xét: Biểu đồ boxplot và histogram cho thấy giá trị của biến nozzle_temp
phân bố chủ yểu từ 200 độ C – 230 độ C và có giá trị lớn nhất là 250 độ C, tần
suất xuất hiện nhiều nhất là từ khoảng 200 -205 độ C và khoảng 215 -220 độ C.
Cho thấy các biểu đồ này biểu diễn đúng và hợp lý với các kết quả tính toán tóm
tắt dữ liệu từ lệnh summary.

18
Xác Suất Thống Kê Nhóm BD02 – HK231

2.2.2.5. Biểu đồ dữ liệu của biến độc lập “bed_temp”

Boxplot and histogram of bed_temp

Tóm tắt dữ liệu của biến bed_temp

Nhận xét: Dựa vào hai biểu đồ trên ta có thể thấy được các giá trị của biến
bed_temp tập trung chủ yêu ở khoảng 65 độ C đến 75 độ C và các giá trị trong
khoảng từ 60 độ C đến 65 độ C là có tần suất xuất hiện nhiều nhất với khoảng 20
lần xuất hiện. Cũng phù hợp với kết quả tính toán bằng lệnh tóm tắt dữ liệu mà
chúng tôi đã làm phía trên.

19
Xác Suất Thống Kê Nhóm BD02 – HK231

2.2.2.6. Biểu đồ dữ liệu của biến độc lập “print_speed”

Hình 18. Code and Boxplot, Histogram of print_speed

Hình 19. Tóm tắt dữ liệu của biến print_speed

Nhận xét: Từ biểu đồ trên ta có thể đưa ra những kết luận ban đầu như sau:
giá trị của biến print_speed chủ yếu nằm trong khoảng từ 40 – 60 mm s , các giá
trị trong khoảng này cũng có tần suất xuất hiện tương đối khá cao chiếm khoảng
gần 80 % tần suất xuất hiện. Còn lại là một số ít các giá trị nằm trong khoảng từ
110 – 120 mm s . Từ đó cho thấy sự phù hợp với kết quả mà chúng tôi tính ra từ
lệnh tóm tắt dữ liệu của biến print_speed.

20
Xác Suất Thống Kê Nhóm BD02 – HK231

2.2.2.7. Biểu đồ dữ liệu của biến độc lập “fan_speed”

Hình 20. Code and Boxplot, Histogram of fan_speed

Hình 21. Tóm tắt dữ liệu của biến fan_speed

Nhận xét: Ta có thể thấy từ biểu đồ cho thấy các giá trị từ 25 % – 75 %
chiếm tỷ lệ cao trong các giá trị của biến fan_speed và các giá trị của biến có tần
suất xuất hiện là ngang nhau.

21
Xác Suất Thống Kê Nhóm BD02 – HK231

2.3. Biểu đồ phân phối của biến phụ thuộc roughness theo từng nhóm phân loại
của các biến độc lập

22
Xác Suất Thống Kê Nhóm BD02 – HK231

Hình 22. Biểu đồ phân phối của biến phụ thuộc roughness theo từng nhóm phân loại của
các biến độc lập

Nhận xét:
Từ biểu đồ trên ta thấy rằng càng tăng giá trị “layer_height” thì biến
“roughness” sẽ tăng lên, chúng tôi có thể thấy được mức tăng này là đáng kể và tăng
lên một cách liên tục nếu như “layer_height” càng tăng. Chứng tỏ hai biến có mối quan
hệ ảnh hưởng một cách rõ rệt khi chúng tôi xem xét biểu đồ phân phối của chúng.
Từ biểu đồ trên ta thấy rằng các giá trị nhóm phân loại trong biến
“wall_thickness” tăng lên thì các giá trị của biến “roughness” tăng giảm không liên tục.
Chúng tôi chưa thấy được một sự ảnh hưởng một cách cụ thể của biến “wall_thickness”
lên biến “roughness”. Chúng tôi chỉ thấy được ở nhóm 4, 5, 6 mm của biến
“wall_thickness” có mức trung vị coi như là gần bằng nhau nhưng cũng chưa thể kết
luận được liệu chúng có ảnh hưởng gi với biến “roughness”.
Các giá trị nhóm phân loại trong biến infill_density tăng lên thì các giá trị của
biến roughness tăng giảm không liên tục. Một cái chúng tôi muốn nhắc đến đó chính là
ở nhóm 30, 40, 50 và 60 % của biến infill_density có sự tăng lên liên tục của biến
roughness.
Nhìn vào biểu đồ trên ta thấy sự ảnh hưởng của nhóm “grid” lên độ nhám –
roughness có phần lớn hơn nhóm “honeycomb” nhưng vậy vẫn không có khác biệt quá
lớn giữa hai nhómnày. Cả hai nhóm đều có khoảng 50% mà giá trị độ nhám – roughness
từ 100 đến dưới 250 .
Nhìn vào biểu đồ phân phối theo nhóm của biến nozzle_temp ta thấy sự ảnh
hưởng của biến này lên biến phụ thuộc tăng giảm không liên tục, chỉ khi nhiệt độ từ 225
độ C – 250 độ C thì biến roughness có xu hướng tăng lên liên tục.

23
Xác Suất Thống Kê Nhóm BD02 – HK231

Ta có thể thấy nếu như tăng giá trị của biến bed_temp lến thì các giá trị của biến
độ nhám – roughness có xu hướng tăng lên và ta có thể thấy một cách rõ ràng thông qua
boxplot của các nhóm đều tăng lên từ trái qua phải. Chứng tỏ hai biến này có quan hệ
ảnh hưởng với nhau khi ta xem xét biểu đồ phân phối của chúng
Khi tăng giá trị của biến print_speed thì điểm nhỏ nhất ở biểu đồ boxplot của các
nhóm tăng lên và chúng ta có thể thấy rõ. Tuy nhiên các điểm cao nhất của các biểu đồ
này lại tăng giảm không liên tục. Một điều thú vị nữa mà chúng tôi có thể thấy mà trung
vị của các nhóm này gần như bằng nhau, có sự chênh lệch không đáng kể.
Ta có thể thấy giá trị của biến độ nhám – roughness giảm khi thay thế vật liệu
nhóm “abs” sang nhóm “pla”. Điều này chúng ta có thể thấy rõ trên biểu đồ một cách rõ
rệt khi mà boxplot của nhóm “abs” có chiều cao hơn hẳn nhóm “pla”. Cho thấy hai biến
này có quan hệ ảnh hưởng với nhau
Từ biểu đồ trên ta thấy rằng càng tăng giá trị “fan_speed” thì biến “roughness”
sẽ tăng lên, chúng tôi có thể thấy được mức tăng này là đáng kể và tăng lên một cách
liên tục nếu như “layer_height” càng tăng. Chứng tỏ hai biến có mối quan hệ ảnh hưởng
một cách rõ rệt khi chúng tôi xem xét biểu đồ phân phối của chúng.
Kết luận:
Sau khi chúng tôi xem xét các biểu đồ phân phối của biến phụ thuộc “roughness”
theo từng nhóm phân loại của các biến độc lập thì chúng tôi có thể đưa ra kết luận sơ bộ
như sau:
Các biến “layer_height”, “infill_pattern”, “nozzle_temperature”,
“bed_temperature”, “material” và “fan_speed” là có mối quan hệ ảnh hưởng đến biến
phụ thuộc được thể hiển rõ trên biểu đồ.
Các biến “layer_height”, “bed_temperature”, “material” và “fan_speed” là các
biển có biểu đồ chúng tôi quan sát rõ nhất về sự ảnh hưởng của chúng lên thông số đầu
ra độ nhám – roughness.

24
Xác Suất Thống Kê Nhóm BD02 – HK231

2.4. Biểu đồ tương quan giữa các biến

Hình 23. Code và Biểu đồ tương quan giữa các biến

Nhận xét:
Biến phụ thuộc “roughness” và biến độc lập “layer_height” có hệ số tương quan
là 0.8 do đó kết luận rằng biến “roughness” có quan hệ tuyến tính mạnh với biến độc lập
“layer_height”, đồng thời biến phụ thuộc quan hệ tuyến tính mạnh với các biến độc lập
còn lại.
Hệ số tương quan giữa biến “bed_temperature” và “fan_speed” bằng 1. Điều đó
cho thấy có hiện tượng đa cộng tuyến xảy ra (2 biến độc lập này có mối quan hệ phụ
thuộc), gây cản trở nhiều cho việc dự đoán và có thể làm tăng đáng kể phương sai của
các ước lượng hệ số, làm giảm độ tin cậy của kết quả hồi quy. Do đó, tiến hành loại bỏ
1 trong 2 biến này khi dựng mô hình.

25
Xác Suất Thống Kê Nhóm BD02 – HK231

CHƯƠNG III. XÂY DỰNG MÔ HÌNH HỒI QUY CHO BIẾN


PHỤ THUỘC ROUGHNESS
Theo như phân tích ở “Hình 31” ta sẽ tiến hành bỏ đi biến “fan_speed” trong mô
hình hồi quy tuyến tính của chúng tôi, vì vậy chúng tôi chọn những biến sau đây để xây
dựng mô hình hồi quy tuyến tính:
Layer_height: Độ dày của mỗi lớp in ( mm )
Infill_pattern: Mẫu lõi in
Nozzle_temperature: Nhiệt độ của đầu in ( C 0 )
Print_speed: Tốc độ in ( mm / s )
Infill_density: Mật độ lõi in (%)
Wall_thickness: Độ dày của thành vách in ( mm )
Material: Vật liệu in 3D được sử dụng
Bed_temperature: Nhiệt độ của bàn in ( C 0 )
Roughness: Độ nhám (  m )
Mô hình hồi quy tổng quát được biểu diễn như sau:
ˆ
roughness =  0 + 1.layer _ height +  2 .infill _ pattern + 3.nozzle _ temp
+  4 . pr int_ speed + 5 .infill _ density +  6 .wall _ thickness +  7 .material
+ 8 .bed _ temp

1. Mô hình hồi quy thứ nhất - model_1


Chúng tôi xây dựng mô hình hồi quy cho biến “roughness” trong đó sử dụng tất
cả các biến đầu vào ngoại trừ biến “fan_speed”.

Hình 24. Đoạn code của mô hình hồi quy thứ nhất model_1

26
Xác Suất Thống Kê Nhóm BD02 – HK231

Hình 25. Tòm tắt kết quả hồi quy của model_1

Nhận xét:
Thứ nhất, dựa vào kết quả trên cho ta biết:
Cột Estimate: Hệ số β của mô hình hồi quy
Cột Std. Error: Độ lệch chuẩn của ước lượng hệ số  tương ứng
Cột t-value = Estimate/Std. Error: là giá trị t kiểm định trong giả thuyết
H0 :  = 0

 H1 :   0
nếu giá trị t có giá trị tuyệt đối lớn hơn giá trị tới hạn, giả thiết H 0 bị bác bỏ, thể hiện
hệ số  có ý nghĩa thống kê.

H0 :  = 0
Cột Pr(>|t|): Giá trị p-value trong kiểm định giả thuyết 
 H1 :   0
(***) thể hiện có mức ý nghĩa thống kê 0%, (**) mức ý nghĩa thống kê 0.1%,
(*) mức ý nghĩa thống kê 1%.
27
Xác Suất Thống Kê Nhóm BD02 – HK231

Thứ hai, ta rút được phương trình hồi quy


ˆ
roughness = −2371 + 1269.layer _ height − 0,1255.infill _ patternhoneycomb
+15,06.nozzle _ temp + 0,6496. pr int_ speed − 0,04231.infill _ density
+2,334.wall _ thickness + 298,5.materialalpha − 16,13.bed _ temp
Thứ ba, ta kiểm định các hệ số hồi quy mô hình model_1
Giả thuyết H 0 : i = 0
Giả thuyết đối H1 : i  0
Pr(> |t|) của các hệ số ứng với biến “wall_thickness”, “infill_density” và
“infill_patternhoneycomb” lớn hơn với mức ý nghĩa  = 0,05 nên ta chưa đủ cơ sở để
bác bỏ giả thuyết H 0 . Do đó hệ số ứng với biến này không có ý nghĩa với mô hình hồi
quy ta xây dựng (model_1). Ta có thể loại biển này ra khỏi mô hình
Pr(> |t|) của các hệ số ứng với biến còn lại bé hơn với mức ý nghĩa α=0.05 nên ta
bác bỏ giả thuyết H 0 , chấp nhận giả thuyết H1 . Do đó hệ số ứng với biến này có ý
nghĩa với mô hình hồi qui mà ta xây dựng (model_1)
Thứ tư, xem xét giá trị R 2 = 0,8752 ; R 2 _ hieuchinh = 0,8509
Với cùng ý nghĩa giải thích sự biến thiên của biến phụ thuộc “roughness” bởi
bao nhiêu % từ sự biến thiên các biến độc lập. Từ kết quả phân tích ta thấy giá trị
R 2 _ hieuchinh = 0,8509 . Nghĩa là trong 100% sự biến thiên của biến “roughness” thì
có 85,09% nguyên nhân là do các biến độc lập gây nên. Và 14,91% còn lại là do các yếu
tố khác gấy ra. Ngoài ra, với 85,09% ta có thể đánh giá mô hình hồi qui ở mức tốt.

2. Mô hình hồi quy thứ hai – model_2


Ta xây dựng mô hình 2 là mô hình là loại bỏ các biến “wall_thickness, infill
_density, infill_patternhoneycomb” ra khỏi mô hình.

Hình 26. Đoạn code của mô hình hồi quy thứ nhất model_2

28
Xác Suất Thống Kê Nhóm BD02 – HK231

Hình 27. Tóm tắt kết quả hồi quy của model_2

Nhận xét:
Thứ nhất, ta rút ra được phương trình hồi quy
ˆ
roughness = −2310,7356 + 1246,5353.layer _ height + 14,7774.nozzle _ temp
+0,5538. pr int_ speed + 294,1610.materialalpha − 15,8078.bed _ temp
Thứ hai, ta kiểm định các hệ số hồi quy mô hình model_2
Giả thuyết H 0 : i = 0

Giả thuyết đối H1 : i  0


 Pr(> |t|) của các hệ số ứng với biến đều bé hơn với mức ý nghĩa  = 0,05
nên ta bác bỏ giả thuyết H 0 , chấp nhận giả thuyết H1 . Do đó hệ số ứng với biến này có
ý nghĩa với mô hình hồi qui mà ta xây dựng (model_2)

29
Xác Suất Thống Kê Nhóm BD02 – HK231

3. Sữ dụng phân tích sâu anova để so sánh model_1 và model_2

Hình 28. Code và Kết quả phân tích Anova

Nhận xét:
Giả thuyết H 0 : Hai mô hình hiệu quả hồi quy như nhau

Giả thuyết đối H1 : Hai mô hình hiệu quả hồi quy khác nhau
Thứ nhất, vì p_value = 0.8749 > mức ý nghĩa 5%, nên ta chưa đủ cơ sở để bác bỏ giả
thuyết H 0 . Vậy model_1 và model_2 có hiệu quả hồi quy giống nhau.

Thứ hai, mặt khác ở model_2 R 2 _ hieuchinh = 0,8571 cao hơn so với model_1 nên
có nghĩa model_2 giải thích được biến thiên của biến roughness bởi các biến độc lập.
Do đó model_2 là mô hình hiệu quả nhất
Hệ số xác định hiệu chỉnh (Adjusted R-squared): R 2 _ hieuchinh = 0,8571nghĩa là
85.71% sự biến thiên trong biến độ nhám - roughness được giải thích bởi các biến độc
lập.
4. Kiểm tra giả định của mô hình hồi quy đa biến
Các giả định của mô hình hồi qui bao gồm
Giả định 1: Tính tuyến tính của dữ liệu: mối quan hệ giữa biến dự báo Xi và biến
phụ thuộc Y phải có quan hệ tuyến tính.
Giả định 2: Sai số có phân phối chuẩn 25
Giả định 3: Sai số có kỳ vọng bằng 0.
Giả định 4: Phương sai của các sai số là hằng số
Chúng tôi tiến hành vẽ các đồ thị để kiểm tra các giả định của mô hình.

Hình 29. Đoạn code vẽ đồ thị kiểm tra giả đinh của model_2

30
Xác Suất Thống Kê Nhóm BD02 – HK231

Hình 30. Đồ thị của model_2

Nhận xét:
Đồ thị thứ 1 (Residuals vs Fitted) vẽ các giá trị dự báo với các giá trị thặng dư
(sai số) tương ứng, dùng để kiểm tra giả định các sai số có kỳ vọng bằng 0 và tính đồng
nhất của các phương sai sai số.
Dựa trên đồ thị ta thấy đường màu đỏ tương đối nằm sát đường y = 0 nên giả
định các sai số có kỳ vọng bằng 0 tương đối thỏa mãn. Các sai số phân tán ngẫu nhiên
tương đối dọc theo đường màu đỏ, nên giả định phương sai các sai số là hằng số tương
đối thoả mãn.
Đồ thị thứ 2 (Normal Q-Q) vẽ các giá trị sai sai số được chuẩn hoá, cho phép
kiểm tra giả định về phân phối chuẩn của các sai số.
Dựa trên đồ thị ta thấy các sai số tập trung nằm trên đường thẳng kỳ vọng phân
phối chuẩn nên giả định phân phối chuẩn của các sai số được thỏa mãn.
Đồ thị thứ 3 (Scale - Location) vẽ căn bậc hai của các giá trị thặng dư được
chuẩn hóa với các giá trị dự báo, được dùng để kiểm tra giả định phương sai của các sai
số là hằng số.

31
Xác Suất Thống Kê Nhóm BD02 – HK231

Dựa trên đồ thị ta thấy, các sai số phân tán tương đối ngẫu nhiên dọc theo đường
màu đỏ nên giả định phương sai các sai số là hằng số tương đối thoả mãn.
Đồ thị thứ 4 (Residuals vs Leverage) cho phép xác định những điểm có ảnh
hưởng cao (influential observations), nếu chúng có hiện diện trong bộ dữ liệu. Những
điểm có ảnh hưởng cao này có thể là các điểm outliers, là những điểm có thể gây nhiều
ảnh hưởng nhất khi phân tích dữ liệu.
Dựa trên đồ thị ta thấy có các quan trắc thứ 5, 23, 25 có thể là các điểm có ảnh
hưởng cao trong bộ dữ liệu. Tuy nhiên ta cũng quan sát thấy rằng các điểm này chưa
vượt qua đường thẳng khoảng cách Cook (đường thẳng đứt nét màu đỏ Cook’s distance).
Do vậy, các điểm này chưa thực sự là các điểm có ảnh hưởng cao trong bộ dữ liệu. Do
đó ta không cần phải loại bỏ chúng khi phân tích.

32
Xác Suất Thống Kê Nhóm BD02 – HK231

CHƯƠNG IV. DỰ BÁO ĐỘ NHÁM – THẢO LUẬN – MỞ RỘNG

1. Dự báo độ nhám
Từ mô hình model_2, chúng tôi dùng lệnh predict để dự báo độ nhám – roughness
tại hai thuộc tính như sau:
X1 layer_height = mean(layer_height)
nozzle_temperature =mean(nozzle_temperature)
bed_temperature = mean(bed_temperature),
print_speed =mean(print_speed)
material = “abs”
X2 layer_height = max(layer_height)
nozzle_temperature =max(nozzle_temperature)
bed_temperature = max(bed_temperature)
print_speed =max(print_speed)
material = “abs”
Xây dựng thuộc tính X1

Hình 31. Code và Kết quả xây dụng thuộc tính X1


Xây dựng thuộc tính X2

Hình 32. Code và Kết quả xây dụng thuộc tính X2


So sánh roughness dự báo tại 2 thuộc tính X1, X2

Hình 33. Code và Kết quả so sánh X1, X2

33
Xác Suất Thống Kê Nhóm BD02 – HK231

Nhận xét:
Ta thấy được chiều dài khoảng tin cậy (range) của X1 > X2 nên ta có thể kết luận
với tập dữ liệu từ X2, ta có thể thu được một giá trị dư báo chính xác hơn so với X1.
2. Thảo luận mở rộng
Việc xây dựng mô hình hồi quy tuyến tính để dự đoán roughness dựa trên các
biến độc lập như layer_height, nozzle_temperature, print_speed, bed_temperature,
material, infill_pattern, wall_thickness, fan_speed và infill_density có thể mang lại
nhiều ứng dụng thực tế trong ngành công nghiệp in 3D.
Ứng dụng thực tế
Tối ưu hóa Quá trình In 3D: Mô hình có thể giúp dự đoán được độ
nhám(roughness) của sản phẩm in 3D dựa trên các thông số in và vật liệu được sử dụng.
Điều này có thể hỗ trợ trong việc tối ưu hóa các thông số in như nhiệt độ, tốc độ in, hoặc
cấu trúc lưới bên trong để đạt được bề mặt sản phẩm tốt nhất mà không cần thử nghiệm
qua nhiều lần và tối ưu hóa sản phẩm cuối cùng.
Kiểm Tra và Đánh Giá Sản Phẩm: Dự đoán độ nhám(roughness) có thể giúp
kiểm soát chất lượng sản phẩm in 3D. Khi độ nhám(roughness) được dự đoán trước, các
điều chỉnh có thể được thực hiện để đảm bảo chất lượng ổn định của sản phẩm cuối
cùng.
Tối ưu hóa Vật liệu và Thiết kế: Hiểu rõ tác động của các thông số in và vật liệu
lên độ nhám(roughness) có thể giúp người dùng tránh được việc in ra các mẫu thử
nghiệm hoặc sản phẩm có chất lượng không mong muốn. Điều này giúp tối ưu hóa vật
liệu liệu và thiết kế.
Tiết kiệm Chi phí và Thời gian: Việc dự đoán độ nhám(roughness) trước khi in
3D có thể giúp tránh việc thử nghiệm lặp đi lặp lại để điều chỉnh thông số in và vật liệu,
giảm thiểu lãng phí vật liệu và thời gian sản xuất.
Nâng cao chất lượng và phát triển sản phẩm: Bằng cách điều chỉnh các thông số
in và vật liệu dựa trên dự đoán độ nhám(roughness), giúp nhà thiết kế dự đoán kết quả
và điều chỉnh thiết kế để có thể tạo ra sản phẩm in 3D với chất lượng và bề mặt như
mong muốn.

34
Xác Suất Thống Kê Nhóm BD02 – HK231

Hiểu Biết Sâu Hơn về Quy trình In 3D: Qua việc phân tích tác động của các
biến lên độ nhám(roughness), người dùng có thể hiểu sâu hơn về quy trình in 3D và cách
tối ưu hóa nó.
Tóm lại, dự đoán độ nhám từ máy in 3D không chỉ giúp cải thiện chất lượng sản
phẩm mà còn tối ưu hóa quy trình sản xuất và tiết kiệm tài nguyên sản xuất. Điều này
đóng vai trò quan trọng trong việc tạo ra sản phẩm chất lượng cao với chi phí và thời
gian sản xuất thấp nhất.
Tuy nhiên, đối với việc xây dựng mô hình này, việc thu thập dữ liệu chính xác
và đủ lớn từ nhiều quy trình in 3D và vật liệu khác nhau là rất quan trọng để mô hình có
thể dự đoán độ nhám(roughness) một cách chính xác và đáng tin cậy.

35
Xác Suất Thống Kê Nhóm BD02 – HK231

Code và nguồn dữ liệu


Code phân tích hồi quy có thể truy cập tại đây: bd02-hk231.R
Nguồn dữ liệu có thể truy cập tại đây: data.csv
Tài liệu tham khảo
1/ Nguyễn Đình Huy (chủ biên), Đậu Thế Cáp, Lê Xuân Đại. Giáo trình xác
suất và thống kê, NXB Đại học Quốc gia TP.HCM, 2019.
2/ Đình Huy (chủ biên), Nguyễn Bá Thi, Bài tập xác suất thống kê, NXB Đại
học quốc gia Tp.HCM, 2018.
3/ Phân tích phương sai Anova, Giáo sư Nguyễn Văn Tuấn, truy cập từ:
https://www.youtube.com/watch?v=nzV76mII7lo&list=RDCMUC21dOPe-
YHO3Gw6BRbyeotQ&index=3
4/ Hiển thị dữ liệu, Giáo sư Nguyễn Văn Tuấn, truy cập từ:
https://www.youtube.com/watch?v=VNExPOfIeLc&list=PLbRKZL7ww3qh
vbM3b33BsKacPku66o6Pn
5/ Hồi quy tuyến tính, Giáo sư Nguyễn Văn Tuấn, truy cập từ:
https://www.youtube.com/watch?v=eVp0oyKxtrI&list=PLbRKZL7ww3qg44
CHsBtGP8u_nmvOc7Va0
6/ Phân tích dữ liệu và biểu đồ bằng R, truy cập từ:
https://cran.r-project.org/doc/contrib/Intro_to_R_Vietnamese.pdf
7/ Vijay K. Rohatgi, A. K. Md. Ehsanes Saleh, Giới thiệu về Xác suất và Thống
kê, 2015.

36

You might also like