You are on page 1of 37

TRƯỜNG ĐẠI HỌC BÁCH KHOA

THÀNH PHỐ HỒ CHÍ MINH


KHOA CƠ KHÍ
BỘ MÔN: KHOA HỌC VÀ ỨNG DỤNG
--------------o0o--------------

XÁC SUẤT VÀ THỐNG KÊ


Bài Tập Lớn
XÁC ĐỊNH MỨC ĐỘ ẢNH HƯỞNG CỦACÁC
THÔNG SỐ ĐIỀU CHỈNH TRONG MÁY IN 3D
GVHD: TS. PHAN THỊ HƯỜNG
STT MÃ SỐ SINH VIÊN HỌ VÀ TÊN QUÁ TRÌNH TIẾN TRÌNH
1 2233095 HỒ LÊ THANH BÌNH 100% 3.1+WORD
2 1852261 LÊ TIẾN BẢO 100% 3.3+3.2
3 2112892 NGUYỄN VĂN BẰNG 100% 1.1+2.2 + 2.3
4 2033791 NGUYỄN VĂN TRỌNG 100% 3.4
5 - PHẠM NGUYỄN MINH TUẤN 0% -

THÀNH PHỐ HỒ CHÍ MINH, THÁNG 8/2023


MỤC LỤC
MỤC LỤC ....................................................................................................................... i
DANH MỤC HÌNH ẢNH .............................................................................................iii
CHƯƠNG 1. GIỚI THIỆU DỮ LIỆU ........................................................................... 1
1.1. CƠ SỞ LÝ THUYẾT ................................................................................ 1
1.1.1. Hồi qui tuyến tính bội ........................................................................................... 1
1.1.2. Hàm hồi quy tổng thể (PRF- Population Regression Function) ........................... 1
1.1.3. Hàm hồi quy mẫu (SRF - Sample Regression Function): .................................. 1
1.1.4. Các giả thiết của phương pháp bình phương nhỏ nhất cho mô hình hồi quy tuyến
tính bội ............................................................................................................................ 2
1.1.5. Độ phù hợp của mô hình............................................................................. 2
1.1.6. Khoảng tin cậy và kiểm định các hệ số hồi quy ...................................... 3
1.1.7. Kiểm định mức độ ý nghĩa chung của mô hình (trường hợp đặc
biệt của kiểm định WALD) ...................................................................................... 5
CHƯƠNG 2. MÔ TẢ ..................................................................................................... 8
2.1. PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ........................................... 8
2.1.1. Lý thuyết về ANOVA (Phân tích phương sai) ..................................................... 8
2.1.2. Phân tích phương sai một yếu tố ......................................................................... 8
2.1.3. Phân tích sâu ANOVA ................................................................................. 13
2.2. Mô hình hồi quy tuyến tính bội ............................................................... 14
2.3. Hệ số xác định ......................................................................................... 15
CHƯƠNG 3. THỐNG KÊ MÔ TẢ .............................................................................. 16
3.1. THỐNG KÊ DỮ LIỆU ........................................................................... 16
3.1.1. KIỂM TRA GIÁ TRỊ CÒN BỊ THIẾU .............................................................. 17
3.1.2. LOẠI BỎ BIẾN KHÔNG ĐÁNG KỂ ...................................................................
3.1.3. Tạo Biến mới ...................................................................................................... 17
3.2. Mô tả dữ liệu ...............................................................................................
3.3. THỐNG KÊ DỮ LIỆU MỚI ......................................................................
3.3.1. Biểu đồ dữ liệu .......................................................................................................
3.3.2. Ma trận tương quan: ........................................................................................... 19
3.4. THỐNG KÊ SUY LUẬN ....................................................................... 23
3.4.1. Ta sẽ xây dựng mô hình hồi quy trong đó .......................................................... 23
3.4.2. Mô hình hồi quy được biểu diễn như sau ........................................................... 23
3.4.3. Ta xây dựng mô hình 2 ....................................................................................... 24
3.4.4. Ta xây dựng mô hình 3 ....................................................................................... 25
3.4.5. Ta xây dựng mô hình 4 ....................................................................................... 26
3.4.6. Từ việc so sánh các mô hình, ta nhận thấy mô hình 3 có hiệu quả cao nhất...... 26
3.5. Kiểm tra các giả định của mô hình. ........................................................ 27

trang ii
DANH MỤC HÌNH ẢNH
Hình 3.1: Đoạn code thống kê dữ liệu .......................................................................... 16
Hình 3.2: Đoạn dữ liệu xem nhanh các giá trị .............................................................. 16
Hình 3.3 Đoạn dữ liệu kiểm tra bị khuyết và tổng hàng, cột ....................................... 17
Hình 3.4: Biểu đồ Heatmap .......................................................................................... 18
Hình 3.5: Datafram sau khi xử lý .....................................................................................
Hình 3. 6 Tạo dữ liệu mới ............................................................................................ 19
Hình 3.7: Biểu đồ Boxplot ............................................................................................ 20

trang iii
CHƯƠNG 1. GIỚI THIỆU DỮ LIỆU
CƠ SỞ LÝ THUYẾT
Hồi qui tuyến tính bội
Mô hình Hồi quy tuyến tính bội có dạng tổng quát như sau:
Y = β1 + β2 X 2 + β 3 X3 + . . . + β k X k + u
Trong đó :
+ Y : Biến phụ thuộc
+ Xi : Biến độc lập
+ β1 : Hệ số tự do (hệ số chẵn)
+ βi : Hệ số hồi quy riêng.
Như vậy, “Hồi quy tuyến tính" là một phương pháp để dự đoán giá trị biến phụ
thuộc(Y) dựa trên giá trị của biến độc lập (X).
Hàm hồi quy tổng thể (PRF- Population Regression Function)
Với Y là biến phụ thuộc X2, X3,...,Xk là biến độc lập, Y là ngẫu nhiên và có một phân
phối xác suất nào đó.
Suy ra: Tồn | tại E (Y X2, X3, . . . , Xk) = giá trị xác định.
Do vậy, F (X2 , X3 , . . .| , Xk )=E (Y X2 , X3 , . . . , Xk ) là hàm hồi quy tổng thể của
Y theo X2 , X3 ,...,Xk . Với một cá thể i, tồn tại (X2,i, X3,i, . . . , Xk,i, Yi)
Ta có : Yi F (X2, X3, . . ., Xk) ⇒ ui = Yi − F
Do vậy: Y|i = E (Y X2, X3, . . . , Xk) + ui
Hồi quy tổng thể PRF:
+ Y = E (Y | X) + U
+ E (Y | X) = F(X)
Hàm hồi quy mẫu (SRF - Sample Regression Function):
Do không biết tổng thể, nên chúng ta không biết giá trị trung bình tổng thể của biến phụ
thuộc là đúng ở mức độ nào. Do vậy chúng ta phải dựa vào dữ liệu mẫu để ước lượng. Trên một
mẫu có n cá thể, gọi Ŷ = Fˆ (X2 , X3 , . . . , Xk ) là hồi quy mẫu. Với một cá thể mẫu Yi /= Fˆ
(X2,i , X3,i , . . . , Xk,i ) sinh ra ei Yi Fˆ (X2 , X3 , . . . , Xk ); ei gọi là phần dư SRF. Ta có
hàm hồi quy mẫu tổng quát được viết dưới dạng như sau:
ŷi = β̂1 + β̂2 x2,i + β̂3 x3,i + . . . + β̂k xk,i

trang 1
Phần dư sinh ra:−ei = yi ŷi Ký hiệu: β̂m là ước lượng của βm . Chúng ta trông đợi

β̂m là ước lượng không chệcch của βm, hơn nữa phải là một ước lượng hiệu quả. Ước lượng SRF:

chọn một phương pháp nào đó để ước lượng các tham số của F qua việc tìm các tham số của Fˆ
và lấy giá trị quan sát củacác tham số này làm giá trị xấp xỉ cho tham số của F.

Các giả thiết của phương pháp bình phương nhỏ nhất cho mô hình hồi quy tuyến tính
bội
Trong khi xây dựng mô hình hồi quy đa biến cần kiểm tra các giả thiết như sau:

Hàm hồi quy là tuyến tính theo các tham số.


Điều này có nghĩa là quá trình thực hành hồi quy trên thực tế được miêu tả bởi mối quan
hệ dưới dạng: y = β1 + β2x2 + β3x3 + β4x4 + . . . + βkxk + u
hoặc mối quan hệ thực tế có thể được viết lại ví dụ như dưới dạng lay loga cả hai vế.
Kỳ vọng của các yếu tố ngẫu nhiên ui bằng 0.
Trung bình tổng thể sai số là bằng 0. Điều này có nghĩa là có một số giá trị sai số mang
dấu dương và một số sai số mang dấu âm. Do hàm xem như là đường trung bình nên có thể giả
định rằng các sai số ngẫu nhiên trên sẽ bị loại trà nhau, ở mác trung bình, trong tổng thể.
Các sai số độc lập với nhau. Các sai số có phương sai bằng nhau.
Tất cả giá trị u được phân phối giống nhau với cùng phương sai σ2, sao cho: Var i(ui) = E
u2 = σ2.
Các sai số có phân phối chuẩn. Điều này rất quan trọng khi phát sinh khoảng tin cậy và thực
hiện kiểm định giả thuyết trong những phạm vi mẫu là nhỏ. Nhưng phạm vi mẫu lớn hơn, Điều
này trở nên không mấy quan trong.
Độ phù hợp của mô hình
Để có thể biết mô hình giải thích được như thể nào hay bao nhiêu % biến động của biến
phụ thuộc, người ta sử dụng R2.
Ta có:
+− Σ (yi y¯)2 : TSS – Total Sum of Squares
+− Σ (ŷi y¯)2 : ESS – Explained Sum of Squares
+ Σe2i : RSS – Residual Sum of Squares Ta có thể viết: TSS = ESS+RSS
Ý nghĩa của các thành phần:

trang 2
+ TSS là tổng bình phương của tất cả các sai lệch giữa các giá trị quan sát Yi và giá trị
trung bình.
+ ESS là tổng bình phương của tất cả các sai lệch giữa các giá trị của biến phụ thuộc Y
nhận được tà hàm hồi quy mẫu và giá trị trung bình của chúng. Phần này đo độ chính xác của
hàm hồi quy.
+ RSS là tổng bình phương của tất cả các sai lệch giữa các giá trị quan sát Y và các giá trị
nhận được tà hàm hồi quy.
+ TSS được chia thành 2 phần: một phần do ESS và một phần do RSS gây ra.
R2 được xác định theo
công thức:

Tỷ số giữa tổng biến thiên được giải thích bởi mô hình cho tổng bình phương cần được giải
thích được gọi là hệ số xác định, hay là trị thống kê “good of fit”. Từ định nghĩa R2 chúng ta
thay R2 đo tỉ lệ hay số % của toàn b sai lệch Y với giá trị trung bình được giải thích bằng mô
hình. Khi đó người ta sử dụng R2 để đo sự phù hợp của hàm hồi quy:
≤ + 0≤ R2 1.
+ R2 cao nghĩa là mô hình ước lượng được giải thích được một mức độ cao biến động
của biến phụ thuộc.
+ Nếu R2 = 1, nghĩa là đường hồi quy giải thích 100% thay đổi của y.
+ Nếu R2 = 0, nghĩa là mô hình không đưa ra thông tin nào về sự thay đổi của biến phụ
thuộc y.
Phía trái β1 ≥ β i ∗ β1 < βi∗ t < −tα;n−k

Ta có thể sử dụng giá trị P-value: P-value < mác ý nghĩa thì bác bỏ giả thiết H0

Khoảng tin cậy và kiểm định các hệ số hồi quy


- Ước lượng khoảng tin cậy đối với các hệ số hồi quy:
Mục đích của phân tích hồi quy không phải chỉ suy đoán về β1, β2, . . . , βk mà còn
phải kiểm tra bản chất sự phụ thuộc. Do vậy cần phải biết phân bo xác suất của β1, β2, . . .

trang 3
, βk. Các phân bố này phụ thuộc vào phân bố của các ui . Với các giả thiết OLS, ui có

phân phối N 0, σ 2 . Các hệ số ước lượng tuân theo phân phối chuẩn:

Ước lượng phương sai sai số dựa vào các phần dư bình phương tối thiểu. Trong đó k
là số hệ số có trong phương trình hồi quy đa biến:

+ ước lượng 2 phía , ta tìm được t  (n-k) thỏa mãn

Khoảng tin cậy 1 − α của βj là:

β̂ j − t α (n − k) Se(β̂ j); β̂ j + t α (n − k) Se(β̂ j)

Kiểm định giả thiết đối với βj:

Kiểm định ý nghĩa thống kê của các hệ sốhồi quy có ý nghĩa hay không: kiểm định rằng
biến giải thích có thực sự ảnh hưởng đển biến phụ thuộc hay không. Nói cách khác là hệ số hồi
quy có ý nghĩa thống kê hay không.
Có thể đưa ra giả thiết nào đó đoi với βj , chȁng hạn βj = βj ∗ . Nếu giả thiết này đúng thì:

Ta có bảng sau:
Bảng 1: Bảng tóm tắt giả thuyết và miền bác bỏ tương ứng

trang 4
Loại gia thiết Giả thiếtH0 Giả thiếtđoi H1 Mien bác bo
Hai phía β1 = βi∗ βi /= βi∗ |t| > tα/2;n−k

phai β1 ≤ βi∗ βi > βi∗ t > tα;n−k

Bước 1: Giả thuyết H0: β2 = β3 = . . . = βk = 0.


Giả thuyết H1: “có ít nhất một trong những giá trị β khác không”.
Bước 2: Trước tiên hồi quy Y theo một số hạng không đổi và X2, X3, . . . , Xk, sau
đó tính tổng bình

Kiểm định βj:


Giả thuyết H0 : βj = 0 ⇔ xj không tác động
Giả thuyết H1 : βj 0 ⇔ xj có tác động.
βj < 0 ⇔ xj có tác động ngược
βj > 0 ⇔ xj có tác động thuận
Kiểm định mức độ ý nghĩa chung của mô hình (trường hợp đặc biệt của kiểm
định WALD)
Khái quát về kiểm định WALD:
- Giả sử chúng ta có 2 mô hình dưới đây
(U) : Y = β1 + β2X2 + β3X3 + β4X4 + u
(R) : Y = β1 + β2X2 + v
Mô hình U được gọi là mô hình không giới hạn (Unrestrict), và mô hình R được
gọi là mô hình giới hạn (Restrict). Đó là do β3 và β4 bu c phải bằng 0 trong mô hình R. Ta
có thể kiểm định giả thuyết liên kết β3 = β4 = 0 với giả thuyết đối là ít nhất một trong
những hệ số này không bằng 0. Kiểm định giả thuyết liên kết này được gọi là kiểm định
Wald, thủ tục như sau.
Đặt các mô hình giới hạn và không giới hạn là:
(U) : Y = β1 + β2X2 + . . . + βmXm + βm+1Xm+1 + . . . + βkXk + u
(R) : Y = β1 + β2X2 + . . . + βmXm + v Mô hình (R) có được bằng cách bỏ bớt
một số biến ở mô hình
(U), đó là:Xm+1, Xm+1,... Xk
Giả thuyết H0 : βm+1 = . . . = βk = 0

trang 5
Giả thuyết H1 : “Không phải đồng thời các tham số bằng 0”.
Lưu ý rằng (U) cháa k hệ số hồi quy chưa biết và (R) chứa m hệ số hồi quy chưa
— −
biết. Do đó, mô hình R có ít hơn (k m) thông số số với U. Câu hỏi chúng ta nêu ra là (k -
m) biến bị loại ra có ảnh hưởng liên kết có ý nghĩa đoi với Y hay không.
Trị thống kê kiểm định đối với giả thiết này là:

Với R2 là số đo đ thích hợp không hiệu chỉnh. Với giả thuyết không, Fc có phân
phối F với (k − m)
Bậc tự do đoi với tả số và (n − k) bậc tự do đoi với mẫu số.
Bác bỏ giả thuyết H0 khi:
Fc > F (α, k − m, n − k)
Hoặc giá trị p-value của thống kê F nhỏ hơn mác ý nghĩa cho trước.
Trong mô hình hồi quy đa biến, giả thuyết “không” cho rằng mô hình không có ý
nghĩa được hiểu là tất cả các hệ số hồi quy riêng đều bằng 0.
sai số RSSU , RSSR. Phân phối F là t số của hai biến ngẫu nhiên phân phối khi bình
phương độc lập. Điều này cho ta trị thống kê:
Vì H0 : β2 = β3 = . . . = βk = 0, nhận thay rằng trị thống kê kiểm định đoi với giả
thuyết này sẽ là:
sai số RSSU , RSSR. Phân phối F là t số của hai biến ngẫu nhiên phân phối khi bình
phương độc lập. Điều này cho ta trị thống kê:

Vì H0 : β2 = β3 = . . . = βk = 0, nhận thay rằng trị thống kê kiểm định đoi với giả
thuyết này sẽ là:

trang 6
Bước 3: Tra số liệu trong bảng F tương ứng với bậc
— tự do (k-1)cho tả
− số và (n - k) cho
mẫu số, và với mác ý nghĩa α cho trước.
Bước 4: Bác bỏ giả thuyết H0 ở mác ý nghĩa α nếu Fc > F (α, k − 1, n − k)
Đoi với phương pháp giá trị p-value, tính giá trị p = P (F > Fc H0) và bác bỏ
|
giả thuyết H0 nếu p bé hơn mác ý nghĩa α.

trang 7
CHƯƠNG 2. MÔ TẢ
PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ
Lý thuyết về ANOVA (Phân tích phương sai)
Mục tiêu của phân tích phương sai (Analysis of Variance - ANOVA) là số sánh trung bình
của nhieu nhóm (tổng thể) dựa trên các trị trung bình của các mẫu quan sát tà các nhóm này và
thông qua kiểm định giả thuyết của kết luận về sự bằng nhau của các trung bình tổng thể này.
Ta có các mô hình phân tích phương sai: phân tích phương sai một yếu tốvà hai yếu
tố. Cụm từ yếu tố ở đây ám chỉ số lượng yếu tốnguyên nhân ảnh hưởng đển yếu tố kết quả đang
nghiên cứu.

Phân tích phương sai một yếu tố


Phân tích phương sai một yếu tố (One way ANOVA) là phân tích ảnh hưởng của một yếu
tố nguyên nhân (dạng biến định tính) ảnh hưởng đển một yếu tố kết quả (dạng biến định lượng)
đang nghiên cứu.
Trường hợp k tổng thể có phân phối chuẩn và phương sai bằng nhau:
- Giả sử rằng chúng ta muon số sánh trung bình của k tổng thể (với ví dụ trên thì k
= 3) dựa trên những mẫu ngẫu nhiên độc lập gom n1, n2, n3, . . . , nk quan sát tà k tổng
thể. Cần ghi nhớ ba giả định sau đây về các nhómộtổng thể được tiến hành phân
tích ANOVA.
+ Các tổng thể này có phân phối bình thường.
+ Các phương sai tổng thể bằng nhau
+ Các quan sát được lay mẫu là độc lập nhau.

- Nếu trung bình của các tổng thể được ký hiệu là µ1 = µ2 = ... = µk thì khi các giả
định trên được đáp áng, mô hình phân tích phương sai một yếu tố ảnh hưởng được mô tả
dưới dạng kiểm định giả thuyết như sau: H0: µ1 = µ2 = ... = µk và giả thuyết đối là
H1: Tồn tại ít nhất một c p trung bình tổng thể khác nhau.
Các bước thực hiện:
Bước 1: Tính các trung bình mẫu của các nhóm (xem như đại di¾n của các tổng thể)
Trước het ta xem cách tính các trung bình mẫu tà những quan sát của k mẫu ngẫu nhiên độc
lập (ký hiệu x¯1 x¯2 , x¯k ) và trung bình chung của k mẫu quan sát (ký hiệu x¯) tà trường hợp tổng
quát như sau:
Bảng 2: Bảng số liệu tổng quát thực hiện phân tích phương sai.
trang 8
Tổng thể
1 2 3 4
X11 X21 ... Xk1
X11 X22 ... Xk1
... ... ... ...
X1n1 X2n2 ... Xknk

Tính trung bình mẫu của tàng nhóm x¯1 x¯2 , ....x¯k theo công thức:

Và trung bình chung của k mẫu (trung bình chung của toàn b mẫu khảo sát):

Bước 2: Tính các tổng các chênh lệch bình phương (hay gọi tất là tổng bình phương) Tính
tổng các chênh lệch bình phương trong nội bộnhóm SSW 1và tổng các chênh lệch bình phương giữa
các nhóm SSG2.
Tổng các chênh lệch bình phương trong nội bộ nhóm (SSW) được tính bằng cách cộng các
chênh lệch bình phương giữa các giá trị quan sát với trung bình mẫu của tàng nhóm, rồi sau đó lại
tính tổng cộng kết quả tất cả các nhóm lại. SSW phản ánh phần biến thiên của yếu tố kết quả do
ảnh hưởng của các yếu tố khác, chá không phải do yếu tố nguyên nhân đang nghiên cứu (là yếu tố
dùng để phân biệt các tổng thể / nhóm đang số sánh).
Tổng các chênh lệch bình phương của tàng nhóm được tính theo công thác:

Tương tự như vậy ta tính cho đển nhóm thá k được SSk . Vậy tổng các chênh lệch
bình phương trong nội bộcác nhóm được tính như sau:

trang 9
SSW = SS1 + SS2 + ... + SSk
Tổng các chênh lệch bình phương giữa các nhóm (SSG) được tính bằng cách cộng các chênh
lệch được lấy bình phương giữa các trung bình mẫu của tàng nhóm với trung bình chung của k nhóm
(các chênh lệch này đều được nhân thêm với số quan sát tương ứng cả tàng nhóm). SSG phản ánh
phần biến thiên của yếu tố kết quả do ảnh hưởng của yếu tố nguyên nhân đang nghiên cứu.

Tổng các chênh lệch bình phương toàn bộ SST được tính bằng cách cộng tổng các chênh lệch
đã lấy bình phương giữa tàng giá trị quan sát của toàn bộ mẫu nghiên cứu (xij) với trung bình
toàn bộ (x). SST phản ánh biến thiên của yếu tố kết quả do ảnh hưởng của tất cả các nguyên
nhân.

Có thể dễ dàng chứng minh là tổng các chênh lệch bình phương toàn bộ bằng tổng cộng
tổng các chênh lệch bình phương trong nội bộ các nhóm và tổng các chênh lệch bình phương giữa
các nhóm. SST = SSW + SSG
Như vậy công thác trên cho thấy, SST là toàn bộ biến thiên của yếu tố kết quả đã được phân
tích thành hai phần: phần biến thiên do yếu tố đang nghiên cứu tạo ra (SSG) và phần biến thiên
còn lại do các yếu tố khác không nghiên cứu ở đây tạo ra (SSW). Nếu phần biến thiên do yếu tố
nguyên nhân đang xét tạo ra càng “đáng kể” số với phần biến thiên do các yếu tố khác không xét
tạo ra, thì chúng ta càng có cơ sở để bác bỏ H0 và kết luận là yếu tố nguyên nhân đang nghiên
cứu ảnh hưởng có ý nghĩa đển yếu tố kết quả.
Bước 3: Tính các phương sai (là trung bình của các chênh lệch bình phương). Các phương sai
được tính bằng cách lay các tổng chênh lệch bình phương chia cho bậctự do tương áng.
Tính phương sai trong nội bộnhóm (MSW) bằng cách lấy tổng các chênh lệch bình phương
trong nội bộ các nhóm (SSW) chia cho bậc tự do tương ứng là n - k (n là số quan sát, k là số
nhóm số sánh). MSW là ước lượng phân biến thiên của yếu tố kết quả do các yếu tố khác gây ra.

trang 10
Tính phương sai giữa các nhóm (MSG) bằng cách lay tổng các chênh lệch bình phương giữa
các nhóm chia cho bậctự do tương ứnglà k - 1. MSG là ước lượng phan biến thiên của yếu tốkết
quả do yếu tốnguyên nhân đang nghiên cứu gây ra.

Giả thuyết ve sự bằng nhau của k trung bình tổng thể được quyết định dựa trên tỉ số của hai phương
sai: phương sai giữa các nhóm (MSG) và phương sai trong nội bộ nhóm (MSW). Tỉ số này gọi là
tỉ số F vì nó tuân theo định luật Fisher – Snedecor với bậc tự do k - 1 ở tả số và n - k ở mẫu số.

Ta bác bỏ giả thuyết H0 cho rằng trị trung bình của k tổng thể bằng nhau khi:

F > Fk−1;n−k;α

F > Fk−1;n−k;α là giá trị giới hạn với bậctự do k tra theo hàng đầu tiên và n – k tra theo cột
đầu tiên, nhớ chọn bảng với mác ý nghĩa phù hợp.

Sau đây là dạng bảng kết quả tổng quát của ANOVA khi phân tích bằng chương tình Excel hay
SPSS.
Kiểm tra các gia định của phân tích phương sai:

Chúng ta có thể kiểm tra nhanh các giả định này bằng đo thị. Histogram là phương pháp tốt
nhất để kiểm tra giả định về phân phối chuẩn của dữ liệu nhưng nó đòi hỏi một số lượng quan sát
khá lớn. Biểu đồ thân lá hay biểu đồ hộp và râu là một thay thể tot trong tình huống số quan sát
ít hơn. Nếu công cụ đo thị cho thay tập dữ liệu mẫu khá phù hợp với phân phối bình thường thì ta
có thể xem giả định phân phối bình thường đã thỏa mãn.

trang 11
Bảng 3: Bảng kết quả tổng quát của ANOVA khi phân tích bằng Excel hay SPSS.

Nguon biến thiên Tổng bình phương Bậctự do Phương sai Tỉ số F


Giữa các nhóm SSG k −1

Trong nội bộ nhóm SSW n −k


Toàn b SST n −1

Một phương pháp kiểm định tham số chắc chắn hơn cho giả định phương sai bằng
nhau là kiểm định Levene về phương sai của các tổng thể. Kiểm định này xuất phát tà giả
thyết sau.

H1:
H1: có ít nhất một cặp phương sai khác nhau.
Để quyết định chấp nhận hay bác bỏ H0 ta tính toán giá trị kiểm định F theo công
thác:

S 2 max là phương sai lớn nhất trong các nhóm nghiên cứu và S 2 min là phương sai nhỏ nhất

trong các nhóm nghiên cứu.


Giá trị F tính được được đểm số sánh với giá trị Fk;df;α tra được tà bảng phân phối

Hartley Fmax. Trong đó, k là số nhóm số sánh, bậctự do df tính theo công thức df = (n − 1)
Trong tình huong, các nhóm có số quan sát khác nhau thì
(chú ý là nếu kết quả tính n̄ là
một số thập phân thì ta lay phần nguyên).
Quy tac quyết định:
Fmax > Fk;df;α thì bác bỏ giả thuyết H0 cho rằng phương sai bằng nhau và ngược lại.
Nếu chúng ta không chắc chắn các giả định hoặc nếu kết quả kiểm định cho thay các giả định
không được thỏa mãn thì một phương pháp kiểm định thay thể cho ANOVA là phương pháp kiểm định
phi tham số Kruskal - Wallis sẽ được áp dụng.
trang 12
Phân tích sâu ANOVA

Mục đích của phân tích phương sai là kiểm định giả thuyết H0 rằng trung bình của tổng
thể bằng nhau. Sau khi phân tích và kết luận, có hai trường hợp xảy ra là chấp thuận giả thuyết H0
hoặc bác bỏ giả thuyết H0. Nếu chấp nhận giả thuyết H0 thì phân tích kết thúc. Nếu bác bỏ giả
thuyết H0, bạn kết luận trung bình của các tổng thể không bằng nha.Vì vậy vấn đề tiếp theo là phân
tích sâu hơn để xác minh nhóm (tổng thể) nào khác nhóm nào, nhóm nào có trung bình lớn hơn hay
nhỏ hơn.
Có nhiều phương pháp để tiếp tục phân tích sâu ANOVA khi bác bỏ giả thyết H0.
Trong phần này chỉ để cập đến một phương pháp thôn dụng đó là phương pháp Tukey, phương pháp
này còn được gọi là kiểm định HSD (Honestly Significầnt Differences). Nội dung của phương
pháp này là so sánh từng cặp các trung bình nhóm ở mác ý nghĩa nào đó cho tất cả các cặp kiểm
định có thể để phát hiện ra những nhóm khác nhau. Nếu có k nhóm nghiên cứu và chúng ta số
sánh tất cả các cặp nhóm hì số lượng c p cần phải số sánh là tő hợp chập 2 của k nhóm.

Trong đó:
- qα;k;n−k là giá trị tra bảng phân phối kiểm định Tukey ở mác ý nghĩa, với bậc tự do
k và n – k, với n là tổng số quan sát mẫu (n = Σni).
- MSW là phương sai trong nội bộ nhóm.
- ni là số quan sát trong một nhóm (tổng thể), trong trường hợp mối nhóm có số quan
sát ni khác nhau, sử dụng giá trị ni nhỏ nhất.
Tiêu chuẩn quyet định là bác bỏ giả thuyết H0 khi đ lệch tuyệt đối giữa các cặp trung bình
mẫu lớn hơn hay bằng T giới hạn.
Bên cạnh việc kiểm định để phát hiện ra những nhóm khác biệt, chúng ta có thể tìm khoảng

ước lượng cho chênh lệch giữa các nhóm có khác biệt có ý nghĩa thống kê. Ước lượng khoảng về
chênh lệch giữa hai trung bình nhóm có khác biệt tính theo công thức:

trang 13
Trong đó, t là giá trị được tra tà bảng phân phối Student t với (n - k) bậctự do. Trong chương
trình Excel không có các lệnh phân tích sâu ANOVA. Chúng ta có thể thực hiện phân tích này bằng
chương trình SPSS. Ngoài ra kết quả của SPSS còn cung cap cho các bạn một kiểm định chính
thác về sự bằng nhau của các phương sai tổng thể là kiểm định Levene.
Mô hình hồi quy tuyến tính bội

Hồi quy chính là một phương pháp thống kê để thiết lập mối quan hệ giữa một biến phụ thuộc
và một nhóm tập hợp các biến độc lập. Mô hình với một biến phụ thuộc với hai hoặc nhiều biến độc
lập được gọi là hồi quy bội (hay còn gọi là hồi quy đa biến).
Ví dụ: Chi tiêu của hộ gia đình về thực phẩm phụ thuộc vào quy mô hộ gia đình, thu nhập, vị
trí địa lý…Tỷ lệ tử vong trẻ em của một quốc gia phụ thuộc vào thu nhập bình quân đầu người, trình
độ giáo dục…Lương của một người phụ thuộc vào chức vụ, kinh nghiệm, độ tuổi,…
Ví dụ: Chi tiêu của hộ gia đình về thực phẩm phụ thuộc vào quy mô hộ gia đình, thu nhập, vị
trí địa lý…; Tỷ lệ tử vong trẻ em của một quốc gia phụ thuộc vào thu nhập bình quân đầu người,
trình độ giáo dục…; Lương của một người phụ thuộc vào chức vụ, kinh nghiệm, độ tuổi,…
Mô hình hồi quy tuyến tính bội có dạng tổng quát như sau:
Y = β1 + β2X2 + β3X3 + … + βkXk + u
Trong đó: Y: biến phụ thuộc
Xi: biến độc lập
β1: hệ số tự do (hệ số chặn)
βi: hệ số hồi quy riêng. βi đo lường tác động riêng phần của biến Xi lên Y với điều kiện các biến số
khác trong mô hình không đổi. Cụ thể hơn, nếu các biến khác trong mô hình không đổi, giá trị kỳ vọng
của Y sẽ tăng βi đơn vị nếu Xi tăng 1 đơn vị u: sai số ngẫu nhiên.
Như vậy, "Hồi quy tuyến tính" là một phương pháp để dự đoán giá trị biến phụ thuộc (Y) dựa trên giá
trị của biến độc lập (X). Thuật ngữ tuyến tính dùng để chỉ rằng bản chất của các thông số của tổng thể
β1 và βi là tuyến tính (bậc nhất). Nó có thể được sử dụng cho các trường hợp chúng ta muốn dự đoán
một số lượng liên tục. Ví dụ: dự đoán thời gian người dùng dừng lại một trang nào đó hoặc số người
đã truy cập vào một website nào đó v.v... Bằng dữ liệu thu thập được, ta đi ước lượng hàm hồi quy của
tổng thể, đó là ước lượng các tham số của tổng thể: β1, β2,…, β
Phương pháp bình phương nhỏ nhất (Ordinary Least Squares)
Phương pháp bình phương nhỏ nhất được đưa ra bởi nhà Toán học Đức Carl Friedrich Gauss. Tư tưởng
của phương pháp này là cực tiểu tổng bình phương của các phần dư. Do đó có thể nói để có được hồi
quy thích hợp nhất, chúng ta chọn các ước lượng có tung độ gốc và độ dốc sao cho phần dư là nhỏ.

trang 14
Hệ số xác định

Hệ số xác định là tỷ lệ biến thiên của các biến trả lời được giải thích bằng các giá trị khác nhau của
các biến độc lập so với biến thiên tổng. Điều đó được tính bằng công thức:

Tỷ số giữa tổng biến thiên được giải thích bởi mô hình cho tổng bình phương cần được giải
thích được gọi là hệ số xác định, hay là trị thống kê “good of fit”. Từ định nghĩa R2 chúng ta thấy R2
đo tỷ lệ hay số % của toàn bộ sai lệch Y với giá trị trung bình được giải thích bằng mô hình. Khi đó
người ta sử dụng R2 để đo sự phù hợp của hàm hồi quy:

0 ≤ R2 ≤ 1.
R2 cao nghĩa là mô hình ước lượng được giải thích được một mức độ cao biến động của biến
phụ thuộc.
Nếu R2 = 1, nghĩa là đường hồi quy giải thích 100% thay đổi của y.
Nếu R2 = 0, nghĩa là mô hình không đưa ra thông tin nào về sự thay đổi của biến phụ thuộc y.
Trong mô hình hồi quy đa biến tỷ lệ của toàn bộ sự khác biệt của biến y do tất cả các biến x2
và x3 gây ra được gọi là hệ số xác định bội, ký hiệu là R2

trang 15
CHƯƠNG 3. THỐNG KÊ MÔ TẢ
THỐNG KÊ DỮ LIỆU
- Data frame có thể được sử dụng để lưu trữ, xử lý, phân tích và trình bày dữ
liệu thống kê trong R.

Hình 3.1: Đoạn code thống kê dữ liệu

Hình 3.2: Đoạn dữ liệu xem nhanh các giá trị

trang 16
KIỂM TRA GIÁ TRỊ CÒN BỊ THIẾU

Hình 3.3 Đoạn dữ liệu kiểm tra bị khuyết và tổng hàng, cột
Nhận xét: Kết quả là không có giá trị nào bị thiếu trong tập dữ liệu, do đó
không cần phải làm sạch dữ liệu và dữ liệu có 50 hàng, 12 biến.
Loại bỏ biến không đáng kể
Theo như trang Omnexus the material selection platform trong baì viết
Strength at Break (Tensile). Đã mô tả Tension strength thấp nhất của vật liệu Abs và
Plastic là 10 Mpa vì vậy chúng tôi tin rằng những giá trị ở biến Tension strength dưới
10 Mpa là không cần thiết và có thể loại bỏ.
Tạo Biến mới

Vì dữ liệu 2 biến Material và Infill_pattern đang ở dạng Text nên cần mã hoá
biến thành Numerical là dạng nhị phân.

Quy ước ở material là 1 với Abs và 0 với Pla.

Quy ước ở Infill pattern là 1 với Grid và 0 với Honeycomb.

Vẽ biểu đồ Correlation Heatmap để nhận xét mối tương quan của các biến.

trang 17
Hình 3.4: Biểu đồ Heatmap
Nhận xét: Trong quá trình phân tích dữ liệu, chúng ta đã nhận thấy có sự tồn
tại của hiện tượng đa tuyến trong mô hình. Đa tuyến được biểu thị thông qua mức
tương quan cao giữa một số cặp biến đầu vào. Hiện tượng này làm cho sai số chuẩn
của các hệ số, cũng như khoảng tin cậy, trở nên lớn hơn và làm giảm tính chất quan
trọng của các thống kê t (t-statistic).
Đa tuyến là một vấn đề phổ biến trong phân tích dữ liệu, và nó có thể ảnh
hưởng đáng kể đến độ chính xác của các kết quả. Khi các biến đầu vào có mức tương
quan mạnh với nhau, mô hình có thể trở nên không ổn định và dự đoán không chính
xác.
Bằng cách giảm đa tuyến, chúng ta sẽ cải thiện tính chính xác và độ tin cậy của
mô hình. Điều này giúp chúng ta có được các kết quả phân tích đáng tin cậy và hợp lý,
giúp hỗ trợ quyết định và đưa ra dự đoán chính xác về các biến đầu ra quan trọng:

trang 18
Độ bền sản phẩm phụ thuộc vào 2 yếu tố giới hạn bền kéo (tension_strength)
và độ giãn dài (elongation). Theo biểu đồ Heatmap, 2 biến này có mối tương quan
đồng biến dương (0.84), vì thế thay bằng tích độ bền (strength):
Strength=elongation×tension strength
Để giải quyết vấn đề đa cộng tuyến tính chúng tôi đã loại bỏ một số biến ban
đầu và thay vào đó tạo ra một số biến mới để phù hợp cho mục đích phân tích của
chúng tôi:

Hình 3.5: Datafram sau khi xử lý


Nhận xét: sau khi xử lý thì số lượng biến giảm từ 12 xuống còn 11 biến. Biến
mới là: strength. Đã loại bỏ 2 biến cũ là tension_strength và elongation.

Hình 3.5: Tạo dữ liệu mới


Nhận xét: tổng quan 550 giá trị của 11 biến.
Trong đó các biến phân loại bao gồm: layer_height, fan_speed, sprint_speed,
material và infill_pattern.
Các biến liên tục bao gồm: wall_thickness, infill_density, nozzle_temperature,
bed_temperature.
Các biến định lượng bao gồm: roughness, và strength.

trang 19
Biểu đồ dữ liệu
3.1.4.1 Histogram

Hình 3.6: Biểu đồ Histogram


Nhận xét:
Đồ thị phân bố độ nhám là phân bố răng cưa, phân bố cao nhất từ khoảng 50-
200 (mm) với tần suất từ 8 đến 9 lần. Thấp nhất trong khoảng 300-400 (mm) với tần
suất trung bình là 3 lần.
Đồ thị phân bố giới hạn bền kéo là phân bố lệch phải, có đỉnh phải tương ứng
tần suất cao nhất từ 25-30 (N/mm2) xuất hiện 12 lần. Thấp nhất là khoảng 35-40
(N/mm2) với 1 lần.
Đồ thị phân bố độ dãn dài là phân bố đỉnh bên méo trái, cao nhất từ 1-1.5 (mm)
với tần suất 14 lần và thấp nhất từ 0-0.5 (mm) với 2 lần.

trang 20
3.1.4.2 Boxplot

Hình 3.8: Biểu đồ Boxplot


Nhận xét:
Biểu đồ Boxplot trên đây biểu diễn mối liên quan giữa đại lượng phụ thuộc
Roughness so với các đại lượng độc lập bao gồm: layer_height, fan_speed,
sprint_speed, material và infill_pattern.
Biểu đồ layer_height và fan_speed cho ta thấy mối tương quan đồng tính
dương giữa chúng và độ nhám sản phẩm. Ba đại lượng còn lại là tốc độ in, vật liệu và
cấu trúc in ảnh hưởng rất ít đến độ nhám sản phẩm.

trang 21
3.1.4.3 Scratter

Hình 3.9 Biểu đồ Scratter


Nhận xét:
Biểu đồ scatter thể hiện mối liên hệ giữa roughness và 3 biến liên tục
wall_thickness, infill_density, nozzle_temperature. Biến rời rạc là Strength.
Nhìn biểu đồ dễ dàng nhìn thấy cả 3 biểu đồ đều có dạng phân tán ngẫu nhiên
nên ta có thể nói rằng giữa chúng không có mối quan hệ tuyến tính. Biểu đồ Strength
có phân bố tập trung cao từ khoảng 0-20 biểu diễn độ bền sản phẩm càng thấp thì độ
nhám càng cao.
Việc không vẽ những biến còn lại vì chúng là biến phân loại nên không giá trị
quan sát khi vẽ nên chúng tôi đã lược bỏ bớt.

trang 22
CHƯƠNG 4: THỐNG KÊ SUY LUẬN
Ta cần nghiên cứu xem mức độ ảnh hưởng của các thông số điều chỉnh trong máy in
3D đến độ nhám của bản in như thế nào?
4.1 Ta sẽ xây dựng mô hình hồi quy trong đó
+ Biến phụ thuộc: roughness.
+ Biến biến độc lập: layer_height, wall_thickness, infill_density,
nozzle_temperature, bed_temperature, print_speed, infill_pattern,
material.
4.2 Mô hình hồi quy được biểu diễn như sau
roughness = 𝛽0 + 𝛽1 .layer_height + 𝛽2 . wall_thickness+. . . +𝛽8 .materialpla + 𝜀
Ta thực hiện ước lượng các hệ số 𝛽𝑖 :
model_1 <- lm(roughness ~layer_height+wall_thickness+infill_density+infill_patt
ern+nozzle_temperature+bed_temperature+print_speed+material, data = data)
summary(model_1)

##
## Call:
## lm(formula = roughness ~ layer_height + wall_thickness + infill_density +
## infill_pattern + nozzle_temperature + bed_temperature + print_speed +
## material, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -72.746 -24.332 -1.641 20.304 96.552
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -2.371e+03 3.716e+02 -6.379 1.25e-07 ***
## layer_height 1.269e+03 8.765e+01 14.483 < 2e-16 ***
## wall_thickness 2.334e+00 2.189e+00 1.066 0.29259
## infill_density -4.231e-02 2.341e-01 -0.181 0.85742
## infill_patternhoneycomb -1.255e-01 1.128e+01 -0.011 0.99117
## nozzle_temperature 1.506e+01 2.529e+00 5.953 5.05e-07 ***
## bed_temperature -1.613e+01 3.251e+00 -4.962 1.27e-05 ***
## print_speed 6.496e-01 2.060e-01 3.153 0.00302 **
## materialpla 2.985e+02 5.836e+01 5.114 7.78e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 38.24 on 41 degrees of freedom
## Multiple R-squared: 0.8752, Adjusted R-squared: 0.8509
## F-statistic: 35.95 on 8 and 41 DF, p-value: 3.834e-16

Nhận xét:

Mô hình hồi quy tuyến tính:

trang 23
̂
𝑟𝑜𝑢𝑔ℎ𝑛𝑒𝑠𝑠 = −2371 + 1269.layer_height +
2.334.wall_thickness+. . . +289.5materialpla.
Kiểm định hệ số βi :
H0 : β i = 0
H1 : β i ≠ 0
Ta thấy rằng p-value ứng với các biến wall_thickness, infill_density,
infill_patternhoneycomb lớn hơn mức ý nghĩa 5% nên ta chưa đủ bằng chứng để bác
bỏ H0. Vì vậy, các biến này không có ý nghĩa đối với mô hình hồi quy ta vừa xây dựng,
do đó ta có thể loại bỏ biến các biến này ra khỏi mô hình hồi quy.
R2 hiệu chỉnh (adjusted R-squared) = 0.8509 thể hiện 85.09% biến thiên của độ
nhám được giải thích bởi các biến độc lập trong mô hình.

▪ Ta xây dựng mô hình 2 là mô hình là loại bỏ biến infill_pattern từ mô hình 1

4.2.1 Ta xây dựng mô hình 2


model_2 <- lm(roughness~layer_height+wall_thickness+infill_density+nozzle_tem
perature+bed_temperature+print_speed+material, data = data)
summary(model_2)

##
## Call:
## lm(formula = roughness ~ layer_height + wall_thickness +
infill_density +
## nozzle_temperature + bed_temperature + print_speed +
material,
## data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -72.714 -24.320 -1.565 20.338 96.602
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -2.371e+03 3.665e+02 -6.469 8.38e-08 ***
## layer_height 1.269e+03 8.654e+01 14.669 < 2e-16 ***
## wall_thickness 2.330e+00 2.138e+00 1.090 0.28187
## infill_density -4.199e-02 2.294e-01 -0.183 0.85568
## nozzle_temperature 1.506e+01 2.495e+00 6.034 3.55e-07 ***
## bed_temperature -1.613e+01 3.207e+00 -5.029 9.68e-06 ***
## print_speed 6.494e-01 2.032e-01 3.196 0.00265 **
## materialpla 2.985e+02 5.765e+01 5.177 5.97e-06 ***
## ---

trang 24
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 37.79 on 42 degrees of freedom
## Multiple R-squared: 0.8752, Adjusted R-squared: 0.8544
## F-statistic: 42.08 on 7 and 42 DF, p-value: < 2.2e-16

Nhận xét: Mô hình 2 có R2 hiệu chỉnh = 0.8544 cao hơn so với R2 hiệu chỉnh ở mô
hình 1 = 0.8509 nên có thể cho rằng mô hình 2 là mô hình hiệu quả hơn.

▪ Ta xây dựng mô hình 3 là mô hình là loại bỏ biến infill_density từ mô hình 2

4.2.2 Ta xây dựng mô hình 3


model_3 <- lm(roughness~layer_height+wall_thickness+nozzle_temperature+bed
_temperature+print_speed+material, data = data)
summary(model_3)

##
## Call:
## lm(formula = roughness ~ layer_height + wall_thickness + nozzle_tempera
ture +
## bed_temperature + print_speed + material, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -73.439 -24.381 -2.064 20.149 96.432
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -2357.5200 355.0824 -6.639 4.29e-08 ***
## layer_height 1268.9371 85.5220 14.838 < 2e-16 ***
## wall_thickness 2.2796 2.0957 1.088 0.28276
## nozzle_temperature 14.9504 2.3982 6.234 1.67e-07 ***
## bed_temperature -15.9967 3.0879 -5.180 5.60e-06 ***
## print_speed 0.6507 0.2008 3.240 0.00231 **
## materialpla 296.5902 56.0865 5.288 3.92e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 37.36 on 43 degrees of freedom
## Multiple R-squared: 0.8751, Adjusted R-squared: 0.8577
## F-statistic: 50.22 on 6 and 43 DF, p-value: < 2.2e-16

Nhận xét: Mô hình 3 có R2 hiệu chỉnh = 0.8577 cao hơn so với R2 hiệu chỉnh ở mô
hình 2 = 0.8544 nên có thể cho rằng mô hình 3 là mô hình hiệu quả hơn.

trang 25
4.2.3 Ta xây dựng mô hình 4
model_4 <- lm(roughness~layer_height+nozzle_temperature+bed_temperature+print_
speed+material, data = data)
summary(model_4)

##
## Call:
## lm(formula = roughness ~ layer_height + nozzle_temperature +
## bed_temperature + print_speed + material, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -74.084 -26.500 -1.662 22.585 92.356
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -2310.7356 353.2009 -6.542 5.38e-08 ***
## layer_height 1246.5353 83.1780 14.986 < 2e-16 ***
## nozzle_temperature 14.7774 2.3979 6.163 1.95e-07 ***
## bed_temperature -15.8078 3.0895 -5.117 6.55e-06 ***
## print_speed 0.5538 0.1804 3.070 0.00366 **
## materialpla 294.1610 56.1586 5.238 4.38e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 37.44 on 44 degrees of freedom
## Multiple R-squared: 0.8717, Adjusted R-squared: 0.8571
## F-statistic: 59.78 on 5 and 44 DF, p-value: < 2.2e-16

Nhận xét: Mô hình 3 có R2 hiệu chỉnh = 0.8577 cao hơn so với R2 hiệu chỉnh ở mô
hình 4 = 0.8571 nên có thể cho rằng mô hình 3 là mô hình hiệu quả hơn.

Từ việc so sánh các mô hình, ta nhận thấy mô hình 3 có hiệu quả cao nhất
Phân tích sự ảnh hưởng của các thông số điều chỉnh trong máy in 3D đến độ nhám
của bản in.
▪ Mô hình hồi quy tuyến tính về sự ảnh hưởng các nhân tố lên roughness:

̂
▪ 𝑟𝑜𝑢𝑔ℎ𝑛𝑒𝑠𝑠 = −2357.5200 + 1268.9371.layer_height +
2.2796.wall_thickness+. . . +296.5902materialpla.

▪ Để xét ảnh hưởng cụ thể của từng biến độc lập, ta xét các hệ số hồi quy (𝛽̂𝑖 ) và p-
value tương ứng. Ta thấy rằng p-value tương ứng với các biến layer_height bé hơn
2e−16, điều này nói lên rằng ảnh hưởng của biến này có ý nghĩa rất cao lên biến độ
nhám roughness. Mặt khác, hệ số hồi quy của một biến độc lập cũng có thể được

trang 26
xem như ảnh hưởng trung bình lên biến phụ thuộc roughness khi tăng một đơn vị
của biến dự báo đó, giả sử rằng các biến dự báo khác không đổi. Cụ thể, hệ số hồi
̂1 = 1268.9371 thì với mỗi khi chiều cao mỗi lớp
quy ứng với biến layer_height 𝛽
in tăng 1mm, ta có thể kỳ vọng độ nhám sẽ tăng lên 1268.9371 𝜇 m về mặt trung
bình (giả sử rằng các biến độc lập khác không thay đổi). Tương tự đối với các biến
còn lại.

4.2.4 Kiểm tra các giả định của mô hình.


Nhắc lại các giả định của mô hình hồi quy:
▪ Tính tuyến tính của dữ liệu: mối quan hệ giữa biến dự báo X và biến phụ thuộc Y
được giả sử là tuyến tính.

▪ Sai số có phân phối chuẩn.


▪ Sai số có kỳ vọng bằng 0
▪ Phương sai của các sai số là hằng số
▪ Các sai số 𝜖1 , . . . , 𝜖𝑛 độc lập với nhau.
Vẽ đồ thị kiểm tra các giả định của mô hình.
Par(mfrow=c(2,2))
plot(model_3)

trang 27
Nhận xét:
Đồ thị 1: Residuals and Fitted vẽ các giá trị thặng dư (sai số) tương ứng với các giá trị
dự báo. Đường màu đỏ không phải là đường thẳng nằm ngang nên giả định tuyến tính
của dữ liệu không thoả mãn. Đường màu đỏ chưa nằm sát đường đứt nét residual bằng
0 nên giả định sai số có kỳ vọng bằng 0 không thoả mãn. Các giá trị thặng dư phân tán
chưa ngẫu nhiên dọc theo đường màu đỏ nên giả định sai số có phương sai là hằng số
không thoả mãn.
Đồ thị 2: Normall Q-Q vẽ các giá trị thặng dư được chuẩn hoá. Ta nhận thấy các giá trị
này nằm dọc theo đường đứt nét kỳ vọng phân phối chuẩn nên giả định sai số có phân
phối chuẩn thoả mãn.
Đồ thị 3: Scale – Location vẽ căn bậc hai các giá trị thặng du được chuẩn hoá. Ta nhận
thấy đường màu đỏ không phải là đường thẳng nằm ngang và các giá trị này không phân
tán dọc theo đường màu đỏ nên giả định sai số có phương sai là hằng số không thoả
mãn.
Đồ thị 4: Residuals and Leverage vẽ các điểm có thể gây ảnh hưởng cao trong bộ dữ
liệu. Ta nhận thấy các điểm 23, 24 và 5 là những điểm có thể gây ảnh hưởng cao trong
bộ dữ liệu, tuy nhiên các điểm này chưa vượt ra khỏi đường gạch đứt Cook’s Distances

trang 28
4.3 Ứng dụng phân loại tình trạng máy in 3D
Dựa vào các tiêu đánh giá chuyên gia hàng đầu về máy in thì lựa chọn một con
máy in 3D dựa vào rất nhiều tiêu chí để chọn một con máy ngon và rẻ.
Chất liệu in PLA (Axit polylatic) và ABS (Acrylonitrile Butandiene Styrene) mỗi sợi
in đều có đặc tính khác nhau của mỗi sợi.
PLA cho đến khi bạn thành thạo một số kỹ thuật hiệu chuẩn để đạt được bản in
chất lượng cao. Mặt khác, nếu bạn muốn xây dựng những thứ mà bạn có thể tùy chỉnh
hoặc sử dụng nguyên mẫu thích ứng, bạn có thể muốn chọn ABS[1].
Nhiệt độ đầu phun (nozzle_temperature) và nhiệt độ bàn in (bed_temperature)
có ảnh hưởng lớn đến chất lượng in 3D. Nhiệt độ dầu phun quyết định nhiệt độ mà sợi
nhựa sẽ được nung chảy và định hình, trong khi nhiệt độ bàn in giúp tăng cường khả
năng bám dính của lớp đầu tiên và giảm thiểu hiện tượng công vênh.
Nhiệt độ đầu phun và nhiệt độ bàn in phụ thuộc vào loại vật liệu mà bạn sử
dụng để in. Ví dụ PLA CÓ nhiệt độ in khuyến nghị từ 180-220°C và nhiệt độ bàn in từ
50-70°C. Trong khi đó, ABS có nhiệt độ in khuyến nghị từ 210-260°C và cần một bản
in có nhiệt độ cao hơn để có kết quả tốt nhất[2].
Tốc độ in (print_speed) và tốc độ quạt (fan speed) có ảnh hưởng đến nhau
trong quá trình in 3D. Tốc độ in quyết định tốc độ mà vật liệu được định hình, trong
khi tốc độ quạt giúp làm mát vật liệu và giảm thiểu hiện tượng cong vênh.
Tốc độ in và tốc độ quạt phụ thuộc vào loại vật liệu mà bạn sử dụng để in. Ví
dụ, PLA có tốc độ in khuyến nghị từ 40-60 mm/s và cần một quạt làm mát hoạt động
ở tốc độ cao để có kết quả tốt nhất đ Trong khi đó, ABS có tốc độ in khuyến nghị từ
40-80 mm/s và cần một quạt làm mát hoạt động ở tốc độ thấp hơn để có kết quả tốt
nhất [3].
Tốc độ quạt (fan speed) có ảnh hưởng đến chất lượng in 3D. Tốc độ quạt phù
hợp phụ thuộc vào loại vật liệu mà bạn sử dụng để in. Ví dụ, khi in với PLA, tốc độ
quạt nên được đặt ở mức 100%[3]. Tuy nhiên, tốt nhất là tắt quạt trong hai lớp đầu
tiên để đảm bảo sự bám dính tốt với bản in[4].
Đối với ABS, tốc độ quạt khuyến nghị là 20-30%[5]. Tuy nhiên, một số nguồn
khuyến nghị tất hoàn toàn quạt khi in ABS để tránh hiện tượng cong vênh và đảm bảo
chất lượng in tốt [5].

trang 29
Dựa vào các tiêu chí trên ta có:
Thông số cài đặt
Chất liệu Nozzle_temperatur
Bed_temperature Print_speed Fan_speed
e

PLA 180-220°C 50-70°C 40-60 mm/s 100%

ABS 210-260°C >70°C 40-80 mm/s 20-30%

trang 30
CHƯƠNG 5. THẢO LUẬN VÀ MỞ RỘNG
5.1 Ưu điểm
Phương pháp hồi quy tuyến tính có các ưu điểm dưới đây
• Dễ hiểu và triển khai: Hồi quy tuyến tính là một phương pháp đơn giản và dễ hiểu.
• Dễ dàng diễn giải: Mô hình hồi quy tuyến tính cho phép bạn xác định mức độ ảnh
hưởng của mỗi biến độc lập lên biến phụ thuộc. Bạn có thể đánh giá tác động của mỗi
biến một cách riêng lẻ và quyết định xem chúng có ảnh hưởng tích cực hay tiêu cực
đối với biến phụ thuộc.
• Dễ kiểm tra và đánh giá: Có nhiều phương pháp để kiểm tra và đánh giá mô hình hồi
quy tuyến tính, bao gồm kiểm định t-Student, kiểm tra F, và các độ đo như R-squared
(R^2), MSE (Mean Squared Error), RMSE (Root Mean Squared Error), và nhiều mô
hình khác.
5.2 Nhược điểm
Phương pháp hồi quy tuyến tính có các nhược điểm đưới đây
• Đối với dữ liệu phi tuyến tính, hồi quy đa thức có thể khá khó khăn để
thiết kế, vì người ta phải có một số thông tin về cấu trúc của dữ liệu và
mối quan hệ giữa các biến tính năng.
• Kết quả của những điều trên, các mô hình này không tốt như các mô hình
khác khi nói đến dữ liệu rất phức tạp.

trang 31
CHƯƠNG 6 Code và dữ liệu
1. https://drive.google.com/drive/folders/1m1Zslgzn_EQIIpmC2a7lExxVx4YdFp
6h?usp=sharing

trang 32
TÀI LIỆU THAM KHẢO
1. Phan Thị Hường, Bài giảng Xác suất Thống kê
2. [2] Nguyễn Đình Huy (chủ biên) ,Nguyễn Bá Thi ,Bài tập xác suất thống kê ,
NXB Đại học quốc gia Tp.HCM ,2018.
3. Nguyễn Tiến Dũng (chủ biên), Nguyễn Đình Huy, Xác suất – Thống kê &
Phân tích số liệu, 2019
4. https://vietmachine.com.vn/van-de-anh-huong-chat-luong-in-3d-va-cach-khac-
phuc.html
5. [1] Nhựa in 3d PLA và ABS nên sử dụng loại nào? | Việt Machine
(vietmachine.com.vn)
6. [2] Làm thế nào để có được cài đặt nhiệt độ giường & in ấn hoàn hảo - Máy in
3D (3dprinterly.com)
7. [3] Làm thế nào để có được cài đặt quạt & làm mát in hoàn hảo - Máy in 3D
(3dprinterly.com)
8. [4] What Is the Optimum Fan Speed for 3D Printing PLA? - 3D Insider
9. [5] How To Know if a 3D Printer Cooling Fan Is Set Too High | Printing It 3D

trang 33

You might also like