You are on page 1of 32

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC CẦN THƠ


TRƯỜNG BÁCH KHOA

HỌC PHẦN: TOÁN ỨNG DỤNG – KC131


BÀI TẬP NHÓM ĐỢT 2

CÁN BỘ HƯỚNG DẪN SINH VIÊN THỰC HIỆN


ThS. Võ Thị Kim Cúc Thái Kỳ Xuân B2203928
Nguyễn Thị Trúc Ly B2203901
Nguyễn Ngọc Phương Thảo B2203959
Phạm Ngọc Thiện B2204674

Tháng 04/2024
BẢNG ĐÁNH GIÁ MỨC ĐỘ ĐÓNG GÓP

Họ và tên MSSV Đóng góp


Thái Kỳ Xuân B2203928 100%
Nguyễn Thị Trúc Ly B2203901 100%
Nguyễn Ngọc Phương Thảo B2203959 100%
Phạm Ngọc Thiện B2204674 100%
CHƯƠNG V: KHỐI (BLOCKING) - BÌNH PHƯƠNG LA TINH

Bài tập 1: Kiểm tra độ cứng


Vấn đề: Dựa vào bảng dữ liệu đã cho, tính toán giá trị F0 và đứa ra kết luận: Liệu các đầu
tip khác nhau có gây ra ảnh hưởng lên kết quả đo độ cứng của vật liệu hay không?
Giải
Giả thuyết liên quan:
H0: μ1=μ2 =μ 3=μ4
H1: μ1 ≠ μ2 ≠ μ 3 ≠ μ4

Bảng dữ liệu:

Tổng (tip i) Trung bình


Tip Mẫu thử 4 (tip i)
yi .=∑ yij yi .
y i.=
j=1
4
1 2 3 4
1 9.3 9.4 9.6 10 38.3 9.575
2 9.4 9.3 9.8 9.9 38.4 9.600
3 9.2 9.4 9.5 9.7 37.8 9.450
4 9.7 9.6 10 10.2 39.5 9.875
Tổng (mẫu j) Tổng tất cả lần quan sát:
4 4 4
37.6 37.7 38.9 39.8
y . j=∑ yij y ..=∑ ∑ yij =154
i=1 i=1 j=1
Trung bình
Trung bình tất cả lần quan sát:
(mẫu j)
9.4 9.425 9.725 9.95 y ..=
y ..
= 9.625
y. j
y . j= 16
4

a 4
SSTreatments =b ∑ ( y i .− y ..)2= 4 ∑ ( y i . − y .. )2 = 4*0.09625= 0.385
i=1 i=1

b 4
SS Blocks =a ∑ ( y . j − y ..)2=4 ∑ ( y . j− y ..)2=¿¿ 4*0.20625= 0.825
i=1 i=1

a b 4 4
SST =∑ ∑ ( y ij − y ..)2=∑ ∑ ( y ij − y .. )2=1.29
i=1 j=1 i =1 j=1

→ SS E =SS T −SS Treatments −SS Blocks =0.08

Bậc tự do trong mô hình thống kê: ( ab-1)= 4*4 -1= 15


Mean Square:
SSTreatments 0.385
MS Treatments = = = 0.1283
a−1 4−1

SS Blocks 0.825
MS Blocks = = =0.275
b−1 4−1

SS E 0.08
MS E = = = 0.0089
(a−1)(b−1) 3∗3

MS Treatments 0.1283
→ F0 = =14.4375
MS E 0.0089
Ta có: F α ,a−1 ,(a−1)(b−1)=F 0.05 ,3 , 9=3.86
Vì: F 0> F0.05 , 3 ,9 → Bác bỏ giả thuyết: H 0: Trung bình của mỗi mức nhân tố giống nhau

Bài tập 2: Kiểm tra độ mòn sơn (sơn kẻ đường)


Vấn đề:
- Sở Giao thông Vận tải Pennsylvania đang nghiên cứu đặc tính mài mòn của 4 loại sơn
đường màu vàng
- Để xác định xem có sự khác biệt nào trên khắp tiểu bang Pennsylvania hay không, bốn
thành phố được chọn: Philadelphia, Pittsburgh, Harrisburg và Scranton
- Dựa trên quy mô dân số, vị trí và thời tiết, bốn thành phố này dự kiến sẽ có điểm xói
mòn khác nhau
- Các công nhân đã áp dụng các dải thử nghiệm của từng loại sơn lên một đường cao tốc
ở bốn thành phố: Philadelphia, Pittsburgh, Harrisburg và Scranton
- Sau khi đường cao tốc tiếp xúc với thời tiết và giao thông, các công nhân đã đo độ mòn
sơn tại mỗi địa điểm trong số bốn địa điểm
- Điểm cao nghĩa là sơn ít bị ăn mòn hơn
→ Xác định xem độ mòn sơn trung bình của cả bốn loại sơn có như nhau hay không
Giải
Giả thuyết liên quan:
H0: μ1=μ2 =μ 3=μ4
H1: μ1 ≠ μ2 ≠ μ 3 ≠ μ4

1) Anova With Block:


Loại sơn được kiểm tra
(Paint) và Thành phố
(Location) có ảnh hưởng
đáng kể đến độ mài mòn
của sơn đường, trong đó:
- Block “Location” cho
thấy sự tác động lớn hơn.
- Paint cũng cho thấy sự
tác động đến biến đáp ứng.

2)

One-way Anova
Không xem xét đến ảnh hưởng của Block Có xem xét đến ảnh hưởng c
=> Chấp nhận giả thuyết H0 (do P-value >0.05) - Độ mòn sơn trung bình của 4 thành phố
là như nhau.
3) Residuals plot

- Biểu đồ Normal Pro: Dữ liệu


được xem là gần với phân
phối chuẩn, tuy nhiên có điểm
dữ liệu bị lệch.
- Biểu đồ Versus Fits cho thấy
dữ liệu có tương quan tuyến
tính tốt với độ biến thiên đồng
đều.
- Biểu đồ Histogram dữ liệu
phân bố gần đối xứng với độ
lệch nhẹ sang trái.
- Versus Order cho thấy dữ
liệu không có xu hướng và có
sự bất thường ( giảm,tăng đột
ngột).
3) Comparrisons (Paint levels)
Các nhóm đều là A nên trung bình các nhóm không có sự khác biệt đáng kể.
Kết luận: P_value > 0.05
=> Chấp nhận giả thuyết H0 (do P-value >0.05) - Độ mòn sơn trung bình của 4 thành phố
là như nhau.

CHƯƠNG VI: THIẾT KẾ GIAI THỪA - FACTORIAL DESIGN

BT: Nướng bánh


Vấn đề
• Nhà sản xuất hỗn hợp bánh đóng gói phải xác định thời gian và nhiệt độ nướng khuyến
nghị để in trên hộp.
• Họ muốn tìm các cài đặt hệ số dẫn đến độ ẩm trung bình là 26% ± 1%
Thu thập dữ liệu
• Các nhà khoa học thực phẩm lặp lại thiết kế giai thừa đầy đủ hai lần.
• Họ nướng tất cả các loại bánh trong một lò duy nhất trong một ngày nên không cần
Blocking.
• Họ nướng bánh trong 30 hoặc 50 phút, ở nhiệt độ 325° hoặc 375°F.
• Các nhà khoa học tính toán độ ẩm bằng cách đo khối lượng nguyên liệu trước và sau
khi nướng.
Yêu cầu
1. Tạo một thiết kế giai thừa đầy đủ với 2 yếu tố, thời gian và nhiệt độ, lặp lại thí nghiệm
hai lần.
2. Mở file Cake.MPJ, chứa dữ liệu của biến đáp ứng
3. Điều chỉnh mô hình thích hợp cho dữ liệu (ANOVA, Fitting model)
4. Kiểm tra các giả định của mô hình bằng cách sử dụng Residual Plot.
5. Tạo Factorial Plots và sử dụng Responde Optimizer để xác định cài đặt tốt nhất về thời
gian và nhiệt độ nhằm đạt được độ ẩm mục tiêu là 26%, với giới hạn dưới là 25% và giới
hạn trên là 27%
Giải
1. Tạo một thiết kế giai thừa đầy đủ với 2 yếu tố, thời gian và nhiệt độ, lặp lại thí
nghiệm hai lần.
2. Mở file Cake.MPJ, chứa dữ liệu của biến đáp ứng
3. Điều chỉnh mô hình thích hợp cho dữ liệu (ANOVA, Fitting model)
Kết luận:
- Biểu đồ Pareto cho thấy ảnh hưởng chuẩn hóa là 2.78. Nhân tố A, B và tương tác AB
vượt qua đường 2.78
- Giá trị P-value của nhân tố A, B và tương tác AB nhỏ hơn 0.05
=> Nhân tố A, B và tương tác AB có ảnh hưởng đến biến đáp ứng
4. Kiểm tra các giả định của mô hình bằng cách sử dụng Residual Plot.

Kết luận:
• Dựa vào biểu đồ Normal Probability Plot, thấy các điểm giá trị dao động xung quanh
đường cố định và không có điểm ngoại lai => Bộ dữ liệu đến từ một quần thể có phân
phối chuẩn.
• Dựa vào biểu đồ Versus Fits, thấy sự biến thiên của sai số được tập trung thành ba
đường và các điểm trên mỗi đường cũng không quá cách biệt. Vì vậy, chúng ta có thể
tạm kết luận rằng phương sai là bằng nhau.
• Dựa vào biểu đồ Histogram Of Residuals, ta có thể thấy rằng biểu đồ có dạng hình
chuông => Bộ dữ liệu đến từ một quần thể có phân phối chuẩn.
• Dựa vào biểu đồ Versus Order, thấy rằng không lặp đi lặp lại => Độc lập
5. Tạo Factorial Plots và sử dụng Responde Optimizer để xác định cài đặt tốt nhất
về thời gian và nhiệt độ nhằm đạt được độ ẩm mục tiêu là 26%, với giới hạn dưới là
25% và giới hạn trên là 27%
- Factorial Plots:
Nhận xét: Từ biểu đồ, ta thấy để đạt được độ ẩm mục tiêu là 26% thì thời gian tốt nhất là
32 ± 1 (phút) và nhiệt độ tốt nhất là 330 ± 5 (॰F)
- Responde Optimize:
Kết luận: Để đạt được biến đáp ứng (độ ẩm) mục tiêu là 26% cần chọn nhiệt
độ là 375॰F và thời gian là 33.5897 phút.

CHƯƠNG VII: THIẾT KẾ GIAI THỪA 2 MỨC

Bài tập: Sự mài mòn của động cơ


Thu thập dữ liệu
• Nhóm đang tìm kiếm phương pháp xử lý ít mài mòn nhất.
• Để kiểm tra tất cả các tương tác có thể xảy ra, họ dùng thiết kế giai thừa đầy đủ.
• Nguồn lực cho phép thực hiện tối đa 20 lần chạy, vì vậy họ quyết định lặp lại thử
nghiệm, sử dụng 2 lần chạy cho mỗi lần xử lý.
• Để hoàn thành bài kiểm tra trong một nửa tổng thời gian, họ sử dụng hai giá kiểm tra.
• Vì hai giá kiểm tra có thể ảnh hưởng đến kết quả nên thí nghiệm sẽ bao gồm Blocking
Hướng dẫn
1. Sử dụng Power và Sample size để đánh giá Power của thí nghiệm này nhằm phát hiện
sự khác biệt là 1.5 với độ lệch chuẩn là 1, 𝛼= 0,05
2. Đánh giá lại Power với hệ số 𝛼= 0,1.
3. Tạo thiết kế giai thừa đầy đủ
4. Thực hiện Phân tích mô hình sử dụng Dataset “EngWear.MPJ”, sử dụng 𝛼=0,1 (Thực
hiện các phân tích trong BT1, BT2, BT3)
Giải

1) Sử dụng Power và Sample size để đánh giá Power của thí nghiệm này nhằm phát
hiện sự khác biệt là 1.5 với độ lệch chuẩn là 1, 𝛼= 0,05
Kết luận: nhằm phát hiện sự khác biệt là 1.5 với độ lệch chuẩn là 1, α = 0.05 thì
mức power là 73%
2) Đánh giá lại Power với hệ số 𝛼= 0,1.
Kết luận: nhằm phát hiện sự khác biệt là 1.5 với độ lệch chuẩn là 1, α = 0.1 thì
mức power là 85%
3) Tạo thiết kế giai thừa đầy đủ
4) Thực hiện Phân tích mô hình sử dụng Dataset “EngWear.MPJ”, sử dụng 𝛼=0,1
(Thực hiện các phân tích trong BT1, BT2, BT3)
- ANALYZE FACTORIAL DESIGN
Kết luận: Biểu đồ Pareto cho thấy, ảnh hưởng chuẩn hóa bằng 1.895:
- Nhân tố A, B và tương tác AC đi qua vạch 1.895 nên A, B và tương tác AC có ảnh
hưởng đến biến đáp ứng.
- Ngược lại, nhân tố C, tương tác AB, tương tác BC và tương tác ABC không ảnh hưởng
đến biến đáp ứng.
Kết luận: Giá trị P-value của A, B và tương tác AC nhỏ hơn 0.1 nên A, B và tương tác
AC có ảnh hưởng biến đáp ứng. Ngược lại, C và tương tác AB, BC, ABC không có ảnh
hưởng.

- HIỆU CHỈNH MÔ HÌNH

Kết luận: Biểu đồ Pareto cho thấy, ảnh hưởng chuẩn hóa bằng 1.812:
- Nhân tố A, B và tương tác AC đi qua vạch 1.812 nên A, B và tương tác AC có ảnh
hưởng đến biến đáp ứng.
- Ngược lại, nhân tố C không ảnh hưởng đến biến đáp ứng.
 VIF = 1 cho thấy tác động của đa cộng tuyến giữa các yếu tố dự đoán là không
tăng.

- KIỂM TRA GIẢ ĐỊNH:


Kết luận:
- Normal Probability và Histogram cho thấy dữ liệu có thể đến từ một tổng thể có phân
phối chuẩn.
- Biểu đồ Versus Order có xu hướng tuần hoàn giữa các điểm dữ liệu 0, cho thấy là dữ
liệu độc lập.
- FACTORIAL PLOT
Kết luận: Hai đường chéo cắt nhau, cho thấy có sự tương tác giữa độ nhớt của dầu và hai
chất phụ gia được cho là làm giảm mài mòn động cơ (A, B).
- CUBE PLOT
Kết luận: Khi chất phụ gia là loại B, độ nhớt của dầu là 40 và nhiệt độ là 75 thì làm giảm
độ mài mòn của động cơ nhiều nhất.
- CONTOUR PLOT
Kết luận:
- Khi nhiệt độ (temperature) dao động từ 93-100 và độ nhớt (viscosity) nằm trong khoảng
từ 30-32 thì độ hao mòn của động cơ < 3.00.
- Khi nhiệt độ (temperature) dao động từ 75-85 và độ nhớt (viscosity) nằm trong khoảng
từ 37-40 thì độ hao mòn của động cơ > 4.5.

CHƯƠNG VIII: HỒI QUY TUYẾN TÍNH

Bài tập: Thời lượng giấc ngủ


Vấn đề
• Xác định những yếu tố dự đoán nào được liệt kê trong bảng có liên quan đến thời gian
ngủ ở 51 loài (Species) đang được nghiên cứu.
• Chỉ số săn mồi (Predation) đi từ 1, ít có khả năng bị săn mồi nhất, đến 5, có nhiều khả
năng bị săn mồi nhất.
• Chỉ số tiếp xúc ánh sáng (Exposure) khi ngủ tăng từ 1, động vật ngủ trong chuồng được
bảo vệ tốt, đến 5, động vật tiếp xúc nhiều với ánh sáng khi ngủ
Giải
1) Tạo matrix plot và kiểm tra tính tương quan
Ma trận tương quan thể hiện mối tương quan nghịch giữa Sleep (Hours) và các yếu tố:
- Body Weight(Kg) (R=-0.317)
- Max Life (Years) (R=-0.396)
- Gestation (Days) (R=-0.629)
- Predation (R=-0.460)
- Exposure (R=-0.668)
2. Dùng Best Subsets để xác định mô hình “tốt nhất”
Kết luận:
- Dựa trên các tiêu chí, mô hình Gestation và Predation là tốt nhất (vì có giá trị
R-Sq predicted cao nhất)
- Có thể xem xét mô hình Exposure. Tuy nhiên, S trong mô hình này lớn nhất
và cũng không cho hiệu quả tốt hơn khi xem xét R-Sq(adj)
- Các mô hình khác không cho sự cải thiện hay kết quả vượt bậc.
3) Dùng Fit Regression Model để xác định những biến quan trọng khi
alpha = 0.05. Điều chỉnh mô hình cho đến khi mô hình chỉ chứa các biến có
p-value <0.05
Do Max Life có P-value = 0.6 > 0.05 -> Điều chỉnh mô hình để loại bỏ biến
không quan trọng.
Do Exposure có P-value = 0.266 > 0.05 -> Điều chỉnh mô hình để loại bỏ biến
không quan trọng.

Do Body Weight có P-value = 0.166 > 0.05 -> Điều chỉnh mô hình để loại bỏ
biến không quan trọng.
Kết luận:
- Các biến dự đoán quan trọng trong mô hình là các biến Gestation và
Predation.
- VIF=1.02 (~1) -> Tốt -> Có thể tiến hành phân tích hồi quy.
- Ta thấy: R-sq, R-sq(adj) và R-sq(pred) xấp xỉ nhau, không có khác biệt quá
lớn -> Mô hình hồi quy là đáng tin cậy và có thể dùng để dự đoán biến đáp ứng
trong tương lai.
4. Kiểm tra các giả định và Outliers

Kết luận:
- Biểu đồ Normal Probability cho thấy dữ liệu có thể tuân theo phân phối
chuẩn.
- Biểu đồ Versus Fits có một số điểm dữ liệu nằm xa đường hồi quy, cho thấy
mô hình có độ biến thiên tương đối cao
- Biểu đồ histogram cho thấy dữ liệu có dạng phân bố lệch phải, tập trung ở
khoảng giá trị thấp và có mức độ biến thiên tương đối cao.
- Biểu đồ Versus Order cho thấy có một mối quan hệ tương quan giữa thứ tự và
giá trị, nhưng mối quan hệ này không hoàn toàn tuyến tính.
Outlier:
Kết luận: Có xuất hiện các điểm ngoại lai (Outliers).

You might also like