You are on page 1of 13

BỘ CÔNG THƯƠNG

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP THỰC PHẨM TP. HỒ CHÍ MINH
KHOA CÔNG NGHỆ THỰC PHẨM


TIỂU LUẬN HỌC PHẦN


THIẾT KẾ THÍ NGHIỆM VÀ XỬ LÝ SỐ LIỆU

ĐỀ TÀI 2
RANDOMIZED BLOCK DESIGN
THIẾT KẾ KHỐI NGẪU NHIÊN

GVHD: TRẦN CHÍ HẢI


Thành viên nhóm :
Huỳnh Bảo Hân 2005208168
Trần Ngọc Hân 2005200337
Lưu Gia Huy 2005208336
Nguyễn Thanh Liêm 2005208507

TP.HCM, THÁNG 4 NĂM 2023


MỤC LỤC
7.3 Thiết kế khối ngẫu nhiên.................................................................................1
7.3.1 Bài toán thực tế.........................................................................................2
7.3.2 Trực quan hóa dữ liệu...............................................................................2
7.3.3 Mô hình mô tả...........................................................................................3
7.3.4 Thử nghiệm giả thuyết.............................................................................6
7.3.5 So sánh giữa các phương pháp xử lí.........................................................9
TÀI LIỆU THAM KHẢO...................................................................................10
7.3 Thiết kế khối ngẫu nhiên

Trong bất kỳ thí nghiệm nào, có những yếu tố ảnh hưởng đến kết quả mặc dù
chúng có thể không được quan tâm nghiên cứu. Các yếu tố như vậy được gọi là các
yếu tố phiền toái. Nếu các yếu tố gây phiền toái là không xác định và không thể
kiểm soát được thì một kỹ thuật thiết kế được gọi là ngẫu nhiên hóa được sử dụng
để chống lại chúng. Tuy nhiên, nếu chúng được biết đến nhưng không thể kiểm soát
được thì ảnh hưởng của chúng có thể được bù đắp bằng một kỹ thuật gọi là phân
tích hiệp phương sai. Nếu các yếu tố gây phiền toái đã biết và có thể kiểm soát được
thì một kỹ thuật thiết kế gọi là chặn có thể được sử dụng để loại bỏ một cách có hệ
thống ảnh hưởng của nó đối với các biện pháp xử lý khác. Chặn là một kỹ thuật
quan trọng đã được sử dụng rộng rãi trong khi tiến hành thiết kế các thí nghiệm.

Thiết kế khối ngẫu nhiên là một thiết kế rất phổ biến sử dụng nguyên tắc chặn.
Bây giờ chúng ta hãy thảo luận về nguyên tắc này. Chặn được sử dụng trong các
trường hợp không thể thực hiện tất cả các lần chạy trong một thử nghiệm trong điều
kiện đồng nhất. Ví dụ: một lô nguyên liệu thô có thể không đủ lớn để thực hiện tất
cả các lần chạy trong một thử nghiệm.

Ngoài ra, có những tình huống mà chúng tôi mong muốn thay đổi có chủ ý các
điều kiện thử nghiệm bao gồm máy móc, người vận hành, môi trường. Điều này
được thực hiện để đảm bảo rằng quy trình hoặc sản phẩm mạnh mẽ đến mức không
bị ảnh hưởng bởi các điều kiện như vậy. Nguyên tắc thử nghiệm được sử dụng trong
các tình huống như vậy liên quan đến việc chặn, trong đó mỗi tập hợp các điều kiện
không đồng nhất xác định một khối. Giả sử trong ví dụ trước đây của chúng ta về
sợi dẫn điện (Phần 1.3.2 của Chương 1), bốn lần chạy trong bản sao I được thực
hiện bằng cách sử dụng monome dẫn điện do Nhà cung cấp X cung cấp và bốn lần
chạy trong Bản sao II được thực hiện bằng cách sử dụng monome dẫn điện do Nhà
cung cấp Y cung cấp. Sau đó, dữ liệu sẽ được phân tích bằng cách sử dụng kỹ thuật
gọi là chặn, trong đó mỗi khối tương ứng với một bản sao. Hơn nữa, phân tích
thống kê có thể được sử dụng để định lượng hiệu ứng khối. Trên thực tế, người ta có
thể thấy rằng hiệu ứng khối tương đối nhỏ.

1
7.3.1 Bài toán thực tế

Một kỹ sư quy trình muốn nghiên cứu ảnh hưởng của quy trình loại bỏ nước đối
với độ ẩm của vải dệt. Anh ấy chọn ba quy trình loại bỏ nước khác nhau, cụ thể là
thủy lực, lực hút và lực ép, đồng thời chọn bốn loại vải khác nhau, đó là các loại vải
dệt. Vì các loại vải được chọn thuộc nhiều loại khác nhau (không đồng nhất), thiết
kế hoàn toàn ngẫu nhiên dường như không phù hợp. Ngoài ra, người kỹ sư muốn
chắc chắn rằng bất kỳ ảnh hưởng nào do các loại vải khác nhau gây ra sẽ không có
bất kỳ ảnh hưởng nào đến việc so sánh ba quy trình (phương pháp xử lý). Do đó,
anh ấy muốn sử dụng kỹ thuật tạo khối và theo đó chia các loại vải thành bốn khối
khác nhau, tùy thuộc vào loại của chúng. Hơn nữa, anh ta ngẫu nhiên hóa thứ tự
chạy trong mỗi khối. Rõ ràng, các khối đặt ra một hạn chế về ngẫu nhiên. Đây là
cách thí nghiệm thường được thực hiện theo thiết kế khối ngẫu nhiên.

7.3.2 Trực quan hóa dữ liệu

Bảng 7.11 Báo cáo kết quả thí nghiệm (Leaf 1987). Ở đây, dữ liệu thể hiện tỷ lệ
phần trăm độ ẩm còn lại trong vải sau khi loại bỏ nước.

Bảng 7.11 Kết quả thí nghiệm độ ẩm

Quy trình Các loại vải (Khối)


(Phương Worsted Barathea Twill Melton
pháp điều trị)
Lực nước 46 35 47 42
Lực hút 54 57 79 86
Lực ép 56 56 61 65

2
7.3.3 Mô hình mô tả

Giả sử chúng ta có m phương pháp xử lý cần được so sánh và n số khối sao cho
có lần quan sát cho mỗi phương pháp trong mỗi khối, và thứ tự các phương pháp
được thực hiện trong mỗi khối được xác định ngẫu nhiên. Bộ dữ liệu kiểm định
được thể hiện trong Bảng 7.12.

Tổng số liệu xử lý yi. và trung bình số liệu xử lý y i. được tính như sau:
n
yi .
y i . =∑ y ij y i .= ,i=1, 2 , … . ,m
j=1 n

Tổng số liệu khối y. j và trung bình khối y . j thu được như sau:
n
y. j
y . j=∑ yij , y . j= , j=1 , 2 , …. , n
i=1 m

Tổng số liệu chung và trung bình số liệu chung được tính như sau
m n m n
y ..=∑ ∑ y ij=∑ y i .=∑ y . j .
i=1 j=1 i=1 j=1

y ..
y ..= .
mn

Các quan sát của thí nghiệm có thể được mô tả bằng thống kê tuyến tính sau
đây:

y ij =μ+ τ i+ βj+ ε ij ; i=1 , 2 ,… . , m; j=1 , 2, … n .

3
Bảng 7.12 Số liệu thí nghiệm khối ngẫu nhiên

Mức độ Quan sát Tổng Trung


cộng bình
Khối Khối … Khối
1 2 3
1 y 11 y 12 … y1b y 1. y 1.
2 y 21 y 12 … y2b y 2. y 2.
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
a ya1 ya1 … y ab ya. y a.
Tổng y .1 y .2 … y. b y ..

Trung y .1 y .2 … y .b y ..
bình

Ở đây, y ij là biến ngẫu nhiên biểu thị cho quan sát thứ ij . μ là một tham số
chung cho tất cả các cấp độ gọi là trung bình chung, τ i là tham số liên quan đến cấp
độ thứ i gọi là hiệu ứng cấp độ i, βj là một tham số được liên quan với khối thứ j
được gọi là khối thứ j , ε ij là thành phần sai số ngẫu nhiên, m biểu thị phương pháp
xử lý và n biểu thị số khối. Đây là mô hình hiệu ứng cố định truyền thống. Mô hình
này cũng có thể được viết dưới dạng

y ij =μij +ε ij ;i=1, 2 , … m; j=1 ,2 , … , n

trong đó μij =μ+ τ i+ βj là giá trị trung bình quan sát thứ i.

Sau đây là các công thức ước tính hợp lý của các tham số mô hình:

^μ= y . .

τ^ i = y i .− y .. ,i=1, 2 , … , m

^β = y . − y .. , j=1 ,2 , … , n
j j

^μij = ^μ + ^τ i+ ^β j= y ..+ ( y i .− y .. ) + ( y . j − y .. ) = y i.+ y . j − y ..

Ước lượng của các quan sát là ^y ij = ^μ + ^τ i+ ^β j= y i .+ y . j − y ..

4
Do đó, sai số còn lại là e ij = y ij −^y ij .

Các công thức này được sử dụng để ước tính các quan sát và sai số. Bảng 7.13
so sánh các quan sát ước tính với các quan sát thực nghiệm và báo cáo số dư. Ở đây,
trong mỗi ô, ba giá trị được báo cáo cho một quá trình cụ thể. Giá trị ngoài cùng bên
trái thu được từ kiểm định, giá trị ở giữa là giá trị được dự đoán và giá trị ngoài
cùng bên phải đại diện cho sai số.

Để xác định tính thích hợp của một mô hình, việc kiểm tra các sai số là cần thiết.
Nếu mô hình phù hợp thì các sai số nên không có cấu trúc, nghĩa là chúng không
nên theo bất kỳ khuôn mẫu nào. Hình 7.7a trình bày biểu đồ sai số theo các phương
pháp xử ký. Có thể thấy rằng sai số không theo bất kỳ xu hướng hoặc mô hình cụ
thể nào đối với các phương pháp xử lý cũng như các khối (Hình 7.7b). Hình 7.7c
không hiển thị bất kỳ xu hướng hay mô hình nào khi sai số được trình bày theo các
phản hồi phù hợp.

Bảng 7.13 Dữ liệu và sai số cho nồng độ độ ẩm.

5
Hơn nữa, điều quan trọng là phải kiểm tra xem sai số có thể được coi là lấy từ
phân phối chuẩn hay không. Hình 7.7d biểu thị biểu đồ xác suất chuẩn của sai số.
Có thể kết luận rằng sai số là lấy từ phân phối chuẩn.

a) Đồ thị sai số so với quy trình cho dữ liệu độ ẩm b) Đồ thị sai số so với các loại vải cho dữ liệu độ ẩm

7.3.4 Kiểm định giả thuyết

c) Biểu đồ sai số so với các phản ứng đã được tìm d) Biểu đồ xác suất chuẩn của các sai số cho dữ liệu
thấy cho dữ liệu độ ẩm: độ ẩm

Như đã đề cập trong Chương 7, kiểm định giả thuyết được thực hiện theo các
bước sau:

Bước 1: Đặt giả thuyết

6
Chúng tôi quan tâm đến việc kiểm tra ngẫu nhiên của các phương pháp xử lí về
độ ẩm trong vải. Sau đó, giả thuyết bác bỏ là không có sự khác biệt giữa các
phương pháp xử lí.

Bảng 7.14 Tính toán xử lý và tổng số khối, trung bình cho dữ liệu độ ẩm

Processe Fabric types (Blocks) Tota Mea


s (Treat- l n
ments) Worste Barathe Twil Melto
d a l n
Hydro 46 35 47 42 170 42.5
Suction 54 57 79 86 276 69
Mangle 56 56 61 65 238 59.5
Total 156 148 187 193 684
Mean 52 49.3 62.3 64,3 57
Điều này được nêu như sau

H0 : μ1 = μ2 =··· = μm hoặc, tương đương H0 : τ1 = τ2 =··· = τm = 0

Giả thuyết thay thế nói rằng có sự khác biệt giữa phương pháp xử lí cho ít nhất
một cặp dữ liệu. Điều này có thể được viết là

H1 : μi ≠ μj cho ít nhất một cặp i và j hoặc, tương đương H1: τ i = 0 cho ít nhất
một cấp i

Bước 2: Lựa chọn mức ý nghĩa

Giả sử mức ý nghĩa được chọn là 0,05. Điều đó có nghĩa là xác suất bác bỏ giả
thuyết khi nó đúng nhỏ hơn hoặc bằng 0,05.

Bước 3: Tính toán thống kê thử nghiệm

7
Thống kê kiểm tra được tính toán bằng cách thực hiện phân tích phương sai của
dữ liệu. Các các tính toán cơ bản về tổng số biện pháp xử lý và phương tiện xử lý
được thể hiện trong Bảng 7.14.

Các tính toán cho ANOVA được hiển thị bên dưới:
m n 3 4
SSTotal = ∑ ∑ ( y ij − y ) = ∑ ∑ ( y ij − y ) = (46 − 57)2 + (35 − 57)2 +
2 2

i=1 j=1 i=1 j=1

(47 − 57)2 + (42 − 57)2 + (54 − 57)2 + (57 − 57)2 + (79 − 57)2 + (86 − 57)2 + (56 − 57)2
+ (56 − 57)2 + (61 − 57)2 + (65 − 57)2 = 2346

m
SStreatments = n ∑ ( y i − y ) = 4[(42.5 − 57)2 + (69 − 57)2 + (59.5 − 57)2] = 1442
2

i=1

n
SSBlocks = m ∑ ( y j − y ) = 3[(52 − 57)2 + (49.3 − 57)2 + (62.3 − 57)2 + (64.3 − 57)2]
2

j=1

= 498

SSError = SSTotal - SStreatments - SSBlocks = 460

Các tính toán được tóm tắt trong Bảng 7.15

Bước 4: So sánh với giá trị tới hạn

Giả thuyết không bị bác bỏ nếu F 0 > Fa,a-1,(a-1)(b-1) = F0.05,2,6 = 5,14. Kết quả được
biểu diễn trong hình 7.8

Bảng 7.15 Bảng ANOVA cho dữ liệu độ ẩm

Source of Sum of Degree of Mean F0


variation squares freedom squares
Treatments 1442 2 721 10.66
Blocks 498 3 166
Errors 406 6 67.66
Total 2346 11

8
Hình 7.8 Hiển thị quan trọng khu vực cho dữ liệu độ ẩm

Bước 5: Đưa ra kết luận

Vì giá trị của thống kê kiểm tra rơi vào giá trị tra bảng được thông qua. Do đó,
người ta kết luận rằng có sự khác biệt giữa phương pháp xử lí , ít nhất là đối với
một cặp dữ liệu. Độ ẩm của các loại vải thu được từ các phương pháp khác nhau thì
khác biệt có ý nghĩa 0,05.

7.3.5 So sánh giữa các phương pháp xử lí

Kiểm định của Tukey so sánh các mức độ có nghĩa khác nhau. Thử nghiệm này
tuyên bố hai ý nghĩa là khác nhau đáng kể nếu giá trị tuyệt đối của chênh lệch vượt
quá

Ta = qa (m,f)
√ MS Error
n

trong đó qa (m, f ) được gọi là studentized range statistic corresponding tương


ứng với mức ý nghĩa của α, m là phương pháp xử lí và f là bậc tự do liên quan với
MSerror và n là số mức. Studentized range statistic corresponding có thể được lấy từ
một bảng tiêu chuẩn. Ở đây, sử dụng Bảng A.17, q0,05 (2, 6) = 3,46, ta có

9

T0,05 = qa (m,f)
MS Error
n
= q0.05 (2,6)

67.66
4
= 14.23

Ba giá trị trung bình là y 1 = 42.5, y 2. = 69, y 3 = 59.5. Sự khác biệt trong giá trị
trung bình là

| y 1 − y 2| = 26.5*

| y 1 − y 3| = 17*

| y 2− y 3 | = 9

Các giá trị được gắn dấu sao cho biết cặp giá trị khác nhau đáng kể. Đôi khi sẽ
rất hữu ích khi vẽ một biểu đồ, như được hiển thị bên dưới, gạch dưới các cặp giá trị
không khác nhau đáng kể.

y 1= 42.5, y 3= 59.5, y 2 = 69

Như đã trình bày, quá trình hydro dẫn đến độ ẩm thấp nhất trong vải và điều này
là khác biệt đáng kể so với những gì được đưa ra bởi các quá trình hút và mangle.
Một kiểm định phổ biến khác để so sánh các cặp phương tiện điều trị là kiểm định
của Fisher. Thử nghiệm này cũng đã được mô tả trong chương trước. Sự khác biệt ít
ý nghĩa nhất. (LSD) được tính toán như sau (sử dụng Bảng A.10, t0.025,6 = 2,4469),

LSD = t0.025,6
√ MS error
n
= 10,06

Ba giá trị trung bình là y 1 = 42.5, y 2. = 69, y 3 = 59.5. Sự khác biệt trong giá trị
trung bình là

| y 1 − y 2| = 26.5*

| y 1 − y 3| = 17*

| y 2− y 3 | = 9

Các giá trị được gắn dấu sao cho biết cặp giá trị khác nhau đáng kể. Đôi khi sẽ
rất hữu ích khi vẽ một biểu đồ, như được hiển thị bên dưới, gạch dưới các cặp giá trị
không khác nhau đáng kể.

10
y 1= 42.5, y 3= 59.5, y 2 = 69

Người ta thấy rằng trong trường hợp này, kết quả kiểm định của Fisher giống với
kiểm định của Tukey

TÀI LIỆU THAM KHẢO


Dharmaraja Selvamuthu-Dipayan Das, Introduction to Statistical Methods,
Design of Experiments and Statistical Qual

11

You might also like