You are on page 1of 229

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/335524502

Quy hoạch thực nghiệm trong kỹ thuật - 2011

Book · September 2019

CITATIONS READS
0 4,735

2 authors:

Van Du Dang-Binh Nguyen


Thainguyen University of Technology Thainguyen University of Technology
36 PUBLICATIONS 382 CITATIONS 15 PUBLICATIONS 259 CITATIONS

SEE PROFILE SEE PROFILE

All content following this page was uploaded by Van Du on 29 April 2020.

The user has requested enhancement of the downloaded file.


NGUYỄN VĂN DỰ, NGUYỄN ĐĂNG BÌNH

QUY HO¹CH THùC NGHIÖM


TRONG Kü THUËT

Nhμ xuÊt b¶n khoa häc vμ kü thuËt


Hμ Néi - 2011
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Lời nói đầu

Hầu hết các nghiên cứu trong kỹ thuật đều gắn với thực nghiệm.
Nghiên cứu thực nghiệm trong kỹ thuật có mục đích xác định các quan hệ
giữa các thông số đầu vào với một hay nhiều giá trị đầu ra của đối tượng.
Hiểu rõ quan hệ này có thể giúp cải thiện hay tối ưu hóa đối tượng nghiên
cứu.
Nghiên cứu thực nghiệm cần được thực hiện theo kế hoạch. Lý thuyết
về xây dựng kế hoạch thí nghiệm còn được gọi là “Quy hoạch thực
nghiệm” hay “Thiết kế thí nghiệm” (Design Of Experiments – DOE). DOE
giúp nhà nghiên cứu có thể thực thi ít thí nghiệm nhất nhưng lại thu được
nhiều thông tin hữu ích nhất về đối tượng được nghiên cứu.
Thực tế giảng dạy và hướng dẫn nghiên cứu cho thấy, nhiều nhà
nghiên cứu kỹ thuật thường mất nhiều thời gian và công sức cho việc tìm
hiểu và tính toán theo các công thức xác suất thống kê phức tạp của lý
thuyết quy hoạch thực nghiệm. Tiến trình nghiên cứu thực nghiệm nếu
được mô tả từng bước sẽ giúp nhà nghiên cứu tập trung sức lực của mình
cho vấn đề chính hơn. Sự trợ giúp đắc lực và hữu hiệu của máy tính trong
việc xử lý số liệu thí nghiệm cũng cần được quan tâm. Tài liệu này được
viết theo xu hướng ứng dụng, cụ thể hóa các lý thuyết về quy hoạch thực
nghiệm và xử lý số liệu thí nghiệm với sự trợ giúp của máy tính vào các bài
toán kỹ thuật. Sách được dùng làm giáo trình giảng dạy sau đại học, các
khóa đào tạo chuyên đề về nghiên cứu thực nghiệm trong lĩnh vực kỹ thuật.
Bạn đọc ở các trình độ khác, các lĩnh vực khác cũng có thể tham khảo kỹ
thuật thiết kế thí nghiệm trong tài liệu này.
Tài liệu bao gồm 6 chương với các nội dung chính sau đây.
Các khái niệm và nguyên tắc cơ bản của nghiên cứu thực nghiệm và
lập kế hoạch thí nghiệm. Giới thiệu về tiến trình thiết kế, thu thập dữ

1
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

liệu và xử lý số liệu thực nghiệm; lập kế hoạch và phân tích số liệu


thí nghiệm bằng máy vi tính.
Các kiến thức căn bản về lý thuyết thống kê được sử dụng trong xử lý
số liệu thí nghiệm. Nhiều ví dụ cụ thể được giới thiệu và phân tích
nhằm giúp người đọc không chuyên về toán có thể hiểu và liên hệ
được với vấn đề nghiên cứu của mình.
Các kỹ thuật phân tích số liệu thí nghiệm nhằm so sánh hai quá trình,
chất lượng hai nhóm đối tượng trong kỹ thuật. Cách xác định số
lượng mẫu thí nghiệm cần thiết cũng được phân tích và minh họa
bằng ví dụ cụ thể.
Cơ sở lý thuyết và cách thức xây dựng kế hoạch thí nghiệm hai mức
cho các bài toán kỹ thuật. Ứng dụng máy tính để xây dựng các kế
hoạch thí nghiệm hai mức.
Cách xây dựng kế hoạch và phân tích số liệu cho thí nghiệm sơ bộ
nhằm sàng lọc ra các yếu tố quan trọng, có ảnh hưởng lớn đến thông
số đầu ra của đối tượng nghiên cứu. Xác định các ảnh hưởng tương
tác giữa các yếu tố thí nghiệm. Cách thức xác định số lượng thí
nghiệm cần thiết. Kỹ thuật phân tích hồi quy và phương sai.
Tiến trình nghiên cứu thực nghiệm tối ưu hóa. Từng bước của quá
trình tìm vùng cực trị, xác định điểm cực trị cũng như hai dạng bài
toán tối ưu cơ bản là đơn mục tiêu và đa mục tiêu được giới thiệu và
phân tích chi tiết. Các giai đoạn phân tích, đánh giá được minh họa
qua các ví dụ xuyên suốt nhằm giúp người đọc hiểu và áp dụng cho
nghiên cứu của mình một cách dễ dàng.
Lần xuất bản đầu tiên chắc còn nhiều thiếu sót. Rất mong bạn đọc
đóng góp ý kiến để hoàn thiện hơn . Góp ý xin gửi về địa chỉ email:
vandu@tnut.edu.vn
Xin trân trọng cám ơn.

Các tác giả

2
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

MỤC LỤC
CHƯƠNG 1. GIỚI THIỆU................................................................................................7
1.1. Nghiên cứu thực nghiệm...........................................................................................7
1.2. Khái niệm thiết kế thí nghiệm.................................................................................10
1.3. Ba nguyên tắc thiết kế thí nghiệm ..........................................................................14
1.3.1. Nguyên tắc ngẫu nhiên....................................................................................14
1.3.2. Nguyên tắc lặp lại ...........................................................................................15
1.3.3. Nguyên tắc tạo khối ........................................................................................15
1.4. Các loại thí nghiệm.................................................................................................16
1.4.1. Thí nghiệm sàng lọc ........................................................................................16
1.4.2. Thí nghiệm so sánh .........................................................................................16
1.4.3. Thí nghiệm tối ưu hóa .....................................................................................17
1.5. Các dạng thiết kế thí nghiệm ..................................................................................17
1.5.1. Thí nghiệm một yếu tố.....................................................................................17
1.5.2. Thí nghiệm đa yếu tố.......................................................................................18
1.5.2.1. Thí nghiệm đa yếu tố tổng quát ............................................................................ 18
1.5.2.2. Thí nghiệm hai mức đầy đủ.................................................................................. 18
1.5.2.3. Thí nghiệm hai mức riêng phần............................................................................ 18
1.5.2.4. Thí nghiệm Plackett-Burman................................................................................ 19
1.5.3. Thí nghiệm Taguchi ........................................................................................19
1.5.4. Thí nghiệm bề mặt chỉ tiêu ..............................................................................19
1.6. Tiến trình nghiên cứu thực nghiệm.........................................................................20
1.6.1. Phát biểu vấn đề..............................................................................................20
1.6.2. Xác định các yếu tố thí nghiệm .......................................................................20
1.6.3. Lựa chọn hàm mục tiêu...................................................................................21
1.6.4. Thiết kế thí nghiệm..........................................................................................21
1.6.5. Tiến hành thí nghiệm ......................................................................................22
1.6.6. Phân tích kết quả ............................................................................................22
1.6.7. Kết luận...........................................................................................................22
1.7. Thiết kế và xử lý số liệu thí nghiệm bằng máy tính................................................23
1.8. Kết luận chương......................................................................................................25
Câu hỏi chương 1...........................................................................................................25
CHƯƠNG 2. THỐNG KÊ CƠ BẢN...............................................................................26
2.1. Dữ liệu thực nghiệm ...............................................................................................27
2.1.1. Tập toàn bộ và tập mẫu ..................................................................................27
2.1.2. Vị trí tập dữ liệu (Location) ............................................................................27
2.1.3. Mức độ biến động (Variation).........................................................................28
2.1.3.1. Khoảng giới hạn (Range) ..................................................................................... 28
2.1.3.2. Phương sai (Varriance) và độ lệch chuẩn (Standard deviation)............................ 29
2.1.4. Hình dạng phân phối dữ liệu (Shape) .............................................................30
2.1.4.1. Đồ thị thống kê (Histogram)................................................................................. 30
2.1.4.2. Mật độ phân phối (Distribution Density).............................................................. 32
2.2. Phân phối Gauss .....................................................................................................33
2.2.1. Giới thiệu ........................................................................................................33

3
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

2.2.1. Tính xác xuất bằng tay ....................................................................................36


2.2.2. Tính xác suất trên máy tính.............................................................................38
2.3. Kiểm định giả thuyết thống kê................................................................................40
2.3.1. Khái niệm........................................................................................................41
2.3.2. Giá trị giới hạn ...............................................................................................42
2.3.3. Giả thuyết một phía và hai phía......................................................................44
2.3.4. Mức ý nghĩa α và giá trị p ..............................................................................45
2.4. Suy diễn thống kê từ một tập mẫu ..........................................................................46
2.4.1. Suy diễn giá trị trung bình khi biết phương sai...............................................46
2.4.2. Suy diễn giá trị trung bình khi chưa biết phương sai......................................50
2.4.2.1. Phân phối t student (Student-t distribution).......................................................... 50
2.4.2.2. Trình tự suy diễn .................................................................................................. 51
2.4.2.3. Ví dụ minh họa ..................................................................................................... 52
2.4.3. Suy diễn phương sai của tập toàn bộ ..............................................................56
2.4.3.1. Phân phối χ2 (Chi-square Distribution) ............................................................... 56
2.4.3.2. Trình tự suy diễn σ2 .............................................................................................. 57
2.4.3.3. Ví dụ minh họa ..................................................................................................... 58
2.5. Hồi quy bậc nhất.....................................................................................................60
2.5.1. Xác định hệ số hồi quy ....................................................................................61
2.5.2. Đánh giá sai số hồi quy...................................................................................64
2.5.3. Hồi quy bằng máy tính ....................................................................................66
2.5.4. Ví dụ ứng dụng................................................................................................70
2.6. Chuyển dữ liệu về dạng phân phối chuẩn ...............................................................71
2.6.1. Kiểm tra dạng phân bố của dữ liệu.................................................................71
2.6.2. Chuyển đổi Box-Cox .......................................................................................74
2.6.3. Chuyển đổi Johnson ........................................................................................76
2.7. Kết luận chương......................................................................................................78
Câu hỏi chương 2...........................................................................................................79
CHƯƠNG 3. THỰC NGHIỆM SO SÁNH.....................................................................80
3.1. Giới thiệu ................................................................................................................80
3.2. So sánh trung bình ..................................................................................................80
3.2.1. Hai tập toàn bộ có cùng độ lệch chuẩn...........................................................82
3.2.2. Hai tập toàn bộ khác độ lệch chuẩn................................................................82
3.2.3. Hai tập có dữ liệu phân bố theo cặp ...............................................................83
3.2.4. Cách thực hiện so sánh ...................................................................................84
3.2.5. Ví dụ minh họa................................................................................................85
3.3. So sánh lượng biến động.........................................................................................93
3.3.1. Phân phối F ....................................................................................................94
3.3.2. Cách thức kiểm định giả thuyết.......................................................................95
3.3.3. Ví dụ minh họa................................................................................................96
3.4. Xác định số lượng mẫu thực nghiệm ......................................................................99
3.4.1. Tính số lượng mẫu bằng tay............................................................................99
3.4.2. Tính số lượng mẫu bằng máy tính.................................................................102
3.5. Kết luận chương....................................................................................................107
Câu hỏi chương 3.........................................................................................................107

4
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

CHƯƠNG 4. KẾ HOẠCH THỰC NGHIỆM 2 MỨC ................................................108


4.1. Giới thiệu ..............................................................................................................108
4.2. Thí nghiệm đầy đủ 2k ............................................................................................108
4.2.1. Thí nghiệm 22 ................................................................................................108
4.2.1.1. Ví dụ................................................................................................................... 109
4.2.1.2. Mô tả kế hoạch thí nghiệm 22 ............................................................................. 112
4.2.2. Thí nghiệm 23 ................................................................................................115
4.2.2. Bổ sung điểm thí nghiệm trung tâm ..............................................................118
4.2.3. Thiết kế thí nghiệm 2k ....................................................................................119
4.3. Thí nghiệm riêng phần 2k-p....................................................................................121
4.3.1. Thí nghiệm riêng phần 23-1............................................................................121
4.3.2. Độ phân giải và các dạng thí nghiệm riêng phần 2k-p ...................................123
4.3.2.1. Độ phân giải thiết kế .......................................................................................... 123
4.3.2.2. Các dạng thiết kế thí nghiệm riêng phần ............................................................ 124
4.3.2. Kế hoạch thí nghiệm P-B ..............................................................................125
4.4. Xây dựng kế hoạch hai mức bằng máy tính..........................................................127
4.5. Xác định số lượng thí nghiệm tối thiểu.................................................................131
4.6. Kết luận chương....................................................................................................135
Câu hỏi chương 4.........................................................................................................136
CHƯƠNG 5. THỰC NGHIỆM SÀNG LỌC ...............................................................137
5.1. Giới thiệu ..............................................................................................................137
5.2. Thiết kế thí nghiệm sàng lọc.................................................................................137
5.3. Phân tích kết quả thí nghiệm.................................................................................138
5.3.1. Xử lý số liệu ..................................................................................................138
5.3.2. Đánh giá các yếu tố ảnh hưởng chính ..........................................................142
5.3.3. Đánh giá tương tác giữa các biến thí nghiệm...............................................144
5.3.4. Mô hình hồi quy thực nghiệm........................................................................145
5.3. Các ví dụ minh họa...............................................................................................145
5.3.1. Thí nghiệm dạng đầy đủ................................................................................146
5.3.2. Thí nghiệm dạng riêng phần .........................................................................157
5.4. Kết luận chương....................................................................................................163
Câu hỏi chương 5.........................................................................................................163
CHƯƠNG 6. THỰC NGHIỆM TỐI ƯU HÓA............................................................164
6.1. Giới thiệu ..............................................................................................................164
6.1.1. Tiến trình tối ưu hóa .....................................................................................164
6.1.2. Mức độ phù hợp của mô hình .......................................................................166
6.1.3. Kế hoạch thí nghiệm bề mặt chỉ tiêu.............................................................166
6.1.4. Tối ưu hóa đa mục tiêu .................................................................................167
6.2. Thí nghiệm khởi đầu.............................................................................................167
6.2.1. Khái niệm......................................................................................................167
6.2.2. Ví dụ minh họa..............................................................................................168
6.3. Leo dốc tìm vùng cực trị.......................................................................................171
6.3.1. Khái niệm......................................................................................................171
6.3.2. Quy tắc xác định bước leo dốc......................................................................173

5
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

6.3.3. Ví dụ minh họa..............................................................................................177


6.4. Thí nghiệm bề mặt chỉ tiêu ...................................................................................182
6.4.1. Kế hoạch thí nghiệm bề mặt chỉ tiêu.............................................................182
6.4.1.1. Thiết kế hỗn hợp tâm xoay ................................................................................. 183
6.4.1.2. Thiết kế Box-Behnken........................................................................................ 184
6.4.1.3. Thiết kế thí nghiệm bằng máy tính ..................................................................... 185
6.4.1.4. Ví dụ minh họa ................................................................................................... 187
6.4.2. Thực hiện thí nghiệm bề mặt chỉ tiêu ............................................................189
6.4.3. Phân tích kết quả thí nghiệm.........................................................................190
6.4.4. Đồ thị bề mặt chỉ tiêu....................................................................................193
6.4.5. Tối ưu hóa đơn mục tiêu ...............................................................................195
6.4.5.1. Tính bằng tay...................................................................................................... 195
6.4.5.2. Tính bằng máy tính............................................................................................. 198
6.5. Tối ưu hóa đa mục tiêu .........................................................................................200
6.5.1. Cách tiếp cận ................................................................................................200
6.5.2. Hàm kỳ vọng .................................................................................................202
6.5.3. Trọng số ........................................................................................................205
6.5.4. Hệ số mức độ quan trọng..............................................................................206
6.5.5. Ví dụ minh họa..............................................................................................207
6.6. Các chú ý thiết kế thí nghiệm tối ưu .....................................................................215
6.7. Kết luận chương....................................................................................................216
Câu hỏi chương 6.........................................................................................................216
PHỤ LỤC 1. MỘT SỐ BẢNG THỐNG KÊ ................................................................217
PHỤ LỤC 2. CĂN BẢN SỬ DỤNG MINITAB ...........................................................223
P.2.1. Khởi động và giao diện Minitab........................................................................223
P2.2. Làm việc với dữ liệu...........................................................................................224
P2.3. Quản lý tập tin Minitab.......................................................................................224
TÀI LIỆU THAM KHẢO..............................................................................................227

6
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Chương 1.
GIỚI THIỆU
1.1. Nghiên cứu thực nghiệm

Trong kỹ thuật, có hai chức năng nghiên cứu chủ yếu là nghiên cứu
sáng tạo và nghiên cứu thực nghiệm.

Nghiên cứu sáng tạo (Creative research) là các nghiên cứu nhằm
phát triển các lý thuyết mới, quá trình mới hay thiết kế các sản phẩm mới.
Nghiên cứu sáng tạo bao gồm cả nghiên cứu sáng tạo lý thuyết (Creative
theoretical research) và nghiên cứu sáng tạo thực tế (Creative practical
research). Nghiên cứu sáng tạo lý thuyết nhằm khám phá hay tạo ra các mô
hình mô tả, lý thuyết hay giải thuật mới. Nghiên cứu sáng tạo thực tế bao
gồm các nghiên cứu nhằm thiết kế những sản phẩm, quá trình mới đáp ứng
đòi hỏi thực tế của xã hội, của kỹ thuật.

Nghiên cứu thực nghiệm (Experimental research) là dạng nghiên


cứu về mối quan hệ “Nguyên nhân - kết quả”. Trước hết, nhà nghiên cứu
xác định các thông số (hay các biến) cần và có thể quan tâm. Sau đó, tiến
hành các thí nghiệm nhằm quan sát, đánh giá xem mục tiêu (còn gọi là biến
phụ thuộc, thông số đầu ra) thay đổi như thế nào khi một hay nhiều biến
khác (gọi là biến độc lập hay thông số đầu vào) được thay đổi.

Nghiên cứu thực nghiệm đóng vai trò quan trọng trong khoa học kỹ
thuật. Các mô hình, lý thuyết, giải thuật, quá trình mới luôn cần được kiểm
nghiệm thực trước khi đem ra ứng dụng. Hơn nữa, nghiên cứu thực nghiệm
còn có ý nghĩa bổ sung, hoàn chỉnh các kết quả nghiên cứu sáng tạo lý
thuyết đã được phát triển.

Bên cạnh đó, các quá trình công nghệ và kỹ thuật thường rất phức
tạp, bao gồm một tập hợp lớn các yếu tố ảnh hưởng và nhiều chỉ tiêu đánh

7
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

giá khác nhau. Trong đa số các các hệ thống hay quá trình kỹ thuật, các
mối quan hệ vào-ra thường không thể mô tả được một cách đầy đủ bằng
các hàm lý thuyết. Người ta thường mô hình hóa các quá trình, đối tượng
cần nghiên cứu như một hộp đen (Black-box) như trên hình 1.1.

Các tham số
điều khiển được
Kết quả
Đầu vào Quá trình, (đầu ra)
Hệ thống,
Đối tượng

Các yếu tố không


điều khiển được

Hình 1.1. Sơ đồ một quá trình, hệ thống hay đối tượng nghiên cứu

Trên hình 1.1, các tín hiệu đầu vào được sơ đồ hóa thành 3 nhóm:
đối tượng đầu vào, các tham số (yếu tố, nhân tố) có thể điều khiển được và
các yếu tố không điều khiển được. Chúng ta không biết và không cần quan
tâm những gì xảy ra bên trong hộp đen, nghĩa là cách thức các thông số nói
trên tác động nhau như thế nào. Cái chúng ta quan tâm là làm sao để xác
lập được quan hệ vào-ra, để từ đó có thể điều khiển được quá trình hay
nhận được thông số ra của đối tượng theo ý muốn. Vấn đề này này có thể
được giải quyết bằng thực nghiệm. Các thí nghiệm được tiến hành, hoặc
trực tiếp trên các đối tượng hay hệ thống cụ thể, hoặc trên các mô hình thí
nghiệm, nhằm thu thập thông tin về quá trình hay sản phẩm kỹ thuật.

Theo Montgomery, thí nghiệm là một quá trình kiểm nghiệm hay
một chuỗi các kiểm nghiệm mà trong đó, các thông số đầu vào của một quá
trình hay hệ thống được thay đổi một cách có chủ đích. Các thay đổi ở các
kết quả đầu ra của hệ thống hay quá trình sẽ được quan sát, ghi nhận để sau
đó phân tích, xác định các nguyên nhân, quan hệ giữa đầu vào và đầu ra
của hệ thống, quá trình hay đối tượng thí nghiệm.

8
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Ví dụ, trong một quá trình gia công cắt gọt kim loại, các yếu tố như
giá trị vận tốc cắt, tốc độ chạy dao, loại chất bôi trơn, chiều sâu cắt v.v…
có thể được xử lý như các biến số đầu vào; còn chất lượng bề mặt của chi
tiết đã hoàn thiện có thể được xem xét như một đặc trưng của đầu ra. Để
cải thiện chất lượng gia công, có thể tiến hành nghiên cứu bằng các thí
nghiệm được tiến hành ngay trên thiết bị và điều kiện gia công thực tế.
Bằng cách thay đổi các thông số vận tốc cắt, tốc độ chạy dao, loại chất bôi
trơn, chiều sâu cắt … theo một kế hoạch cụ thể, nhà nghiên cứu có thể dễ
dàng xác định quan hệ giữa chúng với chất lượng bề mặt chi tiết được gia
công. Rõ ràng, nếu không lập kế hoạch trước, ta khó có thể hình dung sẽ
thay đổi từng thông số như thế nào; liệu kết quả đã tin cậy hay có thể rà
soát hết được các tập hợp giá trị các thông số đầu vào hay chưa, liệu rằng
độ lớn của của vận tốc cắt có ảnh hưởng đến việc chọn lượng chạy dao hay
không v.v …

Trước đây, nghiên cứu thực nghiệm thường được tiến hành theo các
phương pháp cổ điển, có tên gọi là “Một biến tại một thời điểm” (OVAT =
One Variable At a Time). Thí nghiệm được tiến hành bằng cách thay đổi
một thông số ảnh hưởng – một biến nào đó trong khi các biến khác được
giữ nguyên. Khi tìm được một giá trị cho ra mục tiêu ưng ý, biến này sẽ
được giữ nguyên giá trị cho các thí nghiệm tiếp theo. Một biến khác lại
được tiếp tục thay đổi trong khi biến ban đầu và các biến còn lại khác lại
được giữ nguyên. Phương pháp này chỉ phù hợp khi số biến độc lập là ít.
Thêm nữa, ảnh hưởng tương tác giữa các yếu tố không được xem xét. Do
vậy, kết quả nhiều khi không phản ánh đúng quá trình. Hơn nữa, số lượng
thí nghiệm cần thực hiện sẽ tăng rất nhanh khi số biến tăng.

Vấn đề ảnh hưởng của sự tương tác giữa các yếu tố (Interaction
effects) đến một quá trình luôn tồn tại trong mọi lĩnh vực, tác động đến mọi
đối tượng xung quanh ta. Có thể một yếu tố được xét thấy có ảnh hưởng tốt
đến đối tượng, nhưng nếu có một hay nhiều biến khác thay đổi thì ảnh
hưởng của yếu tố đã xét sẽ không còn như trước nữa. Ví dụ, cung cấp nhiều
phân bón cho cây trồng là có lợi cho sự phát triển của cây. Tuy vậy nếu vào

9
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

mùa khô, ta chỉ cung cấp dưỡng chất (phân bón) cho cây trồng mà không
cung cấp nước, cây trồng sẽ chết. Với ít nước, phân bón trở nên có hại cho
cây trồng nhưng trái lại, phân bón sẽ có lợi với một tỷ lệ nhất định của
nước.

Trong các thí nghiệm được quy hoạch chuẩn mực, các biến được
thay đổi đồng thời theo kế hoạch đã định trước. Dữ liệu thu nhận được sau
đó được phân tích một cách khoa học theo các phương pháp phân tích
thống kê. Trước đây, việc lập kế hoạch thí nghiệm cũng như phân tích dữ
liệu thường được tiến hành bằng tay. Nhà nghiên cứu hoặc phải tìm hiểu và
tính toán với các công thức, ma trận, bảng tra hết sức phức tạp; hoặc phải
nhờ cậy các chuyên gia về toán và xác xuất thống kê. Ngày nay, với sự trợ
giúp của các phần mềm thiết kế thí nghiệm thương mại đã được kiểm
chứng, nhà nghiên cứu có thể dành nhiều thời gian, công sức của mình để
quan tâm đến đối tượng và dữ liệu cần phân tích hơn.

1.2. Khái niệm thiết kế thí nghiệm

Từ những năm 1920, Ronald Fisher đã đề xuất các phương pháp


thiết kế thí nghiệm (DOE – Design of Experiments) nhằm nghiên cứu sự
ảnh hưởng đồng thời của các nhân tố khác nhau. Lý thuyết về thiết kế thí
nghiệm từ đó đã được phát triển hết sức mạnh mẽ và trở thành một ngành
khoa học độc lập. Ở Việt Nam, xây dựng kế hoạch thí nghiệm thường được
biết đến với tên gọi “Quy hoạch thực nghiệm”, được giải thích như là một
tập hợp có hệ thống chi tiết các bước để tiến hành thí nghiệm.

Thiết kế thí nghiệm được sử dụng như một công cụ hữu ích nhằm
khảo sát bất kỳ một ứng xử (Response) của một hệ thống, một quá trình
hay một đối tượng nào. Sự thay đổi của ứng xử được coi như một hàm của
một hay nhiều thông số khác – được gọi là các biến thí nghiệm. Nhà nghiên
cứu xây dựng một ma trận thí nghiệm chứa các xác lập cho các biến thí
nghiệm, tiến hành thí nghiệm để thu thập kết quả của ứng xử. Tiếp đó,
thông qua việc sử dụng thống kê toán học, mô hình quan hệ vào-ra sẽ được

10
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

xây dựng. Mô hình này đặc biệt hữu dụng cho nhiều mục đích khác nhau,
chẳng hạn để lựa chọn các tập thông số tối ưu của quá trình hay của sản
phẩm cần thiết kế; giảm thiểu các ảnh hưởng của các thông số không có
lợi; xác định và giảm thiểu các đặc tính nhạy với tác động môi trường để
bền vững hóa quá trình hay sản phẩm v.v…

Một kế hoạch thí nghiệm được thiết kế tốt sẽ cho phép nhà nghiên
cứu tiến hành số lượng thí nghiệm ít nhất, tốn kém ít chi phí, mất thời gian,
công sức ít nhất nhưng lại thu được nhiều thông tin nhất về quá trình, đối
tượng nghiên cứu.

Hãy xem xét một vấn đề kỹ thuật quen thuộc: Quy trình nhiệt luyện
nào cho ra độ cứng cao nhất của một loại thép? Các câu hỏi có thể đặt ra
cho tiến trình thí nghiệm như: liệu có thể thay đổi thành phần dung dịch
làm nguội? Có thể thay đổi thời gian tôi? Có thể thay đổi nhiệt độ tôi? Rõ
ràng, còn một loạt các câu hỏi khác cần đặt ra như:

1. Liệu có thể có bao nhiêu giải pháp?


2. Có những yếu tố nào khác ảnh hưởng đến độ cứng?
3. Cần tôi thử nghiệm bao nhiêu mẫu cho mỗi bể tôi?
4. Thứ tự tôi các mẫu như thế nào?
5. Nên phân tích dữ liệu thu được như thế nào?
6. Các độ cứng thu được nếu khác nhau thì chênh lệch bao nhiêu nên
được coi là đáng kể?

Để trả lời các câu hỏi này, ta cần biết và sử dụng các kiến thức của môn
khoa học về lập kế hoạch thí nghiệm.

Mục đích cơ bản của việc lập kế hoạch thí nghiệm, từ đây gọi tắt là
thiết kế thí nghiệm, là xây dựng một tiến trình thí nghiệm bền vững, ít bị
ảnh hưởng của các thay đổi bên ngoài. Các mục tiêu cụ thể là:

- Giảm thiểu các yếu tố không điều khiển được nếu biết;

11
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

- Xác định các yếu tố quan trọng và có thể điều khiển được;
- Xác định được cấp độ sai khác về giá trị giữa các kết quả;
- Xác định số lượng thí nghiệm cần thiết tối thiểu.

Trong kỹ thuật, thí nghiệm thường được ứng dụng trong cả hai dạng bài
toán cơ bản sau:

Thiết kế, thử nghiệm sản phẩm, quá trình mới;


Phát triển, cải tiến quá trình, hệ thống sản xuất.

Trong thiết kế và phát triển sản phẩm, sử dụng kế hoạch thí nghiệm
có vai trò như:

- Đánh giá và so sánh các cấu trúc cơ bản;


- Đánh giá việc lựa chọn vật liệu;
- Lựa chọn các thông số thiết kế nhằm đảm bảo sản phẩm làm việc
bền vững trong các điều kiện khác nhau;
- Quyết định các tham số kích thước căn bản sẽ tác động đến khả
năng làm việc của sản phẩm.

Thiết kế thí nghiệm đóng một vai trò cực kỳ quan trọng trong việc
phát triển và cải thiện chất lượng quá trình sản xuất. Chẳng hạn, thí
nghiệm có thể được thực hiện để:

- Lựa chọn giải pháp thực hiện;


- Xác định các yếu tố quan trọng ảnh hưởng đến quá trình sản
xuất;
- Mô hình hóa mục tiêu của quá trình sản xuất nhằm:
Đạt đến một mục tiêu cụ thể;
Nâng cao độ ổn định quá trình sản xuất hay chất
lượng sản phẩm gia công;
Tối ưu hóa quá trình hay chất lượng sản phẩm;
Tối ưu hóa đa mục tiêu;

12
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

- Giảm giá thành sản xuất.

Ví dụ, để nâng cao chất lượng và độ ổn định của một phương pháp
hàn mới, nhà nghiên cứu muốn quan tâm đến độ bền của từng mối hàn và
sự biến động của các chỉ tiêu đang được dùng để đánh giá độ bền mối hàn.
Thông qua thí nghiệm, nhà nghiên cứu có thể xác định những thông số nào
có ảnh hưởng nhiều nhất đến độ bền trung bình và sự biến thiên độ bền của
các mối hàn đã được thử nghiệm. Qua thí nghiệm cũng có thể dự đoán
được độ bền mối hàn dưới các điều kiện thay đổi của các thông số cơ bản
của đầu vào chẳng hạn như như tốc độ hàn, điện áp, thời gian hàn, vị trí
mối hàn trong kết cấu…

Một số ứng dụng thành công của thiết kế thí nghiệm (DOE) đã được
nhiều công ty của Hoa Kỳ và châu Âu công bố. Những lợi ích chủ yếu khi
ứng dụng DOE trong sản xuất bao gồm:

Nhận được quy trình được cải tiến và ổn định;


Lợi nhuận được nâng cao do giảm tỷ lệ phế liệu, tỷ lệ khuyết tật, gia
công lại, kiểm tra lại. Vì vậy, thời gian thu hồi vốn đầu tư được rút
ngắn;
Năng suất của quá trình sản xuất được nâng cao;
Những biến động của quá trình được giảm xuống và do đó tính nhất
quán về các thông số đặc trưng của sản phẩm tốt hơn.
Giảm giá thành sản xuất;
Giảm thời gian thiết kế và thời gian phát triển sản phẩm;
Kiến thức về mối quan hệ giữa các đầu vào cơ bản của quy trình và
các đầu ra được nâng lên;
Khuyến khích tinh thần nghiên cứu, cải tiến sản phẩm và quy trình
sản xuất do các nắm vững được cách thức cải thiện, tối ưu hóa quá
trình và sản phẩm;

Các báo cáo cho thấy, sử dụng các phương pháp thiết kế thí nghiệm
có thể giảm được 20-30% thời gian giải quyết các vấn đề kỹ thuật; giảm

13
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

được ít nhất 50% chi phí kiểm nghiệm, chế tạo vật liệu khi thử nghiệm;
tăng 2-3 lần giá trị, chất lượng và độ tin cậy của thông tin thu thập được.

1.3. Ba nguyên tắc thiết kế thí nghiệm

Ba nguyên tắc căn bản nhất của thiết kế thí nghiệm bao gồm:
nguyên tắc ngẫu nhiên, nguyên tắc lặp và nguyên tắc khối. Các nguyên tắc
này được ứng dụng để làm giảm hoặc thậm chí là khử bỏ các sai số của thí
nghiệm. Một vấn đề quan trọng cần lưu ý rằng sai số thí nghiệm có thể dẫn
đến các quyết định sai hoặc trong một số trường hợp, gây sai lệch trong
việc xác định ảnh hưởng của các thông số quan trọng.

1.3.1. Nguyên tắc ngẫu nhiên

Nguyên tắc ngẫu nhiên (Principle of Randomization) được áp dụng


nhằm hạn chế ảnh hưởng của các yếu tố gây nhiễu. Theo nguyên tắc này,
thứ tự thay đổi giá trị các thông số thí nghiệm, cách bố trí thí nghiệm, thứ
tự tiến hành từng thí nghiệm phải được tiến hành theo một thứ tự ngẫu
nhiên.

Ví dụ, khi làm thí nghiệm so sánh ảnh hưởng của hai loại dung dịch
khi nhiệt luyện thép, ta cần lưu ý lấy ngẫu nhiên các mẫu từ các lô vật liệu
khác nhau, được gia công theo trình tự ngẫu nhiên. Cũng tránh thứ tự nhiệt
luyện hết một loạt chi tiết trong một dung dịch này rồi mới chuyển sang tôi
trong dung dịch kia.

Bằng cách sử dụng nguyên tắc ngẫu nhiên, chúng ta đã “bình quân
hóa” và do đó, làm giảm ảnh hưởng xấu của các sai số đo, các yếu tố nhiễu.
Nói cách khác, ngẫu nhiên hóa cho mọi giá trị của mỗi nhân tố đều có cơ
hội ngang nhau để bị ảnh hưởng của nhiễu.

Các phần mềm thiết kế thí nghiệm thường tạo các kế hoạch thí
nghiệm với thứ tự đã ngẫu nhiên hóa. Nếu lập kế hoạch bằng tay, cần lưu ý
“xáo trộn” các thí nghiệm và tiến hành theo một thứ tự ngẫu nhiên.

14
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

1.3.2. Nguyên tắc lặp lại

Theo nguyên tắc lặp lại (Principle of Replication), mỗi thí nghiệm
cần được thực hiện ít nhất nhiều hơn một lần.

Ví dụ, khi làm thí nghiệm so sánh hai môi trường tôi khi nhiệt luyện
mẫu thép, ta xét hai cách làm khác nhau. Ở cách thứ nhất, nhà thí nghiệm
tiến hành tôi 2 mẫu, 1 mẫu trong dầu, 1 mẫu trong nước muối. Ở cách thứ
hai, tiến hành tôi 10 mẫu, 5 mẫu trong dầu, 5 mẫu trong nước. Dễ thấy, với
cách thứ nhất, khó có thể kết luận chắc chắn là tôi trong môi trường nào tốt
hơn – có thể kết quả thu được chứa đựng cả các sai số thí nghiệm, yếu tố
ngẫu nhiên, may mắn… Còn ở cách hai, nếu độ cứng bình quân của 5 mẫu
trong môi trường dầu cao hơn độ cứng bình quân khi tôi trong môi trường
nước, có thể khẳng định một cách thuyết phục hơn.

Cũng cần lưu ý phân biệt hành động lặp lại (Replicate) với việc đo
lại (Repaeat measurement) một vài thông số nào đó nhiều lần. Đo lại nhiều
lần nhằm giảm sai số đo chứ không làm giảm ảnh hưởng các sai số nhiễu
đến kết quả thí nghiệm.

1.3.3. Nguyên tắc tạo khối.

Nguyên tắc tạo khối (Principle of Blocking) thường được sử dụng


khi số lượng thí nghiệm nhiều. Khi đó, ta cần chia thành nhiều khối thí
nghiệm. Khối là một tập hợp các thí nghiệm có chung một hay một vài đặc
tính nào đó. Trong mỗi khối, các thí nghiệm được thiết kế tuân thủ theo
nguyên tắc lặp và nguyên tắc ngẫu nhiên. Nói cách khác, thứ tự các thí
nghiệm trong một khối được xáo trộn ngẫu nhiên; đồng thời, các thí
nghiệm trong khối được lặp lại và xử lý thống kê như trong một kế hoạch
riêng.

15
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Ví dụ, một vật liệu cung cấp cho sản xuất được nhập thành từng
đợt. Để loại bỏ ảnh hưởng sự sai khác vật liệu giữa các đợt nhập vật tư,
giữa các nhà cung cấp khác nhau, có thể chia thành nhiều khối thí nghiệm –
mỗi khối chỉ bao gồm các mẫu từ một đợt nhập vật liệu hay một nhà cung
cấp…

1.4. Các loại thí nghiệm

Trong thực tế kỹ thuật, thường tiến hành ba loại thí nghiệm sau: Thí
nghiệm sàng lọc, thí nghiệm so sánh và thí nghiệm cải thiện quá trình.

1.4.1. Thí nghiệm sàng lọc

Thí nghiệm sàng lọc (Screening Experiment) là thí nghiệm được


tiến hành nhằm các mục đích sau:

- Xác định đâu là các yếu tố ảnh hưởng chính đến đối tượng hay
quá trình cần khảo sát;
- Đánh giá mức độ ảnh hưởng của các yếu tố;
- Đánh giá mức độ ảnh hưởng tương tác giữa các yếu tố.

Thí nghiệm sàng lọc thường khai thác các dạng thiết kế thí nghiệm
toàn phần 2 mức khi số yếu tố thí nghiệm không lớn; hoặc thiết kế thí
nghiệm riêng phần hay thiết kế thí nghiệm P-B.

1.4.2. Thí nghiệm so sánh

Thí nghiệm so sánh (Comparative Expriment) thường được thực


hiện để so sánh và đánh giá sai khác giữa hai nhóm đối tượng mẫu hay hai
quá trình nhằm trả lời câu hỏi: Có hay không sự sai khác giữa các nhóm đối
tượng hay quá trình? Câu hỏi này thường đặt ra khi kiểm chứng một sản
phẩm hay một quá trình mới. Chẳng hạn, một sản phẩm mới có thông số
đặc trưng đo được trên các mẫu phân bố trong khoảng 200 đến 300. Sản
phẩm cũ có thông số này phân bố trong khoảng 180 đến 310. Ta cần trả lời

16
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

câu hỏi: liệu thông số đặc trưng của hai loại sản phẩm có thực sự khác nhau
đáng kể? Liệu sản phẩm mới có tốt hơn sản phẩm cũ?

1.4.3. Thí nghiệm tối ưu hóa

Thí nghiệm tối ưu hóa nhằm tìm kiếm tập xác lập các yếu tố đầu
vào sao cho đạt được giá trị tối ưu của đầu ra. Thí nghiệm tối ưu hóa
thường sử dụng dạng thiết kế thí nghiệm “bề mặt chỉ tiêu” (RSM – xem
phần tiếp theo). Trong trường hợp hàm mục tiêu không có cực trị tronng
phạm vi khảo sát, thí nghiệm cho phép ta tạo các xác lập để đạt được giá trị
xác định của hàm mục tiêu.

1.5. Các dạng thiết kế thí nghiệm

Có 4 dạng thiết kế thí nghiệm cơ bản là: Thí nghiệm một yếu tố;
Thí nghiệm đa yếu tố; Thí nghiệm bề mặt chỉ tiêu và Thí nghiệm Taguchi.

1.5.1. Thí nghiệm một yếu tố

Ở dạng thí nghiệm này, ta chỉ khảo sát để đánh giá ảnh hưởng của
một yếu tố đến hàm mục tiêu như thế nào. Yếu tố được xem xét có thể là ở
dạng định tính hay định lượng.

Yếu tố định tính là yếu tố mà các cấp độ giá trị của nó không đo
đếm được. Ví dụ, có hay không tưới dung dịch trơn nguội; ảnh hưởng của
các loại đá mài khác nhau, loại vật liệu chi tiết… Thí nghiệm với yếu tố
định tính chỉ cho phép đánh giá ảnh hưởng của yếu tố trong phạm vi được
khảo sát đến hàm mục tiêu chứ không thể dự đoán được kết quả ở các cấp
độ khác.

Các yếu tố định lượng là các yếu tố mà đặc tính thay đổi của nó có
thể đo đếm được, chẳng hạn nhiệt độ, tốc độ cắt, lượng chạy dao, điện áp,
điện trở… Thí nghiệm với các yếu tố định lượng không những cho phép

17
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

đánh giá ảnh hưởng của yếu tố đó đến hàm mục tiêu mà còn có thể dự đoán
ứng xử của chi tiết, hệ thống, quá trình ở ngoài vùng đã khảo sát.

1.5.2. Thí nghiệm đa yếu tố

Trong thí nghiệm đa yếu tố, nhiều yếu tố có thể được đánh giá một
cách đồng thời. Mục tiêu của các thí nghiệm dạng này là để xác định các
yếu tố có ảnh hưởng mạnh nhất, đồng thời chỉ ra ảnh hưởng tương tác đồng
thời của chúng đến hàm mục tiêu. Việc dự đoán giá trị hàm mục tiêu hay
ứng xử của hệ thống ở bên ngoài phạm vi giá trị các yếu tố được khảo sát
cần được cân nhắc rất cẩn thận.

Các dạng thí nghiệm đa yếu tố thông dụng bao gồm:

1.5.2.1. Thí nghiệm đa yếu tố tổng quát

Trong thí nghiệm đa yếu tố tổng quát (General Full Factorial


Design), mối yếu tố có thể nhận nhiều mức giá trị khác nhau. Thêm nữa,
các yếu tố có thể bao gồm cả loại định tính lẫn định lượng.

1.5.2.2. Thí nghiệm hai mức đầy đủ

Thí nghiệm hai mức đầy đủ (Two Level Full Factorial Designs) là
các thí nghiệm mà mỗi yếu tố chỉ được thay đổi ở hai mức giá trị. Thí
nghiệm hai mức chỉ cho phép xây dựng mô hình quan hệ ứng xử ở dạng
bậc nhất. Thí nghiệm hai mức đầy đủ thường được ký hiệu là thí nghiệm 2k
trong đó k là số biến thí nghiệm.

1.5.2.3. Thí nghiệm hai mức riêng phần

Thí nghiệm hai mức riêng phần (Two Level Fractional Factorial
Design) là một dạng đặc biệt của thí nghiệm hai mức. Ở dạng thí nghiệm
này, một số tổ hợp giá trị của vài yếu tố sẽ không được xem xét. Thí
nghiệm hai mức riêng phần được sử dụng khi số lượng các yếu tố là lớn,

18
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

chi phí cho thí nghiệm cao. Sử dụng thiết kế thí nghiệm hai mức riêng phần
cho phép giảm số thí nghiệm cần thiết mà vẫn có thể đánh giá được các ảnh
hưởng chính. Thí nghiệm hai mức riêng phần thường được ký hiệu là thí
nghiệm 2k-p.

1.5.2.4. Thí nghiệm Plackett-Burman

Thí nghiệm Plackett-Burman, thường được gọi là thí nghiệm P-B,


là một dạng đặc biệt của thí nghiệm hai mức riêng phần. Thiết kế thí
nghiệm này do R. L. Plackett và J. P. Burman đề xuất. Thiết kế thí nghiệm
P-B chỉ khảo sát ảnh hưởng của các yếu tố chính mà không xét ảnh hưởng
tương tác giữa các yếu tố.

1.5.3. Thí nghiệm Taguchi

Thí nghiệm Taguchi được thiết kế dựa trên ma trận trực giao
Taguchi, có mục đích khảo sát ảnh hưởng của các yếu tố chính khi số
lượng các yếu tố và chi phí thí nghiệm lớn. Trong thiết kế thí nghiệm dạng
Taguchi, các yếu tố có thể nhận không chỉ hai mức mà còn có thể nhiều
hơn. Thêm nữa, các yếu tố trong một kế hoạch thí nghiệm có thể nhận số
mức giá trị khác nhau.

1.5.4. Thí nghiệm bề mặt chỉ tiêu

Thí nghiệm bề mặt chỉ tiêu (Response Surface Designs) được sử


dụng để xây dựng mô hình mô tả quan hệ giữa hàm chỉ tiêu với các biến thí
nghiệm. Quan hệ hàm-biến được mô tả dưới dạng một “bề mặt chỉ tiêu”
(Response Surface), hay còn gọi là “bề mặt đáp trị”, “bề mặt ứng xử”, “bề
mặt đáp ứng”… Với hàm 2 biến, ta dễ dàng hình dung ra quan hệ này có
thể được biểu diễn dưới dạng một mặt cong trong không gian ba chiều. Khi
số biến thí nghiệm nhiều hơn, mặt chỉ tiêu trở thành siêu mặt (Hyper
planes) trong không gian đa chiều. Nhờ xác định được quan hệ vào-ra giữa
các biến thí nghiệm với hàm mục tiêu, ta có thể hoặc tối ưu hóa hàm mục

19
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

tiêu hoặc xác định tập thông số vào để nhận được giá trị hàm mục tiêu như
ý muốn.

Các thí nghiệm được thiết kế sao cho chúng cho phép ta xác lập
được các ảnh hưởng tương tác và ảnh hưởng bậc cao của các yếu tố, từ đó
có thể dựng được bề mặt ứng xử (Response Surface) của đại lượng đang
cần quan tâm. Dựa vào kết quả thí nghiệm, ta xây dựng được mô hình hồi
quy (Regression Model), hay còn gọi là mô hình thực nghiệm (Emprical
Model) nhằm biểu diễn quan hệ vào-ra dưới dạng một hàm liên tục. Có thể
sử dụng hàm hồi quy nhằm dự đoán ứng xử của hệ thống, quá trình hay của
đối tượng dưới các điều kiện đầu vào khác nhau.

1.6. Tiến trình nghiên cứu thực nghiệm

Tiến trình nghiên cứu thực nghiệm thường bao gồm 7 giai đoạn sau
đây:

1.6.1. Phát biểu vấn đề.

Người nghiên cứu cần phát biểu thật rõ ràng vấn đề cần giải quyết của
mình. Cần xác định thật rõ ràng mục tiêu nghiên cứu, chẳng hạn như:

- Hiện tượng, đối tượng, quá trình nào cần khảo sát bằng thí nghiệm?
- Nghiên cứu nhằm mục đích gì:
Để hiểu rõ hơn quan hệ vào – ra của một quá trình mới?
Để so sánh, đánh giá một sản phẩm, một quá trình mới?
Để khẳng định lại các quan hệ đã được xác lập?
Để tối ưu hóa quá trình?
Để loại bớt các tác nhân gây mất ổn định cho quá trình, cho sản
phẩm?

1.6.2. Xác định các yếu tố thí nghiệm

20
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Các yếu tố ảnh hưởng khi làm thí nghiệm thường chia thành 2
nhóm lớn: nhóm các yếu tố thí nghiệm và các yếu tố gây nhiễu. Các yếu tố
thí nghiệm, còn gọi là các biến thí nghiệm, là các yếu tố mà nhà nghiên cứu
muốn điều khiển giá trị của chúng một cách có chủ đích để xem xét xem
kết quả thay đổi như thế nào. Các yếu tố gây nhiễu là các yếu tố có ảnh
hưởng đáng kể đến đối tượng nhưng ta không muốn tính đến chúng trong
thí nghiệm.

Sau khi đã xác định được các biến thí nghiệm, ta cần xác định
khoảng thay đổi giá trị cho từng biến, các mức giá trị muốn xác lập cho
từng biến khi tiến hành thí nghiệm. Một nguyên tắc quan trọng là cố gắng
sử dụng số lượng mức giá trị thay đổi cho từng biến càng thấp càng tốt. Ở
giai đoạn thí nghiệm sơ bộ để xác định các yếu tố chính, cố gắng chọn
khoảng thay đổi giá trị cho từng biến càng rộng càng tốt. Thêm nữa, cần
xác định xem cách đo hay tính toán giá trị cho các biến này sao cho có thể
có được các số liệu chính xác, phục vụ cho quá trình phân tích sau này.

1.6.3. Lựa chọn hàm mục tiêu.

Ta cần cân nhắc và quyết định lựa chọn yếu tố đầu ra nào thực sự
cung cấp các thông tin hữu ích về quá trình hay đối tượng đang cần nghiên
cứu. Hơn nữa, cần xem xét liệu thông số đặc trưng của yếu tố này có thể đo
được một cách thuận tiện hay không.

1.6.4. Thiết kế thí nghiệm

Ở bước này, số lượng và trình tự các thí nghiệm sẽ được xác lập.
Giá trị của mỗi biến thí nghiệm trong từng thí nghiệm cũng cần được chỉ
rõ. Kế hoạch thí nghiệm thường được lập thành một bảng thí nghiệm hay
còn gọi là ma trận thí nghiệm. Mỗi cột của bảng là một biến thí nghiệm;
mỗi hàng của bảng là một tập hợp các giá trị của các biến cho mỗi thí
nghiệm. Hình 1.2 minh họa một phần của một ma trận thí nghiệm có 3
biến.

21
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Thứ tự n (v/p) S(mm/p) t (mm)


1 4000 70 0,1
2 3900 96 0,15
3 4100 44 0,1
4 3900 44 0,15

Hình 1.2. Một phần của ma trận thí nghiệm 3 biến

1.6.5. Tiến hành thí nghiệm

Điều cần lưu tâm khi tiến hành thí nghiệm là phải đo đạc thật cẩn
thận các thông số cần thiết. Bên cạnh đó, cần ghi chép, lưu trữ các kết quả
thí nghiệm kèm theo các điều kiện xác lập thí nghiệm đó. Lưu ý rằng một
trong các nguyên tắc của nghiên cứu khoa học là kết quả phải có khả năng
tái lập lại. Nói cách khác, thí nghiệm nếu được tiến hành lại ở những nơi
khác, tại các thời điểm khác phải cho ra cùng kết quả.

1.6.6. Phân tích kết quả

Các phương pháp thống kê thường được sử dụng như một công cụ
hữu hiệu để xử lý dữ liệu thí nghiệm. Do số lượng số liệu thí nghiệm
thường rất lớn, việc phân tích bằng tay là rất phức tạp và tốn công sức. Các
phần mềm thiết kế thí nghiệm chuyên dụng hiện nay vừa cho phép thiết lập
kế hoạch thí nghiệm chuẩn xác, tiện dụng, vừa có khả năng phân tích dữ
liệu rất nhanh chóng và chính xác. Cũng cần lưu ý rằng, các công cụ thống
kê và máy tính chỉ hỗ trợ con người tính toán nhanh và chính xác hơn chứ
không thể đưa ra các đánh giá cụ thể được. Chúng chỉ có thể đưa ra những
định hướng giúp nhà nghiên cứu có cơ sở tin cậy để đưa ra nhận xét của
mình mà thôi.

1.6.7. Kết luận

Căn cứ vào kết quả đã được phân tích, nhà nghiên cứu đưa ra các
kết luận của mình. Sau quá trình trải nghiệm với mô hình, máy móc thực tế
và xử lý các kết quả, nhà nghiên cứu cũng cần chỉ ra các kinh nghiệm và đề

22
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

xuất định hướng nghiên cứu tiếp theo. Cũng có thể và nên tiến hành các thí
nghiệm khẳng định lại các kết luận đã suy diễn từ việc phân tích kết quả thí
nghiệm ở các bước trước.

1.7. Thiết kế và xử lý số liệu thí nghiệm bằng máy tính

Các kết quả nghiên cứu cần được phân tích và xử lý để thông qua
đó, chỉ ra các ý nghĩa của các bảng số liệu kết quả. Xây dựng các ma trận
thí nghiệm, tra các bảng số liệu dày đặc, tính toán theo các công thức xác
xuất thống kê phức tạp là những công việc làm đau đầu nhiều nhà kỹ thuật
không chuyên về toán.

Với sự trợ giúp của máy tính và các phần mềm chuyên dụng, thiết
kế thí nghiệm và xử lý số liệu thực nghiệm đã trở nên nhẹ nhàng và đơn
giản hơn rất nhiều. Người làm nghiên cứu khi này có thể toàn tâm để ý đến
việc xây dựng các mô hình thí nghiệm và thực hiện chúng. Nói như giáo sư
Nguyễn Văn Tuấn, “không có máy tính, khoa học thống kê vẫn chỉ là một
khoa học buồn tẻ khô khan, với những công thức rắc rối mà thiếu tính ứng
dụng vào thực tế. Máy tính đã giúp khoa học thống kê làm một cuộc cách
mạng lớn nhất trong lịch sử của bộ môn: đó là đưa khoa học thống kê vào
thực tế, giải quyết các vấn đề gai góc nhất và góp phần làm phát triển khoa
học thực nghiệm”.

Hiện nay, hầu hết các tài liệu phục vụ giảng dạy và khai thác kỹ thuật
thiết kế thí nghiệm trên thế giới đều giới thiệu và sử dụng một vài phần
mềm thiết kế và xử lý số liệu thí nghiệm trong các ví dụ ứng dụng. Trong
cuốn sách này, phần mềm Minitab được giới thiệu và sử dụng trong các ví
dụ minh họa vì các lý do sau:

- Trước hết, giao diện của Minitab ở dạng đồ họa, với các menu và hộp
thoại rất đơn giản và dễ dùng. Thực tế cho thấy nhiều học viên cao
học, nghiên cứu sinh đã có thể khai thác hữu hiệu Minitab cho nghiên
cứu của mình chỉ sau một số ít giờ thực hành;

23
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

- Minitab có giao diện và sử dụng cách nhập số liệu hoàn toàn tương tự
MS Excel®, một phần mềm văn phòng rất quen thuộc với hầu hết
người dùng máy tính ở Việt Nam. Hơn nữa, việc trao đổi dữ liệu giữa
hai phần mềm này rất đơn giản, hoặc thông qua chức năng copy-dán,
hoặc thông qua chức năng Import-Export;
- Các đồ thị mô tả thống kê của Minitab có hình thức trình bày rất rõ
ràng; đồng thời có thể dễ dàng hiệu chỉnh theo ý muốn. Các đồ thị
này cũng có thể kết xuất ra nhiều dạng ảnh hiệu chỉnh được;
- Minitab là một phần mềm thống kê và thiết kế thí nghiệm chuyên
dụng, một phần mềm thương mại có lịch sử phát triển từ rất sớm
(Minitab được Barbara F. Ryan, Thomas A. Ryan, Jr. và Brian L.
Joiner của Đại học Pennsylvania phát triển từ năm 1972). Các kết
quả do Minitab xử lý hoàn toàn có thể tin cậy được;
- Mặc dù giá bán của Minitab còn là một rào cản cho việc phổ biến cho
các học viên, nghiên cứu sinh và các nhà nghiên cứu thực nghiệm ở
Việt Nam, nhưng phiên bản dùng thử 30 ngày với đầy đủ chức năng
của Minitab cũng cho phép ta học tập, thực hành và khai thác Minitab
với mục đích phi thương mại;
- Đã có một số tài liệu tiếng Việt về sử dụng Minitab; điều này có thể
giúp độc giả có thể làm quen với việc sử dụng phần mềm này. Bạn
đọc cũng có thể khai thác Minitab cho mục đích thiết kế và xử lý số
liệu thí nghiệm bằng cách làm theo các ví dụ minh họa có trong sách
này. Phần phụ lục cuối sách giúp các bạn mới học làm quen với các
thao tác căn bản ban đầu của Minitab.

Cũng cần nói thêm rằng, gói phần mềm Matlab® cũng có modun thiết
kế và phân tích thí nghiệm. Tuy vậy, người dùng buộc phải nhớ các
cấu trúc câu lệnh và sau đó, hoặc lần lượt nhập lệnh để thực hiện, hoặc
phải “đóng gói” thành một file kịch bản (Script file) để thực thi. Việc
thay đổi nội dung kịch bản cũng đòi hỏi nhà nghiên cứu phải có kiến
thức nhất định về lập trình mới khai thác được.

24
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

1.8. Kết luận chương

Hầu hết các công trình nghiên cứu đều gắn với thực nghiệm.
Nghiên cứu thực nghiệm trong kỹ thuật là nhằm xác định quan hệ giữa các
thông số đầu vào với một hay nhiều thông số mục tiêu đầu ra của đối
tượng. Hiểu rõ quan hệ này có thể giúp cải thiện, tối ưu hóa đối tượng
nghiên cứu.

Nghiên cứu thực nghiệm cần được thực hiện theo kế hoạch. Lý
thuyết về lập kế hoạch thí nghiệm còn được gọi là “Quy hoạch thực
nghiệm” hay “Thiết kế thí nghiệm” (Design Of Experiments – DOE). DOE
giúp nhà nghiên cứu thực hiện ít thí nghiệm nhất có thể nhưng lại thu được
nhiều thông tin hữu ích nhất về đối tượng được nghiên cứu.

Các dữ liệu thực nghiệm thường chỉ có thể thu thập được từ một số
mẫu của một tập hợp lớn phần tử của đối tượng nghiên cứu. Các thuộc tính
của đối tượng nghiên cứu được suy diễn từ các thông tin có được sau khi
phân tích dữ liệu thu được từ các mẫu. Để phân tích dữ liệu thí nghiệm, cần
sử dụng các kỹ thuật phân tích thống kê. Sử dụng các phần mềm chuyên
dụng trên máy tính giúp nhà nghiên cứu tránh được sự “buồn tẻ khô khan,
những công thức rắc rối” của thống kê xác suất và có thể tập trung sức lực
vào mục đích chính của công trình nghiên cứu.

Câu hỏi chương 1

1. Thiết kế thí nghiệm là gì? Tại sao cần thiết kế thí nghiệm khi
nghiên cứu thực nghiệm?
2. Các nguyên tắc thiết kế thí nghiệm? Tại sao cần quan tâm đến các
nguyên tắc này khi thiết kế thí nghiệm?
3. Thí nghiệm hai mức đầy đủ và hai mức riêng phần giống và khác
nhau ở điểm nào?
4. Thí nghiệm P-B được sử dụng khi nào? Tại sao?
5. Hãy cài đặt phần mềm Minitab vào máy tính; xem phần phụ lục và
thực hiện các thao tác làm quen với phần mềm này.

25
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Chương 2.
THỐNG KÊ CƠ BẢN
Giả sử ta cần kiểm tra chất lượng của một loại sản phẩm để đảm
bảo chúng sẽ vận hành ổn định trong quá trình sử dụng. Sau khi chọn một
đại lượng đặc trưng cho chất lượng sản phẩm đó, ta tiến hành đo giá trị của
đại lượng này trên một số lượng chi tiết bất kỳ, ta nhận thấy các giá trị này
không giống hệt nhau. Chúng phân bố rất ngẫu nhiên. Do số lượng sản
phẩm rất lớn, ta không kiểm tra được từng sản phẩm mà chỉ có thể kiểm tra
xác xuất một số nhất định được chọn ngẫu nhiên mà thôi. Nếu số sản phẩm
đạt yêu cầu so với số được kiểm tra chiếm một tỷ lệ nhất định, chẳng hạn
95%, ta có thể kết luận được rằng 95% trong số tất cả sản phẩm đã sản xuất
là đạt yêu cầu không? Không chắc là như vậy. Kỹ thuật thống kê cho phép
ta trả lời các câu hỏi tương tự.

Các đại lượng trong tự nhiên, trong kỹ thuật đều biến động một
cách ngẫu nhiên. Chẳng hạn, lượng ô tô chạy qua một địa điểm trong mỗi
ngày, kích thước của một loạt chi tiết gia công với cùng một chế độ cắt, độ
bền của các mẫu trong một loạt vật liệu được sản xuất trong một điều kiện
giống hệt nhau… Các kết quả quan sát được hay đo được của các quá trình
cũng biến động ngẫu nhiên do tác động của các yếu tố nhiễu, dù rằng các
quá trình được thực hiện với các thiết lập như nhau. Để hiểu và xử lý các
quy luật của các đại lượng ngẫu nhiên, ta cần sử dụng các phương pháp
thống kê.

Nội dung chương này sẽ tóm tắt lại một số khái niệm, kiến thức cơ
bản nhất của tính toán thống kê xác xuất được sử dụng trong việc xử lý,
phân tích số liệu thực nghiệm. Lưu ý rằng ta cần hiểu các kiến thức này để
nắm được quá trình xử lý số liệu cần được tiến hành ra sao, chứ không nhất
thiết phải học thuộc cách tính đó. Các phần mềm máy tính luôn có sẵn các

26
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

công cụ tính toán thống kê cần thiết, giúp quá trình tính toán nhanh và
chính xác hơn rất nhiều.

2.1. Dữ liệu thực nghiệm

2.1.1. Tập toàn bộ và tập mẫu

Trong nghiên cứu thực nghiệm, đại lượng đặc trưng của đối tượng
nghiên cứu thường có giá trị không đồng nhất. Ví dụ, giá trị độ nhám bề
mặt của tất cả các cổ trục khuỷu được mài trên một máy gia công; giới hạn
mỏi dài hạn của tất cả các mẫu trục làm bằng thép; kích thước của một loạt
chi tiết gia công … là các giá trị biến động. Tuy nhiên, ta không thể hoặc
rất khó để đo đạc, khảo sát tất cả các dữ liệu từ một quá trình hay đối tượng
được mà thường chỉ chọn ngẫu nhiên một số lượng nhất định trong đó làm
đại diện cho đối tượng mà thôi. Ta nói ta đã chọn một tập mẫu (sample)
làm đại diện cho tập toàn bộ (population) các dữ liệu của đối tượng cần
khảo sát.

Trong khoa học thực nghiệm, chúng ta không biết các thông số của
một tập toàn bộ mà thường chỉ có thể khảo sát, thu thập số liệu và phân tích
dữ liệu cho một tập mẫu nào đó được chọn trong tập toàn bộ mà thôi. Qua
phân tích số liệu của tập mẫu, ta có thể suy luận ra các đặc trưng của tập
toàn bộ.

Tập hợp các dữ liệu thí nghiệm thu thập được thường rất lớn. Để xử
lý tập hợp rất nhiều các con số này, ta thường dựa vào ba đặc trưng của dữ
liệu: vị trí, mức độ biến đổi và hình dạng phân phối dữ liệu.

2.1.2. Vị trí tập dữ liệu (Location)

Cho một tập dữ liệu gồm n số liệu { x1, x2…xn} thu được từ việc
đánh giá một đại lượng X. Các thông số thường được dùng để xác định vị
trí tập dữ liệu bao gồm:

27
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

- Trung bình số học (mean): là giá trị trung bình cộng của tất cả các
phần tử;
- Trung vị (median): là giá trị của phần tử đứng giữa trong tập dữ
liệu đã xếp theo thứ tự; nếu số phần tử là chẵn, trung vị là giá trị
trung bình cộng của hai phần tử đứng giữa nhất.

Ví dụ 2.1. Khi tiến hành thí nghiệm đo ứng suất mỏi dài hạn của 20 mẫu
trục cùng loại, ta thu các giá trị ứng suất biến động từ 45,2 đến 47,8 MPa,
được sắp xếp theo thứ tự tăng dần như sau:

45,2 45,4 45,6 45,8 45,8 45,8 46,1 46,3 46,4 46,4
46,5 46,6 46,7 46,9 47,0 47,1 47,2 47,4 47,7 47,8

Ta có trung bình số học của tập số liệu đã cho là 46,48. Vì số phần tử là


chẵn, nên trung vị của tập này sẽ là trung bình cộng của hai phần tử số 10
và số 11, tức là bằng (46,4 + 46,5)/2 = 46,45.

2.1.3. Mức độ biến động (Variation)

Trong thống kê kỹ thuật, thường sử dụng hai thông số đánh giá mức
độ biến động của tập dữ liệu: khoảng giới hạn (range) và độ lệch chuẩn
(Standard deviation). Khái niệm khoảng phần tư (interquartile) cũng được
sử dụng trong một số trường hợp.

2.1.3.1. Khoảng giới hạn (Range)

Khoảng giới hạn R là hiệu số giữa giá trị lớn nhất và nhỏ nhất của
tập dữ liệu:

R = xmax − xmin (2.1)

Với tập dữ liệu trong ví dụ 2.1, ta có khoảng giới hạn R = 47,8 –


45,2 = 2,6. Ta có thể nói, các giá trị giới hạn mỏi biến động trong khoảng
2,6 MPa.

28
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

2.1.3.2. Phương sai (Varriance) và độ lệch chuẩn (Standard deviation)

Phương sai một tập mẫu gồm n giá trị được tính theo công thức:

∑ ( x − x)
i
2

s2 = i =1
(2.2)
n −1

Đại lượng s trong công thức trên được gọi là độ lệch chuẩn của tập mẫu;

Phương sai của một tập toàn bộ gồm N phần tử được tính:

∑(x i − μ)2
σ2 = i =1
(2.3)
N

Đại lượng σ được gọi là độ lệch chuẩn của tập toàn bộ.

Trong thực tế, ta thường không biết hoặc không tính được phương
sai và độ lệch chuẩn của tập toàn bộ. Các giá trị này chỉ có thể được tính
toán dựa vào các giá trị phương sai và độ lệch chuẩn của tập mẫu. Quá
trình tính toán này thường được gọi là “suy luận thống kê” (Statistical
Inference).

Để hiểu vai trò mô tả mức độ biến động dữ liệu của phương sai và
độ lệch chuẩn, ta xét tập dữ liệu đã cho trong ví dụ 2.1. Ta đã biết, giá trị
trung bình của tập dữ liệu là 46,48. Câu hỏi đặt ra là các dữ liệu phân tán
rộng hay hẹp, mật độ phân phối như thế nào quanh giá trị này? Áp dụng
công thức trên, ta có được phương sai của tập mẫu này là 0,5606, độ lệch
chuẩn là 0,7488. Giả thiết các số liệu phân bố theo dạng phân phối chuẩn
(sẽ được giới thiệu trong phần tiếp theo), khi đó, sẽ có khoảng 68% số liệu
nằm trong khoảng một độ lệch chuẩn, tức là sẽ có khoảng 20*0,68 ≈ 14 giá
trị nằm trong khoảng từ (46,48 – 0,7485) đến (46,48 + 0,7485), tức là nằm

29
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

trong khoảng (45,7309 đến 47,2285). Quan sát bảng số liệu của ví dụ 2.1,
ta thấy có đúng 14 số liệu phân bố từ giá trị 45,8 cho đến 47,2. Như vậy, độ
lệch chuẩn là một thông số quan trọng phản ánh mức độ phân tán của các
số liệu xung quanh giá trị trung bình của tập dữ liệu. Độ lệch chuẩn của
một tập dữ liệu càng lớn thì các dữ liệu càng phân tán xa giá trị trung bình
của tập đó và ngược lại.

2.1.4. Hình dạng phân phối dữ liệu (Shape)

Trong thực tế, có hai dạng tập hợp dữ liệu dạng số: dạng rời rạc và
dạng liên tục. Tập dữ liệu ở dạng rời rạc gồm các dữ liệu đếm được, là số
lượng của các đặc trưng nào đó của đối tượng, chẳng hạn như thống kê số
chi tiết hỏng sau một thời gian làm việc, màu sắc hay gặp của các vật phẩm
thông dụng… Tập dữ liệu dạng liên tục chứa các dữ liệu không đếm được,
chẳng hạn kích thước đo được của loạt chi tiết gia công, ứng suất dư trong
loạt mẫu thí nghiệm… Ví dụ, ta không thể nói chính xác đường kính của
một bậc trục nào đó là 42,25 mm – rất có thể đường kính thực của nó là
42,45123215 mm, nhưng ta không đo được hoặc đã làm tròn nó mà thôi.
Hoặc cũng có thể, trong loạt chi tiết chúng ta gia công, sẽ có nhiều giá trị
đường kính phân bố các giá trị 42,2511 và 42,2512 v.v…

2.1.4.1. Đồ thị thống kê (Histogram)

Cho một tập dữ liệu không đếm được, đã được xếp theo thứ tự tăng dần:

x1 ≤ x2 ≤ x3 ≤… ≤ xn hay xi ≤ xi+1; i=1..n (2.4

Ta chia khoảng giá trị từ x1 đến xn thành k khoảng và nhóm chúng


lại thành k nhóm theo thứ tự tăng dần:

x(1) ≤ x(2) ≤ … ≤ x(k) hay x(j) ≤ x(j+1); j = 1..k (2.5

Số lần xuất hiện các giá trị dữ liệu nằm trong nhóm thứ j nào đó, ký
hiệu là N(j), được gọi là tần suất tuyệt đối của sự kiện “X nằm trong

30
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

khoảng x(j)”. Tỷ số giữa tần suất tuyệt đối N(j) với tổng số các phần tử n
được gọi là tần suất tương đối. Đồ thị thống kê là đồ thị dạng cột có trục
hoành là các khoảng chia, trục tung là tần suất xuất hiện của giá trị nằm
trong mỗi khoảng chia. Giá trị tần suất có thể là tần suất tuyệt đối hay
tương đối.

Ví dụ 2.2. Vẽ hình dạng phân phối của tập dữ liệu trong ví dụ 2.1.

Giải. Ta chia dữ liệu đã sắp xếp theo thứ tự tăng dần thành 7 khoảng đều
nhau, đếm số lần xuất hiện của các giá trị rơi vào từng khoảng chia và điền
vào ô tương ứng như trong bảng bảng 2.1.

Bảng 2.1. Bảng tính tần suất xuất hiện ứng suất mỏi theo khoảng chia

44,75 45,25 45,75 46,25 46,75 47,25 47,75


Khoảng
chia
đến đến đến đến đến đến đến
45,25 45,75 46,25 46,75 47,25 47,75 48,25
Số lần
xuất hiện
1 2 4 6 4 2 1

Biểu diễn quan hệ giữa tần suất xuất hiện sự kiện giá trị nằm trong khoảng
chia nào đó với giá trị khoảng chia đó, ta được một đồ thị thống kê tần suất
xuất hiện giá trị ứng suất của mẫu như trên hình 2.1.

Hình 2.1. Đồ thị thống kê tần suất xuất hiện giá trị ứng suất

31
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Nhìn vào hình 2.1, dễ thấy sự phân bố tần suất xuất hiện các giá trị
đo ứng suất có dạng rất gần với hình dạng của đường cong chuông. Đường
cong chuông này biểu diễn một dạng phân phối đặc biệt có tên là phân phối
Gauss (đường nét đứt trên đồ thị). Khi khảo sát số lượng mẫu lớn hơn, ta có
thể thu được biểu đồ sát hơn hình dạng của đồ thị phân phối chuẩn.

Với các tập dữ liệu rời rạc, ta dễ dàng lập được đồ thị thống kê với
trục tung chính là tần suất xuất hiện của từng giá trị có trong tập mà không
cần chia khoảng như trên.

2.1.4.2. Mật độ phân phối (Distribution Density)

Để biểu diễn xác suất xuất hiện của một giá trị bất kỳ, ta cần biểu
diễn quan hệ tần suất – giá trị đo bằng một hàm liên tục thay vì các giá trị
rời rạc của đồ thị thống kê. Đồ thị dạng này được gọi là đồ thị hàm mật độ
phân phối. Hình 2.2 biểu diễn một hàm mật độ phân phối có giá trị trung
bình 46,48 và độ lệch chuẩn là 0,7485, bằng các giá trị tương ứng của tập
dữ liệu trong ví dụ 2.1. Nhờ đồ thị hàm mật độ phân phối này, ta có thể nói,
xác suất xuất hiện các mẫu có độ bền mỏi nằm trong khoảng từ 45 đến 45,5
là 7,12% (Xem hình 2.2).

Hình 2.2. Đồ thị mật độ phân phối giá trị ứng suất mỏi

32
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Đồ thị hàm mật độ phân phối có đặc điểm sau:

- Hai nhánh của đường cong tiệm cận với trục hoành ở vô cực;
- Diện tích phần đường cong nằm giữa hai giá trị nào đó trên trục
hoành chính là xác xuất xuất hiện giá trị của đại lượng nằm trong
khoảng đó. Ví dụ trên hình 2.2, xác xuất xuất hiện các mẫu đo có ứng
suất mỏi nằm trong khoảng 45 đến 45,5 MPa là 7,12%.
- Diện tích toàn bộ phần nằm bên dưới đường cong có giá trị bằng 1,
tương ứng xác xuất 100%.
- Nếu đường cong mật độ phân phối được biểu diễn bằng hàm f(x), thì
xác xuất xuất hiện đại lượng X có giá trị nằm trong khoảng từ a đến b
chính là phần diện tích phần bên dưới đường cong và bị chặn bới hai
giá trị a; b được tính theo công thức:

P (a < x < b | μ ;σ ) = ∫ f ( x)dx (2.6)


a

Vế trái của công thức (2.6) được đọc như sau: “Xác xuất để x lớn
hơn a và nhỏ hơn b, với điều kiện phân phối có các giá trị trung bình là μ,
độ lệch chuẩn σ sẽ bằng…”

Trước đây, việc vẽ và tính diện tích “hình thang cong” như trên khá
phức tạp. Ngày nay, với sự trợ giúp của các phần mềm thiết kế thí nghiệm,
các thao tác này được thực hiện rất dễ dàng và nhanh chóng.

2.2. Phân phối Gauss

2.2.1. Giới thiệu

Phân phối Gauss, thường được gọi là phân phối chuẩn (Normal
distribution) là dạng phân phối rất quan trọng và hay gặp trong kỹ thuật.
Các phép tính toán thống kê thường dựa trên giả thiết rằng, dữ liệu của các
đại lượng tuân theo quy luật phân phối chuẩn. Phân phối Gauss là họ phân

33
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

phối có dạng tổng quát giống nhau, được biểu diễn bởi các đường cong có
phương trình:

1 ⎛ ( x − μ )2 ⎞
f ( x) = exp⎜⎜ − ⎟⎟ (2.7)
2πσ ⎝ 2σ 2

Trong phương trình (2.7), f(x) là hàm của biến x. Khi tính giá trị của
f(x), ta cần hai tham số là giá trị trung bình μ và độ lệch chuẩn σ. Do vậy,
người ta thường ký hiệu hàm này dưới dạng f(x; μ, σ); công thức (2.7) hay
được viết dưới dạng:

1 ⎛ ( x − μ )2 ⎞
ϕ ( x ; μ ,σ ) = exp⎜⎜ − ⎟ (2.8)
2πσ ⎝ 2σ 2 ⎟⎠

Các phân phối chuẩn khác nhau chỉ sai khác về tham số vị trí (giá
trị trung bình μ) và/ hoặc tỉ lệ (phương sai σ2). Hình 2.3 trình bày ba hàm
mật độ phân phối có các giá trị trung bình và độ lệch chuẩn lần lượt là (3;
2) (0;1) và (0;2). Phân phối có giá trị trung bình μ=0 và độ lệch chuẩn σ =
1 được gọi là phân phối chuẩn hóa (Standard Distribution).

Hình 2.3. Một số hàm mật độ phân phối Gauss

34
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Như đã biết, trong thực tế ta không cần tính giá trị của ϕ tại các giá
trị x khác nhau, mà thường quan tâm đến diện tích phần giới hạn giữa trục
hoành và đường cong ϕ(x). Lúc này, đường cong phân chuẩn được gọi là
đồ thị mật độ phân phối chuẩn (Standard Distribution Density).

Nếu giá trị của một đại lượng x biến động theo quy luật phân phối
chuẩn, thì xác suất để nó nhận giá trị nằm trong khoảng từ a đến b được
tính theo công thức:

b b
1 ⎛ ( x − μ )2 ⎞
Φ (a < x < b | μ ;σ ) = ∫ f ( x)dx = ∫ exp⎜⎜ − ⎟⎟ (2.9)
a a 2πσ ⎝ 2σ 2

Trong thực tế, phạm vi các giá trị của x cần tính xác suất xảy ra là
rất lớn. Chẳng hạn, giá trị độ bền kéo của một loại thép có thể là vài trăm
MPa, nhưng giá trị của độ nhám bề mặt là chỉ tính bằng 1 vài micromet.
Việc tính xác suất theo (2.8) vừa phức tạp, vừa rất hay phải thực hiện trong
tính toán. Do vậy, người ta đã tìm cách đơn giản hóa thao tác này. Nhận
thấy x luôn xuất hiện trong mỗi tính toán cùng với các đại lượng μ và σ,
người ta sử dụng phép đổi biến:

x−μ
z= (2.10)
σ

Phân phối của z có đặc tính rất quan trọng: biên độ dao động của z
sẽ cho thấy phân phối x cách xa giá trị trung bình bao nhiêu lần của độ lệch
chuẩn. Nếu giá trị của z âm, chứng tỏ x < μ và ngược lại.

Sử dụng phép đổi biến này, hàm phân phối (2.8) sẽ có dạng:

1 ⎛ z2 ⎞
ϕ (z ) = exp⎜⎜ − ⎟⎟ (2.11)
2π ⎝ 2⎠

35
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Xác suất để x nhận giá trị a < x < b sẽ được tính:

Φ (a < x < b | μ ;σ ) = Φ ( za < z < zb ) (2.12)

a−μ b−μ
Với z a = ; zb = (2.13)
σ σ

2.2.1. Tính xác xuất bằng tay

Người ta đã tính sẵn các giá trị xác suất Φ phụ thuộc vào các giá trị
zp (giá trị Z ứng với xác suất p) và cho trong các bảng tra. Giá trị Φ ứng
với zp chính là xác suất tích lũy (Cumulative Probability) để đại lượng z
nhận giá trị nhỏ hơn zp, tức là (-∞<z<zp). Một phần của bảng tra này được
minh họa như trong bảng 2.1 dưới đây. Bảng đầy đủ được cho trong phụ
lục.

Bảng 2.1. Một phần bảng tra xác xuất Φ(-∞<z<zp)

0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
-3,00 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
-2,90 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
-2,80 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
-2,70 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026

Chẳng hạn, để biết xác suất đại lượng ngẫu nhiên z nhận giá trị nằm
trong khoảng (-∞<z<-3,01), ta tìm ô nằm trên hàng -3,00 và cột 0,01, nhận
được giá trị 0,0013. Xác suất để z nằm trong khoảng đã cho là 0,0013 hay
Φ(-∞<z<-3,01) = 0,0013.

Để tính xác suất một đại lượng x nào đó nhận các giá trị a < x < b,
trước hết, ta cần tính các giá trị za, zb theo công thức (2.13), sau đó tra bảng
để lấy các giá trị xác suất Φ(-∞<x<za) và Φ(-∞<x<zb). Cuối cùng, tính xác
xuất cần tìm theo công thức:

36
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Φ ( za < z < zb ) = Φ ( −∞ < z < zb ) − Φ ( −∞ < z < za ) (2.14)

Ví dụ 2.3. Giả thiết ứng suất mỏi dài hạn của các mẫu làm bằng thép phân
bố theo quy luật phân phối chuẩn có giá trị trung bình là 46,48 và độ lệch
chuẩn là 0,7485. Hãy tính xác suất để xuất hiện các mẫu có ứng suất mỏi
dài hạn nằm trong khoảng từ 46 đến 47 MPa?

Giải.

Ta đổi biến để chuyển về dạng phân phối chuẩn chuẩn hóa. Sử dụng
công thức (2.13), ta tính được các giá trị z ứng với các mốc tính xác suất 46
và 48 MPa lần lượt là:

a−μ 46 − 46,48
za = = ≈ -0,64
σ 0,7485
b − μ 47 − 46,48
zb = = ≈ 0,69
σ 0,7485

Tra bảng xác suất cho hàm phân phối chuẩn chuẩn hóa (được trích
như trong bảng 2.2 dưới đây), ta được Φ(-∞<z<-0,64)=0,2611 và Φ(-
∞<z<0,69)=0,7549.

Bảng 2.2. Trích một phần bảng tra xác suất Φ(-∞<z<zp) cho ví dụ 2.3

0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
-3,00 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
… … … … … … … … … … …
-0.60 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451
… … … … … … … … … … …
0.60 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549

Vậy ta có:

37
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Φ (− 0,64 < z < 0,69) = Φ ( −∞ < z < − 0,64) − Φ (−∞ < z < 0,69)
= 0,7549 − 0,2611 = 0,4938

Kết luận: xác suất để xuất hiện mẫu có giới hạn mỏi dài hạn nằm trong
khoảng 46 đến 47 MPa là 49,38%.

2.2.2. Tính xác suất trên máy tính

Ví dụ 2.4. Giải ví dụ 2.3 trên máy tính bằng Minitab?

Giải: Trong Minitab, kích chọn menu Calc > Probabilty Distribution >
Normal rồi nhập các thông số tương ứng như hình 2.4.

Hình 2.4. Hộp thoại nhập số liệu tính xác suất theo phân phối chuẩn chuẩn
hóa

Thực hiện 2 lần cho hai giá trị giới hạn, ta thu được các kết quả sau:

Cumulative Distribution Function


Normal with mean = 0 and standard deviation = 1
x P( X <= x )
0,69 0,754903

38
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Cumulative Distribution Function


Normal with mean = 0 and standard deviation = 1
x P( X <= x )
-0,64 0,261086

Ta nhận được kết quả (chính xác hơn so với tra bảng) như sau:

Φ (− 0,64 < z < 0,69) = 0,754903 − 0,261186 = 0,493817

Các lưu ý:

- Ở trên, ta chọn cách tính “Cumulative probability ” để tính xác suất,


tức là diện tích bên dưới đường cong phân phối và nằm về bên trái
giá trị X được nhập. Nếu muốn tính ra giá trị X ứng với mức xác suất
nào đó (mức α chẳng hạn), ta chọn mục “Inverse Cumulative
probability” trong hộp thoại”.
- Lựa chọn Probability Density (phía trên cùng của hộp thoại) cho
phép ta tính ra độ cao của đường cong phân phối ứng với vị trí X
hoặc giá trị xác suất mà ta nhập ở mục “Input constant”.
- Thay vì nhập một số, ta có thể yêu cầu Minitab tính xác suất theo các
phương án trên cho một loạt giá trị tùy ý. Khi này, hãy nhập các giá
trị cần tính vào 1 cột trong Worksheet; kích chọn “Input column”
trong hộp thoại và chỉ định tên cột đó. Nhập tên cột chưa kết quả vào
mục Optional storage trong hộp thoại.

Một cách khác để tính và minh họa bằng đồ thị trong Minitab được
thực hiện như sau. Kích chọn menu Graph>Probability Distribution
Plot… Trong hộp thoại Probability Distribution Plot, chọn View
Probability, sau đó chọn kiểu phân phối là Normal. Nhập giá trị trung
bình vào hộp Mean, độ lệch chuẩn vào hộp Standard deviation (Xem
hình 2.4). Chọn nhãn Shared Area, chọn X value rồi nhập các giá trị za, zb
vừa tính ở trên vào các ô tương ứng. Kết quả ta được đồ thị như trên hình

39
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

2.5. Phần diện tích hình thang cong giữa hai giá trị này (được hiển thị ngay
phía trên đồ thị được vẽ) chính là xác suất cần tính.

Hình 2.5. Cách dựng đồ thị mật độ phân phối chuẩn chuẩn hóa cho ví dụ 2.1

Một số tính chất của hàm mật độ phân phối chuẩn chuẩn hóa bao gồm:

Hàm mật độ là đối xứng qua giá trị trung bình;


Trị trung bình cũng là mode và trung vị của nó;
68,26894921371% của diện tích dưới đường cong là nằm trong độ
lệch chuẩn 1 tính từ trị trung bình;
95.44997361036% của diện tích dưới đường cong là nằm trong độ
lệch chuẩn 2;
99.73002039367% của diện tích dưới đường cong là nằm trong độ
lệch chuẩn 3;

2.3. Kiểm định giả thuyết thống kê

40
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

2.3.1. Khái niệm

Trong thực tế, ít khi ta biết được các thông tin chính xác về vị trí và
sự phân bố số liệu của tập toàn bộ đối tượng khảo sát mà chỉ dự đoán các
thông tin này dựa trên việc khảo sát tập mẫu. Một giả thuyết thống kê
(Statistical Hypothesis) là một phát biểu nhận định sơ bộ về tập toàn thể khi
nghiên cứu về sự phân bố của tập đó.

Để loại bỏ một giả thuyết, ta cần kết luận rằng nó không đúng. Tuy
nhiên, khi ta chấp nhận một giả thuyết, không có nghĩa là ta coi giả thuyết
đó là đúng, mà chỉ bởi vì ta chưa tìm được đủ chứng cứ để tin tưởng vào
điều trái lại. Vì vậy, việc kiểm định giả thuyết thường được tiến hành với
cả hai mặt của nhận định: khía cạnh nghi ngờ được phát biểu dưới dạng giả
thuyết đảo (Null Hypothesis), còn khía cạnh ta tin tưởng được phát biểu
dưới dạng giả thuyết chính (Alternative Hypothesis).

Giả thuyết thống kê thường đi theo cặp bao gồm: một giả thuyết
đảo, còn gọi là giả thuyết không, ký hiệu là H0 và một giả thuyết chính
(Alternative hypothesis), ký hiệu là H1.

Giả thuyết đảo thường là một phát biểu giả định về cái mà ta không
tin tưởng lắm. Ta có thể nghi ngờ rằng giả thuyết đảo liệu có đúng không,
do đó ta tiến hành kiểm chứng nó. Trái lại, giả thuyết chính lại là giả thuyết
mà ta thường thực sự tin là đúng. Phép kiểm định thống kê cho các số liệu
thí nghiệm được thực hiện nhằm đảm bảo rằng xác suất ta loại bỏ (nhầm)
một giả thuyết đảo ngay cả khi nó đúng là rất nhỏ. Xác suất này thường
được gọi là mức ý nghĩa (Significant level) của kiểm định.

Ví dụ, giả sử sau khi đo kích thước một số lượng mẫu được chọn
bất kỳ trong một loạt sản phẩm mới được chế tạo, nhà phân tích nghi ngờ
rằng, liệu đường kính trung bình của tất cả các sản phẩm trong loạt đó, bao
gồm cả những sản phẩm không được đo, bằng 100 mm. Giả thuyết đảo

41
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

được phát biểu rằng: “đường kính trung bình của các trục là 100 mm”. Khi
đó, có thể diễn đạt một cách đơn giản hơn dưới dạng công thức:

H 0 : μ = 100;
H1 : μ ≠ 100

Việc kiểm định giả thuyết H0 được thực hiện bằng phân tích thống
kê. Kết quả của phép kiểm định này là kết luận “Loại bỏ H0 là sai lầm”
hoặc “Có thể loại bỏ H0”. Nếu loại bỏ H0, ta có thể đi đến chấp nhận giả
thuyết chính. Còn kết luận “Loại bỏ H0 là sai lầm” mang ý nghĩa là ta
“không có đủ chứng cứ thuyết phục để loại bỏ H0”.

2.3.2. Giá trị giới hạn

Phát triển tiếp ví dụ đã nêu ở trên về việc kiểm định giả thuyết
“đường kính trung bình của các trục là 100 mm”. Giả sử nhà phân tích lấy
một vài tập mẫu trục ngẫu nhiên bất kỳ, mỗi tập mẫu có số lượng là 25 mẫu
và đo đường kính các mẫu này. Anh ta cho rằng nếu trung bình cộng các
kích thước trong mỗi tập mẫu mà có giá trị nằm trong khoảng 99,98 đến
100,02 mm thì có thể coi như chấp nhận được giả thuyết trên. Các giá trị
99,98 và 100,02 được gọi là các giá trị giới hạn (Critical values). Câu hỏi
đặt ra là kết luận như thế có độ tin cậy là bao nhiêu?

Giả sử rằng tập toàn bộ các kích thước trục thực sự có đường kính
trung bình là 100, đồng thời các giá trị đường kính phân tán theo quy luật
phân phối chuẩn với độ lệch chuẩn σ=0,05. Lý thuyết giới hạn trung tâm
(Central Limit Theorem) phát biểu rằng, giá trị trung bình của các tập mẫu
cũng tuân theo phân phối chuẩn; phân phối này có trung bình cũng bằng
100 và có độ lệch chuẩn bằng 0,05 / 25 = 0,01 . Đặt các giá trị giới hạn
(99,98 và 100,02) lên đồ thị phân phối của giá trị trung bình các tập mẫu và
cho hiển thị xác suất tích lũy các phần giới hạn, ta được hình ảnh minh họa
như trên hình 2.6.

42
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Hình 2.6. Minh họa các vùng chấp nhận và loại bỏ H0

Trên hình 2.6, nếu trung bình của các tập mẫu rơi vào vùng nằm từ
99,98 đến 100,02 mm, ta không loại bỏ được H0. Do vậy, vùng này được
gọi là vùng “Loại bỏ H0 là sai lầm”, ta ghi chú là “Không loại H0” . Diện
tích vùng này chính là xác suất mà ta không loại bỏ H0 là đúng. Trái lại,
vùng còn lại là vùng chứa xác suất mà ta loại bỏ H0 là kết luận sai. Tổng
diện tích hai phần đuôi này là 2x0,0228 = 0,0456 hay 4,56%. Vùng này
được gọi là “vùng giới hạn” (Critical region). Việc loại bỏ giả thuyết H0 khi
nó đúng (tức là làm một việc sai lầm) được gọi là “sai lầm loại I”. Nghĩa là,
ở đây ta có xác suất 4,56% khả năng mắc sai lầm loại I. Giá trị 4,56% này
được gọi là mức ý nghĩa của kiểm định (Significant level of the test) và
được ký hiệu là α. Giá trị của α được quyết định khi ta ấn định mức tới hạn
(99,98 và 100,02) để chấp nhận hay loại bỏ giả thuyết H0.

Loại sai lầm thứ hai (Sai lầm loại II) là sai lầm nếu đưa ra kết luận
không loại bỏ H0 khi mà nó sai thực sự. Trong ví dụ này, nếu đường kính
trung bình các mẫu nằm ngoài khoảng 99,98 đến 100,02 mà ta lại chấp
nhận H0 thì ta mắc sai lầm loại II.

43
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

2.3.3. Giả thuyết một phía và hai phía

Trong bài toán vừa xét ở trên, vùng giới hạn để kiểm định giả
thuyết được chia thành hai phần có diện tích như nhau, phân bố về hai phía
đuôi của đường cong phân phối. Loại giả thuyết H0 mà cho phép ta có thể
loại bỏ nó bởi các giá trị giới hạn nằm ở cả 2 phía như vậy được gọi là giả
thuyết 2 phía (Two-sided hypothesis). Một loại giả thuyết khác mà vùng
giới hạn chỉ nằm về một phía của đường cong phân phối, được gọi là giả
thuyết một phía (One-sided hypothesis). Dễ thấy sẽ có giả thuyết 1 phía
phải và giả thuyết một phía bên trái, tùy thuộc cách phát biểu giả thuyết
chính.

Ví dụ, xét bài toán trên, có thể nhà kiểm định cho rằng: “nếu các
mẫu có đường kính trung bình lớn hơn 100,02 mm thì coi như đường kính
trung bình cả loạt trục có đường kính lớn hơn 100 mm”. Khi này, giả
thuyết cần kiểm định có dạng sau:

H 0 : μ = 100;
H1 : μ > 100.

Hình 2.7. Minh họa vùng giới hạn giả thuyết 1 phía – bên phải

44
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Giả thuyết này thuộc loại giả thuyết một phía và có vùng giới hạn
nằm về phía phải của đường cong phân phối. Hình 2.7 minh họa điều này.

Tương tự, nếu giả thuyết cần kiểm định có dạng sau:

H 0 : μ = a;
H1 : μ < a.

Trong đó, a là một giá trị giới hạn, thì giả thuyết này thuộc loại giả
thuyết một phía và có vùng giới hạn nằm về phía trái của đường cong phân
phối.

Sau khi kiểm định, nếu không loại bỏ được H0, có nghĩa là ta không
có cơ hội chấp nhận giả thuyết chính H1. Khi này, nên phát biểu lại giả
thuyết chính để kiểm tra điều kiện nào có thể chấp nhận được. Nói cách
khác, ta luôn cố gắng loại bỏ H0 để có cơ hội chấp nhận được giả thuyết
chính.

2.3.4. Mức ý nghĩa và giá trị p

Trong thống kê, mức ý nghĩa (α-level) là cấp độ mạo hiểm lớn
nhất có thể chấp nhận được để loại bỏ một giả thuyết đảo khi nó đúng. Nói
cách khác, đó là xác suất xảy ra sai lầm loại I. Giá trị của α nằm trong
khoảng từ 0 đến 1. Khi kiểm định giả thuyết thống kê, ta cần chọn trước giá
trị α. Giá trị α thường được chọn bằng 0,05. Giá trị α càng nhỏ thì xác suất
ta mắc sai lầm khi loại bỏ một giả thuyết đảo càng thấp. Nói cách khác, khi
kiểm định giả thuyết với α càng nhỏ, ta càng yên tâm rằng ta có cơ sở loại
bỏ hay chấp nhận giả thuyết đảo. Tuy nhiên, α càng nhỏ có nghĩa là ta càng
khó có cơ hội chấp nhận các sản phẩm “khá tốt”. Ví dụ, khi xem xét quyết
định có đầu tư mua một loại máy mới hay không, nếu đặt α=0,001 chẳng
hạn, ta chỉ có 0,1% cơ hội chấp nhận là nó tốt hơn máy hiện tại.

45
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Khoảng tin cậy để chấp nhận giả thuyết đảo được tính bằng 1-α.
Chẳng hạn, với mức α=0,05, ta có thể nói, ta có 95% tin cậy để chấp nhận
hoặc loại bỏ giả thuyết đảo. Khoảng tin cậy thường được ký hiệu trong các
phần mềm thống kê là CI (Viết tắt của Confidence Interval).

Giá trị xác suất p, thường được gọi tắt là giá trị p (p-value) được
sử dụng rất thường xuyên trong kiểm định thống kê và phân tích số liệu
thực nghiệm. Giá trị p có được qua các tính toán thống kê. Giá trị p tính ra
càng nhỏ thì xác suất mắc sai lầm khi loại bỏ giả thuyết đảo càng ít. Người
ta thường so sánh giá trị p với mức ý nghĩa α. Nếu giá trị p nhỏ hơn mức α
đã chọn, ta loại bỏ giả thuyết đảo.

Các ví dụ dưới đây sẽ minh họa việc sử dụng mức α và giá trị p
trong kiểm định giả thuyết thống kê.

2.4. Suy diễn thống kê từ một tập mẫu

2.4.1. Suy diễn giá trị trung bình khi biết phương sai

Trong nhiều trường hợp, ta chỉ biết giá trị trung bình của tập mẫu
được chọn ngẫu nhiên từ tập toàn bộ. Bài toán đặt ra ở đây là ta cần suy ra
giá trị trung bình của tập toàn bộ nếu đã biết phương sai của tập toàn bộ.
Bài toán khi chưa biết phương sai của tập toàn bộ sẽ được trình bày ở phần
sau.

Lời giải bài toán dựa trên giả thiết dữ liệu tuân theo phân phối
chuẩn. Gọi X là giá trị trung bình của tập mẫu được chọn. Lý thuyết giới
hạn trung tâm đã phát biểu rằng các giá trị trung bình của các tập mẫu cũng
tuân theo phân phối chuẩn; phân phối này có trung bình là trung bình của
tập toàn bộ và có phương sai bằng phương sai của tập toàn bộ chia cho căn
bậc hai của số lượng các tập mẫu. Ta có thể tìm lời giải cho bài toán này
bằng một trong ba cách sau đây.

46
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Cách 1. Sử dụng tính toán theo giá trị chuẩn hóa z, tính bằng tay:

1. Phát biểu giả thuyết thống kê;


2. Lựa chọn mức ý nghĩa α; tính hoặc tra bảng xác suất để tìm ra
giá trị giới hạn hai phía;
3. Kiểm tra xem giá trị trung bình đã chuẩn hóa (đổi biến) của tập
mẫu rơi vào vùng chấp nhận hay loại bỏ giả thuyết đảo;
4. Kết luận

Cách 2. Sử dụng tính toán bằng tay, so sánh giá trị p với mức α:

1. Phát biểu giả thuyết thống kê;


2. Lựa chọn mức ý nghĩa α; Tính hoặc tra bảng xác suất để tính
xác suất cho giá trị trung bình; đó chính là giá trị p.
3. So sánh p với α;
4. Kết luận

Cách 3. Sử dụng máy tính

Ví dụ 2.5. Khi kiểm tra kích thước 16 mẫu được chọn ngẫu nhiên trong
loạt chi tiết gia công, tính được giá trị kích thước trung bình của các mẫu là
100,02 mm. Biết rằng các kích thước tuân theo phân phối chuẩn, có độ lệch
chuẩn bằng 0,04. Kiểm tra xem giá trị trung bình của các kích thước của cả
loạt có bằng 100 mm hay không?

Giải.

Cách 1.

Bước 1. Ta phát biểu giả thuyết thống kê như sau:

H 0 : μ = 100;
H1 : μ ≠ 100.

47
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Bước 2. Chọn mức ý nghĩa α=0,05. Vì kiểm tra hai phía, ta tra bảng tìm giá
trị giới hạn ứng với mức α/2 = 0,025. Lưu ý ở phía bên phải, cần tra cho
mức 1-α, tức là 0,975 (Xem minh họa trong bảng dưới đây).

0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
-2.00 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183
-1.90 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233
… … … … … … … … … … …
1.90 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.00 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817

Ta được các giá trị giới hạn z1 = -1,96 và z2 = 1,96.

Bước 3. Đổi biến theo công thức (2.10) cho giá trị trung bình của tập mẫu,
ta có:

X −μ X − μ 100,02 − 100 0,02


z0 = = = = =2
σ tb σ/ n 0,04 / 16 0,01

Trong đó, σtb là độ lệch chuẩn của phân phối các giá trị trung bình. Nhận
thấy giá trị này nằm ngoài khoảng giới hạn (-1,96 đến 1,96), do vậy, ta loại
bỏ giả thuyết đảo.

Bước 4. Kết luận: Với độ tin cậy 95%, có thể khẳng định rằng kích thước
trung bình của loạt chi tiết không bằng 100 mm.

Cách 2.
Bước 1. Như cách 1;
Bước 2. Chọn mức α=0,05; Tra bảng xác xuất, ta được P(-∞<z<2) =
0,9772; do vậy, P(2<=z) = 1-0,9772 = 0,0228. Vì đang kiểm định giả
thuyết hai phía, ta có giá trị p=2x0,0228=0,0456.
Bước 3. So sánh với mức α đã chọn, ta thấy (p=0,0456) < (α=0,05).

48
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Bước 4. Kết luận giống như cách 1.


Cách 3. Sử dụng phần mềm Minitab.
Bước 1. Kích chọn menu Stat>Basic statistic>1-sample Z; Điền các thông
số đã cho vào hộp thoại như hình 2.8. Kích nút Option của hộp thoại và đặt
mức tin cậy (Confidence Level ) là 0,95. Chọn kiểu giả thuyết chính trong
danh sách “Alternative” là “not equal”.

Hình 2.8. Nhập thông số tính cho hộp thoại kiểm định Z

Minitab liệt kê lại các thông số ta đã nhập, đồng thời cho ta biết giá
trị của p (đã làm tròn) là 0,046 (Xem hình minh họa dưới đây).

Bước 2. Đánh giá kết quả. Trên cửa sổ Session Window của Minitab (xem
hình minh họa), thông báo giá trị p bằng 0,046, nhỏ hơn mức ý nghĩa α đã
chọn là 0,05.
Bước 3. Kết luận giống như 2 cách trên.

49
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Ghi chú: Bạn đọc có thể thử nhanh bằng Minitab các giá trị trung bình của
mẫu khác nhau để hiểu rõ quan hệ giữa giá trị p và việc chấp nhận giả
thuyết đảo. Chẳng hạn, nếu kích thước trung bình của 16 mẫu là 100,01 ta
có thể chấp nhận giả thuyết ‘đường kính trung bình của loạt chi tiết là 100
mm”, với độ tin cậy 95% và p = 0,317 như minh họa dưới đây:

2.4.2. Suy diễn giá trị trung bình khi chưa biết phương sai

2.4.2.1. Phân phối t student (Student-t distribution)

Phân phối t student, từ đây gọi tắt là phân phối t, có dạng hình
chuông tương tự phân phối chuẩn, nhưng có phần đuôi hai bên rộng hơn.
Hình 2.8 so sánh hình dạng của hai loại phân phối này.

Hình 2.8. Phân phối t có bậc tự do bằng 4 và phân phối chuẩn chuẩn hóa

50
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Điểm đặc biệt của phân phối t là nó được định nghĩa bởi số bậc tự
do. Số bậc tự do là giá trị được tính theo số lượng mẫu được chọn trong tập
toàn bộ. Bậc tự do bằng số mẫu trừ đi 1. Khi số mẫu tăng lên thì phần đuôi
của phân phối t càng mỏng đi và càng tiến gần đến phân phối chuẩn. Phân
phối t được sử dụng trong suy diễn giá trị trung bình của tập toàn bộ khi
không biết phương sai. Ngoài ra, phân phối t cũng được dùng để đánh giá ý
nghĩa của các hệ số hồi quy.

Đồ thị hàm phân phối t được biểu diễn qua công thức sau:

X − μ0
t= (2.15)
s/ n

2.4.2.2. Trình tự suy diễn

Cách tính toán bằng tay có thể được thực hiện theo trình tự như dưới đây:

1. Phát biểu giả thuyết thống kê;


2. Chọn mức ý nghĩa α;
3. Tính giá trị t theo giả thuyết;
4. Tính giá trị t giới hạn theo mức α;
5. So sánh t tính toán với t giới hạn;
6. Kết luận

Để tính bằng tay theo cách so sánh giá trị p với mức ý nghĩa α, việc
tính p là khó khăn do các giá trị trong bảng tra là rời rạc và khá xa nhau.
Tuy vậy, nếu sử dụng các phần mềm thống kê thì việc tính p lại có thể
được thực hiện rất dễ dàng. Ngoài ra, sử dụng phần mềm còn hỗ trợ ta xử
lý các dữ liệu có số phần tử rất lớn.

51
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

2.4.2.3. Ví dụ minh họa

Ví dụ 2.6. Một tập mẫu gồm 25 mẫu được lấy ngẫu nhiên từ một loạt chi
tiết. Giá trị trung bình của độ bền các mẫu này là 498 MPa. Biết rằng các
giá trị độ bền của mẫu tuân theo phân phối chuẩn và có độ lệch chuẩn là 5.
Với độ tin cậy 90%, kiểm định xem liệu giá trị độ bền trung bình của toàn
bộ các chi tiết trong loạt có nhỏ hơn giá trị ứng suất cho phép là 500 MPa
không?

Giải

Cách 1. Thực hiện tính, tra bảng bằng tay.


Bước 1. Phát biểu giả thuyết thống kê dưới dạng sau:
H 0 : μ = 500;
H1 : μ < 500.

Lưu ý rằng, giả thuyết này cho thấy đây là loại giả thuyết một phía. Vùng
giới hạn nằm ở phía trái đồ thị phân phối.
Bước 2. Xác định mức ý nghĩa α. Với độ tin cậy 90%, mức ý nghĩa α=1-
0,90=0,1.
Bước 3. Tính giá trị t theo giả thuyết. Thay số liệu đã cho vào công thức
(2.15) ta có:

X − μ0 498 − 500
t= = = −2
s/ n 5 / 25

Bước 4. Tính các giá trị t giới hạn theo mức ý nghĩa α. Để tra bảng xác suất
của phân phối t, ta lưu ý rằng tập mẫu có 25 mẫu, do vậy số bậc tự do sẽ là
25-1=24. Tra bảng ứng với hàng 24 và cột 0,1; ta được giá trị xác suất t0,1;
24 = 1,318 (Xem minh họa qua bảng 2.4).

52
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Bước 5. So sánh giá trị t theo tính toán với giá trị t giới hạn. Lưu ý rằng giả
thuyết là một phía, vùng giới hạn nằm bên trái đồ thị phân phối, do vậy giá
trị t giới hạn cần lấy là: t0 = - t0,05; 24 = -1,318. Dễ thấy (t=-5) < (t0 = -1,318).

Bảng 2.4. Trích bảng phân phối Student-t

0,001 0,0025 0,005 0,01 0,025 0,05 0,10


1 318,289 127,321 63,656 31,821 12,706 6,314 3,078
… … … … … … … …
24 3,467 3,091 2,797 2,492 2,064 1,711 1,318
25 3,450 3,078 2,787 2,485 2,060 1,708 1,316

Bước 6. Kết luận: Vì t nhỏ hơn t giới hạn, ta loại bỏ giả thuyết đảo. Tức là
với độ tin cậy 90%, có thể kết luận rằng các chi tiết trong cả loạt có ứng
suất trung bình nhỏ hơn 500 MPa.

Ghi chú. Bạn đọc có thể nhận xét rằng, theo bảng phân phối t, ứng với 24
bậc tự do, nếu chọn mức ý nghĩa α=0,025 (tức là mức tin cậy tới 97,5%) thì
có thể kết luận là ứng suất trung bình của loạt chi tiết sẽ không nhỏ hơn
500 MPa.

Cách 2. Tính và so sánh giá trị p với mức α bằng máy tính.

Trong Minitab, kích menu Stat>Basic Statistic>1-Sample t …


Nhập các thông số vào hộp thoại như hình 2.9a. Kế đó, kích nút Option để
lựa chọn cấp độ tin cậy và kiểu giả thuyết chính. Lưu ý ở đây ta chọn kiểu
“less than”, nghĩa là “nhỏ hơn”.

Kết quả được kết xuất trên cửa sổ Session như minh họa trên hình 2.10.
Nhận thấy giá trị (p=0,028) < (α=0,1) nên ta loại bỏ giả thuyết đảo.

53
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

(a) (b)
Hình 2.9. Kiểm định t: (a) Nhập thông số tính và (b)các tùy chọn để nhập cấp độ
tin cậy (Confidence level) và chọn kiểu giả thuyết chính (Alternative)

Hình 2.10. Kết quả tính bằng Minitab cho ví dụ 2.6

Ghi chú: các dữ liệu đo được có thể nhập thẳng vào một cột của bảng dữ
liệu trong Minitab. Khi này ta không cần tính trước các dữ liệu về số lượng
mẫu, giá trị trung bình và độ lệch chuẩn của tập mẫu nữa. Thay vì nhập các
dữ liệu này vào mục Summarized data (Xem hình 2.10a), ta chỉ cần chọn
mục Samples in columns và chỉ ra địa chỉ các cột chứa giá trị thực của các
mẫu mà thôi. Ví dụ dưới đây minh họa điều này.

Ví dụ 2.7. Chọn ngẫu nhiên 15 mẫu trong loạt chi tiết và đo độ dày của các
mẫu này (đơn vị là mm), thu được các số liệu sau:

5,01 4,93 4,95 4,85 5,07 4,7 5,06 5,07


4,68 4,95 5,06 4,98 4,80 4,99 5,05 4,92

Hãy kiểm tra xem có khả năng độ dày trung bình của cả loạt chi tiết có
vượt quá 5 mm không? Lấy độ tin cậy quyết định là 95%.

54
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Giải: Nhập các số liệu đã cho vào một cột của Minitab rồi kích menu
Stat>Basic Statistic>1-Sample t để thực hiện kiểm định t.

Hình 2.11. Tính toán bằng Minitab cho ví dụ 2.7

Kích chuột vào hộp trống trong mục Samples in columns , kích kép tên cột
chứa dữ liệu trong danh sách phía bên trái (Xem minh họa trên hình 2.11).
Kích nút Option để đặt các chức năng về độ tin cậy và kiểu giả thuyết.

Kết quả thu được như trên hình 2.12.

Hình 2.12. Kết quả kiểm định giả thuyết đảo μ=5 và giả thuyết chính μ>5

Trên hình 2.12, nhận xét thấy p=0,958, lớn hơn mức α=0,05. Do vậy có thể
không loại bỏ được giả thuyết đảo (μ=5). Nói cách khác, giả thuyết chính
μ>5 không được chấp nhận. Tức là không có khả năng độ dày trung bình
của các chi tiết lớn hơn 5 mm.

55
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Để kiểm định chắc chắn liệu độ dày trung bình có nhỏ hơn 5 không, ta phát
biểu lại giả thuyết chính với μ<5 và lặp lại quá trình kiểm định. Minitab
cho ta thấy lúc này p=0,042 (hình 2.13). Khi này có thể loại bỏ giả thuyết
đảo μ=5. Do đó, ta có thể chấp nhận giả thuyết chính μ<5. Tức là có thể kết
luận: với 95% tin cậy, độ dày trung bình của các chi tiết nhỏ hơn 5 mm.

Hình 2.13. Kết quả kiểm định giả thuyết đảo μ=5 và giả thuyết chính μ <5

2.4.3. Suy diễn phương sai của tập toàn bộ

2
2.4.3.1. Phân phối (Chi-square Distribution)

Hình dạng của phân phối χ2 phụ thuộc vào số bậc tự do (Degree of
freedom, viết tắt là df), tức là số lượng dữ liệu của tập mẫu trừ đi 1. Phân
phối này thường lệch trái và dương, nhưng độ lệch càng giảm khi số mẫu
càng tăng. Khi bậc tự do df lớn hơn 30, phân phối χ2 trở nên cân đối gần
với phân phối chuẩn. Hình 2.14 minh họa các nhận xét này.

(a)
(b)
Hình 2.14. Các đồ thị phân phối: (a) phân phối chuẩn và χ2
(b) phân phối χ2 với bậc tự do bằng 10 và 30

56
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Cho một tập mẫu gồm n phần tử, có phương sai tập mẫu là s 2; tập
mẫu này được lấy ngẫu nhiên từ tập toàn bộ có phương sai là σ2; thì phân
phối χ2 được tính theo công thức sau:

(n − 1) s 2
χ = 2
(2.16)
σ2

Công thức này được dùng để suy luận giá trị phương sai σ2 của tập
toàn bộ như dưới đây.

2
2.4.3.2. Trình tự suy diễn

Cách tính toán bằng tay được tiến hành theo trình tự sau:

1. Phát biểu giả thuyết thống kê:

H 0 : σ 2 = a;
(2.17)
H1 : σ 2 ≠ a

Có thể phát biểu giả thuyết chính dưới dạng H1 : σ 2 > a hoặc
H1 : σ 2 < a . Trong đó, a là giá trị phương sai dự đoán cho tập toàn bộ.

2. Chọn mức ý nghĩa α, từ đó tra bảng phân phối xác suất χ2 để xác
định giá trị giới hạn χ2 ứng với xác suất α.
3. Tính giá trị χ2 theo các thông số đã cho và giá trị phương sai dự
đoán theo giả thuyết.
4. So sánh χ2 tính được với giá trị giới hạn và kết luận. Nếu χ2 tính
được nhỏ hơn giới hạn thì kết luận không loại bỏ được giả thuyết
H0.

57
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

2.4.3.3. Ví dụ minh họa

Ví dụ 2.8. Cho một tập dữ liệu về độ nhám bề mặt của 25 mẫu lấy ngẫu
nhiên trong một loạt sản phẩm. Phương sai phân phối của tập này là 2. Với
độ tin cậy 95%, xác định xem phương sai của tập toàn bộ có lớn hơn 1
không?

Cách 1. Giải bằng tay

Ta tiến hành theo trình tự đã nêu ở phần trên theo các bước sau.

Bước 1. Phát biểu giả thuyết. Ký hiệu phương sai của tập toàn bộ là σ2, ta
có:

H 0 : σ 2 = 1;
H1 : σ 2 > 1.

Đây là giả thuyết 1 phía. Vùng giới hạn sẽ nằm ở phía phải của đồ thị phân
phối.

Bước 2. Xác định mức ý nghĩa α. Với độ tin cậy 95%, ta có α=1-
0,95=0,05. Với số lượng mẫu n=25, ta có số bậc tự do df=n-1=25-1=24. Vì
vùng giới hạn nằm phía phải đồ thị phân phối, ta tra bảng xác suất χ2 ứng
với 1-α=0,95 và df=24 (Xem bảng 2.5), ta được giá trị giới hạn của χ2:

χ12−α ,df = χ 02,95;19 = 36,42

Bảng 2.5. Trích bảng “Giá trị χ2 thỏa mãn P(0<χ2<α)”.


p
υ 0,005 0,01 0,025 0,05 0,1 0,9 0,95 0,975 0,99 0,995
… … … … … … … … … … …
23 9,26 10,20 11,69 13,09 14,85 32,01 35,17 38,08 41,64 44,18
24 9,89 10,86 12,40 13,85 15,66 33,20 36,42 39,36 42,98 45,56
25 10,52 11,52 13,12 14,61 16,47 34,38 37,65 40,65 44,31 46,93

58
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Bước 3. Tính giá trị χ2 ứng với giả thuyết đã phát biểu. Thay các số liệu đã
biết vào công thức (2.16) ta được:

(n − 1)s 2 ( 25 − 1).2
χ =
2
= = 48
σ 2
1

Bước 4. So sánh ta thấy (χ 2 = 48) > ( χα2 ,df = 36,42) , nghĩa là với 95% tin
cậy, ta có thể loại bỏ giả thuyết H0. Nói cách khác, phương sai của tập toàn
bộ lớn hơn 1 (chấp nhận giả thuyết H1). Hình 2.15 minh họa vùng giới hạn
trên đồ thị phân phối χ2.

Hình 2.15. Vị trí χ2 bằng 48 nằm trong vùng loại bỏ H0

Trên hình vẽ, ta thấy giá trị χ2 tính theo giả thuyết của ta (bằng 48) nằm
trong vùng loại bỏ H0. Vùng này được tô xám, nằm về phía đuôi bên phải
đồ thị χ2 tính từ giá trị giới hạn là 36,42. Giá trị này được xác định tùy
thuộc cấp độ tin cậy.

Cách 2. Giải bằng máy tính

59
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Kích menu Stat > Basic Statistics > 1 Variance và nhập các thông tin cho
hộp thoại như trên hình 2.16. Chọn Summarized data, nhập Sample size
bằng 25; Sample variance bằng 2. Kiểm vào hộp Hypothesis test và nhập
Hypothesis variance bằng 1. Kích nút Option, nhập độ tin cậy là 0,95 vào
hộp Confedence level; chọn kiểu giả thuyết đảo là Greater than. Kích nút
OK của các hộp thoại. Ta được kết quả như minh họa bên phải hình 2.16.

Hình 2.16. Nhập liệu và kết quả tính trong Minitab cho ví dụ 2.8

Quan sát kết quả trên hình 2.16, nhận thấy giá trị χ2 (Chi_Square)
được thông báo là 48; giá trị p bằng 0,03 – nhỏ hơn mức ý nghĩa α (bằng
0,05). Vì giá trị p nhỏ hơn mức ý nghĩa α, ta loại bỏ giả thuyết đảo và chấp
nhận giả thuyết chính. Nói cách khác, với số liệu đã cho, phương sai của
tập toàn bộ sẽ lớn hơn 1.

2.5. Hồi quy bậc nhất

Một trong những mục đích quan trọng của nghiên cứu thực nghiệm
là dự đoán hàm mục tiêu khi các thông số đầu vào khác với các giá trị đã
thử nghiệm. Mục đích này đạt được nhờ xây dựng các phương trình toán
học mô tả quan hệ giữa hàm mục tiêu với các thông số đầu vào. Các
phương trình này được gọi là mô hình hồi quy (regression model). Ở mức
cơ bản nhất, ta nhắc lại một số kiến thức căn bản về hồi quy bậc nhất.

60
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Phương trình hồi quy bậc nhất có dạng một hàm bậc nhất, một biến. Các
vấn đề liên quan đến hồi quy nhiều biến và hồi quy bậc cao được trình bày
trong các chương liên quan tiếp sau.

2.5.1. Xác định hệ số hồi quy

Đặt vấn đề: Giả sử ta tiến hành n thí nghiệm để khảo sát sự phụ thuộc của
một đại lượng y vào một biến x. Ta thu được n cặp số liệu (xi;yi). Ta muốn
biểu diễn quan hệ y phụ thuộc x dưới dạng một hàm bậc nhất có dạng:

yˆ = b0 + b1 x (2.18)

Rất không may là trong hầu hết các tình huống, ta chỉ có thể tìm được hàm
ŷ biểu diễn quan hệ gần đúng nhất với tập dữ liệu thí nghiệm mà thôi
(Xem minh họa trên hình 2.17).

Hình 2.17. Đồ thị hồi quy và các điểm thí nghiệm thực

Ứng với vị trí xi nào đó, giá trị tính ra của ŷi theo (2.16) không bằng giá trị
yi ta thu được qua thí nghiệm mà sai khác một lượng:

ε i = yˆ i − y i = yˆ − ( b0 + b1 x i ) (2.19)

61
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Mong muốn của ta là làm sao tìm được ŷ sao cho từng ε i là nhỏ nhất. Tuy
nhiên cho đến nay, cách tốt nhất được biết đến là phương pháp sai số bình
phương tối thiểu (Least Squared Error Method) nhằm thỏa mãn điều kiện:

n n
SSε = ∑ ε = ∑ ( yˆ i − yi ) 2 = min
i
2
(2.20)
i =1 i =1

Ký hiệu SS là viết tắt của thuật ngữ Sum of Squares (tổng các bình
phương). Để thuận tiện cho việc khai thác các phần mềm thống kê và thiết
kế thí nghiệm với giao diện và ký hiệu quốc tế, các ký hiệu trong nhiều
công thức được giữ nguyên các chỉ số gốc bằng tiếng Anh như trên.

Phương pháp này có thể tóm tắt như sau:

- Tính trung bình của các giá trị xi và yi, thu được x và y ;
- Tính các số dư mô hình (Model residuals) theo các công thức
sau:

n
SSx = ∑ ( xi − x ) 2 (2.21)
i =1

n
SS y = ∑ ( xi − x ) 2 (2.22)
i =1

n
SSxy = ∑ ( xi − x )( yi − y ) (2.23)
i =1

- Tính các giá trị b0 và bi theo các công thức:

SS xy
b1 = (2.24)
SS x

62
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

b0 = y − b1 x (2.25)

Ví dụ 2.9

Cho tập dữ liệu thí nghiệm như bảng dưới đây. Hãy tìm phương trình hồi
quy theo phương pháp bình phương bé nhất.

STT x y
1 1 3
2 2 7
3 6 14
4 8 18
5 8 23

Giải

- Tính các giá trị trung bình của x và y:

x = (1+ 2 + 6 + 8 + 8) / 5 = 5

y = (3+ 7 + 14 + 18 + 23) / 5 = 13

- Tính các giá trị SS theo các công thức (2.21)-(2.23):

SS x = (1− 5)2 + ( 2− 5)2 + (6 − 5)2 + (8 − 5)2 + (8 − 5)2 = 44

SS y = (3− 13)2 + (7 − 13)2 + (14 − 13)2 + (18 − 13)2 + (23 − 13) 2 = 262

SS xy = (1− 5)(3− 13)+ ( 2 − 5)( 7 − 13) + (6 − 5)(14 − 13) +


+ (8 − 5)(18 − 13) + (8 − 5)( 23 − 13) = 104

Cuối cùng có:

63
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

SS xy 104
b1 = = = 2,36 ; b0 = y − b1 x = 13− 2,36.5 = 1.18
SS x 44

Vậy phương trình hồi quy là: y = 1,18 + 2,36 x

2.5.2. Đánh giá sai số hồi quy

Để đánh giá mức độ chính xác của mô hình hồi quy tìm được so với các giá
trị thí nghiệm, người ta sử dụng hệ số đánh giá quyết định (Coefficient of
determination) theo công thức:

2
SS xy2
r = (2.26)
SS x SS y

Giá trị r = r 2 được gọi là hệ số tương quan (Correlation coefficient).

Giá trị r2 thường nằm trong khoảng 0< r2<1. Nếu giá trị r2 nhỏ, chứng tỏ
các số liệu thí nghiệm tìm được hoặc chưa đủ để có được mô hình hồi quy
đúng đắn, hoặc còn quá nhiều sai số thu thập dữ liệu. Giá trị r2 lớn chứng tỏ
các dữ liệu thu được đã khá tốt để dựng được mô hình hồi quy có ít sai lệch
so với thực nghiệm. Thông thường, r2 lớn hơn 0,9 được coi là tốt. Tuy
nhiên lưu ý rằng giá trị r2 cao không hẳn là mô hình đã có dạng mô tả (bậc
nhất hay bậc hai, lô-ga…) là phù hợp tốt với dữ liệu thí nghiệm. Để đánh
giá mức độ phù hợp của dạng mô hình với dữ liệu, ta cần thực hiện phép
kiểm định có tên là “kiểm định mức độ không phù hợp của mô hình”
(Lack-of-fit test), sẽ được giới thiệu sau.

Trong các bài toán hồi quy nhiều biến bậc cao, giá trị r2 tính được
khá cao và không phản ánh đúng độ tin cậy khi xem xét mô hình hồi quy.
Người ta đã điều chỉnh lại cách tính hệ số này và đặt tên mới cho nó là hệ
số đánh giá quyết định được điều chỉnh (Adjusted). Hệ số này được tính
theo công thức sau:

64
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

2 df Σ SSε
radj = 1− (2.27)
dfε SS y

Trong đó, số bậc tự do tổng được tính là dfΣ = (n-1); số bậc tự do các sai số
được tính là dfε = (n-2).

Hệ số được điều chỉnh này luôn nhỏ hơn và do vậy, an toàn hơn khi
đánh giá mô hình hồi quy.

Để đánh giá mức có ý nghĩa của các hệ số hồi quy, thường dựa vào
giá trị p. Giả thuyết đảo khi phân tích hồi quy là hệ số hồi quy nào đó bằng
không. Khi đánh giá một hệ số hồi quy nào đó có nên hay không nên có
mặt trong phương trình hồi quy, nếu giá trị p nhỏ hơn mức ý nghĩa α, ta có
thể tin tưởng rằng xác suất để hệ số hồi quy đó có mặt là lớn. Khi p>α, ta
có thể loại bỏ hệ số đó, tức là lấy hệ số đó bằng không. Việc tính giá trị p
dựa trên kiểm định t, thực hiện theo cách thức đã trình bày ở các phần trên.
Do khuôn khổ tài liệu, vấn đề này không được trình bày ở đây. Các phần
mềm thống kê khi phân tích hồi quy đều tính toán các giá trị p và cho hiển
thị kết quả này.

Ví dụ 2.10. Tính các hệ số quyết định và hệ số quyết định được điều chỉnh
cho ví dụ 2.9.

Giải

Hệ số quyết định được tính theo công thức 2.26:

SS xy2 104 2
r =
2
= = 0,938
SS x SS y 44.262

Để tính hệ số quyết định được điều chỉnh, ta tính ∑ε i


2
như sau:

65
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

xi yi ŷi ε i2 = ( yˆ i − yi ) 2
1 3 3,54 0,29
2 7 5,9 1,21
6 14 15,34 1,79
8 18 20,06 4,24
8 23 20,06 8,64
∑ε i
2
16,18

Hệ số quyết định được điều chỉnh được tính theo công thức 2.27:

2 df Σ SSε (5 − 1).16,18
radj =1− =1− = 0,918
dfε SS y (5 − 2).262

2.5.3. Hồi quy bằng máy tính

Để tính hồi quy bằng Minitab, nhập dữ liệu vào worksheet của chương
trình như minh họa phía trái hình 2.18. Các minh họa dưới đây sử dụng dữ
liệu của ví dụ 2.9.

Hình 2.18. Nhập dữ liệu tính hồi quy và hộp thoại khai báo

Kích menu Stat>Regression>Regression; trong hộp thoại mới xuất hiện,


kích vào hộp Response rồi kích chọn cột y trong danh sách phía bên trái
hộp thoại. Kích select để chọn cột này. Làm tương tự để khai báo cột x cho
hộp Predictor. Kích nút Graph để vẽ các đồ thị minh họa. Kiểm vào các
hộp Regular và Four in one của hộp thoại. Kích nút OK trong mỗi hộp
thoại. Ta được các kết quả như dưới đây.

66
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

1. Các đồ thị

Minitab kết xuất 2 đồ thị, một đồ thị mô hình hồi quy kèm theo các điểm
dữ liệu đã nhập, một đồ thị “4 trong 1” biểu diễn các đồ thị đánh giá số dư
giữa mô hình và dữ liệu đã nhập.

- Đồ thị mô hình hồi quy có tên gọi Fitted line : y versus x. Nếu
không nhìn thấy cửa sổ này, hãy kích menu Windows > Fitted
line: y versus x. Hình 2.19 minh họa cửa sổ này.

Trên đồ thị, mô hình hồi quy tìm được được biểu diễn bằng đoạn
thẳng liền nét. Các điểm dữ liệu được hiển thị bằng các dấu chấm. Hai đoạn
cong biểu diễn bằng nét đứt minh họa khoảng tin cậy được khi đánh giá mô
hình (Confidence Interval, viết tắt là CI). Mô hình nằm trong khoảng này
có nghĩa là có độ tin tưởng được vượt trên mức quy định (ngầm định là
95% như trên hình vẽ).

Hình 2.19. Đồ thị mô hình hồi quy

Đồ thị “4 trong 1” gồm 4 đồ thị con đánh giá các số dư (sai lệch giữa giá trị
được nhập và mô hình), được minh họa trên hình 2.20 và được mô tả như
dưới đây.

67
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Hình 2.20. Các đồ thị đánh giá số dư

- Đồ thị Normal Probability Plot so sánh xác suất phân bố các số dư


(hiển thị bằng các điểm) so với phân phối chuẩn (hiển thị bằng đoạn
thẳng nét liền). Đồ thị cho thấy các số dư phân bố rất gần với phân
phối chuẩn.
- Đồ thị Histogram hiển thị tần suất xuất hiện các số dư.
- Đồ thị Versus Fit biểu diễn quan hệ giữa các số dư và giá trị tương
ứng của mô hình hồi quy. Các điểm phân bố ngẫu nhiên, không theo
quy luật nào chứng tỏ dữ liệu y đã nhập không bị ảnh hưởng bởi các
yếu tố điều khiển có quy luật nào khác ngoài x.
- Đồ thị Versus Order biểu diễn quan hệ giữa các số dư và thứ tự các
điểm dữ liệu. Các điểm phân bố ngẫu nhiên, không theo quy luật nào
chứng tỏ dữ liệu y đã nhập không bị ảnh hưởng bởi các yếu tố thời gian
(chẳng hạn, càng về sau càng lớn). Hai đồ thị Versus Fit và Versus
Order càng phân bố ngẫu nhiên xung quanh đường 0 và không theo
quy luật nào càng tốt.

2. Phân tích thống kê

Kết quả phân tích thống kê cho ta cái nhìn định lượng về mô hình
hồi quy. Kết quả này được Minitab cho hiển thị trên cửa sổ Session. Để
hiển thị cửa sổ này, kích menu Windows>Session. Các số liệu hiển thị trên

68
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

cửa sổ Session được minh họa trên hình 2.21. Các dòng chữ được đánh số
để tiện phân tích.

Hình 2.21. Kết quả phân tích thống kê hồi quy cho ví dụ 2.9

Dòng thứ nhất và thứ 2 thông báo kết quả phương trình hồi quy.
Dongf thứ 4 và 5 cho ta biết giá trị cụ thể của từng hệ số hồi quy, giá trị t
khi kiểm định giả thuyết thống kê về sự tồn tại của các hệ số này. Cột cuối
cùng của hao hành này là giá trị p khi kiểm định các giả thuyết đó. Vì giá
trị p ứng với hệ số b0 khá lớn (0,602), ta có thể nghi ngờ rằng sự có mặt của
hệ số này trong phương trình hồi quy là không có ý nghĩa, tức là không cần
thiết. Dòng thứ 6 cho ta biết hệ số quyết định (R-Sq = 93,8%) và hệ số
quyết định được điều chỉnh (R-Sq(adj) = 91,8%). Các kết quả này đúng
như ta đã tính toán bằng tay ở trên.

Phần dưới của bảng kết quả từ dòng thứ 7 trở đi là kết quả phân tích
phương sai (Analysis of Variance – ANOVA). Có các cột sau:

DF (Degree of Freedom): số bậc tự do;


SS (Sum of Squares): tổng các bình phương;
MS (Mean of Squares): Trung bình cộng các bình phương;
F: giá trị giới hạn khi kiểm định F;
P: giá trị p (p-value).

69
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Nhận thấy kết quả tính bằng Minitab đều trùng khớp với các số liệu
của các đại lượng tương ứng đã tính ở trên (ví dụ 2.9 và 2.10). Giá trị p rất
nhỏ cho thấy mô hình hồi quy tìm được khớp khá tốt với dữ liệu đã cho.

2.5.4. Ví dụ ứng dụng

Ví dụ 2.11. Một dây chuyền sản xuất của một công ty đang sản xuất một
loại sản phẩm và muốn đánh giá chất lượng của sản phẩm này. Tuy nhiên,
đo trực tiếp thông số chất lượng này là rất tốn kém và không khả thi trong
điều kiện thực tại. Biết rằng thông số chất lượng này (thông số 1) có quan
hệ khá chặt chẽ với một thông số khác dễ đo hơn và có thể thực hiện tại
nhà máy (thông số 2). Vì vậy, ban lãnh đạo công ty quyết định cho thuê đo
hai loại thông số trên tại một cơ sở chuyên đánh giá chất lượng. Kết quả đo
trên 9 mẫu cho trong bảng dưới đây. Hãy tìm quan hệ giữa hai thông số để
từ đó, nhà máy có thể áp dụng đo thông số thứ hai để suy ra thông số thứ
nhất.

Mẫu đo 1 2 3 4 5 6 7 8 9
Thông số 1 4,1 2,2 2,7 6,0 8,5 4,1 9,0 8,0 7,5
Thông số 2 2,1 1,5 1,7 2,5 3 2,1 3,2 2,8 2,5

Giải

Ta đặt ra giả thuyết rằng quan hệ giữa hai thông số là quan hệ bậc nhất.
Gọi thông số thứ hai là y, thông số thứ nhất x, ta mong muốn xác định quan
hệ này dưới dạng: y = b + ax. Để xác định các hệ số a, b, ta thực hiện hồi
quy trong Minitab như sau.

1. Nhập dữ liệu đã cho vào Worksheet của Minitab. Các giá trị của
thông số thứ nhất vào cột C1, của thông số thứ hai vào cột C2. Tiếp
đó, kích menu Stat > Regression > Regression . Trong hộp thoại,
chọn Response là C2; chọn Predictors là C1. Kích nút Graph,
chọn Four in one.

70
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

2. Phân tích kết quả. Cửa sổ Session liệt kê các thông tin sau:

Hình 2.22. Kết quả phân tích thống kê hồi quy ví dụ 2.11

Xử lý kết quả: Kiểm tra các giá trị của p-value ứng với cả hai hệ số a và b
(dòng 5 và 6, cột cuối cùng) đều bằng 0,000, nhỏ hơn rất nhiều so với giá
trị α thông thường (0,05). Điều này chứng tỏ quan hệ được dự đoán cho hai
thông số là rất có cơ sở thống kê. Các giá trị hệ số quyết định r2 và radj
2
lần
lượt bằng 95,7% và 95,1% chứng tỏ mô hình hồi quy tìm được rất khớp với
dữ liệu đo. Mục Unusual observation (điểm quan sát kỳ dị) cho biết điểm
dữ liệu số 9 nằm ngoài khoảng thống kê thông thường (quá sai lệch so với
quy luật phân bố chung). Điểm này gọi là điểm outlier. Quan sát các đồ thị
số dư, ta cũng dễ dàng nhận thấy sự “lạc lõng” ứng với dữ liệu thứ 9.

Kết luận: có thể sử dụng quan hệ y = 1,12 + 0,218x để biểu diễn quan hệ
giữa thông số thứ hai và thông số thứ nhất. Nhà máy có thể chỉ cần đo
thông số này để chỉ ra giá trị của thông số kia.

2.6. Chuyển dữ liệu về dạng phân phối chuẩn

2.6.1. Kiểm tra dạng phân bố của dữ liệu

Như đã biết, hầu hết các đại lượng trong kỹ thuật đều có giá trị thay
đổi ngẫu nhiên. Chẳng hạn, sai số kích thước của loạt chi tiết gia công thay

71
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

đổi ngẫu nhiên mặc dù các điều kiện gia công được giữ nguyên; độ bền kéo
của một loạt thép cũng có giá trị biến động ngẫu nhiên dù điều kiện sản
xuất vẫn không thay đổi. Nói chung, các quy luật thay đổi của các đại
lượng ngẫu nhiên trong kỹ thuật thường theo quy luật phân phối chuẩn.
Tuy vậy, đôi khi ta có thể gặp một số trường hợp mà đại lượng cần nghiên
cứu không tuân theo phân phối chuẩn. Khi này, để áp dụng được các
nguyên tắc thống kê, ta cần chuyển đổi (Transform) tập dữ liệu về dạng
phân phối chuẩn.

Để kiểm tra xem một tập giá trị có tuân theo phân phối chuẩn hay
không, ta sử dụng đồ thị xác suất phân phối chuẩn (Normal Distribution
Plot). Nếu các dữ liệu phân bố theo quy luật phân phối chuẩn, các điểm dữ
liệu sẽ phân bố gần sát đường chuẩn; đồng thời, giá trị p khi kiểm định giả
thuyết về phân phối chuẩn sẽ lớn hơn mức ý nghĩa α.

Ví dụ 2.12. Xét xem 2 tập dữ liệu A và B cho trong bảng dưới đây có tuân
theo quy luật phân phối chuẩn hay không?

5,11 4,89 4,83 4,37 4,5 4,6 4,57 5,11 4,44 4,82
A
6,02 5,37 5,53 5,79 4,64 5,17 4,95 5,21 5,89 4,25
10,21 0,62 0,72 1,35 2,43 0,31 4,94 4,09 3,41 0,65
B
2,47 0,11 8,99 5,17 10,93 10,44 21,45 4,52 12,2 1,24

Giải.

Ta nhập 2 tập dữ liệu đã cho vào 2 cột C1 và C2 trong một


Worksheet của Minitab. Kích menu Graph > Probability Plot. Chọn chức
năng Multiple để vẽ 2 đồ thị; chọn tên các cột C1 và C2 cho mục Graph
variables; kích nút Multiple graphs và chọn In separate panels of the
same graph để vẽ các đồ thị rời nhau. Kết quả thu được như trên hình
2.23.

Trên hình 2.23, các điểm dữ liệu đã cho được biểu diễn bằng các
điểm chấm. Trên mỗi đồ thị có 3 đoạn thẳng; đoạn chính giữa biểu diễn xác

72
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

suất phân phối chuẩn; hai đoạn bên cạnh biểu diễn giới hạn 95% của
khoảng tin cậy được.

Hình 2.23. Đồ thị phân phối của 2 tập dữ liệu trong ví dụ 2.12.

Nếu các điểm phân phối nằm dọc theo đường chuẩn và nằm trong
khoảng giới hạn, có thể coi như các dữ liệu tuân theo quy luật phân phối
chuẩn. Các điểm của tập dữ liệu trên đồ thị thỏa mãn điều này. Thêm nữa,
các thông tin thống kê của tập A (được trình bày phía bên phải đồ thị) cho
thấy giá trị p của phép kiểm định thống kê là 0,502 - lớn hơn nhiều so với
mức ý nghĩa α là 0,05. Do vậy, có thể kết luận là tập dữ liệu A tuân theo
quy luật phân phối chuẩn.

Trái lại, các điểm dữ liệu của tập B (được vẽ trên đồ thị B của hình
2.23) không phân bố dọc theo đường chuẩn; đồng thời, giá trị p của kiểm
định thống kê rất nhỏ (0,006) cho thấy, tập dữ liệu này không theo quy luật
phân phối chuẩn.

Muốn chuyển đổi dữ liệu (Data transformation) để chuyển tập dữ


liệu thành dạng phân phối chuẩn. Có hai dạng chuyển đổi hay dùng là
chuyển đổi Box-Cox và chuyển đổi Johnson.

73
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

2.6.2. Chuyển đổi Box-Cox

Phép chuyển đổi Box-Cox, hay còn gọi là phép đổi biến Box-Cox,
được sử dụng khi tập dữ liệu phân bố rất lệch về một phía. Điều kiện để sử
dụng phép chuyển đổi này là các dữ liệu phải có giá trị lớn hơn không và
chia thành các nhóm nhỏ. Chẳng hạn, tập dữ liệu được thu thập định kỳ,
mỗi lần thu được n số liệu, ta nói cỡ nhóm nhỏ là n. Phép chuyển đổi Box-
Cox thực hiện phép đổi biến có dạng:

⎡ X ' = X λ khi λ ≠ 0
⎢ (2.28)
⎣ X ' = ln( X ) khi λ = 0

Trong đó, X* là giá trị dữ liệu mới; X là giá trị dữ liệu cũ; λ là số mũ
chuyển đổi. Giá trị λ được xác định bằng cách dò tìm, sao cho độ lệch
chuẩn của tập dữ liệu đã được chuyển đổi là nhỏ nhất. Phương pháp Box-
Cox thực hiện việc dò tìm λ trong khoảng từ -5 đến 5; sau đó làm tròn đến
một trong các giá trị thông dụng như trong bảng 2.6.

Bảng 2.6. Các giá trị thông dụng của số mũ λ trong chuyển đổi Box-Cox

Giá trị λ Công thức chuyển đổi


λ=2 X’ = X2
λ = 0.5 X'= X
λ=0 X' = ln X
λ = − 0.5 X '= 1 / X
λ=−1 X ' = 1/ X

Cách thực hiện phép đổi biến Box-Cox bằng Minitab có thể tham khảo qua
ví dụ dưới đây.

Ví dụ 2.13. Thực hiện phép đổi biến Box-Cox cho tập dữ liệu B của ví dụ
2.12; giả sử mỗi lần thu thập được 5 số liệu.

74
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Giải. Trong Minitab, cho hiển thị Worksheet chứa cột dữ liệu của ví dụ
2.12; kích menu Stat > Control Charts > Box-Cox Transformation.
Chọn mục All observations for a chart are in one column (Mọi dữ liệu
chứa trong một cột); Nhập số dữ liệu cho mỗi nhóm nhỏ (cỡ dữ liệu nhóm
nhỏ) là 5 vào hộp Subgroup size. Kích nút Option, chọn Optimal or
rounded lambda (Tối ưu hóa hoặc làm tròn λ); nhập tên cột C5 vào hộp
Store transformed data in để chứa kết quả đã chuyển đổi vào cột C5 của
Worksheet. Kích OK của các hộp thoại. Ta được đồ thị chuyển đổi Box-
Cox như trên hình 2.24; đồng thời 20 dữ liệu mới được tính toán và lưu vào
cột C5 của Worksheet.

Hình 2.24. Đồ thị Box-Cox của ví dụ 2.13

Hình 2.25. Đồ thị phân phối xác suất sau khi đã chuyển đổi

Trên đồ thị hình 2.24, ta thấy kết quả λ (Lambda) được làm tròn
(Rounded Value) là 0,5. Điều này có nghĩa các giá trị mới được tính theo

75
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

phép đổi biến là lấy căn bậc 2 của giá trị cũ, số liệu này Minitab đã tính
giúp và lưu vào cột C5. Ra lệnh vẽ đồ thị xác suất phân phối cho cột dữ
liệu này, ta được kết quả như hình 2.25. Trên hình 2.25, ta thấy giá trị xác
suất p của đồ thị phân phối xác suất là 0,401, các điểm dữ liệu nằm sát
đường chuẩn hơn; do vậy có thể nói dữ liệu mới đã gần với phân phối
chuẩn.

2.6.3. Chuyển đổi Johnson

Chuyển đổi Johnson, còn gọi là phép đổi biến Johnson, được sử
dụng để chuyển đổi một tập dữ liệu không theo quy luật phân phối chuẩn
thành dạng phân phối chuẩn. Phương pháp chuyển đổi Johnson thực hiện
một giải thuật phức tạp hơn so với phương pháp Box-Cox và thường được
áp dụng cho các trường hợp phương pháp Box-Cox không hữu hiệu hoặc
không áp dụng được.

Cách thực hiện chuyển đổi Johnson trên Minitab có thể tham khảo
qua ví dụ dưới đây.

Ví dụ 2.14. Thực hiện phép đổi biến Johnson cho tập dữ liệu B của ví dụ
2.12; giả sử các số liệu được thu thập hoàn toàn ngẫu nhiên, không chia
nhóm.

Giải. Trong Minitab, cho hiển thị Worksheet chứa cột dữ liệu của ví dụ
2.12; kích Stat > Quality Tools > Johnson Transformation; Trong hộp
Data are arranged as, kích chọn Single column rồi kích chọn cột B.
Trong hộp Store transformed data in, chọn Single column rồi nhập C6
để lưu tập dữ liệu được chuyển đổi vào cột C6. Kích nút Options, trong
hộp P-Value to select best fit , nhập giá trị mức ý nghĩa là 0.05. Kích OK
trong mỗi hộp thoại. Ta được kết quả chuyển đổi lưu trong cột C6 của
Worksheet hiện thời và một đồ thị chuyển đổi Johnson như trên hình 2.26.

76
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Đồ thị trên hình 2.26 gồm 3 đồ thị nhỏ; góc trên bên trái là đồ thị
phân phối xác suất của dữ liệu gốc ban đầu. Bên dưới là đồ thị phân phối
của dữ liệu đã chuyển đổi. Bên cạnh mỗi đồ thị là các giá trị: số dữ liệu
(N); kết quả thống kê Anderson-Darling (AD) và giá trị xác suất p của
kiểm định mức độ phù hợp theo phân phối chuẩn. Đồ thị phía bên phải
trình bày cách chọn công thức chuyển đổi.

Hình 2.26. Kết quả chuyển đổi Johnson cho ví dụ 2.14

Ta rút ra các kết luận sau từ đồ thị kết quả trên hình 2.26:

- Dữ liệu cũ không theo phân phối chuẩn (giá trị p là 0,006; rất nhỏ so
với mức ý nghĩa 0,05);
- Dữ liệu đã chuyển đổi khớp rất tốt với phân phối chuẩn (giá trị p
bằng 0,866; lớn hơn nhiều so với mức ý nghĩa 0,05);
- Dữ liệu đã được chuyển đổi theo công thức đổi biến (theo thông báo
Transfomation function equals ở góc dưới bên phải đồ thị) như sau:

⎛ X + 0,0399804 ⎞
X ' = 1,29251 + 0,680443 ⋅ ln ⎜ ⎟
⎝ 24,2872 − X ⎠

77
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

2.7. Kết luận chương

Trong thực tế, ta không biết được các thông tin về tất cả các phần tử
trong một tập hợp đối tượng, mà chỉ có thể thu thập được một số lượng hạn
chế thông tin về một nhóm đối tượng của tập hợp đó. Dựa vào thông tin
của nhóm đối tượng này (tập mẫu), kỹ thuật phân tích thống kê cho phép ta
suy diễn ra các giá trị trung bình, mức độ phân tán (độ lệch chuẩn, phương
sai) của thông tin về toàn thể các phần tử trong tập hợp các đối tượng cùng
loại (gọi là tập toàn bộ).

Trong kỹ thuật, hầu hết các đại lượng đều có giá trị phân phối theo
quy luật phân phối chuẩn Gauss. Các phép suy diễn thống kê đều dựa vào
giả thiết rằng tập dữ liệu tuân theo quy luật phân phối chuẩn. Khi suy diễn,
ta thường phát biểu mệnh đề được dự đoán dưới dạng một giả thuyết thống
kê. Các phương pháp kiểm định giả thuyết thống kê thông dụng bao gồm
kiểm định Z, kiểm định t. Các phép kiểm định này dựa trên các phân phối
χ2 và phân phối Student. Kỹ thuật hồi quy cho phép ta xâu dựng mô hình
hồi quy nhằm xác định quan hệ giữa hàm mục tiêu với một hay nhiều biến
thí nghiệm dưới dạng một phương trình toán học. Sử dụng mô hình hồi quy
cho phép ta suy diễn và dự đoán ứng xử của đối tượng ứng với các giá trị
của các biến khác với các giá trị đã thí nghiệm. Việc đánh giá kết quả các
phép suy diễn nói trên đều dựa trên việc tính toán xác suất tin cậy của phép
thống kê. Hai thông số quan trọng để đánh giá là mức ý nghĩa α và giá trị
xác suất p (p-value). Nguyên tắc cơ bản là khi p<α, ta loại bỏ giả thuyết
đảo. Các phép suy diễn về giá trị trung bình, giá trị phương sai, độ lệch
chuẩn đều có giả thuyết đảo là các giá trị này bằng giá trị dự đoán. Với
phân tích hồi quy, giả thuyết đảo là các hệ số hồi quy bằng không. Giá trị p
ứng với hệ số hồi quy nào càng nhỏ thì hệ số đó càng có nhiều khả năng
hiện hữu trong phương trình hồi quy. Với các dữ liệu không tuân theo quy
luật phân phối chuẩn, ta nên chuyển đổi về dạng phân phối chuẩn.

78
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Câu hỏi chương 2

1. Phân biệt và lấy ví dụ sự khác nhau giữa tập toàn bộ và tập mẫu?
2. Phân biệt phương sai và độ lệch chuẩn của tập toàn bộ với của tập
mẫu?
3. Khi nào dùng phân phối t-student, khi nào dùng χ2 để suy diễn
thống kê?
4. Giá trị p (p-value) là gì? Vai trò của giá trị p trong suy diễn thống
kê?
5. Thế nào là giả thuyết 1 phía, 2 phía? Cách tính giá trị p trong mỗi
trường hợp?
6. Hồi quy là gì? Cách đánh giá sai số hồi quy?
7. Tại sao cần chuyển các dữ liệu về dạng phân phối chuẩn?
8. Phạm vi sử dụng của chuyển đổi Box-Cox và chuyển đổi Johnson?
9. Thực hành tính các ví dụ trong chương bằng tay và bằng phần mềm
theo hướng dẫn trong bài.

79
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Chương 3.
THỰC NGHIỆM SO SÁNH
3.1. Giới thiệu

Trong kỹ thuật, ta rất hay gặp các quá trình thực hiện cùng một công
việc hay chế tạo ra cùng một loại sản phẩm. Việc tiến hành thực nghiệm để
so sánh, đánh giá giữa các quá trình với nhau giúp nhà sản xuất đưa ra các
quyết định đầu tư đúng đắn. Các câu hỏi thường được đặt ra là:

1. Hai quá trình có cho ra giá trị như nhau không?


2. Hai quá trình có biến động như nhau không?
3. Hai quá trình có cùng tỷ lệ khuyết tật không?
4. Tuổi thọ của hai quá trình có giống nhau không?

Chương này trình bày các khái niệm cơ bản, kỹ thuật xử lý thống kê và
cách ứng dụng máy tính để so sánh hai tập dữ liệu từ các quá trình hoặc sản
phẩm được thí nghiệm.

3.2. So sánh trung bình

Cho hai tập mẫu được lấy ngẫu nhiên từ hai tập toàn bộ độc lập và
cần so sánh với nhau. Các số liệu đo được của hai tập này được ký hiệu
như sau:

- Tập thứ nhất: Y1, Y2,… YN1;


- Tập thứ hai: Z1, Z2, … ZN2;

Một số vấn đề đặt ra cần giải đáp là:

- Giá trị trung bình của hai tập toàn bộ có bằng nhau không?

80
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

- Giá trị trung bình của tập toàn bộ thứ nhất có nhỏ hơn tập toàn
bộ thứ hai không?
- Giá trị trung bình của tập toàn bộ thứ nhất có lớn hơn tập toàn
bộ thứ hai không?

Gọi trị trung bình dữ liệu của các tập toàn bộ lần lượt là μ1 và μ2.
Các giả thuyết thống kê có thể được đặt ra là:

o H0: μ1 = μ2;
o H0: μ1 < μ2;
o H0: μ1 > μ2;

Khi phát biểu các giả thuyết thống kê, nên lưu ý đến các vấn đề sau:

- Thứ nhất, nếu ta mong muốn chứng tỏ quá trình mới là tốt hơn,
ta thể hiện điều đó trong phát biểu giả thuyết chính;
- Thứ hai, nếu ta muốn giữ nguyên tình trạng như hiện tại, hãy
phát biểu nó trong giả thuyết đảo.

Các thông số cần sử dụng trong quá trình kiểm định giả thuyết thống
kê bao gồm:

1. Giá trị trung bình của các tập mẫu:

1 N1 1 N2
Y = ∑
N 1 i =1
Yi ; Z =
N2
∑Z
i =1
i (3.1)

Trong đó, N1 và N2 lần lượt là số phần tử của các tập mẫu Y và Z.

2. Độ lệch chuẩn của các tập mẫu:

81
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

N1 N2

∑ (Y − Y ) ∑ (Z −Z)
2 2
i i
S1 = i =1
; S2 = i =1
(3.2)
N1 − 1 N2 −1

3. Số bậc tự do của các tập mẫu:

ν1 = N1 -1; ν2 = N2 -1 (3.3)

3.2.1. Hai tập toàn bộ có cùng độ lệch chuẩn

Nếu hai tập toàn bộ có cùng độ lệch chuẩn, việc kiểm định sẽ có độ
tin cậy cao hơn so với trường hợp hai tập toàn bộ khác độ lệch chuẩn. Tuy
nhiên, nếu thực tế hai tập toàn bộ khác độ lệch chuẩn sẽ gây nên sai số lớn
nếu áp dụng cách tính này.

Việc kiểm định giả thuyết thống kê được thực hiện dựa trên kiểm
định t. Cụ thể là:

Y −Z
t= (3.4)
1 1
S +
N1 N 2

Độ lệch chuẩn mẫu tương đương được tính theo công thức:

S=
( N1 − 1)S12 + ( N 2 − 1)S22 (3.5)
( N1 − 1) + (N 2 − 1)

Số bậc tự do tương đương: ν = N1 + N 2 − 2

3.2.2. Hai tập toàn bộ khác độ lệch chuẩn

Nếu không chắc chắn hai tập toàn bộ có cùng độ lệch chuẩn, sử
dụng công thức tính t như sau:

82
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Y −Z
t= (3.6)
S12 S22
+
N1 N 2

Số bậc tự do được dự đoán bằng công thức gần đúng Welch-Satterthwaite:

2
⎛ S12 S22 ⎞
⎜⎜ + ⎟⎟
N
⎝ 1 N 2 ⎠
ν= (3.7)
S14 S24
+
N12 ( N1 − 1) N 22 (N 2 − 1)

3.2.3. Hai tập có dữ liệu phân bố theo cặp

Cho hai tập mẫu có số lượng như nhau, được lấy từ hai tập toàn bộ
độc lập và cần so sánh với nhau. Các số liệu đo được của hai tập này được
ký hiệu như sau:

- Tập thứ nhất: Y1, Y2,… YN;


- Tập thứ hai: Z1, Z2, … ZN;

Các dữ liệu được gọi là bố trí theo cặp nếu dữ liệu thứ k trong tập
thứ nhất luôn có mối liên hệ tương ứng với dữ liệu thứ k trong tập thứ hai.

Chẳng hạn, giả sử ta chọn một số mẫu cùng loại, sau đó lần lượt đo
từng mẫu bằng hai hệ thống thiết bị khác nhau và lưu dữ liệu đo mỗi mẫu
thành từng cặp. Ta muốn dùng dữ liệu này để so sánh, đánh giá chất lượng
giữa hai hệ thống đo chẳng hạn. Một ví dụ khác, ta muốn so sánh tính đồng
đều giữa hai chiếc trong mỗi đôi của một loại giày bảo hộ lao động. Giả sử
ta lấy 20 đôi giày ngẫu nhiên bất kỳ, đưa cho 20 công nhân được chọn ngẫu
nhiên đi thử sau cùng một thời gian nhất định. Kết quả đo độ mòn của hai
đế giày trái và phải sẽ cho ta 20 cặp dữ liệu đối ứng nhau từng đôi một.

83
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Lượng sai khác giữa các cặp dữ liệu từ hai tập mẫu Yi, Zi (i=1..N) được
tính:

di = Yi – Zi (3.8)

Giá trị trung bình của tập các giá trị sai khác là:

1 n
d=
N
∑d
i =1
i (3.9)

Độ lệch chuẩn của tập các giá trị sai khác là:

1 N
sd =
N − 1 i =1
(
∑ di − d )
2
(3.10)

Để so sánh sai khác về giá trị trung bình của hai tập dữ liệu mẫu phân bố
theo cặp, ta sử dụng kiểm định t. Giá trị t được tính theo công thức sau:

d
t= (3.11)
sd / N

3.2.4. Cách thực hiện so sánh

Cách 1. Tính toán bằng tay:

Bước 1. Tính các số liệu sơ bộ theo các công thức trên;

Bước 2. Tính t tùy theo điều kiện đã biết hay chưa chắc chắn hai tập toàn
bộ có cùng độ lệch chuẩn; hoặc dữ liệu phân bố theo cặp; được thực hiện
theo các công thức nêu trên;

84
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Bước 3. Tra bảng xác suất Student-t tìm các giá trị t giới hạn, tùy thuộc
mức ý nghĩa α và cách phát biểu giả thuyết đảo. Nếu giả thuyết đảo cho
rằng μ1 = μ2 thì tra bảng tìm tα/2;ν. Nếu không, tra bảng tìm tα;ν.

Bước 4. So sánh t với t tra bảng và đưa ra kết luận:

- Với H0: μ1 = μ2; loại bỏ H0 nếu | t | ≥ tα/2;ν.


- Với H0: μ1 > μ2; loại bỏ H0 nếu t < tα;ν.
- Với H0: μ1 < μ2; loại bỏ H0 nếu t > tα;ν.

Cách 2. Tính toán bằng máy. Xem các ví dụ minh họa phía sau.

3.2.5. Ví dụ minh họa

Ví dụ 3.1. Một dây chuyền lắp ráp mới (số 2) được đưa vào kiểm chứng và
so sánh với dây chuyền cũ (số 1) về mặt thời gian lắp ráp sản phẩm. Thời
gian lắp ráp một số sản phẩm trên mỗi dây chuyền (tính bằng phút/ sản
phẩm) được cho trong bảng dưới đây.

Bảng 3.1. Thời gian lắp ráp sản phẩm của ví dụ 3.1

STT Dây chuyền 1 Dây chuyền 2


1 32 36
2 37 31
3 35 30
4 28 31
5 41 34
6 44 36
7 35 29
8 31 32
9 34 31
10 38 -
11 42 -

85
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Câu hỏi đặt ra là liệu thời gian lắp ráp trung bình trên dây chuyền mới có
nhỏ hơn thời gian lắp ráp trên dây chuyền cũ không.

Giải

Cách 1. Tính bằng tay

Bước 1. Gọi thời gian lắp ráp trung bình trên dây chuyền 1 là μ1, trên dây
chuyền 2 là μ2. Ta mong muốn dây chuyền 2 sẽ tốt hơn, do vậy ta phát biểu
giả thuyết đảo là μ1 < μ2 với hy vọng là sẽ loại bỏ giả thuyết này. Giả
thuyết thống kê sẽ có dạng:

H0: μ1 ≤ μ2;
H1: μ1 > μ2.

Đây là giả thuyết đảo một phía. Vùng giới hạn nằm về phía bên phải đường
cong phân phối t.

Tính các giá trị trung bình và phương sai hai tập mẫu, ta có:

Đại lượng Dây chuyền 1 Dây chuyền 2


Thờì gian trung bình (phút/sản phẩm) 36,0909 32,2222
Độ lệch chuẩn 4,9082 2,5386
Số lượng mẫu 11 9
Bậc tự do 10 8

Ta chưa biết gì về khả năng thời gian lắp ráp trên hai dây chuyền có cùng
độ lệch chuẩn hay không, nên ta tính các thông số theo phương án hai độ
lệch chuẩn khác nhau.

Số bậc tự do tính theo công thức (3.7):

86
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

2 2
⎛ S12 S 22 ⎞ ⎛ 4,9082 2 2,53862 ⎞
⎜ ⎟
⎜⎜
N
+
N
⎟⎟ ⎜ 11 + 9 ⎟⎠
ν= ⎝ 1 2 ⎠
= ⎝ = 15,5
S14 S24 4,90824 2,53864
+ +
N12 ( N1 − 1) N 22 (N 2 − 1) 112 (11 − 1) 92 (9 − 1)

Bước 2. Tính t theo công thức (3.6)

Y −Z 36,0909 − 32,2222
t= = = 2,2694
S12 S22 4,90822 2,53862
+ +
N1 N 2 11 9

Bước 3. Chọn mức ý nghĩa α=0,05. Tra bảng xác suất Student-t ứng với số
bậc tự do 16, ta được giá trị t0,05;16 = 1,746.

Bước 4. So sánh ta thấy (t=2,2694) > (t0,05;16 = 1,746). Do vậy, ta loại bỏ


giả thuyết đảo. Do vậy, có thể kết luận rằng, với độ chắc chắn 95%, dây
chuyền 1 có thời gian lắp ráp trung bình lâu hơn dây chuyền 2.

Cách 2. Tính bằng Minitab

Trước hết, nhập bảng số liệu vào 2 cột C1 và C2 của Minitab như hình 3.1.
Kích menu Stat>Basic Statistics>2-Sample t. Trong hộp thoại 2-Sample
t, kích chọn mục Samples in different columns (Các dữ liệu ở các cột
khác nhau). Kích chuột vào ô First rồi kích kép vào tên cột “Dây chuyền
1” trong danh sách tên các cột dữ liệu để chọn nó. Tiếp tục cho ô Second.

Kích nút Options để thiết lập các lựa chọn. Nhập các lựa chọn sau:

- Confidence level: nhập cấp độ tin cậy;


- Test difference: nhập giá trị tối thiểu để coi như hai trung bình là
khác nhau; Ví dụ như trên hình, nếu hai giá trị chênh nhau ít nhất 0,01
phút mới được coi là có khác nhau.

87
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

- Alternative: Chọn kiểu giả thuyết chính: chọn Greater than (Lớn
hơn); Not equal (không bằng) hay Less than (nhỏ hơn).

Hình 3.1. Nhập liệu và lựa chọn cho ví dụ 3.1

Ta có thể kích nút Graph và kiểm vào hộp Invidual Plot để Minitab vẽ
đồ thị biểu diễn các điểm dữ liệu. Sau khi kích nút OK, thu được kết quả
trên cửa sổ Session và một đồ thị như hình 3.2. Kết quả tính toán cho thấy,
với (p-value = 0,019) < (α=0,05), ta loại bỏ giả thuyết đảo. Ngoài ra, dây
chuyền 2 còn có thời gian lắp ráp trung bình nhỏ hơn của dây chuyền 1 tới
3,87 phút. Nếu tính bằng tay, ta sẽ không có được kết quả này. Đồ thị các
điểm dữ liệu cũng cho thấy dây chuyền 2 có thời gian lắp ráp trung bình
nhỏ hơn hẳn.

88
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Hình 3.2. Kết quả tính bằng Minitab cho ví dụ 3.2

Ví dụ 3.2. Một công ty sản xuất giày muốn so sánh độ bền mòn của hai loại
cao su dự định dùng làm đế giày. Người ta làm mẫu 10 đôi giày được sản
xuất trong điều kiện như nhau. Tuy nhiên vật liệu đế giày thì được gán
ngẫu nhiên cho mỗi đôi sao cho vật liệu đế giày từng chiếc là khác nhau.
Chẳng hạn, đôi này thì bên trái làm bằng vật liệu A, bên phải bằng vật liệu
B. Nhưng đôi khác thì có thể bên trái làm bằng vật liệu B, bên phải làm
bằng vật liệu A… Mười người thử nghiệm đi thử trong một thời gian nhất
định. Lượng mòn của từng loại vật liệu ở các đế giày được đo và ghi lại
trong bảng dưới đây.

89
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Bảng 3.2. Lượng mòn đế giày (mm) của ví dụ 3.2

STT Lượng mòn vật liệu A Lượng mòn vật liệu B


1 3,30 3,50
2 2,05 2,20
3 2,73 2,80
4 3,58 3,55
5 2,68 2,95
6 1,65 1,60
7 2,38 2,45
8 2,70 2,83
9 2,20 2,33
10 3,33 3,40

Câu hỏi cần giải đáp là liệu hai vật liệu có độ bền mòn khác nhau không; và
nếu có, loại nào tốt hơn? Nhà sản xuất muốn có độ tin tưởng 95%.

Giải

Với dạng bài toán có dữ liệu hai tập phân bố theo cặp như trên, ta chọn
cách so sánh t theo cặp. Gọi μA và μB lần lượt là trung bình tập toàn bộ của
lượng mòn các vật liệu đế giày A và B sau 3 tháng. Giả thuyết đảo được
phát biểu là lượng mòn trung bình này là như nhau; tức là:

H 0 : μ A − μB = 0

Ta có thể phát biểu giả thuyết chính ở một trong ba dạng sau: Hoặc
H1 : μ A − μB ≠ 0 hoặc H 0 : μ A − μB > 0 hoặc H 0 : μ A − μB < 0 .

Dưới đây, ta sử dụng Minitab để thử cả ba cách phát biểu này.

Trước hết, nhập các số liệu ở bảng 3.2 vào Minitab và đặt tên các cột dữ
liệu theo ý muốn. Chẳng hạn, ta đặt tên cột thứ nhất là “Vật liệu A”, cột thứ
hai là “Vật liệu B”. Kích menu Stat>Basic Statistics>Paired t… như minh
họa trên hình 3.3.

90
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Trong hộp thoại tiếp theo, chọn Samples in columns rồi kích chọn tên
từng cột cho hai tập mẫu. Kích nút Option để nhập mức tin cậy (95%);
nhập chênh lệch giữa các giá trị trung bình 2 tập toàn bộ ít nhất là 0; Chọn
kiểu giả thuyết chính là not equal để kiểm định khả năng hai lượng mòn
trung bình là khác nhau (Xem hình 3.4).

Hình 3.3. Minh họa cách kiểm định t cho dữ liệu dạng cặp

Hình 3.4. Minh họa các lựa chọn để so sánh t theo cặp

91
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Giả sử ta chọn kiểu giả thuyết chính là not equal, tức là tương đương với
phát biểu H1 : μ A − μ B ≠ 0 . Sau khi kích nút OK, Minitab hiển thị kết quả
như hình 3.5.

Hình 3.5. Kết quả kiểm định với giả thuyết chính H1 : μ A − μB ≠ 0

Quan sát dòng dưới cùng của thông báo (xem hình 3.5), ta thấy giá trị p-
value là 0,01; giá trị này nhỏ hơn mức α = 0,05 (do mức tin cậy là 95%).
Do vậy ta loại bỏ giả thuyết H0. Nói cách khác, có thể kết luận là lượng
mòn của hai vật liệu là khác nhau đáng kể (có ý nghĩa thống kê).

Bây giờ ta thử kiểm tra xem liệu lượng mòn của vật liệu A có lớn hơn của
vật liệu B không. Lặp lại quá trình như trên, nhưng trong hộp chọn
Alternative, ta chọn loại Greater than (có nghĩa là “lớn hơn”). Kết quả
thu được như hình 3.6.

Hình 3.6. Kết quả kiểm định với giả thuyết chính H1 : μ A − μ B > 0

92
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Nhận thấy (xem hình 3.6), giá trị p-value (bằng 0,005) nhỏ hơn mức
α, nên ta cũng loại bỏ H0. Tức là có thể chấp nhận giả thuyết chính: Lượng
mòn trung bình của vật liệu A lớn hơn của vật liệu B.

Đến đây, có thể ta muốn thử kiểm tra xem, nếu phát biểu giả thuyết
chính là H 0 : μ A − μB < 0 thì kết quả sẽ ra sao? Lặp lại cách tính như trên
và chọn Less than trong mục chọn Alternative. Ta sẽ thu được kết quả p-
value = 0,995 (Bạn đọc hãy tự thử thực hiện). Có nghĩa là ta có thể chấp
nhận giả thuyết đảo? Thực tế vì kết quả không chấp nhận được cho giả
thuyết chính nên Minitab cho là như vậy. Qua đây, ta cũng thấy lợi ích của
việc sử dụng máy tính để thử kiểm tra nhiều tình huống khác nhau. Nếu
thực hiện bằng tay sẽ rất mất thời gian.

3.3. So sánh lượng biến động

Cho hai tập mẫu được lấy ngẫu nhiên từ hai tập toàn bộ độc lập và
cần so sánh với nhau. Các số liệu đo được của hai tập này được ký hiệu
như sau:

- Tập thứ nhất: Y1, Y2,… YN1;


- Tập thứ hai: Z1, Z2, … ZN2;

Một số vấn đề đặt ra cần giải đáp là:

- Hai tập dữ liệu toàn bộ có cùng độ lệch chuẩn không?


- Độ lệch chuẩn của tập thứ nhất có nhỏ hơn độ lệch chuẩn của
tập thứ hai không?
- Độ lệch chuẩn của tập thứ nhất có nhỏ hơn độ lệch chuẩn của
tập thứ hai không?

Gọi độ lệch chuẩn của tập toàn bộ thứ nhất là σ1, phương sai của
tập toàn bộ thứ hai là σ2, ta có các giả thuyết đảo tương ứng với các câu hỏi
trên là:

93
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

H0: μ1 = μ2;
H0: μ1 ≤ μ2;
H0: μ1 ≥ μ2;

Việc kiểm định các giả thuyết thống kê trên được dựa trên các số liệu sau:

1. Phương sai của các tập mẫu:

1 N1
2
S =
1 ∑ (Yi − Y )2 (3.12)
N 1 − 1 i =1

1 N2
2
S =
2 ∑ (Zi − Z )2 (3.13)
N 2 − 1 i =1

2. Số bậc tự do của các tập mẫu:

ν 1 = N1 − 1;ν 2 = N 2 − 1 (3.14)

Trong đó, N1 và N2 lần lượt là số phần tử của các tập mẫu Y và Z.

3.3.1. Phân phối F

Phân phối F (F-distribution) thực chất là kết quả phép chia của hai
phân phối χ2 giữa hai tập dữ liệu toàn bộ. Đường cong phân phối F có
phương trình mô tả ở dạng:

χ u2
F = u2 (3.15)
χν
v

Trong đó, u và ν lần lượt là số bậc tự do của phân phối χ2 của các
tập toàn bộ.

94
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Phân phối F được sử dụng để quyết định xem hai tập toàn bộ có
cùng phương sai hay không. Đồ thị phân phối F cũng lệch phải như đồ thị
của phân phối χ2. Đồ thị này mô tả ảnh hưởng của số bậc tự do đến hình
dạng của phân phối. Hình 3.3 minh họa hai dạng phân phối: phân phối F và
phân phối χ2 được vẽ bằng Minitab.

Hình 3.3. Các đồ thị phân phối F và phân phối χ2

3.3.2. Cách thức kiểm định giả thuyết

Cách 1. Tính toán bằng tay được thực hiện theo các bước sau:

Bước 1. Tính các số liệu sơ bộ theo các công thức trên;

Bước 2. Tính giá trị F của hai tập dữ liệu mẫu theo công thức:

S12
F= 2 (3.16)
S2

95
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Bước 3. Tra bảng xác suất của phân phối F để tìm các giá trị t giới hạn, tùy
thuộc mức ý nghĩa α và cách phát biểu giả thuyết đảo. Nếu giả thuyết đảo
cho rằng μ1 = μ2 thì tra bảng tìm Fα/2;ν2;ν1. Nếu không, tra bảng tìm
Fα;ν2;ν1.

Các chú ý khi tra bảng phân phối F:

1. Do đặc tính của phân phối F, giá trị F1-α/2;ν2;ν được suy ra từ giá trị
Fα/2;ν2;ν theo công thức sau:

1
F1−α / 2 ;ν 1 ;ν 2 = (3.17)
Fα / 2 ;ν 1 ;ν 2

2. Với giả thuyết 2 phía, nếu mức ý nghĩa là α, tra bảng F với mức
α/2;
3. Khi tra bảng F, số bậc tự do của tập mẫu trên tử số của công thức
tính F được hiển thị phía trên bảng; số bậc tự do của tập mẫu dưới
mẫu số của công thức tính F được hiển thị phía bên trái bảng.

Bước 4. So sánh F với F tra bảng và đưa ra kết luận:

- Với H0: μ1 = μ2; loại bỏ H0 nếu F1-α/2;ν2;ν < F < Fα/2;ν2;ν1.


- Với H0: μ1 > μ2; loại bỏ H0 nếu F > Fα;ν2;ν1.
- Với H0: μ1 < μ2; loại bỏ H0 nếu F > Fα;ν2;ν1.

Cách 2. Tính toán bằng máy. Xem ví dụ minh họa phía dưới đây.

3.3.3. Ví dụ minh họa

Ví dụ 3.3.

Xét tình huống so sánh thời gian lắp ráp của bài toán trong ví dụ 3.1. Câu
hỏi tiếp theo đặt ra ở đây là liệu thời gian lắp ráp tất cả các sản phẩm trên

96
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

dây chuyền 2 có ít biến động hơn trên dây chuyền 1 không? Nói theo ngôn
ngữ thống kê, ta cần kiểm tra xem độ lệch chuẩn của thời gian lắp ráp trên
dây chuyền 2 có nhỏ hơn độ lệch chuẩn của thời gian lắp ráp trên dây
chuyền 1 hay không? Giả sử chọn độ tin cậy là 95%.

Giải

Cách 1. Tính toán bằng tay

Bước 1. Phát biểu giả thuyết thống kê

Gọi độ lệch chuẩn của thời gian lắp ráp mỗi sản phẩm trên dây chuyền 1 là
σ1; trên dây chuyền 2 là σ2, ta phát biểu giả thuyết thống kê dưới dạng:

H0 :σ1 = σ2;
H1 : σ 1 > σ 2 .

Bước 2. Tính giá trị F:

S12 4,9082 2
F= 2 = = 3,60
S 2 2,5874 2

Bước 3. Tra bảng tìm giá trị giới hạn của F. Lưu ý rằng đây là giả thuyết 1
phía. Mức α=1-0,95=0,05. Tra bảng phân phối F với α=0,05; ν1 = 11-1=10
và ν2 = 9-1 = 8, ta được giá trị Fα; ν1; ν2 = F0,05; 10; 8 = 3,35.

Bước 4. So sánh ta thấy (F=3,60) > (F0,05; 10; 8 = 3,35), do vậy có thể loại bỏ
H0. Ta kết luận rằng, với độ tin tưởng 95%, dây chuyền 2 có biến động thời
gian lắp ráp sản phẩm nhỏ hơn của dây chuyền 1.

Cách 2. Thực hiện trên Minitab

97
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Minitab chỉ hỗ trợ kiểm tra khả năng bằng nhau của 2 phương sai
chứ không có lựa chọn phát biểu giả thuyết chính. Tuy vậy, ta có thể dùng
Minitab tính các giá trị F tùy thuộc mức α nào đó; hoặc tính p-value theo
giá trị F được nhập. Điều này thuận tiện và chính xác hơn tra bảng rất
nhiều. Để tính toán, kích menu Calc> Probability Distribution>F… Cách
nhập các thông số và tùy chọn hoàn toàn tương tự như với phân phối chuẩn
(Xem phần 2.2.2. “Tính xác suất trên máy tính” của chương 2).

Có thể sử dụng chức năng vẽ đồ thị phân phối F để đồng thời xác định các
giá trị F giới hạn hoặc p-value ứng với giá trị F nào đó, vừa minh họa cho
kết quả tính toán bằng đồ thị. Kích menu Graph>Probability Distribution
và chọn View Probability. Chọn dạng phân phối là F. Trong nhãn Shared
Area, chọn cách tính thông số. Nếu chọn Probability để nhập giá trị α;
Minitab sẽ xuất ra các giá trị F giới hạn (như khi tra bảng). Nếu chọn X
value để nhập giá trị F tính theo các tập mẫu, Minitab sẽ xuất ra giá trị p-
value. Căn cứ giá trị p-value, ta có thể đưa ra kết luận tính toán. Nếu p-
value nhỏ hơn mức α, ta loại bỏ giả thuyết đảo.

Hình 3.4. Minh họa cách vẽ và tính các thông số của phân phối F

98
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

3.4. Xác định số lượng mẫu thực nghiệm

Một câu hỏi luôn được đặt ra với người làm thực nghiệm là: cần
khảo sát bao nhiêu mẫu thì đủ? Dĩ nhiên, số lượng mẫu càng lớn thì càng
có độ tin cậy cao hơn, giảm được các sai số do ảnh hưởng ngẫu nhiên nhiều
hơn. Tuy nhiên, để có nhiều mẫu, cần làm thí nghiệm nhiều lần. Vậy cần có
ít nhất bao nhiêu mẫu?

Việc tìm ra câu trả lời chính xác là rất không dễ dàng. Số lượng
mẫu tối thiểu phụ thuộc vào loại kiểm định cần tiến hành. Dưới đây trình
bày trình bày cơ sở tính toán số lượng mẫu cho một số loại kiểm định đã
biết. Các công thức tính toán bằng tay được lấy theo “Sổ tay thống kê kỹ
thuật” (Engineering Statistics Handbook). Cách xác định bằng máy tính
được tham khảo từ trợ giúp của Minitab.

Cách xác định số lượng mẫu cho các loại khác sẽ được giới thiệu
trong các chương tương ứng.

3.4.1. Tính số lượng mẫu bằng tay

Để xác định số lượng mẫu cần thiết nhằm suy diễn cho một tập mẫu
mà chưa biết giá trị trung bình của nó, cần dựa vào các thông tin sau:

- Giá trị mức ý nghĩa α - mức độ mạo hiểm khi loại bỏ một giả
thuyết đúng;
- Giá trị mức β - mức độ mạo hiểm khi chấp nhận một giả thuyết
đảo sai;
- Giá trị của độ lệch chuẩn của tập toàn bộ.

Khái niệm về sai số đánh giá δ: là giá trị sai số bé nhất mà ta có thể
chấp nhận khi tính toán thống kê. Chẳng hạn, một phát biểu khi dự đoán
giá trị trung bình của tập toàn bộ có dạng:

99
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

H 0 : μ = a;
H1 : μ ≠ a

Vì ta chỉ ước đoán về giá trị trung bình của tập toàn bộ chứ không
thể biết chính xác về nó, ta phải chấp nhận một sai số. Chẳng hạn, những
giá trị a±δ, với δ là sai số cho phép, có thể được coi là thỏa mãn giả thuyết
μ=a.

Ví dụ, ta muốn kiểm tra xem đường kính trung bình của tập các
đường kính trục có bằng 50 không; với sai số bằng 0,05. Điều này có nghĩa
là các trục có kích thước nằm trong khoảng 50±0,05 được coi là có đường
kính bằng 0,05 và trái lại. Ta nói, sai số đánh giá của thống kê của ta là
0,05.

Dễ thấy, số lượng mẫu càng lớn thì ta càng có cơ hội dự đoán được
giá trị cần tính của tập toàn bộ sát thực hơn; tức là ta càng có thể ấn định
giá trị nhỏ hơn cho δ. Thực tế, người ta thường lấy giá trị của δ = k.σ với
k≤1 nhằm đơn giản hóa tính toán.

Nếu biết trước độ lệch chuẩn của tập toàn bộ, số lượng mẫu tối thiểu có
thể được xác định theo công thức:

- Khi kiểm định giả thuyết hai phía:

2
⎛σ ⎞
N ≥ (Zα / 2 + Z β )
2
⎜ ⎟ (3.18)
⎝δ ⎠

- Khi kiểm định giả thuyết một phía:

2
⎛σ ⎞
N ≥ (Zα + Z β ) ⎜ ⎟
2
(3.19)
⎝δ ⎠

100
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Trong đó, Zα và Zβ là các giá trị giới hạn tra trong bảng xác suất phân phối
chuẩn chuẩn hóa.

Ví dụ 3.5. Tính số lượng mẫu cho một thử nghiệm nhằm ước đoán trung
bình của một tập toàn bộ với mức ý nghĩa α=0,05 và mức độ mạo hiểm
β=0,1. Hy vọng dự đoán được giá trị trung bình sai khác so với thực tế
không quá một lần độ lệch chuẩn (δ=σ).

Giải: Với giả thuyết một phía, ta có số lượng mẫu tối thiểu là:

2 2
⎛σ ⎞ 2⎛σ ⎞
N ≥ (Zα + Z β ) ⎜ ⎟ = (Z 0,05 + Z 0,1 ) ⎜ ⎟ = ( 1,64 + 1,28) .1 = 8,57 ≈ 9
2 2

⎝δ ⎠ ⎝σ ⎠

Trong trường hợp ta muốn dự đoán chính xác hơn, chẳng hạn với δ=0,5σ
thì:

2 2
⎛σ ⎞ 2⎛ σ ⎞
N ≥ (Zα + Z β ) ⎜ ⎟ = (Z 0,05 + Z 0,1 ) ⎜ ⎟ = (1,64 + 1,28) .22 = 34,18 ≈ 35
2 2

⎝δ ⎠ ⎝ 0,5σ ⎠

Nếu chưa biết độ lệch chuẩn của tập toàn bộ, phép suy diễn dựa trên
phân phối t. Khi này, công thức dự đoán số mẫu tối thiểu cần thiết sẽ có
dạng:

- Khi kiểm định giả thuyết hai phía:

2
⎛s⎞
N ≥ (tα / 2 + tβ )
2
⎜ ⎟ (3.20)
⎝δ ⎠

- Khi kiểm định giả thuyết một phía:

2
⎛s⎞
N ≥ (tα + tβ ) ⎜ ⎟
2
(3.21)
⎝δ ⎠

101
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Trong các công thức (3.20) và (3.21) trên, giá trị độ lệch chuẩn s
của tập mẫu là chưa biết (vì ta chưa tiến hành thí nghiệm và thu thập dữ
liệu). Nhưng bằng cách chọn sai số δ là một tỷ lệ của s, ta luôn xác định
được tỷ số s/δ. Tuy nhiên, trở ngại chính là để tra các giá trị giới hạn tα, tβ,
ta cần biết số bậc tự do của tập mẫu: ν=N-1. Vì số lượng mẫu là đang cần
tìm nên ta cũng không thể xác định được số bậc tự do này.

Để giải quyết khó khăn này, người ta thường khởi tạo sơ bộ một giá
trị N tối thiểu theo kinh nghiệm, sau đó tra bảng tính các giá trị giới hạn
của t để tính ra một giá trị N mới. Dùng giá trị N mới này, lặp thêm một lần
tính toán nữa. Chẳng hạn, với giả thuyết 1 phía, α=0,05 và β=0,1, chọn
δ=σ, ta khởi tạo một giá trị N=9 (do vậy số bậc tự do tập mẫu là 8) và tính
được như sau:

2
⎛s⎞
N ≥ (t 0,05; 8 + t0,1; 8 ) ⎜ ⎟ = ( 1,86 + 1,40) .1 = 10,6 ≈ 11
2 2

⎝δ ⎠

Lặp tiếp lần nữa với N=11, ta tra bảng các giá trị t cho phân phối t với bậc
tự do tập mẫu bằng 10, thu được:

2
⎛s⎞
N ≥ (t 0 ,05;10 + t 0,1;10 ) ⎜ ⎟ = ( 1,81+ 1,37) .1 = 10,11 ≈ 11
2 2

⎝δ ⎠

Kinh nghiệm cho thấy, chỉ cần lặp thêm một lần là đủ.

Số lượng mẫu cho thực nghiệm so sánh hai tập toàn bộ được lấy
bằng hai lần giá trị tính theo các công thức trên, tùy theo dạng kiểm định
giả thuyết thống kê. Lưu ý là số lượng mẫu này là số lượng cần lấy từ mỗi
tập được so sánh.

3.4.2. Tính số lượng mẫu bằng máy tính

102
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Khái niệm “Năng lực thống kê” (Statistical Power): là xác suất ta có thể
chắc chắn loại bỏ một giả thuyết đảo khi nó sai. Năng lực thống kê được
tính bằng 1-β, trong đó β là xác suất mắc sai lầm loại II.

Khi tính toán trong Minitab, ta thường cần nhập mức α thông qua hộp nhập
“Confidence level” (=1–α). Còn để mô tả β, ta sử dụng thuật ngữ Power.
Giá trị của Power bằng 1-β.

Để tính số lượng mẫu cần thiết, kích menu Stat>Basic Statistics>Power


and Sample Size rồi chọn một trong các nhánh sau:

- 1-Sample Z: để tính số mẫu khi dùng kiểm định Z;


- 1-Sample t: để tính số mẫu khi dùng kiểm định t một tập dữ
liệu;
- 2-Sample t: để tính số mẫu khi dùng kiểm định t cho hai tập dữ
liệu;

Các thông số và lựa chọn được nhập thông qua ba hộp thoại được mô tả
dưới đây.

1. Hộp thoại tùy chọn đầu tiên sẽ hiển thị với các lựa chọn sau:

- Specify values for any two of the following: Nhập hai trong ba thông
số dưới đây. Minitab hiển thị 3 hộp nhập số liệu để nhập 3 thông số liên
quan nhau như dưới đây. Ta cần nhập trước giá trị cho hai trong số ba
thông số trên. Minitab sẽ tính cho ta thông số còn lại.

o Power value: Nhập một hoặc nhiều giá trị của mức năng lực thống
kê mong muốn. Các giá trị cần cách nhau bằng dấu cách trắng. Sau
này, ứng với mỗi giá trị này, Minitab sẽ cho ra một giá trị hoặc là số
lượng mẫu cần thiết; hoặc là sai số đánh giá có thể đạt được.
o Sample sizes: Nhập một hoặc nhiều số lượng mẫu ấn định trước.
Nếu ta ấn định trước số lượng mẫu, Minitab sẽ tính ra hoặc là năng

103
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

lực thống kê, hoặc là sai số đánh giá có thể đạt được. Để nhập một
loạt các giá trị số lượng mẫu ấn định trước, ta cũng có thể nhập giá
trị đầu tiên, dấu hai chấm, giá trị cuối cùng kèm dấu / bước tăng. Ví
dụ, nếu nhập 10:25/5 có nghĩa là ta muốn nhập các giá trị 10; 15;
20; 25.
o Differences: Nhập một hay nhiều giá trị sai số đánh giá. Lưu ý như
sau:
Nếu ta dự định phát biểu giả thuyết thống kê dạng “nhỏ
hơn”, ta cần nhập giá trị sai số đánh giá là số âm;
Nếu ta dự định phát biểu giả thuyết thống kê dạng “lớn
hơn”, ta cần nhập giá trị sai số đánh giá là số dương.
- Standard deviation: Nhập giá trị ước đoán của độ lệch chuẩn. Để nhập
kiểu tính toán mà sai số đánh giá tính theo độ lệch chuẩn, ta có thể
nhập giá trị độ lệch chuẩn bằng 1 và nhập giá trị δ/σ vào hộp
“Differences”.

2. Hộp thoại Option hiển thị các tùy chọn sau:

- Alternative Hypothesis: Khai báo cách phát biểu giả thuyết chính;

• Less than: Giả thuyết chính ở dạng một phía, bên trái.
• Not equal: Giả thuyết chính ở dạng hai phía.
• Greater than: Giả thuyết chính ở dạng một phía, bên phải.
- Significance level: Nhập giá trị mức ý nghĩa . Giá trị ngầm định là
0,05.
- Store sample sizes in: Nhập tên cột lưu trữ các giá trị số lượng mẫu;
- Store differences in: Nhập tên cột lưu trữ các giá trị sai số đánh giá;
- Store power values in: Nhập tên cột lưu trữ các giá trị năng lực thống
kê.

3. Hộp lựa chọn “Graph”: dùng để xác định các lựa chọn vẽ đồ thị năng
lực thống kê phụ thuộc giá trị sai số đánh giá. Mỗi giá trị số lượng mẫu sẽ
được vẽ trên một đường cong. Hộp thoại có các tùy chọn sau:

104
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

- Display power curve: Chọn dấu kiểm sẽ cho phép vẽ đồ thị năng lực
thống kê.
- Generate additional power curves based on Sample sizes: Nhập
thêm một hoặc nhiều giá trị số lượng mẫu để vẽ thêm một số đường
cong năng lực thống kê nữa. Tùy chọn này cho phép ta có thêm các
hình ảnh về mối quan hệ liên kết giữa số lượng mẫu và năng lực thống
kê.

Ví dụ 3.6.

Thực hiện lại ví dụ 3.5 có so sánh các mức năng lực thống kê khác nhau.
Tính số lượng mẫu cho một thử nghiệm nhằm ước đoán trung bình của một
tập toàn bộ với mức ý nghĩa α=0,05 và mức độ mạo hiểm β=0,1; 0,05 và
0,01. Hy vọng dự đoán được giá trị trung bình sai khác so với thực tế
không quá một lần độ lệch chuẩn (δ=σ).

Giải:
Với các mức độ mạo hiểm 0,1; 0,05 và 0,01 ta lần lượt có các mức năng
lực thống kê là 0,9; 0,95 và 0,99. Kích menu Stat>Power and Sample
Size> 1-Sample Z, ta có hộp thoại nhập liệu như hình 3.5.

Hình 3.5. Các hộp nhập liệu cho ví dụ 3.6

105
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Kết quả tính toán được hiển thị trên cửa sổ Session (Hình 3.6a) và đồ thị
(Hình 3.6b).
(a) (b)

Hình 3.6. Các kết quả tính cho ví dụ 3.6

Trên hình 3.6a ta thấy, các giá trị số lượng mẫu cần thiết (cột
Sample Size) sẽ là 9; 11; 16, ứng với các mức năng lực thống kê yêu cầu
lần lượt là 0,9; 0,95; và 0,99 (cột Target power). Vì các giá trị số lượng
mẫu được làm tròn lên số nguyên gần nhất, nên năng lực thống kê thực tế
(Actual Power) sẽ cao hơn 1 chút so với yêu cầu. Dễ thấy, số lượng mẫu
càng lớn thì khả năng mắc sai lầm càng thấp. Hình 3.6b phản ảnh mối
tương quan định tính bằng đồ thị Power.

(a) (b)

Hình 3.7. Ví dụ về số lượng mẫu khi so sánh hai tập và suy diễn trên 1 tập

Khi thực hiện thực nghiệm so sánh, số lượng mẫu yêu cầu gần như
lớn gấp đôi so với khi thực hiện thí nghiệm để suy diễn trên một tập dữ
liệu. Hình 3.7 minh họa điều này. Trên hình 3.7a là số lượng mẫu cần thiết
(18 mẫu) cho một thực nghiệm suy diễn với α=0,05; β=0,01. Còn trên
hình 3.7b là số lượng mẫu cho một so sánh trung bình hai tập dữ liệu, cũng

106
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

với các yêu cầu α và β như trên. Lúc này, số lượng mẫu yêu cầu là 33 cho
mỗi tập mẫu (The sample size for each group).

3.5. Kết luận chương

Thực nghiệm so sánh dùng để so sánh hai quá trình, hai nhóm đối
tượng nhằm chỉ ra sự sai khác giữa chúng. Về bản chất, thực nghiệm so
sánh nhằm phát hiện sự sai khác về giá trị trung bình, về mức độ biến động
giữa hai tập dữ liệu được thu thập từ hai tập mẫu. Thống kê so sánh cho
phép ta khẳng định hai tập khác nhau hay không khác nhau, sai khác nhau
bao nhiêu với mức tin cậy nhất định. Số lượng tập mẫu càng lớn thì ta càng
có khả năng đánh giá, so sánh chính xác hơn. Số lượng mẫu cần thiết được
xác định dựa vào lý thuyết thống kê và có thể tính toán dễ dàng bằng máy
tính.

Câu hỏi chương 3

1. Thực nghiệm so sánh có thể đánh giá những sai khác dạng nào giữa
hai tập toàn bộ?
2. Có mấy cách so sánh sai khác giá trị trung bình giữa hai tập toàn
bộ?
3. Phân phối nào được sử dụng để so sánh trung bình?
4. Những phân phối nào được sử dụng để so sánh lượng biến động
giữa hai tập toàn bộ? Tại sao?
5. Thực hành các ví dụ cho trong bài bằng tay và bằng máy tính.
6. Tại sao cần xác định số lượng mẫu thí nghiệm? Thử xác định số
lượng mẫu cho các ý nghĩa α và mức độ mạo hiểm β khác nhau.

107
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Chương 4.
KẾ HOẠCH THỰC NGHIỆM 2 MỨC
4.1. Giới thiệu

Các thí nghiệm hai mức là các thí nghiệm trong đó mỗi biến thí
nghiệm chỉ được khảo sát ở hai mức giá trị. Tổ hợp giá trị của các biến
phản ánh các xác lập đầu vào đã gây nên giá trị ứng xử tương ứng của hệ
thống. Mỗi cách xác lập này tương ứng với một lần tiến hành thí nghiệm.
Tập hợp biểu diễn tất cả các lần thí nghiệm được gọi là “kế hoạch thí
nghiệm” hoặc “thiết kế thí nghiệm”.

Thí nghiệm hai mức được chia thành hai nhóm chính:
- Thí nghiệm hai mức đầy đủ (còn gọi là thí nghiệm toàn phần hai
mức); thường được ký hiệu là thí nghiệm dạng 2k.
- Thí nghiệm hai mức riêng phần, được ký hiệu là thí nghiệm
dạng 2k-m.

4.2. Thí nghiệm đầy đủ 2k

Kết quả thí nghiệm hai mức đầy đủ cho phép ta xác định ứng xử
của đối tượng ở tất cả các cấp độ và các khả năng tương tác của các biến
thí nghiệm. Tập hợp các thí nghiệm với k biến, mỗi biến nhận 2 mức giá trị
được gọi là thí nghiệm đầy đủ 2k. Tổng số thí nghiệm cho mỗi lần lặp tất cả
các thí nghiệm là 2k.

4.2.1. Thí nghiệm 22

Thí nghiệm 22 là dạng thí nghiệm đơn giản nhất của thí nghiệm toàn
phần hai mức. Nghiên cứu chỉ tiến hành trên hai biến thí nghiệm. Mỗi biến

108
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

cũng chỉ nhận hai giá trị, được xác định bởi người làm thí nghiệm. Tổng số
thí nghiệm cho mỗi lần lặp là 22 = 2x2 = 4 thí nghiệm.

4.2.1.1. Ví dụ

Để làm quen với các thuật ngữ được sử dụng trong thiết kế và xử lý số liệu
thí nghiệm, ta xét một ví dụ minh họa sau đây.

Ví dụ 4.1. Khảo sát ảnh hưởng của lượng chạy dao và chế độ trơn nguội
đến nhám bề mặt của một quá trình gia công. Hai yếu tố này thay đổi trong
khoảng như dưới đây.

Thông số \ Cấp độ Thấp nhất Cao nhất Kiểu thay đổi


Lượng chạy dao (mm/ph) 0,12 0,38 Liên tục
Chế độ trơn nguội Không có Có Gián đoạn

Tiến hành 4 thí nghiệm và thu được kết quả như bảng 4.1.

Bảng 4.1. Các kết quả thí nghiệm cho ví dụ 4.1.

TT Lượng chạy dao (mm/ph) Chế độ trơn nguội Nhám Ra (μm)


1 0,12 Không có 0,6
2 0,12 Có 0,3
3 0,38 Không có 3,8
4 0,38 Có 3,0

Các câu hỏi đặt ra cần trả lời là:

- Trong hai thông số là lượng chạy dao và chế độ bôi trơn, thông số
nào có ảnh hưởng lớn hơn đến nhám bề mặt?
- Các yếu tố ảnh hưởng đến nhám bề mặt như thế nào?

Trong thí nghiệm này, lượng chạy dao và chế độ bôi trơn được gọi là
các yếu tố thí nghiệm hay biến thí nghiệm. Còn nhám bề mặt được gọi là

109
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

ứng xử (Response) của đối tượng (quá trình gia công), hay còn gọi là hàm
mục tiêu.

Giải

Để tiện cho theo dõi tính


toán, ta sơ đồ hóa các thí
nghiệm như hình 4.1. Các giá trị
ứng xử (nhám bề mặt) được
biểu diễn ở các góc của một
hình vuông. Hai cạnh của hình Hình 4.1. Sơ đồ thí nghiệm của ví dụ 4.1
vuông biểu diễn khoảng thay
đổi của hai biến thí nghiệm. Các
giá trị giới hạn của mỗi biến ghi trên điểm mút của cạnh tương ứng.

1. Xét ảnh hưởng của lượng chạy dao. So sánh sự chênh lệch của
nhám bề mặt khi lượng chạy dao thay đổi, còn chế độ bôi trơn giữ
nguyên:
a. Khi không bôi trơn, lượng thay đổi của nhám bề mặt khi
lượng chạy dao thay đổi là: (ΔRa)0= 3,8-0,6=3,2 (1);
b. Khi có bôi trơn, lượng thay đổi của nhám bề mặt khi lượng
chạy dao thay đổi là: (ΔRa)1= 3,0-0,3=2,70 (2);
c. Ảnh hưởng chung của lượng chạy dao, Ecd chính là trung
bình cộng của (1) và (2): E cd = (3,2+2,7)/2 = 2,95 (3).
2. Xét ảnh hưởng của chế độ bôi trơn.
a. Khi lượng chạy dao thấp, lượng thay đổi của nhám bề mặt
khi thay chế độ bôi trơn là: (ΔRa)- = 0,3-0,6= -0,3 (4);
b. Khi lượng chạy dao cao, lượng thay đổi của nhám bề mặt
khi thay chế độ bôi trơn là: (ΔRa)+ = 3,0-3,8= -0,8 (5);
c. Ảnh hưởng của chế độ bôi trơn là trung bình cộng của hai
giá trị (4) và (5): Ebt = [(-0,3) + (-0,8)]/2 = -0,55 (6).
3. Ảnh hưởng tương tác giữa lượng chạy dao và chế độ bôi trơn.

110
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

a. Xét tương tác giữa lượng chạy dao và chế độ bôi trơn. Giả sử ảnh
hưởng của lượng chạy dao không phụ thuộc vào chế độ bôi trơn thì
các giá trị tính theo (1) và (2) phải bằng nhau. Tuy nhiên, vì có tác
động tương tác của chế độ bôi trơn lên ảnh hưởng của lượng chạy
dao, dẫn đến kết quả ảnh hưởng của lượng chạy dao đến nhám bề
mặt thay đổi từ 3,2 μm (tính theo (1)) đến 2,7 μm (tính theo (2)).
Do vậy ảnh hưởng tương tác này được tính Ecd-bt = (2,7 – 3,2)/2 = -
0,25 μm.
b. Tương tự, tương tác giữa chế độ bôi trơn và lượng chạy dao được
tính từ (4) và (5): Ebt-cd = [(-0,8) – (-0,3)]/2 = -0,25 μm.
c. Nhận thấy, tương tác giữa ảnh hưởng của lượng chạy dao đến ảnh
hưởng của chế độ bôi trơn và ngược lại là như nhau.

Ta có thể phân tích lời giải theo một cách tiếp cận khác ngắn gọn hơn. Mã
hóa hai mức giá trị thấp và cao của lượng chạy dao lần lượt là (-1) và (+1).
Mã hóa hai mức “giá trị” của chế độ bôi trơn: không bôi trơn là (-1); có bôi
trơn là (+1). Ký hiệu lượng chạy dao là A; chế độ bôi trơn là B; nhám bề
mặt là Y. Ta tóm tắt kết quả thí nghiệm như trong bảng 4.2. Trong bảng
này, ta thêm một cột AB và điền các giá trị trong mỗi ô của cột này là tích
số các giá trị của A với B cùng hàng.

Bảng 4.2. Mã hóa thí nghiệm cho ví dụ 4.1.

Lượng chạy dao Chế độ Mã hóa Nhám Ra (μm)


TT
(mm/ph) trơn nguội A B AB Y
1 0,12 Không có -1 -1 +1 0,6
2 0,12 Có -1 +1 -1 0,3
3 0,38 Không có +1 -1 -1 3,8
4 0,38 Có +1 +1 +1 3,0

Sử dụng bảng 4.2., ta tính nhanh được các đại lượng như sau:

111
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

1. Ảnh hưởng của lượng chạy dao. Lấy tổng các tích của các ô
trong cột A nhân với cột Y, chia cho 2:

(− 1.0,6)+ (− 1.0,3)+ (1.3,8) + (1.3,0)


Ecd = = 2,95 (5)
2

2. Ảnh hưởng của chế độ bôi trơn. Lấy tổng các tích cột B nhân
với Y, chia cho 2:

( 1.0,6)+ (1.0,3)+ (− 1.3,8) + (1.3,0)



Ebt = = − 0,55 (6)
2

3. Ảnh hưởng tương tác AB. Lấy tổng các tích cột AB nhân với Y,
chia cho 2:

(1.0,6)+ (− 1.0,3)+ (− 1.3,8) + (1.3,0)


E cd −bt = = − 0,25 (7)
2

Có thể thấy ngay các giá trị tính được khớp với kết quả đã tính theo cách
đầu tiên. Cách mã hóa và tính toán như phương án sau được sử dụng trong
các phân tích thực nghiệm do tính tiện dụng của nó. Các phần mềm thiết kế
thí nghiệm cho phép thực hiện mã hóa và tính toán tất cả các đại lượng theo
cả giá trị mã hóa và giá trị thực.

4.2.1.2. Mô tả kế hoạch thí nghiệm 22

Để thuận tiện cho việc trình bày, ta ký hiệu các biến là A và B. Ảnh
hưởng tương tác giữa các biến này được ký hiệu là AB.

Giá trị thực của mỗi biến sẽ tùy thuộc vào thí nghiệm cụ thể. Ở đây,
để thuận tiện cho trình bày, ta sẽ sử dụng ký hiệu mã hóa là “-1” để biểu
diễn giá trị ở mức thấp; ký hiệu “+1” biểu diễn giá trị ở mức cao của mỗi
biến. Bảng 4.3 trình bày các khả năng thiết lập các mức giá trị.

112
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Bảng 4.3. Bảng kế hoạch thí nghiệm dạng 22


Tên biến
A B
Lần chạy
1 (1) -1 -1
2 (a) +1 -1
3 (b) -1 +1
4 (ab) +1 +1

Trong cột “Lần chạy”, ta đã đặt tên cho các lần thí nghiệm như sau:
Lần thứ nhất có giá trị hai biến đều ở mức thấp nhất, ta đặt tên là thí
nghiệm (1). Lần thứ hai, A có giá trị cao nhất, còn B vẫn giữ ở mức thấp
nhất, ta đặt tên là lần chạy a. Tương tự, lần chạy thứ ba trong bảng đặt tên
là b vì có biến B ở mức cao nhất, còn A thấp nhất. Lần chạy cuối cùng đặt
tên là ab vì cả A và B đều ở mức cao nhất.

Cách khởi tạo bảng kế hoạch thí nghiệm như sau: trước hết ta tạo
thí nghiệm (1) cho hàng thứ nhất với điều kiện các biến đều nhận mức thấp
nhất. Tiếp đó, lần lượt tạo các thí nghiệm sao cho mỗi biến nhận mức giá
trị lớn nhất một lần (hàng 2 và 3), biến còn lại nhận mức thấp nhất. Cuối
cùng, cả hai mức nhận giá trị cao nhất (hàng 4). Thứ tự được tạo như vậy
gọi là thứ tự chuẩn của các thí nghiệm. Lưu ý rằng khi thực hiện với trên
một lần lặp, không nên thực hiện liên tiếp hai thí nghiệm có xác lập mức
các biến giống nhau. Ta cần ngẫu nhiên hóa thứ tự thí nghiệm.

Biểu diễn các mức giá trị của các biến dưới dạng một ma trận như sau.

I A B AB
⎡+1 − 1 − 1 + 1⎤
⎢+ 1 + 1 − 1 − 1⎥ (4.1)
⎢ ⎥
⎢+ 1 − 1 + 1 − 1⎥
⎢ ⎥
⎣+1 + 1 + 1 + 1⎦

113
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Ma trận (4.1) được gọi là “ma trận thí nghiệm 22” và được tạo theo
cách sau. Trước hết, ta tạo 2 cột chứa các giá trị của A và B. Sau đó, tạo
một cột bên phải của B để chứa các tương tác AB. Giá trị của cột này là
tích số các giá trị tương ứng của A và B trong 2 cột trước. Cuối cùng, ta tạo
cột I bên trái cột A. Cột này chứa tích số của tất cả 3 cột A, B và AB.
Trong ma trận (4.1), cột I được gọi là cột định danh (Identification);
cột AB chứa các hệ số để tính tương tác ảnh hưởng giữa A và B. Ma trận
có dạng vuông, 4 hàng, 4 cột.
Nhận thấy rằng, tổng các tích số các phần tử cùng hàng của hai cột
bất kỳ của ma trận trên luôn bằng không. Thực vậy, tổng các tích hai cột A
và B sẽ là (-1.-1)+(+1.-1)(-1.+1)(+1.+1)=0. Đặc tính này được gọi là tính
chất trực giao của ma trận. Đặc tính này được thể hiện ở chỗ, mỗi cặp mức
giá trị của các yếu tố xuất hiện với số lần như nhau. Chẳng hạn, cặp (-1;-1)
xuất hiện chỉ 1 lần thì bất kỳ cặp nào khác cũng chỉ xuất hiện một lần. Điều
này dẫn đến tính chất cân bằng của ma
trận. Ma trận thí nghiệm có tính trực giao
và cân bằng là một ưu việt rất lớn của
thiết kế thí nghiệm 2k.

Ma trận thí nghiệm 22 có thể được


biểu diễn dưới dạng hình ảnh như trên
hình 4.2. Mỗi điểm góc của hình vuông Hình 4.2. Sơ đồ thí nghiệm 22
biểu diễn một tập hợp các mức giá trị của
các biến. Chẳng hạn, điểm góc trên bên trái của hình vuông biểu diễn tập
hợp hai mức giá trị: biến A nhận mức cao nhất, còn biến B nhận mức thấp
nhất. Các thí nghiệm dạng này thường được gọi là thí nghiệm tại điểm góc
(Corner points). Cách đặt tên này được sử dụng để phân biệt với thí nghiệm
tại điểm trung tâm (Center Point), là các thí nghiệm được thực hiện với giá
trị mỗi biến được lấy giá trị trung bình cộng các mức cao nhất và thấp nhất
của từng biến.

114
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

4.2.2. Thí nghiệm 23

Thí nghiệm 23 là thí nghiệm thực hiện với ba biến thí nghiệm, mỗi
biến chỉ nhận hai mức giá trị xác định.

Ký hiệu các biến là A, B và C. Ký hiệu mức giá trị thấp của mỗi
biến là -1; mức giá trị cao là +1. Ta có bảng kế hoạch thí nghiệm 23 như
bảng 4.4.

Cách tạo bảng kế hoạch thí nghiệm: Trước hết, ta tạo hàng đầu tiên với
các mức của các biến đều nhận giá trị thấp nhất. Tiếp đó, trong cột “tên thí
nghiệm”, ta lần lượt bổ sung tên đặc trưng cho các mức cao nhất của mỗi
biến (a cho mức cao nhất của biến A; b cho mức cao nhất của biến B…).
Khi đã bổ sung một tên mới, thì ở (các) hàng tiếp theo, ta điền ngay tất cả
các tổ hợp của nó với các tên đã có.

Bảng 4.4. Bảng kế hoạch thí nghiệm 23

STT Tên thí nghiệm A B C


1 (1) -1 -1 -1
2 a +1 -1 -1
3 b -1 +1 -1
4 ab +1 +1 -1
5 c -1 -1 +1
6 ac +1 -1 +1
7 bc -1 +1 +1
8 abc +1 +1 +1

Trình tự tạo kế hoạch thí nghiệm 23 bằng tay (xem bảng 4.4):

Trước hết, điền ký hiệu (1) ở cột “tên thí nghiệm”. Tất cả các ô
trong hàng này được điền giá trị (-1);

115
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Điền ký hiệu “a” vào ô tiếp theo ở cột “tên thí nghiệm”. Trong
hàng này, ô tương ứng của cột A điền giá trị +1; các ô còn lại điền
giá trị -1;
Điền ký hiệu “b” vào ô tiếp theo ở cột “tên thí nghiệm”. Trong
hàng này, ô tương ứng của cột B điền giá trị +1; các ô còn lại điền
giá trị -1;
Đến đây, cần điền ký hiệu “ab” vào ô tiếp theo ở cột “tên thí
nghiệm”. Trong hàng này, các ô tương ứng của cột A và B điền
giá trị +1; các ô còn lại điền giá trị -1;
Điền ký hiệu “c” vào ô tiếp theo ở cột “tên thí nghiệm”. Trong
hàng này, ô tương ứng của cột C điền giá trị +1; các ô còn lại điền
giá trị -1;
Lần lượt điền các ký hiệu “ac”, “bc” vào các ô tiếp theo của cột
“tên thí nghiệm”. Ở hàng “ac”, các ô ứng với A và C cần điền giá
trị +1. Cũng như vậy, ở hàng “bc”, các ô tương ứng với B và C
cần điền giá trị +1. Các ô còn lại đều điền giá trị -1.

Thứ tự các thí nghiệm được tạo như trên được gọi là thứ tự chuẩn
(standard order) hoặc thứ tự
Yates (Yates' order). Quy tắc này
cũng được áp dụng khi số lượng
các biến nhiều hơn 3. Lưu ý rằng
khi thực hiện với trên một lần
lặp, các thí nghiệm cần được
thực hiện theo trình tự ngẫu
nhiên. Tức là không thực hiện
liên tiếp hai thí nghiệm có xác
lập mức các biến giống nhau. Sử Hình 4.3. Sơ đồ thí nghiệm 23
dụng các công cụ hỗ trợ trên máy
tính sẽ giúp ta có kế hoạch thực thi các thí nghiệm thỏa mãn nguyên tắc
này.

116
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Hình 4.3. biểu diễn sơ đồ thí nghiệm 23. Có tổng số tám thí nghiệm cần
thực hiện. Các thí nghiệm này chính là các thí nghiệm tại điểm góc (Corner
points). Các ký hiệu tên thí nghiệm tại điểm góc được hiển thị ở các góc
tương ứng của hình lập phương.

Ma trận thí nghiệm 23

Cũng theo nguyên tắc tạo thêm các cột như với ma trận 22, ta dựng được
ma trận thí nghiệm 23 như trên hình 4.4.

I A B C AB AC BC ABC
+1 -1 -1 -1 +1 +1 +1 -1
+1 +1 -1 -1 -1 -1 +1 +1
+1 -1 +1 -1 -1 +1 -1 +1
+1 +1 +1 -1 +1 -1 -1 -1
+1 -1 -1 +1 +1 -1 -1 +1
+1 +1 -1 +1 -1 +1 -1 -1
+1 -1 +1 +1 -1 -1 +1 -1
+1 +1 +1 +1 +1 +1 +1 +1

Hình 4.5. Ma trận thí nghiệm 23

Tính trực giao của ma trận thí nghiệm

Nhận thấy (xem hình 4.5), các tập mức giá trị xuất hiện với số lần
như nhau (chỉ 1 lần). Tổng các tích số các cặp giá trị cùng hàng của hai cột
bất kỳ của ma trận (trừ cột I) cũng luôn bằng không. Ma trận 23 và tất cả
các ma trận thí nghiệm 2k khác, là những ma trận trực giao. Ma trận thí
nghiệm trực giao cho phép phân tích trực tiếp các ảnh hưởng chính và các
tương tác của các biến thí nghiệm một cách độc lập. Đây là ưu việt lớn của
thiết kế thí nghiệm 2k.

117
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

4.2.2. Bổ sung điểm thí nghiệm trung tâm

Khả năng phát hiện ra các thay đổi nhỏ của hàm mục tiêu khi thực
hiện thí nghiệm 2k sẽ tăng lên nếu thực hiện thêm nhiều lần lặp. Thêm một
lần lặp có nghĩa là ta phải thực hiện tất cả các thí nghiệm một lần nữa. Nếu
chỉ thêm một số chứ không phải toàn bộ các thí nghiệm, sẽ làm mất tính
cân bằng của ma trận thí nghiệm. Tuy vậy, việc thực hiện lại tất cả các thí
nghiệm có thể sẽ rất tốn kém khi số biến thí nghiệm lớn hoặc chi phí cho
mỗi thí nghiệm cao. Một trong những cách bổ sung thêm thí nghiệm là
thêm vào một số điểm thí nghiệm trung tâm.

Điểm thí nghiệm trung tâm (Center Point) là điểm thí nghiệm có
mức giá trị mã hóa của các biến bằng không, nghĩa là điểm giữa của
khoảng thay đổi từ -1 đến +1 của mỗi biến thí nghiệm. Thí nghiệm trung
tâm chỉ có đúng ý nghĩa nếu giá trị các biến là các số (Numeric). Giá trị
thực của một biến tại điểm thí nghiệm trung tâm chính là trung bình cộng
giữa hai giá trị lớn nhất và nhỏ nhất của nó.

Một trong những lý do để bổ sung thêm các thí nghiệm tại điểm
trung tâm là cho phép ta kiểm tra xem liệu hàm mục tiêu có tỷ lệ bậc nhất
(tuyến tính) với các biến hay không. Nếu chỉ thí nghiệm với hai mức cho
mỗi biến, ta không thể kết luận hàm mục tiêu có tuyến tính hay không.
Trong giai đoạn thí nghiệm sàng lọc, ít khi ta cần kiểm tra tính tuyến tính
của hàm mục tiêu. Nhưng ở các thực nghiệm tối ưu, kiểm tra tính tuyến
tính cho phép ta khẳng định, đã đến vùng chứa cực trị của hàm mục tiêu
hay chưa.

Các chi tiết về thiết kế thí nghiệm với điểm thí nghiệm trung tâm sẽ
được trình bày trong chương tiếp theo. Khái niệm “điểm thí nghiệm trung
tâm” trình bày ở đây giúp ta làm quen với thuật ngữ này khi khai thác các
phần mềm thiết kế thí nghiệm.

118
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

4.2.3. Thiết kế thí nghiệm 2k

Kế hoạch thí nghiệm 2k, với k là số biến thí nghiệm bất kỳ cũng
được xây dựng dựa trên nguyên tắc thứ tự chuẩn như trên. Tuy nhiên, khi
số biến lớn, việc lập kế hoạch bằng tay như trên sẽ mất nhiều thời gian.
Dưới đây sẽ trình bày kỹ thuật khai thác Minitab cho thiết kế 2k trên máy vi
tính. Phân tích kết quả thí nghiệm sẽ được trình bày trong các chương tiếp
theo.

Để thiết kế một kế hoạch thí nghiệm hai mức bằng Minitab, khởi
tạo một tập tin project mới. Kích menu Stat > DOE > Factorial > Create
Factorial Design.

Hộp thoại Create Factorial Design xuất hiện với các lựa chọn như trên
hình 4.6.

Hình 4.6. Hộp thoại khởi tạo thiết kế thí nghiệm 2 mức

Tiến hành theo trình tự sau đây:

1. Kích chọn 2-level factorial (default generators) để thiết kế hai


mức theo cách khởi tạo ngầm định;
2. Chọn số biến thí nghiệm trong danh sách Number of factors;
3. Kích nút Design;

119
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

4. Chọn “Full factorial” trong danh sách Design;


5. Nếu cần, chọn số lần lặp cho toàn bộ thí nghiệm vào mục Number
of replicates for corner points ;
6. Nếu muốn, chọn số khối muốn sử dụng trong danh sách Blocks;
7. Kích nút OK trong các hộp thoại.

Khái niệm về khối thí nghiệm (Block). Việc phân chia thành các khối
nhằm đảm bảo điều kiện như nhau của các dữ liệu thu được về ứng xử của
đối tượng thí nghiệm. Khi số lượng thí nghiệm nhiều, thời gian thực hiện
thí nghiệm lớn hoặc thực hiện trên các lô vật tư khác nhau, ta cần tạo các
khối. Một khối bao gồm các thí nghiệm thực hiện trong một điều kiện thời
gian (ví dụ một ngày, một ca) hay cùng điều kiện vật tư (ví dụ thực hiện
trên cùng một lô vật liệu từ cùng một nhà cung cấp). Chi tiết về thiết kế thí
nghiệm về khối sẽ được trình bày trong các chương tiếp sau.

Sau khi kích nút OK, Minitab cho hiển thị kết quả kế hoạch thí
nghiệm đã được xây dựng trên cửa sổ Worksheet. Hình 4.5. dưới đây minh
họa kế hoạch thí nghiệm 2 mức với ba biến thí nghiệm, một lần lặp, không
chia khối (số khối bằng 1).

Hình 4.7. Kết quả thiết kế thí nghiệm 23 trên Minitab

Trên hình 4.7, kế hoạch thí nghiệm được trình bày ở dạng bảng gồm
7 cột, 8 hàng. Mỗi hàng chứa các thông số cần thiết lập cho một thí
nghiệm. Cột thứ nhất (Cột C1 trên hình vẽ) được đặt tên là StdOrder, viết

120
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

tắt của Standard Order. Cột này trình bày thứ tự chuẩn của các thí
nghiệm. Cột thứ hai (RunOrder) là thứ tự thực hiện thực tế mà ta nên tuân
thủ khi làm các thí nghiệm. Thứ tự này được khởi tạo theo nguyên tắc ngẫu
nhiên. Trước khi thực hiện thí nghiệm, ta nên sắp xếp lại bảng theo thứ tự
này để dễ theo dõi. Các cột CenterPt (Center Point – điểm ở tâm) hiển thị
trạng thái thí nghiệm có phải thí nghiệm tâm không. Số 1 báo hiệu rằng các
điểm thí nghiệm này là ở các góc của đồ thị thí nghiệm. Cột Blocks hiển thị
số thứ tự của khối chứa thí nghiệm. Các cột tiếp theo (A, B và C) hiển thị
các mức giá trị của các biến

Nhận thấy các cột mức thí nghiệm nhận được giống hệt với kết quả trên
bảng 4.4 cả về thứ tự và cách phối hợp. Khi số biến thí nghiệm lớn, việc sử
dụng máy tính sẽ cho ta kết quả nhanh hơn nhiều so với làm thủ công bằng
tay, đồng thời tránh được các sai sót, nhầm lẫn.

4.3. Thí nghiệm riêng phần 2k-p

4.3.1. Thí nghiệm riêng phần 23-1

Khi số lượng các biến thí nghiệm lớn, việc thực hiện nhiều thí
nghiệm theo dạng thiết kế đầy đủ 2k sẽ gây tốn kém cả về chi phí và thời
gian. Chẳng hạn, nếu số biến cần khảo sát là 8, số thí nghiệm cho một lần
lặp đã là 28 = 256 thí nghiệm. Kế hoạch thí nghiệm riêng phần được thiết
kế nhằm rút ra những nhận xét cơ bản về tương tác giữa các yếu tố chính
với nhau và với hàm mục tiêu nhưng chỉ cần một số ít thí nghiệm.

Thiết kế thí nghiệm riêng phần (Fractional Factorial Design) được


thực hiện dựa trên nguyên tắc về các ảnh hưởng chính. Nguyên tắc này
phát biểu rằng trong hầu hết các trường hợp, ứng xử của đối tượng chỉ bị
ảnh hưởng của một số ít các yếu tố ảnh hưởng chính và một số tương tác
bậc thấp.

Xét ví dụ tạo kế hoạch thí nghiệm ba biến dạng riêng phần 23-1. Với
thí nghiệm đầy đủ, ta cần thực hiện 23 = 8 thí nghiệm. Còn với thí nghiệm

121
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

riêng phần này, ta chỉ cần thực hiện 23-1 = 22 =4 thí nghiệm. Nói cách khác,
ta đã bớt số thí nghiệm đi một nửa. Thực vậy, số thí nghiệm của thí nghiệm
2k-1 là N = 2k-1 = 2k/2. Chính vì vậy, thí nghiệm dạng 2k-1 còn được gọi là
thí nghiệm một nửa (One-half fraction design).

Trình tự tạo kế hoạch thí nghiệm 23-1 như sau. Trước hết, ta tạo
bảng kế hoạch thí nghiệm dạng đầy đủ 22 (xem minh họa trên bảng 4.5).
Sau đó, ở phương án I, ta copy 2 cột A, B sang; đồng thời tạo cột cho biến
C bằng cách lấy tích của 2 cột A và B này. Phương án 1 của thiết kế 23-1
bao gồm 3 cột A, B, C được tạo cho các mức giá trị của 3 biến A, B, C với
chỉ 4 lần chạy. Người ta thường ký hiệu phương án 1 dưới dạng I=ABC.
Có nghĩa là cột I của ma trận thí nghiệm là tích các cột A,B và C; với
C=AB. Ký hiệu I=ABC nói lên quan hệ các cột khi định nghĩa phương án,
và được gọi là quan hệ định nghĩa (Defining Relation). Phương án 2 được
tạo hoàn toàn tương tự, chỉ khác là cột C được lấy giá trị (–AB).

Bảng 4.5. Hai phương án tạo thí nghiệm 23-1

Thí nghiệm Phương án 1; Phương án 2;


TT cơ sở (22) C = AB C = -AB
A B A B C=AB A B C=-AB
1 -1 -1 -1 -1 +1 -1 -1 -1
2 +1 -1 +1 -1 -1 +1 -1 +1
3 -1 +1 -1 +1 -1 -1 +1 +1
4 +1 +1 +1 +1 +1 +1 +1 -1

Hai phương án đều có thể được sử dụng với chức năng và hiệu quả như
nhau. Điều đặc biệt lý thú là nếu ta lần lượt thực hiện hai phương án này,
chúng sẽ lại tạo thành một thí nghiệm đầy đủ 23. Nói cách khác, thực sự ta
đã “chia đôi” kế hoạch thí nghiệm đầy đủ thành hai phần như nhau. Khi có
điều kiện, ta sẽ thực hiện nốt “nửa” còn lại để có được đánh giá đầy đủ về
tất cả các tổ hợp giá trị của các biến.

122
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

4.3.2. Độ phân giải và các dạng thí nghiệm riêng phần 2k-p

4.3.2.1. Độ phân giải thiết kế

Thí nghiệm 23-1 nói trên thuộc nhóm các thí nghiệm riêng phần có độ phân
giải (Resolution) III. Số III có nghĩa là có 3 chữ cái trong ký hiệu của
phương án tạo cột mới.

Trong ký hiệu C=AB, ảnh hưởng của yếu tố chính C được coi như
trùng hợp (confounding) với ảnh hưởng tương tác hai chiều (Two-way
interaction) AB. Yếu tố bị trùng hợp với yếu tố khác nghĩa là không thể
phân tách chúng một cách độc lập. Đây chính là cơ sở để ta hiểu cách định
nghĩa độ phân giải của các thiết kế thí nghiệm.

Trong thiết kế thí nghiệm, có 3 độ phân giải thông dụng nhất là độ


phân giải III, IV và V. Độ phân giải càng cao càng ít bị hạn chế bởi giả
thiết về việc bỏ sót các tương tác. Dưới đây ta tìm hiểu các định nghĩa về
độ phân giải trong thiết kế thí nghiệm.

1. Độ phân giải thiết kế (Design Resolution) là cách mô tả sự mở


rộng cho yếu tố thí nghiệm mà ở đó, các yếu tố ảnh hưởng được
xem xét cùng với các yếu tố khác.
2. Độ phân giải III. Ở độ phân giải này, không có các yếu tố chính
bị trùng hợp, chỉ có yếu tố chính trùng hợp với các tương tác 2
chiều. Ví dụ, các thiết kế 23-1 (C=AB) hay 25-2 (D=AB; E=AC) là
các thiết kế có độ phân giải III.
3. Độ phân giải IV. Ở độ phân giải này, không có yếu tố chính bị
trùng hợp với các yếu tố chính hay tương tác 2 chiều khác. Chỉ
có một số tương tác hai chiều trùng hợp với các tương tác 2 chiều
khác, đồng thời một số yếu tố chính trùng hợp ví các tương tác 3
chiều (3 yếu tố tương tác lẫn nhau). Ví dụ, thiết kế 24-1
(D=ABC); thiết kế 26-2 (E=ABC; F=BCD) là các thiết kế có độ
phân giải IV.

123
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

4. Độ phân giải V. Không có yếu tố chính hoặc tương tác hai chiều
bị trùng hợp với bất kỳ yếu tố chính hay tương tác 2 chiều nào
khác. Tuy nhiên các tương tác hai chiều trùng hợp với các tương
tác 3 chiều khác, đồng thời một số yếu tố chính trùng hợp với các
tương tác 4 chiều (4 yếu tố tương tác lẫn nhau). Ví dụ, thiết kế
25-1 (E=ABCD); thiết kế 28-2 (G=ABCD; H=ABEF) là các thiết
kế có độ phân giải V.

4.3.2.2. Các dạng thiết kế thí nghiệm riêng phần

Có ba dạng thiết kế riêng phần 2k-p, được ký hiệu lần lượt là 2 III
k− p k− p
; 2 IV và
2Vk − p . Trong các ký hiệu này, độ phân giải được ký hiệu bằng chữ số La mã
và viết ở dạng chỉ số dưới. Ký hiệu k chỉ tổng số biến thí nghiệm, p ký hiệu
số biến được giảm bớt. Mỗi biến được giảm bớt được định nghĩa thông qua
các biến khác. Ví dụ, trong thiết kế 26IV− 2 , có hai biến được giảm bớt là E và
F. Chúng được lấy giá trị theo các biến khác: E=ABC; F=BCD. Nghĩa là, ta
chỉ cần làm thí nghiệm cho 4 biến A; B; C và D mà thôi. Bảng 4.6 liệt kê
các phương án thiết kế thí nghiệm riêng phần thông dụng nhất cho số lượng
biến thí nghiệm từ 2 đến 15.

Bảng 4.6. Các phương án thiết kế 2k-p

Số lần Số biến thí nghiệm


chạy
đủ 2 3 4 5 6 7 8 9 10 11 12 13 14 15

4 Đủ III
8 Đủ IV III III III
16 Đủ V IV IV IV III III III III III III III
32 Đủ VI IV IV IV IV IV IV IV IV IV
64 Đủ VII V IV IV IV IV IV IV IV
128 Đủ VIII VI V V IV IV IV IV

Trong bảng 4.6, các ô trống có nghĩa là không có phương án riêng


phần. Các ô có số liệu được chia thành hai phần, phía trên là độ phân giải,

124
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

phía dưới là số thí nghiệm cần thực hiện. Chẳng hạn, với số biến bằng 5, ta
có 3 phương án thiết kế. Phương án đủ 25 sẽ cần 32 lần chạy; phương án
cho độ phân giải là V - ký hiệu là 2V5−1 (E=ABCD; I=ABCDE) sẽ cần 16 lần
chạy; còn phương án 2 5III−2 cho độ phân giải III (D=AB; E=AC; I=ABC) và
cần 8 lần chạy.

Việc xây dựng các kế hoạch riêng phần bằng tay rất phức tạp. Với
sự trợ giúp của các phần mềm thiết kế thí nghiệm, ta chỉ cần khai báo số
biến, số lần chạy mong muốn (hoặc độ phân giải mong muốn), chúng sẽ tạo
rất nhanh và chính xác các bảng kế hoạch cần thiết. Người làm nghiên cứu
sẽ dành được nhiều thời gian hơn cho nghiên cứu của mình. Cách khai thác
máy tính để xây dựng các kế hoạch thí nghiệm riêng phần sẽ được giới
thiệu trong các nội dung phù hợp tiếp sau.

4.3.2. Kế hoạch thí nghiệm P-B

Kế hoạch thí nghiệm P-B (Plackett-Burman design) là kế hoạch thí


nghiệm riêng phần đặc biệt có độ phân giải là III nhưng có số lần chạy rất
ít. Nếu ta giả thiết bỏ qua các tương tác 2 chiều, việc sử dụng thiết kế P-B
sẽ làm giảm bớt số lượng thí nghiệm đi rất nhiều. Một thiết kế P-B với số
lần chạy là n có thể cho phép đánh giá ảnh hưởng của k = n-1 yếu tố.
Chẳng hạn, một kế hoạch thí nghiệm P-B có thể cho phép đánh giá ảnh
hưởng của 19 yếu tố chỉ với 20 lần chạy.

Các kế hoạch thí nghiệm P-B được thiết kế với số lần chạy n là bội
số của 4. Nếu n là bội số của 2, thiết kế P-B trở thành thiết kế 2k-p với độ
phân giải III đã nêu ở trên. Với các giá trị n là 12; 20; 24; 28 và 36, thiết kế
P-B có cấu trúc hình học mang đặc tính khá thú vị. Việc khởi tạo kế hoạch
P-B có cấu trúc hình học (Geometric P-B design) khá đơn giản như sau.
Trước hết, ta cần bộ các giá trị khởi tạo cho cột đầu tiên của bảng kế hoạch
thí nghiệm. Các giá trị này cho trong các tài liệu tra cứu. Thí nghiệm 12 lần
chạy cần bộ khởi tạo gồm 11 giá trị (+1) hay (-1); 20 lần chạy cần 19 giá trị

125
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

… Bảng 4.7 trình bày hai bộ giá trị khởi tạo ứng với n=12 và n=20. Để đơn
giản, ta sử dụng ký hiệu (+) thay cho giá trị (+1); ký hiệu (-) thay cho giá trị
(-1).

Bảng 4.7. Bộ khởi tạo thí nghiệm P-B với n=12 và n=20
n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
12 + + - + + + - - - + -
20 + + - - + + + + - + - + - - - - + + -

Đầu tiên, lấy các giá trị theo đúng thứ tự trong bộ khởi tạo để tạo
thành cột đầu tiên của bảng kế hoạch thí nghiệm gồm k hàng. Tiếp đến cột
thứ hai, ta lấy giá trị ô cuối cùng của cột một làm ô đầu tiên của cột hai
này. Sau đó, lấy lần lượt các ô từ hàng đầu tiên đến hàng k-1 đưa vào các ô
từ thứ hai đến ô cuối cùng của cột hai. điền các giá trị cho cột thứ hai của
bảng kế hoạch thí nghiệm. Cột thứ ba cũng được suy diễn từ cột thứ hai
theo nguyên tắc trên. Cứ như vậy cho đến cột cuối cùng (cột thứ k của
bảng). Cuối cùng, ta bổ sung một hàng thứ n=k+1 có tất cả các ô đều mang
dấu (-).

Hình 4.8. Xây dựng kế hoạch thí nghiệm P-B có cấu trúc hình học

126
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Hình 4.8 minh họa cách thức và kết quả xây dựng kế hoạch thí
nghiệm P-B cho 11 biến với 12 lần chạy.

Kế hoạch thí nghiệm P-B không có cấu trúc hình học (Non-
geometric P-B design) khá phức tạp và không được giới thiệu ở đây. Các
phần mềm thiết kế thí nghiệm đều hỗ trợ xây dựng kế hoạch thí nghiệm P-
B rất nhanh chóng, chỉ thông qua vài thao tác đơn giản.

4.4. Xây dựng kế hoạch hai mức bằng máy tính

Để xây dựng kế hoạch thí nghiệm hai mức bằng máy tính với
Minitab, kích menu Stat > DOE > Factorial > Create Factorial Design.

Bước 1. Chọn dạng kế hoạch thí nghiệm.

Hộp thoại Create Factorial Design xuất hiện (xem hình 4.8).

Hình 4.8. Các lựa chọn thiết kế thí nghiệm

Các lựa chọn có nghĩa như dưới đây:

2-level factorial (default generators): Chọn thiết kế hai mức


chuẩn;

127
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

2-level factorial (specify generators): Chọn thiết kế hai mức có


xác lập riêng;
Plackett-Burman design: Chọn thiết kế kiểu P-B
General full factorial design: Chọn kiểu thiết kế tổng quát khi có
ít nhất 1 biến thay đổi theo 3 mức.
Number of factors: Nhập số biến thí nghiệm.

Nếu muốn thiết kế hai mức đầy đủ hoặc riêng phần bình thường, ta chọn
mục 2-level factorial (default generators ); còn nếu muốn lập kế hoạch thí
nghiệm kiểu P-B, ta chọn Plackett-Burman design. Chọn số biến thí
nghiệm trong danh sách Number of factors.

Bước 2. Khai báo các thông số thiết kế thí nghiệm

Nếu thiết kế hai mức đủ hoặc riêng phần thông thường:


o Kích nút Design để mở hộp thoại con.
o Chọn kiểu thiết kế riêng phần hay đầy đủ trong danh sách
nếu cần;
o Khai báo số thí nghiệm trung tâm muốn bổ sung bằng cách
chọn trong danh sách Number of center points per block.
o Khai báo số lần lặp toàn bộ các thí nghiệm gốc bằng cách
chọn trong danh sách Number of replicates for corner
points.
o Khai báo số khối thí nghiệm (nếu muốn phân chia thành
khối) bằng cách chọn trong danh sách Number of blocks.
Nếu thiết kế dạng P-B:
o Kích nút Design để mở hộp thoại con.
o Khai báo số lần chạy muốn thực hiện bằng cách chọn trong
danh sách Number of runs;
o Khai báo số thí nghiệm trung tâm muốn bổ sung (tối đa 50)
bằng cách gõ vào hộp Number of center points per
replicate;

128
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

o Khai báo số lần lặp cho các thí nghiệm gốc (không kể thí
nghiệm trung tâm được bổ sung) vào hộp nhập Number of
replicates. Chẳng hạn, nếu ta dự định thiết kế 12 lần chạy
và đặt số lần lặp là 2, ta sẽ phải thực hiện 24 thí nghiệm.
o Kiểm vào hộp Block on replicates nếu muốn. Khi này, mỗi
lần lặp sẽ được đặt trong một khối.
Kích nút OK để quay về hộp khai báo chính.

Bước 3. Đặt tên và khai báo khoảng thay đổi các biến. Kích nút Factors
trong hộp thoại chính. Nhập các thông tin theo hướng dẫn dưới đây.

Nhập tên biến vào hộp Name;


Chọn kiểu dữ liệu của biến trong danh sách Type;
Nhập giá trị mức dưới (giá trị thực) của biến vào hộp Low;
Nhập giá trị mức trên (giá trị thực) của biến vào hộp High;
Lặp lại cho từng biến; cuối cùng kích OK.

Hình 4.9. Hộp thoại khai báo biến thí nghiệm

Hình 4.9 minh họa cách khai báo biến cho thí nghiệm 22 trong ví dụ
4.1. Kế hoạch thí nghiệm được Minitab hiển thị trên cửa sổ Worksheet
(xem minh họa trên hình 4.10). Thứ tự chuẩn được liệt kê trong cột
StdOrder. Ta sẽ thực hiện các thí nghiệm theo thứ tự tăng dần của cột
RunOrder. Các thông số thiết lập cho mỗi biến thí nghiệm được liệt kê
trong các ô tương ứng với lần thí nghiệm cần tiến hành.

129
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Hình 4.10. Kết quả kế hoạch thí nghiệm trong Minitab

Nếu muốn sắp xếp lại thứ tự hiển thị các thí nghiệm hay các kiểu
hiển thị các mức giá trị của biến thí nghiệm, hãy kích menu Stat >
DOE > Display Design. Chọn cách cho hiển thị trong hộp thoại như
sau:

Chọn mục Run order for design nếu muốn hiển thị trật tự các
thí nghiệm theo trình tự thực hiện;
Chọn Standard order for design để hiển thị theo thứ tự chuẩn;
Chọn Coded units để hiển thị các mức giá trị của các biến ở
dạng được mã hóa. Mức cao sẽ hiển thị bằng số 1; mức thấp
hiển thị bằng số -1; mức trung tâm sẽ hiển thị bằng số 0;
Chọn Uncoded Units để hiển thị đúng giá trị thực của các biến;

Hình 4.11 minh họa kế hoạch thí nghiệm của hình 4.10 đã đổi sang dạng
mã hóa các mức giá trị và sắp xếp theo thứ tự chuẩn.

Hình 4.11. Hiển thị dạng mã hóa, thứ tự chuẩn của một kế hoạch 22

130
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

4.5. Xác định số lượng thí nghiệm tối thiểu

Số lượng thí nghiệm cho mỗi lần lặp của một kế hoạch thí nghiệm
hai mức được xác định bởi số biến thí nghiệm và dạng thí nghiệm dự định
thực hiện. Chẳng hạn, một thí nghiệm ba biến, hai mức dạng đầy đủ sẽ cần
23 = 8 thí nghiệm gốc; ngoài ra có thể bổ sung một điểm thí nghiệm trung
tâm.

Câu hỏi đặt ra ở đây là ta cần lặp lại bao nhiêu lần để đạt được độ
chính xác cần thiết? “Độ chính xác cần thiết”, theo cách nói thông thường
của ta, cần chuyển thành ngôn ngữ thiết kế thí nghiệm là “mức ảnh hưởng
tối thiểu” (minimum effect). Đây chính là lượng chênh lệch tối thiểu giữa
hai mức giá trị của hàm mục tiêu mà ta mong muốn phát hiện được. Chẳng
hạn, khi làm thí nghiệm xét ảnh hưởng của một số thông số đến sai lệch
kích thước sản phẩm, ta quy ước rằng nếu kích thước biến động quá 0,01
thì được coi là đã có sai khác (có bị ảnh hưởng); còn nếu thấp hơn mức này
thì coi như chưa có ảnh hưởng gì. Mức 0,01 này chính là mức ảnh hưởng
tối thiểu.

Lưu ý rằng các biến đều được mã hóa và có phạm vi thay đổi như
nhau, từ -1 đến +1. Vì vậy, năng lực của một thiết kế 2k để phát hiện được
sự sai khác δ cho mỗi biến là như nhau. Các giá trị thực thấp nhất và cao
nhất của mỗi biến càng xa nhau thì càng có khả năng phát hiện sai khác lớn
hơn.

Dựa trên phân tích mối quan hệ giữa số lượng mẫu và khả năng
kiểm định giả thuyết thống kê cho kiểm định t, người ta xác định được số
lần lặp cần thiết cho thí nghiệm 2k theo công thức sau:

2
1 ⎡ σ ⎤
r ≥ k − 2 ⎢(tα / 2 + t β ) ε ⎥ (4.3)
2 ⎣ δ ⎦

131
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Trong đó, r là số lần lặp toàn bộ các thí nghiệm; σε là phương sai dự đoán
của trường phân bố dữ liệu.

Minitab cung cấp công cụ để tính số lần lặp cần thiết, hoặc năng lực
thống kê (Power) cho các dạng thiết kế thí nghiệm 2 mức, bao gồm dạng
đầy đủ, dạng riêng phần và thiết kế P-B. Có thể tính các thông số sau đây.

Số lần lặp của toàn bộ kế hoạch thí nghiệm;


Năng lực thống kê;
Ảnh hưởng tối thiểu;
Số điểm góc thí nghiệm.

Ta cần nhập ba trong số bốn thông số trên; Minitab sẽ tính ra thông số còn
lại.

Để thực hiện tính toán, kích menu Stat > Power and Sample Size
>2-Level Factorial Design. Hộp thoại xuất hiện có dạng như hình 4.12.

Hình 4.12. Minh họa một hộp tính toán số lần lặp

Các lựa chọn bao gồm:

132
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Number of factors: Số biến thí nghiệm;


Number of corner points: Số điểm góc của sơ đồ thí
nghiệm;
Replicates: Số lần lặp (để trống nếu ta cần tính);
Effects: Giá trị ảnh hưởng tối thiểu;
Power values: Năng lực thống kê;
Number of center points (per block): Số lượng điểm thí
nghiệm trung tâm;
Standard deviation: Độ lệch chuẩn dự đoán của phân phối
hàm mục tiêu.

Ví dụ 4.3. Tính toán số lần lặp cần thiết cho ví dụ 4.1. Cần tiến hành thí
nghiệm cho 2 biến, 2 mức đầy đủ sao cho năng lực thống kê đạt 90%; mức
ý nghĩa α=0,5.

Giải

Giả sử ta dự định thực hiện thí nghiệm đầy đủ và không bổ sung


điểm thí nghiệm trung tâm, ta nhập các thông số như sau (minh họa trên
hình 4.12):

Number of factors: Nhập số biến thí nghiệm là 2;


Number of corner points: Nhập số điểm góc của sơ đồ thí
nghiệm là 4;
Replicates: Để trống;
Effects: Giá trị ảnh hưởng tối thiểu nhập bằng 1; nghĩa là ta
muốn phát hiện sai khác cỡ bằng giá trị sai lệch chuẩn;
Power values: Nhập các giá trị năng lực thống kê bằng 0,8;
0,85; 0,9; 0,95 để có thêm lựa chọn quyết định;
Number of center points (per block): Nhập số lượng điểm
thí nghiệm trung tâm bằng 0;
Standard deviation: Nhập độ lệch chuẩn dự đoán của phân
phối hàm mục tiêu là 1 do ta chưa biết giá trị này. Khi này

133
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

giá trị nhập ở ô Effects sẽ chính là tỷ số giữa sai khác cần


dự đoán so với độ lệch chuẩn.

Kết quả thu được Minitab hiển thị cả trên cửa sổ Session và đồ thị năng lực
tính toán. Hình 4.13 và 4.14 minh họa kết quả này.

Hình 4.13. Số liệu tính toán số lần lặp Hình 4.14. Đồ thị năng lực thống kê
của ví dụ 4.3 của ví dụ 4.3

Quan sát hình 4.13, để ý cột Reps (Viết tắt của Replications) chính là số
lần lặp cần thiết tương ứng với các yêu cầu khác nhau về năng lực thống
kê. Tổng số lần chạy thí nghiệm tương ứng cho trong cột Total Runs. Như
vậy, để đạt được độ tin cậy thống kê cỡ trên 80%, ta cần thực hiện ít nhất 9
lần lặp lại cho toàn bộ kế hoạch thí nghiệm của ví dụ 2.1. Tức là cần thực
hiện tất cả ít nhất 36 thí nghiệm.

Trên hình 4.14, có thể nhận thấy nếu ta dùng các giá trị số lần lặp đã ấn
định để phát hiện các sai lệch càng nhỏ thì năng lực thống kê (độ tin tưởng)
càng thấp. Chẳng hạn, năng lực thống kê để phát hiện sai lệch cỡ 0,5 lần độ
lệch chuẩn chỉ cỡ khoảng 0,4; tức là độ tin tưởng cỡ 40%.

Ví dụ 4.4. Tính toán năng lực thống kê cho bài toán nêu trong ví dụ 4.1.
Giả sử tiến hành thí nghiệm cho 2 biến, 2 mức chỉ với 2; 3 hoặc 4 lần lặp;
mức ý nghĩa α=0,5.

Giải

134
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Thực hiện các thao tác tương tự như trong ví dụ 4.3, nhưng ta nhập các giá
trị 2; 3; 4 vào hộp Replicates của hộp thoại tính toán của Minitab; còn hộp
Power thì để trống. Kết quả cho thấy (xem minh họa trên hình 4.15):

- Các giá trị Power (năng lực tính toán) lần lượt là 0,19; 0,33 và
0,45 tương ứng với các trường hợp lặp 2; 3 và 4 lần. Nói cách khác, kết
luận ta đưa ra dựa vào các thí nghiệm như vậy chỉ có độ tin cậy lần lượt là
19; 33 và 45%.

Hình 4.15. Kết quả tính năng lực thống kê cho thí nghiệm 22

Lặp lại tính toán trên với việc bổ sung các điểm thí nghiệm trung tâm, ta
thấy năng lực tính toán được cải thiện nhưng không nhiều. Chẳng hạn, bổ
sung 2 lần thí nghiệm tại điểm trung tâm với 2 lần lặp, ta sẽ thu được năng
lực thống kê là 0,21; cao hơn so với khi không có điểm trung tâm (0,19).

4.6. Kết luận chương

Trong giai đoạn khởi đầu của nghiên cứu thực nghiệm, ta thường
phải khảo sát một số lượng lớn các yếu tố có thể ảnh hưởng đến đối tượng
cần nghiên cứu. Các thí nghiệm hai mức được thực hiện nhằm chỉ ra các
yếu tố có ít ảnh hưởng nhất, tạo cơ sở định hướng tập trung nghiên cứu cho
những yếu tố quan trọng hơn. Mặc dù thí nghiệm hai mức chỉ khảo sát
được một phạm vi hẹp của giá trị các biến thí nghiệm, nhưng nó lại có khả
năng cung cấp các thông tin hữu ích về ứng xử của đối tượng nghiên cứu.

135
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Thí nghiệm hai mức cho phép khảo sát được xu hướng thay đổi của hàm
đầu ra, do vậy nó có thể được sử dụng để định hướng các thí nghiệm tiếp
theo. Thí nghiệm hai mức là cơ sở để phát triển thành các thí nghiệm cao
cấp và chính xác hơn.

Câu hỏi chương 4

1. Tại sao cần mã hóa các biến thí nghiệm?


2. Kế hoạch thí nghiệm trực giao nghĩa là gì? Kiểm tra tính trực giao
của các kế hoạch thí nghiệm trong các ví dụ trong bài?
3. Tại sao thí nghiệm 2k-1 được gọi là thí nghiệm một nửa?
4. Tiến hành lập kế hoạch thí nghiệm hai mức đầy đủ cho 2, 3, 4, 5
biến bằng tay. Sau đó thực hiện trên máy tính và so sánh kết quả.
5. Giải thích các ký hiệu độ phân giải trong thiết kế thí nghiệm riêng
phần? Lấy ví dụ minh họa?
6. Tiến hành lập kế hoạch thí nghiệm P-B cho 15 biến với 16 lần
chạy?
7. Phân biệt thứ tự thực hiện thí nghiệm với thứ tự chuẩn? Khi nào nên
sắp xếp kế hoạch thí nghiệm theo thứ tự chuẩn? theo thứ tự thực
hiện?
8. Tiến hành thực hiện lại các ví dụ trong bài.

136
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Chương 5.
THỰC NGHIỆM SÀNG LỌC
5.1. Giới thiệu

Trong hầu hết các nghiên cứu thực nghiệm về các đối tượng hay
quá trình kỹ thuật, số lượng các yếu tố có thể ảnh hưởng đến mục tiêu
nghiên cứu thường rất lớn. Nói theo ngôn ngữ nghiên cứu thực nghiệm, số
biến thí nghiệm có thể gây ảnh hưởng đến hàm mục tiêu là không ít. Kế
hoạch thí nghiệm sàng lọc (Screening Experiment Design) được thiết kế
nhằm giảm bớt số biến cần tiến hành thí nghiệm bằng cách chỉ ra các biến
có ảnh hưởng mạnh nhất đến hàm mục tiêu. Căn cứ vào khả năng tiến hành
thí nghiệm, nhà nghiên cứu có thể chọn chỉ một số ít biến và tiến hành tiếp
các thí nghiệm cải thiện hay tối ưu hóa hàm đầu ra.

Các mục đích cần đạt được của thực nghiệm sàng lọc là:

1. Tiến hành số thí nghiệm ít nhất trên số biến nhiều nhất;


2. Đánh giá được mức độ ảnh hưởng của các biến đến hàm đầu ra;
3. Đánh giá được mức độ ảnh hưởng tương tác giữa các biến;
4. Xác định được quan hệ vào-ra đơn giản (bậc nhất) dùng làm cơ
sở cho qua trình cải thiện hoặc tối ưu hóa sau này.

Cách thức thiết kế các kế hoạch thí nghiệm và kiến thức cơ bản về
phân tích ảnh hưởng chính, ảnh hưởng tương tác đã được trình bày trong
chương trước. Nội dung chương này tập trung vào các kỹ thuật phân tích
thống kê cho thực nghiệm sàng lọc bằng máy tính.

5.2. Thiết kế thí nghiệm sàng lọc

Tùy theo số lượng các biến cần khảo sát và đòi hỏi về chi phí, thời gian cho
thí nghiệm, có thể chọn kiểu thiết kế thí nghiệm dạng 2k hoặc 2k-p cho các

137
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

thí nghiệm sàng lọc. Các kỹ thuật phân tích thống kê sẽ cho phép đánh giá
mức độ ảnh hưởng của các biến được xét đến hàm đầu ra cũng như tác
dụng tương tác giữa chúng. Kỹ thuật hồi quy đa biến được sử dụng để xác
định quan hệ giữa các biến với hàm mục tiêu.

Tùy theo yêu cầu thực tế, ta có thể sử dụng kế hoạch thiết kế thí
nghiệm dạng 2k hoặc 2k-1. Nhiều tác giả khuyên rằng, khi số biến thí
nghiệm không quá 5, có thể sử dụng thiết kế 2k. Khi số biến thí nghiệm lớn
hơn 5, nên dùng thiết kế 2k-p. Ví dụ dưới đây minh họa cách thiết kế khác
nhau cho cùng một bài toán. Qua đó, có thể thấy được mức độ chính xác
cũng như khả năng ứng dụng của các dạng thiết kế này.

5.3. Phân tích kết quả thí nghiệm

Sau khi xây dựng được kế hoạch thí nghiệm, ta tiến hành các thí
nghiệm theo trình tự đã được ngẫu nhiên hóa. Trình tự này được hiển thị
trong cột RunOrder của bảng kế hoạch. Tốt nhất là in kế hoạch thí nghiệm
ra giấy và tiến hành thí nghiệm theo trình tự rồi ghi lại kết quả. Cuối cùng
mới nhập vào máy tính để phân tích các số liệu thí nghiệm đã thu thập
được.

Khi làm các bài tập xử lý số liệu thí nghiệm theo các tài liệu hướng
dẫn, cần để ý xem thứ tự các thí nghiệm trong tập số liệu cho trước được
sắp xếp theo thứ tự nào: thứ tự chuẩn hay thứ tự chạy thí nghiệm. Từ đó, ta
cho máy tính sắp xếp lại kế hoạch theo đúng thứ tự cho trong tập số liệu
mẫu để nhập dữ liệu được nhanh và chính xác.

5.3.1. Xử lý số liệu

Trong Minitab, để tiến hành phân tích kết quả thí nghiệm, kích menu
Stat > DOE > Factorial > Analyze Factorial Design. Hộp thoại phân tích
kết quả thí nghiệm của Minitab được hiển thị như trên hình 5.1.

138
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Hình 5.1. Hộp lựa chọn phân tích kết quả thí nghiệm

Tiến hành thực hiện phân tích kết quả gồm các bước sau:

Bước 1.Trước hết, ta khai báo tên các cột chứa hàm mục tiêu bằng cách
kích chuột vào ô Responses. Tên các cột mới nhập dữ liệu được hiển thị
trong danh sách bên trái hộp thoại. Kích chọn tên cột chứa hàm mục tiêu
muốn đánh giá rồi kích nút Select. Nếu muốn chọn nhiều cột, nhấn và giữ
phím Ctrl trong khi kích chọn.

Bước 2. Kích nút Terms để xác định các lựa chọn về các yếu tố đầu vào
muốn đưa vào phân tích. Trong quá trình phân tích, ta thường phải loại bỏ
các yếu tố không có ý nghĩa thống kê nhằm đơn giản hóa mô hình. Nhiều
khi ta cũng cần thử đánh giá mô hình bằng cách thêm, bớt các yếu tố.

Các lựa chọn bao gồm (xem minh họa trên hình 5.2):

Include terms in the model up through order: Chọn cấp độ đánh


giá mức tương tác giữa các yếu tố thí nghiệm. Chẳng hạn, nếu ta
chọn mức 3, các tương tác 3 yếu tố (ABC; BCD; CDE) sẽ được đưa
vào phân tích. Lựa chọn này chỉ được kích hoạt cho dạng thí
nghiệm đầy đủ. Thí nghiệm P-B sẽ không có lựa chọn này.

139
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Available Terms: Danh sách liệt kê các yếu tố bao gồm tên các
biến và các tương tác khả dĩ giữa chúng nhưng không tham gia vào
mô hình phân tích.
Selected Terms: Các yếu tố đã được chọn để đưa vào phân tích.
Include blocks in the model: Đánh dấu kiểm vào mục này nếu kế
hoạch thí nghiệm bao gồm các khối. Thiết kế P-B không có lựa
chọn này. Lựa chọn này chỉ được kích hoạt nếu dữ liệu trong cột
Blocks có nhiều hơn 1 giá trị.
Include center points in the model: Đánh dấu kiểm vào mục này
để khai báo có sử dụng các điểm thí nghiệm trung tâm trong kế
hoạch thí nghiệm. Lựa chọn này chỉ được kích hoạt nếu dữ liệu
trong cột CenterPts có nhiều
hơn 1 giá trị.

Hình 5.2 minh họa hộp thoại Term


của thiết kế hai mức đầy đủ. Để bổ
sung một yếu tố vào mô hình phân
tích, kích chọn tên yếu tố trong danh
sách Available Terms rồi kích nút
> . Nếu muốn chọn nhiều yếu tố,
nhấn và giữ phím Ctrl khi chọn.

Nếu muốn loại bỏ một hay nhiều Hình 5.2. Hộp Terms
yếu tố ra khỏi mô hình phân tích, cho thí nghiệm 2 biến
kích chọn yếu tố đó trong danh sách Selected Terms rồi kích nút < .
Kích nút >> sẽ chuyển toàn bộ các yếu tố vào mô hình phân tích. Kích
nút << sẽ loại bỏ tất cả các yếu tố khỏi mô hình phân tích.

Kinh nghiệm thống kê cho thấy, trong hầu hết các trường hợp,
tương tác ba yếu tố rất ít khi có ảnh hưởng đáng kể đến ứng xử của đối
tượng. Do vậy, thông thường, ta chỉ cần xét đến tương tác hai yếu tố. Để ấn
định xem xét đến mức tương tác hai yếu tố, trong hộp Term (xem hình

140
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

5.2), ta chọn giá trị là 2 trong danh sách Include terms in the model up
through order.

Bước 3. Kích nút Graphs để lựa chọn vẽ các đồ thị thống kê. Các đồ thị
thống kê không những cho ta cái nhìn trực quan về kết quả thống kê, mà
còn hiển thị các thông tin cốt yếu liên quan đến kết quả thống kê. Hộp thoại
Graphs được minh họa trên hình 5.3.

Hình 5.3. Hộp thoại Graphs khi phân tích thí nghiệm

Để lựa chọn vẽ các đồ thị đánh giá các yếu tố ảnh hưởng chính,
trong danh sách Effects plots, kiểm vào hộp Normal để vẽ đồ thị ảnh
hưởng dưới dạng xác suất chuẩn hóa, kiểm hộp Pareto để vẽ đồ thị Pareto.
Đồ thị Half Normal có ý nghĩa tương tự đồ thị Normal nhưng chỉ vẽ nửa ở
phía dương. Ý nghĩa các đồ thị này sẽ được phân tích trong các phần tiếp
theo. Mức ý nghĩa α được khai báo trong hộp nhập có tên Alpha.

141
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Mục Residuals for plots cho phép ta lựa chọn cách sử dụng các số
dư của dữ liệu thí nghiệm so với mô hình hồi quy để vẽ đồ thị. Lựa chọn
Regular sẽ số dư với các giá trị thực; lựa chọn Standardized sẽ dùng các
số dư được chuẩn hóa. Lựa chọn Deleted để sử dụng phép chuẩn hóa
student, nhằm xem xét các điểm kỳ dị.

Mục Residual plots cho phép lựa chọn vẽ các đồ thị thống kê về số
dư (sai khác) của dữ liệu thí nghiệm so với giá trị hồi quy dự đoán. Đồ thị
Histogram cho ta cách nhìn về phân phối của dữ liệu hàm mục tiêu. Đồ thị
Normal plot cho phép đánh giá xem dữ liệu hàm mục tiêu có tuân theo
phân phối chuẩn hay không. Đồ thị Residual versus fits hiển thị đồ thị các
số dư như một hàm của các giá trị dự đoán khớp với mô hình hồi quy. Đồ
thị Residual versus order hiển thị hàm các số dư theo thứ tự chạy thí
nghiệm nhằm phát hiện có khả năng sai số hệ thống do thời gian không (ví
dụ, thiết bị nóng dần lên gây sai số đo…). Nếu muốn hiển thị cả 4 đồ thị
này trong một cửa sổ, chọn Four in one.

Ta cũng có thể kiểm vào hộp Residual versus variables để vẽ đồ


thị quan hệ giữa các số dư phụ thuộc một hay nhiều biến nào đó. Lựa chọn
này nhằm xem xét khả năng liệu có biến thí nghiệm nào gây sai số hệ thống
hay không.

Ý nghĩa của các đại lượng trên và cách sử dụng chúng trong phân
tích thí nghiệm sẽ được trình bày trong các mục tiếp theo.

Bước 4. Kích nút OK trong các hộp thoại và tiến hành đánh giá các kết quả
thống kê. Minitab hiển thị các số liệu thống kê trên cửa sổ Session. Các đồ
thị thống kê được hiển thị trong các cửa sổ riêng do Minitab tạo ra.

5.3.2. Đánh giá các yếu tố ảnh hưởng chính

Một biến thí nghiệm được coi là có ảnh hưởng mạnh nếu sự thay
đổi của biến gây nên sự thay đổi lớn của hàm mục tiêu đó. Vấn đề là cần

142
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

đánh giá mức độ thay đổi bao nhiêu thì được coi là thay đổi lớn? Câu trả lời
là cần sử dụng xác suất thống kê. Một thay đổi của một đại lượng được coi
là đáng kể khi phép thống kê cho ra kết luận là thay đổi đó “có ý nghĩa
thống kê”. Trong nghiên cứu thực nghiệm, ảnh hưởng của các biến thí
nghiệm được gọi là các ảnh hưởng chính (main effect); ảnh hưởng của các
tác động tương tác giữa các biến được gọi là các ảnh hưởng tương tác
(interaction effect).

Để đánh giá mức độ ảnh hưởng của các biến thí nghiệm một cách
độc lập, ta có thể xét đồ thị các ảnh hưởng chính (Main Effects Plot) như
sau. Kích menu Stat > DOE > Factorial > Factorial Plots rồi kiểm vào
hộp Main Effects. Kích nút Setup để thiết lập các thông số. Trong hộp
thoại Setup, kích chọn các hàm mục tiêu muốn đánh giá. Có thể kích nút
Options để nhập tiêu đề cho đồ thị được vẽ. Đồ thị các ảnh hưởng chính
biểu diễn quan hệ giữa giá trị trung bình của hàm mục tiêu ứng với hai mức
giá trị của từng biến thí nghiệm. Chẳng hạn, đồ thị ảnh hưởng của một biến
A được vẽ bằng cách: xác định giá trị trung bình thứ nhất của hàm mục tiêu
ứng với mức thấp của A. Tất cả các giá trị của hàm mục tiêu ứng với mức
thấp của biến A sẽ được cộng lại và chia trung bình. Tương tự, giá trị trung
bình thứ hai được xác định ứng với mức cao của biến thí nghiệm A. Trục
tung của đồ thị cho biến A là giá trị trung bình của hàm mục tiêu tại mỗi
mức giá trị ứng với biến A. Trục hoành là giá trị của biến A. Đồ thị thực
chất là đoạn thẳng nối hai điểm vừa xác định. Các đồ thị ảnh hưởng cho các
biến khác được vẽ tương tự. Đồ thị ứng với biến nào có độ dốc lớn hơn
chứng tỏ biến đó có ảnh hưởng mạnh đến hàm mục tiêu.

Cũng có thể phân tích định tính bằng cách quan sát các đồ thị thống
kê. Đồ thị Normal Plot of the Standardized Effects (Đồ thị chuẩn hóa các
ảnh hưởng) và đồ thị Pareto của các ảnh hưởng cho ta các thông tin căn
bản về các yếu tố ảnh hưởng chính.

Trên đồ thị Normal Plot, các điểm nằm xa đường chuẩn hóa biểu
diễn cho các yếu tố có ảnh hưởng chính. Minitab ký hiệu các điểm này với

143
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

ghi chú Significant Effect (ảnh hưởng có ý nghĩa). Còn trên đồ thị Pareto,
các yếu tố có ý nghĩa được biểu diễn bằng các thanh nằm ngang vượt qua
đường giới hạn. Trong trường hợp tất cả các yếu tố đều có ảnh hưởng yếu
(thấp hơn mức giới hạn của kiểm định t), Minitab sẽ không hiển thị các đồ
thị này.

Để có phân tích định lượng về các ảnh hưởng chính, ta xem xét các
số liệu tính toán trên cửa sổ Session. Cột P-value liệt kê giá trị xác suất
thống kê dùng cho phép kiểm định t về mức độ quan trọng của từng yếu tố
thí nghiệm. Các yếu tố tương ứng với giá trị p nhỏ hơn mức ý nghĩa α là
các yếu tố có ý nghĩa thống kê về mức độ ảnh hưởng. Điều này sẽ được
trình bày trong phần phân tích hồi quy.

5.3.3. Đánh giá tương tác giữa các biến thí nghiệm

Một biến thí nghiệm A được gọi là có ảnh hưởng tương tác đến biến
B nếu giá trị của biến A gây tác động đến ảnh hưởng của biến B lên hàm
mục tiêu. Ví dụ, khi biến A nhận giá trị a1, một lượng thay đổi ΔB của biến
B làm cho hàm mục tiêu Y thay đổi một lượng ΔY1. Tuy nhiên, khi A nhận
giá trị khác với a1, thì vẫn lượng thay đổi ΔB của biến B lại gây nên sự thay
đổi ΔY2 khác đáng kể so với ΔY1.

Để đánh giá ảnh hưởng tương tác giữa các yếu tố, ta sử dụng đồ thị
tương tác (Interaction Plot). Mỗi đồ thị tương tác sẽ hiển thị khả năng
tương tác giữa hai yếu tố. Mỗi cặp biến thí nghiệm sẽ được đánh giá thông
qua một đồ thị. Đồ thị tương tác biểu diễn giá trị trung bình của hàm mục
tiêu tại hai mức của một biến trong khi biến kia được lần lượt giữ cố định ở
hai mức giá trị. Trên các đồ thị ảnh hưởng tương tác, đồ thị nào có độ dốc
của hai đường biểu diễn hàm mục tiêu càng sai khác nhau thì ảnh hưởng
tương tác giữa hai biến được biểu diễn trên đồ thị đó càng mạnh.

Để vẽ đồ thị tương tác trong Minitab, kích menu Stat > DOE >
Factorial > Factorial Plots rồi kiểm vào hộp Interaction Plot . Kích nút

144
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Setup để thiết lập các thông số. Trong hộp thoại Setup, kích chọn các hàm
mục tiêu muốn đánh giá. Có thể kích nút Options để chọn cách vẽ tương
tác một phía hay hai phía và nhập tiêu đề cho đồ thị được vẽ.

5.3.4. Mô hình hồi quy thực nghiệm

Với quy hoạch thực nghiệm nhiều biến hai mức, phương trình hồi quy ở
dạng hàm đa biến, biểu diễn sự phụ thuộc của hàm mục tiêu vào các biến
thực nghiệm được khảo sát. Do chỉ khảo sát ở hai mức giá trị của mỗi biến,
do vậy quan hệ giữa hàm mục tiêu và các biến chỉ có thể biểu diễn ở dạng:

y = b0 + b1 x1 + b2 x2 + ... + bn xn +
+ b12 x1 x2 + b13 x1 x3 + ... + b1n x1 xn + (5.1)
+... + b12 ...n x1 x2 ... xn

Phân tích hồi quy đa biến cho phép ta xác định các hệ số b0, bx, bxx
trong phương trình (5.1) nói trên.

Phân tích hồi quy luôn được Minitab tích hợp vào trong quá trình
phân tích số liệu thí nghiệm. Cấp độ tương tác giữa các yếu tố trong
phương trình hồi quy tùy thuộc mức xem xét ta đã ấn định ở mục “Include
terms in the model up through order” trong hộp thoại Term. Kết quả
hồi quy được hiển thị trên cửa sổ Session. Bằng cách quan sát các số liệu
thống kê được đưa ra ở đây, ta có thể đưa ra các kết luận có cơ sở định
lượng về kết quả thí nghiệm. Đánh giá qua mô hình hồi quy có độ tin cậy
cao hơn và chính xác hơn đánh giá định tính qua các đồ thị. Có thể tham
khảo cách đánh giá thông qua các ví dụ minh họa dưới đây.

5.3. Các ví dụ minh họa

Tiến trình thiết kế và phân tích một số dạng kế hoạch thí nghiệm đầy đủ
khác nhau bao gồm loại có lặp, có tạo khối và loại không lặp, không tạo
khối được giới thiệu kèm theo ví dụ minh họa dưới đây.

145
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

5.3.1. Thí nghiệm dạng đầy đủ

Ví dụ 5.1. Một thí nghiệm được tiến hành nhằm đánh giá các ảnh hưởng
của các thông số của điều kiện sản xuất đến chất lượng đầu ra của sản
phẩm. Các thông số đầu vào được thiết lập ở hai mức giá trị cho cho trong
bảng 5.1 dưới đây.

Bảng 5.1. Các giá trị thông số đầu vào và biến thí nghiệm cho ví dụ 5.1

Giá trị Giá trị thấp Giá trị cao

Giá trị thực Mã hóa Giá trị thực Mã hóa


Thông số
Thông số 1 20 -1 50 +1
Thông số 2 150 -1 200 +1
Thông số 3 Kiểu 1 -1 Kiểu 2 +1

Nhà sản xuất muốn xác định xem các thông số đầu vào có ảnh
hưởng đến giá trị thông số đầu ra như thế nào để tiến hành cải thiện quá
trình nhằm có được giá trị thông số đầu ra càng lớn càng tốt.

Giải

Do số biến thí nghiệm không nhiều, ta tiến hành thiết kế thí nghiệm
ở dạng 2k đầy đủ. Với 3 biến thí nghiệm, ta có số thí nghiệm cần thiết là 23
= 8. Với mong muốn nâng cao độ tin cậy của các thí nghiệm, ta lặp lại các
thí nghiệm thêm một lần nữa. Như vậy, tổng số thí nghiệm cần thực hiện là
16. Giả sử do điều kiện thời gian, ta chỉ có thể tiến hành 8 thí nghiệm mỗi
ca. Như vậy, ta cần thiết kế thí nghiệm dạng 2 mức đầy đủ, 3 biến và hai
khối. Quá trình thiết kế và phân tích gồm các công việc dưới đây.

1. Thiết kế thí nghiệm

Tạo một tập tin đề án mới trong Minitab, lưu cất tập tin này. Kích
menu Stat>DOE>Factorial>Create Factorial Design. Chọn số biến bằng

146
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

3. Kích nút Design và chọn Full Factorial , chọn số block bằng 2 (như
hình 5.1a). Kích nút OK. Kích nút Factor và nhập các thông số đã cho như
hình 5.1b. Kết quả ta được bảng kế hoạch thí nghiệm như hình 5.2. Kế
hoạch này hiển thị với các giá trị thực của các biến và được sắp xếp theo
thứ tự thực thi. Tiến hành thí nghiệm và đo các giá trị thông số đầu ra và
nhập kết quả vào cột cuối cùng bên phải của bảng kế hoạch trong Minitab.
Đặt tên cho cột này, chẳng hạn ta đặt tên làY.

Hình 5.1. Lập kế hoạch thí nghiệm đầy đủ, lặp 2 lần, 2 khối cho ví dụ 5.1

Hình 5.2. Một phần kế hoạch giá trị thực, sắp xếp theo thứ tự thực thi

Bạn đọc nên nhập lại các thông số và thực hiện theo trình tự được
trình bày ở đây. Như vậy có thể hiểu vấn đề nhanh hơn. Để nhập lại các số
liệu giống như trong tài liệu, hãy chuyển sang cách hiển thị kế hoạch thí
nghiệm theo dạng mã hóa và sắp xếp theo thứ tự chuẩn. Kích menu
Stat>DOE>Display Design, kiểm các mục Standard order for design và
Coded units, kích OK. Các số liệu đầy đủ cho trên hình 5.3.

147
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Hình 5.3. Một phần kế hoạch dạng mã hóa, thứ tự chuẩn

2. Xác định các yếu tố ảnh hưởng chính

Các yếu tố ảnh hưởng chính có thể được xác định một cách định
tính thông qua đồ thị các ảnh hưởng chính (Main Effects Plot). Kích
menu Stat > DOE > Factorial > Factorial Plots. Kiểm vào hộp Main
Effects; Kích nút Setup bên cạnh hộp này và chọn Response là hàm mục
tiêu Y; kích nút >> để chọn tất cả các biến thí nghiệm và đưa vào danh
sách xem xét ảnh hưởng (Xem minh họa trên hình 5.4). Kích nút OK của
các hộp thoại.

Hình 5.4. Các thiết lập vẽ đồ thị ảnh hưởng chính

148
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Đồ thị ảnh hưởng của mỗi biến thí nghiệm được vẽ một cách độc
lập trên một đồ thị chung (xem minh họa trên hình 5.5).

Hình 5.5. Đồ thị các ảnh hưởng chính của ví dụ 5.1

Trên hình 5.5, ba đồ thị ảnh hưởng của 3 biến được vẽ trong ba ô
độc lập nhau. Ô góc trên bên trái của đồ thị biểu diễn ảnh hưởng của biến
x1. Nhận thấy trên đồ thị, khi x1 thay đổi từ -1 đến +1, hàm mục tiêu thay
đổi từ 44 đến 47 (Có thể xác định giá trị chính xác của các số liệu này bằng
cách rê chuột trên điểm mút của đồ thị - xem minh họa trên hình 5.5). Độ
dốc của đồ thị này là (47-44)/2 = 1,5. So sánh định tính cho ta thấy, độ dốc
của đồ thị ảnh hưởng của x1 là lớn nhất; tiếp đến là đồ thị x2 và cuối cùng
là x3. Độ dốc của đồ thị nào càng lớn, thì ảnh hưởng của biến được vẽ trên
đồ thị đó đến hàm mục tiêu càng mạnh. Như vậy, biến x1 có ảnh hưởng
mạnh nhất đến hàm mục tiêu; biến x3 có ảnh hưởng yếu nhất.

Một cách khác để đánh giá các ảnh hưởng chính là xem xét đồ thị
các ảnh hưởng được chuẩn hóa hoặc đồ thị các ảnh hưởng Pareto.

Để thực hiện phân tích các số liệu thí nghiệm và cho hiển thị cácđồ
thị phân tích, kích menu Stat > DOE > Factorial > Analyze Factorial

149
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Design (Xem lại mục 5.3.1). Kích chọn hàm mục tiêu Y cho cho hộp
Response. Kích nút Term; chọn cấp độ xem xét tương tác giữa các biến
(hộp Include terms in the model up through order) là cấp 2; kiểm vào
hộp Include blocks in the model để xem xét yếu tố khối. Kích nút OK
trong các hộp thoại. Kích nút Graph, kiểm vào hộp Normal và hộp
Pareto.

Xem xét đồ thị các ảnh hưởng được chuẩn hóa “Normal Plot of
the Standardized Effects”. Nếu không thấy cửa sổ đồ thị này, kích menu
Window > Effect Plot for Y. Đồ thị được minh họa như trên hình 5.6.

Hình 5.6. Đồ thị ảnh hưởng chuẩn hóa cho ví dụ 5.1

Trên hình 5.6, đồ thị được vẽ cho hàm mục tiêu với mức ý nghĩa
α=0,05. Các yếu tố có ảnh hưởng lớn (Significant) được biểu diễn qua các
điểm hình vuông. Các yếu tố này bao gồm: A (biến x1), B (biến x2) và
tương tác AB (tương tác giữa hai biến x1 và x2). Trong đó, biến x1 (A) có
ảnh hưởng mạnh nhất, do điểm biểu diễn yếu tố A nằm xa đường chuẩn
nhất; kế tiếp là đến yếu tố B và cuối cùng là yếu tố tương tác AB.

Đồ thị Pareto của các ảnh hưởng được minh họa trên hình 5.7. Nếu
không thấy cửa sổ này, hãy kích menu Window > Effects Pareto for Y.

150
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Hình 5.7. Đồ thị Pareto của các yếu tố ảnh hưởng trong ví dụ 5.1

Trên đồ thị hình 5.7, Minitab sử dụng giá trị mức ý nghĩa α để vẽ
đường giới hạn (có hoành độ 2,31 trên đồ thị) của vùng loại bỏ giả thuyết
đảo. Các giá trị ảnh hưởng (đã chuẩn hóa) được biểu diễn dưới dạng các
thanh nằm ngang. Các yếu tố ứng với thanh biểu diễn vượt quá bên phải
đường giới hạn là các giá trị có ảnh hưởng đáng kể. Những yếu tố có biểu
diễn nằm về bên trái đường giới hạn là những yếu tố có ảnh hưởng yếu. Đồ
thị cho thấy các yếu tố: A (biến x1), B(biến x2), AB(tương tác giữa hai
biến x1 và x2) có các giá trị vượt khỏi đường giới hạn. Ảnh hưởng tương
tác sẽ được phân tích kỹ hơn ở phần tiếp theo. Như vậy, hai biến thí
nghiệm x1 và x2 là có ảnh hưởng lớn đến hàm mục tiêu. Điều này phù hợp
với kết luận rút ra từ việc phân tích đồ thị chuẩn hóa các ảnh hưởng ở trên.

Căn cứ vào kết quả đánh giá mức độ ảnh hưởng của các yếu tố thí
nghiệm, ta có thể loại bỏ một số biến có ít ảnh hưởng. Từ đó có thể tiến
hành tiếp các thí nghiệm phức tạp hơn với các biến đã được giữ lại nhằm
khảo sát quá trình một cách chi tiết hơn.

3. Đánh giá ảnh hưởng tương tác giữa các yếu tố

151
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Tiến hành vẽ đồ thị tương tác cho tập dữ liệu thí nghiệm bằng cách
kích menu Stat > DOE > Factorial > Factorial Plots. Kiểm vào hộp
Interaction; kích nút Setup bên cạnh hộp này và chọn Response là hàm
mục tiêu Y; kích nút >> để chọn tất cả các biến thí nghiệm và đưa vào danh
sách xem xét ảnh hưởng (Xem minh họa trên hình 5.4). Kích nút Option và
kiểm vào hộp Draw full interaction plot matrix để vẽ tất cả các dạng
tương tác hai chiều. Minitab gọi đồ thị các tương tác là một ma trận các đồ
thị con (plot matrix). Kích nút OK của các hộp thoại. Đồ thị các ảnh hưởng
tương tác xuất hiện như minh họa trên hình 5.8. Nếu không thấy đồ thị, hãy
kích menu Window > Interaction Plot for Y.

Hình 5.8. Đồ thị các ảnh hưởng tương tác cho ví dụ 5.1

Để tiện cho việc phân tích, ta đánh số các ô của ma trận đồ thị như
trên hình vẽ. Ô thứ ij có nghĩa là ô nằm ở hàng thứ i và cột thứ j của ma
trận. Các ô nằm trên hàng thứ i biểu diễn sự thay đổi của hàm mục tiêu
theo giá trị các biến xj (j≠i) khi xi được đặt ở mức thấp nhất (đường nét
liền) và mức cao nhất (đường nét đứt). Chẳng hạn xét ô 12, ta thấy giá trị
hàm mục tiêu tăng khi x2 tăng từ -1 đến +1; nhưng lượng tăng của hàm
mục tiêu khi x1=-1 là lớn hơn so với lượng tăng của hàm mục tiêu khi
x1=+1. Trên đồ thị, đường nét đứt dốc hơn đường nét liền. Điều này có

152
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

nghĩa là, x1 lớn hay bé có ảnh hưởng đến sự tác động của biến x2 lên hàm
mục tiêu. Nói cách khác, x1 có ảnh hưởng tương tác đáng kể đến ảnh
hưởng của x2. Nhận xét tương tự cũng có thể rút ra bằng cách quan sát ô
21, tức là x2 có ảnh hưởng tương tác đáng kể đến ảnh hưởng của x1. Ta
nói, hai biến x1 và x2 có ảnh hưởng tương tác đáng kể lẫn nhau.

Xét ô 13, ta thấy hai đoạn thẳng trên ô này có độ dốc nhưng lại gần
như song song với nhau. Điều này có nghĩa là mặc dù hàm mục tiêu có
thay đổi khi x3 thay đổi, nhưng lượng chênh lệch tung độ giữa hai đầu mút
mỗi đoạn thẳng thì gần như là bằng nhau dù x1 lớn hay bé. Nói cách khác,
x1 không có ảnh hưởng tương tác đáng kể đến ảnh hưởng của x3. Nhận xét
này cũng được khẳng định trên ô 31, tức là x3 không có ảnh hưởng tương
tác đáng kể đến ảnh hưởng của x1. Ta nói, hai biến x1 và x3 không có ảnh
hưởng tương tác đáng kể đến nhau.

Có thể quét nhanh tất cả các ô và rút ra nhận xét rằng, ô nào có các
đoạn đồ thị có độ dốc khác nhau nhiều thì ảnh hưởng tương tác giữa các
biến tương ứng của ô đó càng đáng kể và ngược lại. Hình 5.8 cho thấy, chỉ
có tương tác x1-x2 là đáng kể; còn lại các tương tác ảnh hưởng x1-x3 và
x2-x3 là không đáng kể. Nhận xét này phù hợp với nhận xét khi phân tích
đồ thị các ảnh hưởng được chuẩn hóa (hình 5.6).

Ghi chú. Các đánh giá dựa trên việc quan sát các đồ thị cho ta kết quả
nhanh nhưng mang tính chất đánh giá định tính. Để có kết luận chắc chắn
hơn, ta cần xem xét các đặc trưng định lượng của các đại lượng. Cách phân
tích định lượng được thực hiện bằng cách xem xét mô hình hồi quy và phân
tích phương sai, được trình bày chi tiết trong phần tiếp theo.

4. Phân tích hồi quy-phương sai

Sau khi ra lệnh phân tích kết quả thí nghiệm như đã trình bày ở trên,
Minitab cho hiển thị các kết quả phân tích mô hình hồi quy và phân tích
phương sai trong cửa sổ Session. Để hiển thị cửa sổ này, kích menu

153
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Window > Session. Để thuận tiện cho việc phân tích, các thông tin này
được hiển thị trong bảng 5.2, được bổ sung thêm cột số thứ tự các hàng.
Lưu ý rằng các phân tích được thực hiện với giá trị của mức ý nghĩa α
được thiết lập là 0,05.

4a. Mô hình hồi quy

Mô hình hồi quy ở mức tương tác hai yếu tố bao gồm 01 số hạng hằng số
(b0), 03 số hạng ứng với 3 biến thí nghiệm (các số hạng ảnh hưởng chính),
03 số hạng của các ảnh hưởng tương tác mức hai. Phương trình hồi quy có
dạng:

y = b0 + b1 x1 + b2 x2 + + b3 x3
(5.2)
+ b12 x1 x2 + b13 x1 x3 + b23 x2 x3

Các hệ số b0, bx, bxx được Minitab liệt kê giá trị trong cột Coef (cột thứ 4
trong bảng 5.2). Tên các yếu tố (bao gồm các biến thí nghiệm và các tương
tác) được liệt kê trong cột Term (cột thứ 2 trong bảng 5.3).

Bảng 5.2. Thông tin mô hình hồi quy cho ví dụ 5.1


Factorial Fit: Y versus Block; x1; x2; x3
Estimated Effects and Coefficients for Y (coded units)
STT Term Effect Coef SECoef T P
1 Constant 45,5581 0,08911 511,26 0,000
2 Block -0,0481 0,08911 -0,54 0,604
3 x1 2,9588 1,4794 0,08911 16,60 0,000
4 x2 2,7637 1,3819 0,08911 15,51 0,000
5 x3 0,1613 0,0806 0,08911 0,90 0,392
6 x1*x2 0,8613 0,4306 0,08911 4,83 0,001
7 x1*x3 0,0737 0,0369 0,08911 0,41 0,690
8 x2*x3 -0,0863 -0,0431 0,08911 -0,48 0,641
9 S = 0,356441 PRESS = 4,0656
10 R-Sq = 98,54% R-Sq(pred)=94,17% R-Sq(adj)=97,27%

Giá trị b0 trong phương trình (5.2) được ký hiệu là constant (hằng
số) trong cột Term của bảng. Các giá trị của các hệ số được liệt kê trong
cột “Coef”. Cột T biểu diễn giá trị tính theo phân phối t của đại lượng được

154
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

xét; cột P liệt kê giá trị xác suất p (p-value) khi kiểm định giả thuyết thống
kê về khả năng các hệ số bằng không. Giá trị p lớn hơn mức ý nghĩa α báo
hiệu rằng việc tồn tại hệ số tương ứng là không có ý nghĩa thống kê. Nói
cách khác, khi p > α, có thể tin tưởng đến (1-α)% để lấy hệ số đó bằng
không. Tức là ảnh hưởng của thành phần tương ứng là không đáng kể đến
hàm mục tiêu.

Quan sát cột giá trị p (cột cuối cùng bên phải của bảng) ta có được
hầu hết các kết luận về các thành phần có thể ảnh hưởng đến hàm mục tiêu.
Trước hết, giá trị p của yếu tố block (0,604) khá lớn so với mức ý nghĩa α
(bằng 0,05). Điều này nói lên việc phân chia khối là không có ảnh hưởng
đến kết quả xây dựng mô hình. Tiếp theo, các biến độc lập có ảnh hưởng
rất mạnh là x1, x2 (các hàng số 3 và 4). Giá trị p ứng với các biến này nhỏ
hơn 0,001 nên Minitab hiển thị giá trị 0,000. Biến x3 (hàng số 5) có mức
ảnh hưởng rất yếu đến mức có thể loại bỏ (p=0,392, lớn hơn α=0,05).
Trong các yếu tố tương tác hai mức, chỉ có cặp tương tác giữa các biến x1
và x2 (hàng số 6) là có ảnh hưởng đáng kể (p=0,001); còn lại các ảnh
hưởng khác đều là các ảnh hưởng yếu (x1x3 có p=0,690 và x2x3 có
p=0,641).

Hàng số 9 và 10 của bảng hiển thị các thông số đánh giá mô hình
hồi quy. Các hệ số quyết định r2 (ký hiệu là R-Sq) và radj
2
(ký hiệu là R-
Sq(Adj)) đều lớn hơn 90%, chứng tỏ mô hình tìm được khớp khá tốt với
dữ liệu.

4b. Phân tích phương sai

Phần tiếp theo của cửa sổ Session là bảng phân tích phương sai
(Analysis Of Variance – ANOVA), được minh họa trong bảng 5.4 dưới
đây.

155
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Bảng 5.4. Bảng phân tích phương sai của mô hình hồi quy cho ví dụ 5.1

Analysis of Variance for Y (coded units)


Blocks 1 0,0371 0,0371 0,0371 0,29 0,604
Main Effects 3 65,6741 65,6741 21,8914 172,31 0,000
2-Way Interactions 3 3,0185 3,0185 1,0062 7,92 0,009
Residual Error 8 1,0164 1,0164 0,1271
Total 15 69,746

Bảng phân tích phương sai có các cột sau:

- Source: danh sách các thành phần được phân tích phương sai;
- DF: số bậc tự do (degrees of freedom) của từng thành phần.
- SS: Tổng các bình phương (sum of squares);
- MS: Bình phương trung bình, là thương của tổng các bình
phương chi cho số bậc tự do;
- F: Giá trị phân phối F thực tế của thành phần được phân tích.
Có thể tra bảng xác suất phân phối F để tìm giá trị giới hạn và
so sánh với giá trị F thực tế để đánh giá mức độ quan trọng (có
ý nghĩa thống kê) của thành phần được phân tích;
- P: Giá trị xác suất p (p-value); thường được so sánh với mức ý
nghĩa α đã chọn để đánh giá xem liệu thành phần đang xét có ý
nghĩa thống kê không. Nếu p<α, thành phần đang xét có ý nghĩa
thống kê.

Trong bảng phương sai, ta quan tâm đến các thông tin sau. Thứ
nhất, các ảnh hưởng chính (Main Effects) có giá trị p rất nhỏ (nhỏ hơn
0,001) chứng tỏ các ảnh hưởng chính là có ý nghĩa thống kê. Các ảnh
hưởng tương tác hai chiều (2-way Interactions) giữa các yếu tố đang xét
cũng có giá trị p cũng rất nhỏ (0,009), chứng tỏ các ảnh hưởng tương tác đó
có ý nghĩa thống kê. Nói cách khác, các ảnh hưởng chính và các ảnh hưởng
tương tác đều đáng kể.

156
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

5.3.2. Thí nghiệm dạng riêng phần

Ví dụ 5.2.

Một nghiên cứu sơ bộ cần đánh giá 6 yếu tố được cho là có thể ảnh
hưởng đến thông số chất lượng của một sản phẩm. Để tiết kiệm kinh phí,
người ta muốn tiến hành số thí nghiệm ít nhất có thể được.

Giải

Với 6 biến thí nghiệm, nếu xây dựng kế hoạch thí nghiệm dạng đầy
đủ, ta cần thực hiện 26 = 64 thí nghiệm cho mỗi lần lặp. Với mong muốn
thực hiện ít thí nghiệm nhất, ta thiết kế kế hoạch thí nghiệm dạng riêng
6− 3
phần với độ phân giải III, tức là sử dụng kế hoạch dạng 2 III . Số thí nghiệm
cần thiết cho mỗi lần lặp là 2 6− 3 = 23 = 8 . Để giảm sai số thí nghiệm, tiến
hành thực hiện 2 lần lặp. Giả sử rằng trong 1 ca, có thể tiến hành hết cả 16
thí nghiệm, ta sẽ thiết kế ở dạng không tạo nhiều khối.

1. Thiết kế thí nghiệm

Khởi tạo file đề án mới


trong Minitab bằng cách chọn File
> New > Minitab Project. Kích
Stat > DOE > Factorial > Create
Factorial Design; nhập số biến
bằng 6 rồi kích nút Design; chọn
mục 1/8 fraction ứng với số lần
chạy là 8 (xem minh họa trên hình
5.9). Nhập số lần lặp là 2 trong hộp Hình 5.9. Khởi tạo kế hoạch 26III− 3
Number of replicates for corner
points. Kích nút OK. Quay về hộp thoại chính, kích nút Factors để khai
báo các tên và giá trị các biến. Có thể để nguyên các mức giá trị các biến là
-1 và +1 để khảo sát ở chế độ mã hóa. Kích nút OK của các hộp thoại.

157
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Giả sử sau khi tiến hành thí nghiệm và thu thập số liệu, ta thu được
các kết quả như hình 5.10. Ở đây ta đặt tên hàm mục tiêu là y_III_2**6-3.

Hình 5.10. Kết quả thí nghiệm cho ví dụ 5.2

2. Phân tích kết quả

2a. Đánh giá các ảnh hưởng


của các biến thí nghiệm

Vẽ đồ thị các ảnh hưởng


chính: kích menu Stat > DOE >
Factorial > Factorial Plots;
kiểm vào hộp Main Effects rồi
kích nút Setup bên cạnh hộp
này. Chọn tên hàm mục tiêu
Hình 5.10.
trong hộp Responses, kích nút
Vẽ đồ thị Main Effects cho ví dụ 5.2
>> để chọn đưa toàn bộ các biến
thí nghiệm vào danh sách đánh giá (Xem minh họa trên hình 5.10). Kích
nút OK trong các hộp thoại.

158
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Hình 5.11 minh họa kết quả vẽ đồ thị các ảnh hưởng chính của 6
biến thí nghiệm. Nếu không thấy cửa sổ này, kích menu Window > Main
Effect Plot for y_III_2**6-3.

Hình 5.11. Đồ thị các ảnh hưởng chính cho ví dụ 5.2.

Có thể nhận thấy ngay qua đồ thị 5.11 là, các biến có ảnh hưởng mạnh đến
hàm mục tiêu là x1, x3 và x4. Như vậy, có thể kết luận sơ bộ là nên chọn 3
đại lượng này làm biến thí nghiệm cho các nghiên cứu thực nghiệm chi tiết
hơn sau này. Tuy nhiên, để khẳng định nhận xét này, ta cần xem xét tiếp
các đồ thị khác và đặc biệt là phân tích hồi quy-phương sai.

Để phân tích kết quả thống kê và vẽ các đồ thị phân tích, kích menu Stat >
DOE > Factorial > Analyze Factorial Design. Các thao tác thực hiện
trong các hộp thoại xin xem lại mục 5.3.1 và ví dụ 5.1. Các đồ thị ảnh
hưởng chuẩn hóa và đồ thị Pareto của các ảnh hưởng của ví dụ 5.2 có dạng
như hình 5.12 và 5.13.

159
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Hình 5.12. Đồ thị các ảnh hưởng chuẩn hóa của ví dụ 5.2

Hình 5.13. Đồ thị Pareto của các ảnh hưởng trong ví dụ 5.2

Cả hai đồ thị đều cho thấy: Biến x3 (ứng với thông số C) có ảnh
hưởng mạnh nhất; tiếp đó là các biến x1 (thông số A) và biến x4 (thông số
D). Các yếu tố còn lại đều có ảnh hưởng không đáng kể. Kết quả này phù
hợp với nhận xét sơ bộ ở phần trên.

160
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

2b. Đánh giá ảnh hưởng tương tác giữa các biến thí nghiệm

Khi vẽ đồ thị các ảnh hưởng


tương tác, ta chỉ giữ lại 3 biến có
ảnh hưởng đáng kể như đã kết
luận ở trên. Để thực hiện điều
này, trong hộp thoại Interaction,
ta kích chọn các biến muốn loại
bỏ (nhấn và giữ phím Ctrl khi
kích) rồi kích nút < để loại
chúng ra khỏi danh sách
Selected (Xem minh họa trên
hình 5.14. Đồ thị tương tác chỉ
Hình 5.15. Gỡ bỏ một số biến
với ba biến sẽ thông thoáng và
dễ quan sát hơn. Kết quả minh họa trên hình 5.15.

Hình 5.15. Đồ thị tương tác ảnh hưởng cho ví dụ 5.2

Kết quả trên đồ thị 5.12 cho thấy, các đoạn thẳng trên các đồ thị gần
như song song với nhau. Do vậy, có thể nói các yếu tố hầu như không có
tác dụng ảnh hưởng tương tác nhau.

161
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

2c. Phân tích hồi quy-phương sai

Kết quả phân tích hồi quy-phương sai được hiển thị trên cửa sổ
Session. Kích menu Window > Session sẽ đưa cửa sổ này lên phía trước
màn hình. Hình 5.16 là ảnh chụp kết quả phân tích của ví dụ 5.2.

Hình 5.16. Kết quả phân tích hồi quy-phương sai của ví dụ 5.2

Trước hết, quan sát phần mô hình hồi quy (Estimated Effects and
Coefficients), ta thấy các hệ số của các biến x1, x3 và x4 đều có giá trị p
rất nhỏ. Điều đó chứng tỏ sự có mặt của các biến này trong phương trình
hồi quy là có ý nghĩa. Các biến và tương tác khác đều có giá trị p lớn hơn
nhiều so với mức ý nghĩa α, do vậy có thể loại bỏ chúng khỏi phương trình
hồi quy.

Phần phân tích phương sai cho thấy, giá trị xác suất p ứng với các
ảnh hưởng chính (Main effects) nhỏ hơn 0,001. Do vậy, các ảnh hưởng của
các biến là đáng kể. Các tương tác hai chiều (2-way Interactions) có p-
value bằng 0,469, lớn hơn nhiều so với mức α (0,05). Do vậy, có thể
khẳng định rằng, các biến không có ảnh hưởng tương tác lẫn nhau.

162
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

5.4. Kết luận chương

Thí nghiệm sàng lọc (Screening Experiments) được thiết kế và thực


hiện nhằm đánh giá các ảnh hưởng của các biến thí nghiệm được cho là có
thể ảnh hưởng đến hàm mục tiêu. Qua đó, người làm thí nghiệm có thể
chọn ra một số ít các biến có ảnh hưởng mạnh để có thể thực hiện tiếp các
thí nghiệm nhằm nghiên cứu sâu hơn. Thí nghiệm sàng lọc cũng nhằm
đánh giá khả năng tác động tương tác giữa các biến thí nghiệm.

Ảnh hưởng của các biến thí nghiệm có thể được đánh giá định tính
thông qua các đồ thị ảnh hưởng chuẩn hóa hoặc các đồ thị ảnh hưởng
Pareto. Ảnh hưởng tương tác giữa các biến có thể được đánh giá định tính
thông qua các đồ thị ảnh hưởng tương tác. Tuy nhiên, sử dụng mô hình hồi
quy và phân tích phương sai cho phép ta đánh giá toàn diện hơn, có cơ sở
định lượng thống kê để có các nhận định chính xác hơn.

Thực nghiệm sàng lọc được tiến hành như một giai đoạn khởi động
nhằm có được cái nhìn cơ bản, sơ bộ về mối quan hệ nguyên nhân-kết quả
của đối tượng nghiên cứu. Tuy vậy, do số lượng thí nghiệm hạn chế, các
kết quả chỉ mang tính tham khảo. Để đưa ra kết luận chính xác hơn, cần
xây dựng và thực hiện các kế hoạch thí nghiệm chi tiết hơn. Chương tiếp
theo sẽ trình bày về một kế hoạch thí nghiệm rất phổ biến nhằm đánh giá,
cải thiện hoặc tối ưu hóa quá trình, đối tượng nghiên cứu.

Câu hỏi chương 5

1. Mục đích của thí nghiệm sàng lọc? Các dạng thiết kế thí nghiệm
thường dùng trong thí nghiệm sàng lọc?
2. Yếu tố ảnh hưởng chính là gì? Các cách thức xác định yếu tố ảnh
hưởng chính?
3. Tại sao cần xác định ảnh hưởng tương tác giữa các biến thí nghiệm?
4. Thực hiện lại các ví dụ đã cho trong bài.

163
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Chương 6.
THỰC NGHIỆM TỐI ƯU HÓA
6.1. Giới thiệu

Một trong những mục đích chính yếu của nghiên cứu thực nghiệm
trong kỹ thuật là tìm giá trị cực trị hay tìm vùng tối ưu cho một quá trình
hay các điều kiện tối ưu để vận hành một hệ thống. Lớp các bài toán nghiên
cứu thực nghiệm về vấn đề tối ưu thường được biết đến với tên gọi
“phương pháp bề mặt chỉ tiêu” (Response Surface Methods – RSM).

Phương pháp bề mặt chỉ tiêu rất hữu ích trong việc phát triển, nâng
cao hiệu quả và tối ưu hóa quá trình sản xuất. Nó cũng có các ứng dụng
quan trọng trong việc thiết kế và phát triển các sản phẩm mới cũng như cải
thiện các sản phẩm hiện có. Nội dung chính của RSM là sử dụng một chuỗi
các thí nghiệm được thiết kế với các mục đích sau:

- Chỉ ra tập giá trị các biến đầu vào (điều kiện vận hành, thực thi)
sao cho tạo ra ứng xử của đối tượng nghiên cứu là “tốt nhất”;
- Tìm kiếm các giá trị biến đầu vào nhằm đạt được các yêu cầu cụ
thể về ứng xử của đối tượng nghiên cứu;
- Xác định các điều kiện vận hành mới đảm bảo cải thiện chất
lượng hoạt động của đối tượng so với tình trạng cũ;
- Mô hình hóa quan hệ giữa các biến đầu vào với ứng xử của đối
tượng nghiên cứu, dùng làm cơ sở để dự đoán hay điều khiển quá
trình hay hệ thống.

Để đạt được các mục đích trên, phương pháp RSM thực hiện việc xây dựng
hàm mô tả bề mặt chỉ tiêu (Response Surface) phụ thuộc các thông số đầu
vào.

6.1.1. Tiến trình tối ưu hóa

164
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Tiến trình tối ưu hoá bằng RSM thường gồm 3 giai đoạn sau:

- Giai đoạn 1: Thí nghiệm khởi đầu. Sau khi tiến hành các thí
nghiệm sàng lọc (Screening Design) nhằm lựa chọn các biến thí
nghiệm được tiếp tục khảo sát, ta phân tích mô hình rút gọn (đã loại
bỏ các yếu tố không có ảnh hưởng đáng kể), nhằm xây dựng mô
hình hồi quy bậc nhất mô tả hàm mục tiêu. Việc đánh giá mức độ
không phù hợp của mô hình bậc nhất cho phép ta kiểm tra được
xem vùng đã khảo sát có ở vùng lân cận cực trị hay không. Nếu mô
hình bậc nhất không phù hợp, có nghĩa là hàm mục tiêu đã ở vùng
lân cận cực trị, chuyển sang giai đoạn 3; trái lại, chuyển sang giai
đoạn 2.
- Giai đoạn 2: Leo dốc tìm vùng cực trị. Nếu vùng thí nghiệm còn
ở xa vùng cực trị, tiến hành các thí nghiệm nhằm tìm nhanh đến
vùng chứa cực trị. Phương pháp thực hiện có tên là Leo dốc/ xuống
dốc (Steepest Ascent/Descent Method) tìm vùng cực trị. Nhiệm vụ
cơ bản là xác định giá trị gia số cho từng biến thí nghiệm. Sau đó
tiến hành các thí nghiệm với các giá trị mới của các biến cho đến
khi hàm mục tiêu đảo chiều thay đổi giá trị. Thí nghiệm xác định
mức độ không phù hợp của mô hình bậc nhất được tiến hành để
khẳng định khả năng đã ở vùng chứa cực trị.
- Giai đoạn 3: Thí nghiệm bề mặt chỉ tiêu. Khi đã ở vùng lân cận
cực trị, tiến hành các thí nghiệm để mô tả quan hệ vào-ra dưới dạng
hàm bậc cao (Hồi quy bậc cao). Các thí nghiệm được thiết kế theo
kế hoạch thí nghiệm bề mặt chỉ tiêu (Response Surface Design).
Cuối cùng, tiến hành phân tích đánh giá kết quả để đưa ra các kết
luận.

Nói chung, tiến trình tối ưu hóa bằng RSM chủ yếu dựa trên các mô
hình hồi quy thực nghiệm. Các kỹ thuật sử dụng trong từng giai đoạn nói
trên sẽ được phân tích chi tiết trong các phần tiếp theo.

165
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

6.1.2. Mức độ phù hợp của mô hình

Trong quá trình đi tìm vùng chứa cực trị của hàm mục tiêu, ta cần
kiểm tra xem mô hình hồi quy mô tả hàm mục tiêu là bậc nhất hay bậc cao.
Sau khi xây dựng hàm mục tiêu, ta tiến hành kiểm định giả thuyết thống kê
để đánh giá xem mô hình đã khớp (fit) với dữ liệu tốt đến mức nào. Việc
đánh giá như vậy được gọi là “kiểm định mức độ không phù hợp của mô
hình” (Lack of fit test). Giả thuyết thống kê được phát biểu như sau:

- Giả thuyết đảo: Mô hình khớp với dữ liệu;


- Giả thuyết chính: Mô hình không khớp với dữ liệu;

Cũng như các phép kiểm định thống kê khác, thông số quan trọng để
chấp nhận hay loại bỏ giả thuyết đảo là giá trị p (p-value). Lý thuyết tính
toán thống kê chỉ ra như sau:

- Nếu giá trị p nhỏ hơn mức ý nghĩa α, ta loại bỏ giả thuyết đảo.
Nghĩa là, mô hình đã xây dựng không khớp với dữ liệu;
- Nếu giá trị p lớn hơn mức ý nghĩa α, mô hình đã dựng là phù hợp
để mô tả dữ liệu;

Để có thể kiểm định về mức độ phù hợp của mô hình, mỗi biến
trong một kế hoạch thí nghiệm cần nhận 3 mức giá trị. Dễ thấy nếu chỉ
khảo sát 2 giá trị của biến, mô hình bậc nhất sẽ luôn tỏ ra là phù hợp với dữ
liệu và do vậy, ta không có khả năng phát hiện khi nào mô hình này là
không phù hợp. Trong các thí nghiệm khởi đầu, để có 3 mức giá trị cho
mỗi biến, ta thường bổ sung điểm thí nghiệm trung tâm - là điểm có giá trị
trung bình cộng của hai giá trị cao nhất và thấp nhất của biến.

6.1.3. Kế hoạch thí nghiệm bề mặt chỉ tiêu

Khi đã ở vùng chứa cực trị, để mô tả chính xác quan hệ giữa hàm
mục tiêu với các biến thí nghiệm, ta cần khảo sát nhiều mức giá trị cho mỗi
biến. Có hai cách xây dựng kế hoạch thí nghiệm là thiết kế thí nghiệm hỗn

166
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

hợp tâm xoay (Central Composite Design – CCD) và thiết kế Box-


Behnken. Các kỹ thuật thiết kế này sẽ được trình bày chi tiết trong các phần
sau.

6.1.4. Tối ưu hóa đa mục tiêu

Bài toán tối ưu hóa một chỉ tiêu nào đó của đối tượng nghiên cứu
được gọi là bài toán đơn mục tiêu (Single Response). Trong trường hợp
này, ta tiến hành xây dựng một mô hình hồi quy cho hàm mục tiêu.

Bài toán tối ưu hóa đồng thời nhiều chỉ tiêu phức tạp hơn không chỉ
ở chỗ cần xem xét nhiều chỉ tiêu, mà còn ở chỗ có một số hàm chỉ tiêu có
“lợi ích” trái ngược nhau. Để giải quyết bài toán này, ta cần chấp nhận một
số nhượng bộ (Trade-offs) nhất định. Một trong các cách tiếp cận bài toán
thực nghiệm tối ưu hóa đa mục tiêu sẽ được trình bày cuối cùng, sau khi
giới thiệu chi tiết từng bước của tiến trình tối ưu hóa đơn mục tiêu.

6.2. Thí nghiệm khởi đầu

6.2.1. Khái niệm

Sau khi tiến hành thí nghiệm sàng lọc, ta cần loại bỏ bớt các biến có
ảnh hưởng không đáng kể đến hàm mục tiêu. Tiếp tục tiến hành một số thí
nghiệm với các biến còn giữ lại, đồng thời bổ sung thêm một số điểm thí
nghiệm trung tâm. Các thí nghiệm này được gọi là thí nghiệm khởi đầu
(Initial experiments) cho quá trình tối ưu hóa. Việc bổ sung điểm trung tâm
cho phép ta đánh giá mức độ phù hợp (Lack-of-fit test) của mô hình hồi
quy bậc nhất đã xây dựng cho hàm mục tiêu. Đây là thông tin quan trọng
để quyết định các bước tiếp theo.

Các phần mềm thiết kế thí nghiệm thường tự động phân tích mức
độ phù hợp của mô hình nếu thiết kế có chứa điểm thí nghiệm trung tâm.
Ví dụ dưới đây minh họa cách phân tích một thí nghiệm khởi đầu cho tiến
trình tối ưu hóa đơn mục tiêu.

167
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

6.2.2. Ví dụ minh họa

Ví dụ 6.1. Một sản phẩm được đánh giá thông qua thông số chất lượng Y.
Thí nghiệm sàng lọc đã kết luận rằng có hai biến độc lập, điều khiển được
có ảnh hưởng mạnh đến giá trị của Y. Các giá trị đã khảo sát của các biến
lần lượt là X1 = (30; 60); X2 = (100; 150). Hãy tiến hành thí nghiệm khởi
đầu cho quá trình tối ưu hóa nhằm đạt mục tiêu Y lớn nhất?

Giải. Ta thiết kế thí nghiệm dạng đầy đủ 22, có bổ sung thêm năm điểm thí
nghiệm trung tâm. Để tiện cho việc trình bày, ta thống nhất ký hiệu các
biến mã hóa bằng các chữ cái in thường; ký hiệu các biến ở dạng giá trị
thực bằng các chữ cái in hoa. Các mức giá trị của biến thí nghiệm được mô
tả trong bảng sau:

Biến thí nghiệm Biến thứ nhất Biến thứ hai


Giá trị Giá trị Giá trị Giá trị
Mức thực mã hóa thực mã hóa
X1 x1 X2 x2
Mức thấp 30 -1 100 -1
Mức trung bình (trung tâm) 45 0 125 0
Mức cao 60 1 150 1

Tiến hành thiết kế thí nghiệm trong Minitab theo trình tự như đã
biết. Trước hết, tạo một file đề án mới. Tiếp đó, kích menu Stat > DOE >
Factorial > Create Factorial Design. Nhập số biến bằng 2. Kích nút
Design của hộp thoại và chọn số điểm thí nghiệm trung tâm là 5 trong danh
sách Number of center points per block. Chọn số lần lặp là 1 (mục
Number of replicates for corner points); số block là 1 (mục Number of
blocks). Kích nút Factors và khai báo tên, các mức giá trị thực cao nhất và
thấp nhất của các biến. Kết quả kế hoạch thí nghiệm được thiết kế như trên
hình 6.1.

Quan sát cột CenterPt của kế hoạch thí nghiệm (hình 6.1), ta thấy
Minitab hiển thị hai loại giá trị: giá trị 0 cho điểm thí nghiệm trung tâm

168
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

(Center point) và giá trị 1 cho điểm thí nghiệm góc (Corner point). Khi
phân tích dữ liệu, chương trình sẽ tự động kiểm tra mức độ phù hợp của mô
hình (lack-of-fit test) nếu các giá trị trong cột CenterPt này khác nhau.

Hình 6.1. Kế hoạch thí nghiệm cho ví dụ 6.1

Tiến hành thí nghiệm theo thứ tự trong kế hoạch đã lập, đặt tên (là
Y) cho một cột mới bên phải các cột đã có trong bảng thí nghiệm và nhập
các kết quả đo được của thông số Y vào cột này. Hình 6.2 minh họa bảng
kế hoạch thí nghiệm đã nhập cột kết quả. Để tiện theo dõi cho bạn đọc
muốn nhập lại số liệu để thực hành, kế hoạch được sắp xếp lại theo thứ tự
StdOrder và hiển thị các mức giá trị các biến ở dạng mã hóa (Coded).

Hình 6.2. Nhập kết quả thí nghiệm cho ví dụ 6.1

Tiến hành phân tích kết quả thí nghiệm bằng cách kích menu Stat >
DOE > Factorial > Analyze Factorial Design. Kích nút Term và chọn

169
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

cấp 1 trong hộp Include terms in the model up through order để yêu
cầu Minitab phân tích mô hình hồi quy bậc nhất. Kiểm tra chắc chắn hộp
kiểm Include center points in the model đã được đánh dấu kiểm. Kích nút
OK trong các hộp thoại. Kết quả phân tích được hiển thị trên cửa sổ
Session như minh họa trên hình 6.3.

Phần phía trên của hình 6.3 hiển thị giá trị và các kết quả kiểm định
các hệ số trong phương trình hồi quy. Có thể viết lại phương trình này
(theo các giá trị liệt kê trong các cột Term và Coef) như sau:

Y = 450,322 + 2,158x1 + 1,372 x2

Hình 6.3. Phân tích kết quả thí nghiệm cho ví dụ 6.1

Giá trị p ứng với các hệ số đều rất nhỏ (nhỏ hơn 0,001) chứng tỏ sự
có mặt của các hệ số này là có nghĩa. Giá trị p của các điểm trung tâm (ứng
với ký hiệu Ct Pt trong cột Term) là khá lớn, chứng tỏ các điểm trung tâm
không có ảnh hưởng đáng kể đến mô hình hồi quy. Nói cách khác, giá trị

170
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

của Y tại các điểm trung tâm không làm sai lệch mô hình bậc nhất dựng
qua các điểm góc.

Phần phía dưới của cửa sổ kết quả, như đã biết, là phần phân tích
phương sai (Analysis of variance). Kiểm tra giá trị p ứng với hàng “Lack
of fit” của phần phân tích phương sai, ta thấy p = 0,947. Giá trị của p lớn
hơn nhiều so với mức ý nghĩa α (bằng 0,05). Điều này có nghĩa là mô hình
hồi quy (bậc nhất) là phù hợp. Đến đây, ta chuyển sang bước tiếp theo của
quá trình tìm cực trị: Leo dốc tìm vùng chứa cực trị.

6.3. Leo dốc tìm vùng cực trị

6.3.1. Khái niệm

Nếu kết quả của thí nghiệm khởi đầu cho thấy có thể mô tả hàm
mục tiêu bằng một hàm hồi quy bậc nhất, điều đó chứng tỏ vùng thí
nghiệm của ta còn ở xa vùng chứa cực trị. Thật vậy, có thể hình dung vùng
lân cận cực trị giống như vùng đỉnh đồi hay đáy thung lũng. Nếu ta cắt
ngang “quả đồi” hay “thung lũng” bằng các mặt phẳng, ta sẽ được các
đường cong khép kín. Tập hợp các giao tuyến của các mặt phẳng ở các
mức giá trị hàm mục tiêu khác nhau với bề mặt chỉ tiêu chiếu lên mặt
phẳng vuông góc với trục biểu diễn hàm mục tiêu được gọi là các đường
mức (Contour lines). Hình 6.4 minh họa khái niệm bề mặt chỉ tiêu và các
giao tuyến tại 5 mức khác nhau.

Hình 6.4. Đồ thị một bề mặt chỉ tiêu và giao tuyến tại các mức khác nhau

171
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Càng xa vùng cực trị, bán kính các đường mức càng lớn. Nếu chỉ
khảo sát một vùng nhỏ, phương trình mô tả một đoạn cong có bán kính rất
lớn sẽ gần như là bậc nhất. Để tiến nhanh đến vùng chứa cực trị của hàm
mục tiêu, ta cần xác định đúng hướng điều chỉnh giá trị các biến thí
nghiệm. Hình 6.5 minh họa các đường mức tại các khu vực thí nghiệm khởi
đầu khác nhau và hướng tiến đến vùng chứa cực trị của một hàm mục tiêu.

Hình 6.5. Một đồ thị đường mức và định hướng tiến nhanh đến vùng cực trị [2]

Để tìm được vùng chứa cực trị (vùng số 5 trên hình 6.5), ta cần thay
đổi giá trị các biến thí nghiệm và thực hiện một chuỗi các thí nghiệm liên
tiếp ứng với các giá trị mới của biến thí nghiệm để theo dõi sự thay đổi của
hàm mục tiêu. Các thí nghiệm này gọi là các thí nghiệm leo dốc. Cần thực
hiện các thí nghiệm leo dốc cho đến khi khẳng định đã đến vùng chứa cực
trị của hàm mục tiêu. Đặc điểm nhận biết vùng cực trị là sự biến thiên của
hàm mục tiêu đổi chiều; đồng thời tại vùng đó, mô hình hồi quy bậc nhất
dùng để mô tả hàm mục tiêu trở nên không phù hợp nữa.

Các giai đoạn tìm vùng chứa cực trị của hàm mục tiêu bao gồm:

1. Xác định hướng tiến hành các thí nghiệm leo dốc (path of
steepest ascent) nếu cần tối đa hóa hàm mục tiêu; hoặc các thí
nghiệm xuống dốc (path of steepest descent) nếu muốn tối thiểu
hóa hàm mục tiêu;

172
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

2. Thực hiện các thí nghiệm theo hướng đã xác lập. Có thể tiến
hành các thí nghiệm đơn hoặc lặp để giảm sai số; theo dõi kết
quả thay đổi của hàm mục tiêu. Nói chung, giá trị hàm mục tiêu
sẽ thể hiện sự cải thiện (tăng khi leo dốc, hoặc giảm khi xuống
dốc). Tiến hành các thí nghiệm cho đến khi hàm mục tiêu đảo
chiều. Nên tiến hành thêm các thí nghiệm với hai xác lập nữa để
khẳng định chắc chắn sự đảo chiều của hàm mục tiêu.
3. Xây dựng kế hoạch 2 mức có điểm trung tâm tại lân cận điểm thí
nghiệm có hàm mục tiêu đảo chiều để khẳng định mô hình hồi
quy bậc nhất là không còn phù hợp.

Nội dung của việc xác định hướng tiến hành các thí nghiệm leo dốc hoặc
xuống dốc bao gồm 2 nhiệm vụ sau:

- Thứ nhất, xác định cần tăng hay giảm giá trị các biến thí nghiệm
cho mỗi bước leo/xuống dốc. Chức năng này còn được gọi là xác
định hướng tìm kiếm (Search direction).
- Thứ hai, xác định lượng thay đổi giá trị các biến cho mỗi bước leo
dốc/xuống dốc. Chức năng này thường được gọi là xác định chiều
dài bước đi tìm kiếm (length of the moving step).

6.3.2. Quy tắc xác định bước leo dốc

Các tọa độ dọc theo đường leo dốc phụ thuộc vào dấu và độ lớn của
các hệ số của các biến trong phương trình hồi quy bậc nhất, đã lập cho hàm
mục tiêu. Gia số cho mỗi biến thí nghiệm xj (j = 1; 2; …; k), đã mã hóa,
được xác định theo một quan hệ tương quan lẫn nhau theo quy tắc sau:

Gia số cho một biến thí nghiệm xj dọc theo đường leo dốc hay
xuống dốc đều tỷ lệ thuận với giá trị của hệ số của biến đó trong phương
trình hồi quy bậc nhất đã dựng cho hàm mục tiêu. Dấu của gia số khi leo
dốc (tìm cực đại) là dấu của hệ số đó trong phương trình. Dấu của gia số

173
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

khi xuống dốc (tìm cực tiểu) ngược với dấu của hệ số của biến trong
phương trình hồi quy.

Ví dụ, nếu phương trình hồi quy bậc nhất của một hàm mục tiêu có
dạng y = 20 + 3x1 − 1,5 x2 , thì khi muốn làm các thí nghiệm tìm cực đại của
hàm hồi quy, ta cần thực hiện với các biến x1 được tăng thêm và các biến x2
được giảm đi. Trái lại, khi muốn tìm cực tiểu, ta cần giảm biến x1 và tăng
biến x2. Hơn nữa, cứ tăng (hay giảm) biến x1 đi 2 đơn vị thì ta cần giảm
(hoặc tăng) x2 đi 1 đơn vị (tỷ lệ 3/1,5 = 2/1). Các thí nghiệm leo dốc với các
gia số này được minh họa trên hình 6.6. Hướng leo dốc được biểu diễn
bằng mũi tên trên hình vẽ. Trên mặt phẳng biểu diễn giá trị các biến, hướng
leo dốc / xuống dốc có phương vuông góc với các đường mức (contour
lines). Khi số biến k ≥ 3, các đường mức trở thành các mặt phẳng (k=3)
hoặc các siêu mặt (k>3; hyperplanes). Hướng leo dốc sẽ có phương vuông
góc với các mặt này.

Hình 6.6. Mô phỏng thí nghiệm leo dốc cho mô hình y = 20 + 3x1 − 1,5 x2 [1]

Bạn đọc có thể tham khảo cơ sở toán học của quy tắc trên như dưới đây.

Ta đã biết, mô hình hồi quy bậc nhất mô tả quan hệ giữa hàm mục
tiêu với các biến thí nghiệm xi, i=1..k có dạng:

174
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

y = b0 + b1 x1 + b2 x2 + ... + bk xk (6.2)

Bài toán xác định hướng và độ dài bước leo dốc có mục đích là tìm
giá trị lớn nhất của hàm mục tiêu y ứng trong điều kiện các biến được thay
đổi trong một phạm vi nhỏ. Nói cách khác, các điểm thí nghiệm được lựa
chọn sao cho y là lớn nhất trong một không gian hữu hạn xác định bởi giá
trị r:

k
r = ∑ xi2
2
(6.3)
i =1

Đây là điều kiện bắt buộc, bởi lẽ nếu không có điều kiện này, y sẽ
nhận giá trị lớn nhất (bằng ∞) khi các xi → ∞ , do y tỷ lệ bậc nhất tuyến
tính với xi. Với điều kiện ràng buộc (6.3), với các điểm thí nghiệm mới nằm
cách điểm thí nghiệm hiện thời một khoảng r, ta tìm các giá trị xi sao cho y
đạt giá trị lớn nhất.

Lưu ý rằng, ta cần xem xét phương trình hồi quy với các biến được
mã hóa. Giả thiết đặt gốc tọa độ tại điểm thí nghiệm vừa thực hiện ở bước
thí nghiệm khởi đầu. Lời giải cho bài toán tối ưu hóa (6.2) với ràng buộc
(6.3) được thực hiện bằng phép nhân La-grăng (Lagrange multiplers). Điều
kiện tối ưu được thỏa mãn nếu:

⎛ k 2 2⎞
L = b0 + b1 x1 + b2 x2 + ... + bk xk − λ ⎜ ∑ xi − r ⎟ (6.4)
⎝ i =1 ⎠

Đạo hàm riêng của L theo xi, ta được:

∂L
= bi − 2λxi (i = 1;2;...; k ) (6.5)
∂xi

175
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Cho các đạo hàm riêng này bằng không, ta được các tọa độ của các điểm
thí nghiệm mới cho bước leo dốc tiếp theo:

bi 1
xi = = bi = ρ .bi (i = 1;2;...; k ) (6.6)
2λ 2λ

Trong đó, ρ = 1 / 2λ được gọi là hệ số tỷ lệ. Các giá trị mới của các
biến thí nghiệm sẽ tỷ lệ với các hệ số bi tương ứng của chúng trong phương
trình hồi quy trước đây:

x1 = ρ .b1 ; x2 = ρ .b2 ; ...; xk = ρ .bk (6.7)

Phương trình (6.7) cho ta mối quan hệ giữa các giá trị các biến cho
mỗi điểm thí nghiệm mới cho quá trình leo dốc tìm cực đại. Quá trình
xuống dốc tìm cực tiểu cần lấy các giá trị ρ có dấu ngược lại. Giá trị của ρ
được chọn tùy ý người làm thí nghiệm, dựa vào kinh nghiệm và hiểu biết
về đối tượng đang nghiên cứu. Nếu chọn ρ quá nhỏ, cần làm rất nhiều thí
nghiệm mới tìm được đến vùng cực trị. Trái lại, nếu chọn ρ quá lớn, bước
thí nghiệm quá dài, có thể bỏ qua vùng chứa cực trị.

Rõ ràng, các giá trị xi theo (6.7) phù hợp với quy tắc đã phát biểu ở
phần đầu mục 6.3.2, tức là:

x1 b1 x2 b2 x b
= ; = ... hay i = i ; (i, j = 1..k )
x2 b2 x3 b3 x j bj

Tóm lại, các bước để xác định các thông số leo dốc được thực hiện theo
trình tự sau:

1. Chọn trước một giá trị gia số Δxj cho một biến thí nghiệm xj nào
đó. Thông thường, nên chọn biến ta dễ điều khiển nhất hoặc
biến ứng với hệ số hồi quy bj có giá trị tuyệt đối lớn nhất.

176
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

2. Xác định gia số cho các biến còn lại theo công thức:

bi
Δxi = Δx j ( j = 1..k ) (6.8)
bj

3. Chuyển các giá trị gia số Δxi từ dạng mã hóa sang dạng tự nhiên
để tiến hành thí nghiệm;

6.3.3. Ví dụ minh họa

Ví dụ 6.2. Xây dựng kế hoạch thí nghiệm leo dốc cho bài toán đã nêu trong
ví dụ 6.1.

Giải

Ở bước thí nghiệm khởi đầu (xem ví dụ 6.1 ), ta đã xây dựng được
mô hình hồi quy bậc nhất mô tả hàm mục tiêu phụ thuộc các biến thí
nghiệm (dạng mã hóa) x1 và x2 như sau:

Y = 450,322 + 2,158x1 + 1,372 x2

Với x1 và x2 được khảo sát ở các mức sau:

Giá trị Giá trị Giá trị


mã hóa thực thực
x1; x2 X1 X2
-1 30 100
0 45 125
1 60 150

Tiến hành chọn các giá trị gia số cho các biến thí nghiệm theo các bước
như sau:

177
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

1. Chọn trước bước tiến Δx1 cho biến x1 bằng 1 đơn vị mã hóa. Lý
do là biến x1 có hệ số trong phương trình hồi quy là 2,158 lớn
hơn hệ số của x2 là 1,372;
2. Bước tiến cho biến x2 được xác định theo công thức (6.7):

b2 1,372
Δx2 = Δx1 = ⋅ 1 = 0,636
b1 2,158

3. Xác định giá trị thực của các gia số biến thí nghiệm:

Dễ thấy, khoảng giá trị 1 đơn vị mã hóa của biến x1 tương ứng với
15 đơn vị thực (bằng 60-45); còn khoảng giá trị 1 đơn vị mã hóa của biến
x2 tương ứng với 25 đơn vị giá trị thực. Do vậy, các giá trị gia số của các
biến thí nghiệm ở dạng giá trị thực sẽ là:

ΔX 1 = 1⋅ 15 = 15;ΔX 2 = 0,636 ⋅ 25 = 15,9 ≈ 16

Kết luận: vì ta đang cần tìm cực đại của hàm mục tiêu Y, nên cần
thực hiện các thí nghiệm leo dốc. Do vậy, các gia số của các biến thí
nghiệm được lấy cùng dấu với các hệ số tương ứng của các biến trong
phương trình hồi quy bậc nhất ở thí nghiệm khởi đầu. Mỗi thí nghiệm tiếp
theo sẽ lấy gia số bằng bội số của các gia số đã xác định. Số bước thí
nghiệm tùy thuộc khi nào hàm mục
tiêu đảo chiều, không tăng nữa.

Có thể minh họa kết quả qua


đồ thị các đường mức của hàm mục
tiêu trong phạm vi đã khảo sát như
hình 6.7. Trên hình 6.7, ta thấy càng
về phía ứng với giá trị cao của x1 và
x2, hàm mục tiêu Y có giá trị càng
lớn. Vì vậy, tăng đồng thời x1 và x2

Hình 6.7. Hướng leo dốc cho ví dụ 6.2

178
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

sẽ cho phép ta có thể tiến nhanh đến vùng chứa giá trị cực đại của Y. Đánh
giá một cách định tính cũng có thể thấy rằng, các đường mức có xu hướng
dốc hơn 45°. Do vậy, hướng tiến vuông góc với đường mức sẽ cần gia số
của x1 lớn hơn của x2.

Ví dụ 6.3. Tiến hành các thí nghiệm và đánh giá vùng dừng cho các bước
leo dốc cho bài toán đã nêu trong ví dụ 6.2.

Giải

Giả sử tiến hành được liên tiếp các bước thí nghiệm và thu được các kết
quả như trình bày trong bảng 6.1 dưới đây.

Bảng 6.1. Kết quả các thí nghiệm leo dốc cho ví dụ 6.3

Biến thứ nhất Biến thứ hai Hàm


STT thí
Ký hiệu Giá trị Giá trị mục tiêu
nghiệm Mã hóa Mã hóa
thực thực Y
- Δ 1 15 0,64 16 -
1 Gốc (Khởi đầu) 0 60 0,00 150 453,86
2 Gốc + Δ 1 75 0,64 166 454,27
3 Gốc + 2Δ 2 90 1,28 182 457,31
4 Gốc + 3Δ 3 105 1,92 198 460,34
5 Gốc + 4Δ 4 120 2,56 214 463,38
6 Gốc + 5Δ 5 135 3,20 230 468,42
7 Gốc + 6Δ 6 150 3,84 246 470,46
8 Gốc + 7Δ 7 165 4,48 262 472,50
9 Gốc + 8 8 180 5,12 278 476,53
10 Gốc + 9Δ 9 195 5,76 294 474,22
11 Gốc + 10Δ 10 210 6,40 310 472,55

Kết quả cho thấy các thí nghiệm từ bước 1 cho đến bước 9 đều cho
giá trị hàm mục tiêu tăng dần. Đến thí nghiệm tại bước thứ 10, nhận thấy
giá trị hàm mục tiêu thu được nhỏ hơn bước 9, ta tiến hành thêm một bước
gia số nữa cho các biến. Giả sử bước thứ 11 cũng cho ra giá trị hàm mục
tiêu nhỏ hơn bước thứ 10. Đến đây, có thể dừng quá trình leo dốc và thực

179
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

hiện một số thí nghiệm để kiểm tra mức độ phù hợp của mô hình bậc nhất.
Các kết quả trong bảng 6.1 có thể được minh họa trực quan như trên hình
6.8.

Hình 6.8. Hàm mục tiêu Y tại các bước thí nghiệm của ví dụ 6.3

Hình 6.8 cho ta thấy quá trình “leo dốc”, bắt đầu từ thí nghiệm khởi
đầu (bước số 1 trên trục hoành), hàm mục tiêu đạt giá trị đỉnh tại bước số 9.
Chú ý rằng, tại mỗi bước, ta chỉ thực hiện với một giá trị của x1 và một giá
trị của x2. Có thể lặp lại một số lần thí nghiệm để giảm bớt các sai số ngẫu
nhiên…

Để kiểm tra mức độ phù hợp của mô hình, ta có thể thiết kế một kế
hoạch đầy đủ có điểm trung tâm tại điểm thứ 9. Tức là, các biến sẽ có mức
trung bình bằng giá trị các biến ở bước thí nghiệm số 9. Để tiết kiệm, ta có
thể sử dụng lại các kết quả đã thí nghiệm bằng cách lấy các thiết lập của
bước số 8 và số 9 làm các thí nghiệm góc. Bước số 8 đóng vai trò thí
nghiệm góc có x1=-1 và x2=-1; bước số 9 đóng vai trò thí nghiệm góc có
x1=+1 và x2=1. Ta cần làm thêm các thí nghiệm góc với (x1; x2) = (-1; +1)
và (x1; x2) = (+1; -1) nữa. Ngoài ra, cũng nên tiến hành một số thí nghiệm
lặp tại điểm trung tâm để nâng cao độ chính xác cho phép kiểm định.

180
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Giả sử sau khi tiến hành các thí nghiệm kiểm tra bổ sung tại điểm
số 9 theo thiết kế ở trên, với 5 thí nghiệm lặp tại tâm, ta thu được kết quả
và nhập vào Minitab như trong hình 6.9.

Hình 6.9. Thiết kế thí nghiệm và kết quả kiểm tra ví dụ 6.3

Tiến hành phân tích thí nghiệm bằng lệnh Stat > DOE > Factorial
> Analyze Factorial Design, ta được kết quả như hình 6.10.

Hình 6.10. Phân tích thí nghiệm có điểm trung tâm của ví dụ 6.3

Trên hình 6.10, mô hình hồi quy được lập vẫn được giả định là ở dạng bậc
nhất. Quan sát nhanh kết quả phân tích ANOVA, ta thấy ở dòng thứ 5 từ

181
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

dưới lên, thông báo cho biết khả năng xuất hiện dạng cong (Curvature) của
mặt chỉ tiêu là rất lớn (giá trị p nhỏ hơn 0,001 – tức là có xác xuất tới trên
99,9% khả năng là cần biểu diễn mặt chỉ tiêu ở dạng cong). Giá trị xác suất
p rất nhỏ (0,029) khi kiểm tra mức độ phù hợp của mô hình (Lack of fit –
dòng thứ 3 từ dưới lên) cũng khẳng định mô hình bậc nhất là không phù
hợp.

Đến đây, nhiệm vụ đặt ra là để tìm chính xác khu vực hay điểm cực
trị, cần tiến hành các thí nghiệm để mô tả chính xác hơn hàm mục tiêu. Để
làm được điều này, mỗi biến thí nghiệm cần được thử nghiệm ở số mức giá
trị nhiều hơn 3. Vấn đề này sẽ được trình bày trong phần tiếp theo.

6.4. Thí nghiệm bề mặt chỉ tiêu

Khi cần mô tả chính xác quan hệ giữa hàm mục tiêu và các thông số
thí nghiệm, ta tiến hành kế hoạch thí nghiệm bề mặt chỉ tiêu (Response
Surface Design). Mục đích của kế hoạch này là bổ sung thêm các điểm thí
nghiệm nhằm có thể xây dựng mô hình bậc 2 mô tả hàm mục tiêu. THực tế
kinh nghiệm đã chỉ ra rằng, với vùng giới hạn nhỏ giữa các mức thí
nghiệm, hàm bậc 2 là đủ chính xác để mô tả các hàm mục tiêu.

Các công việc cần làm ở giai đoạn này là:

1. Xây dựng kế hoạch thí nghiệm (thiết kế thí nghiệm);


2. Tiến hành các thí nghiệm và thu thập kết quả;
3. Phân tích số liệu thí nghiệm; xây dựng mô hình hồi quy;
4. Xác định điều kiện tối ưu hóa;
5. Thực hiện các thí nghiệm kiểm định.

Các kỹ thuật thực hiện các công việc này được trình bày trong các
phần tiếp theo.

6.4.1. Kế hoạch thí nghiệm bề mặt chỉ tiêu

182
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Khi xây dựng kế hoạch thí nghiệm bề mặt chỉ tiêu, ta có thể chọn
một trong hai dạng kế hoạch thiết kế: thiết kế dạng hỗn hợp tâm xoay
(CCD – Central Composite Design) hoặc thiết kế Box-Behnken (Box-
Behnken design). Mỗi dạng có những ưu nhược điểm nhất định và thích
hợp với từng điều kiện nhất định. Các phân tích dưới đây sẽ giúp ta cân
nhắc và lựa chọn dạng thiết kế thích hợp.

6.4.1.1. Thiết kế hỗn hợp tâm xoay

Thiết kế hỗn hợp tâm xoay (CCD – Central Composite Design) là


dạng thiết kế được hình thành bằng cách tổ hợp thiết kế 2 mức đầy đủ với
2k điểm thí nghiệm dọc trục (Axial), còn gọi là các điểm “sao” (Star
points) và điểm thí nghiệm trung tâm. Hình 6.11. minh họa cách hình thành
một thiết kế CCD cho thí nghiệm 2 biến.

+ =

(a) (b) (c)


2
Hình 6.11. (a) Sơ đồ thí nghiệm 2 ; (b) 4 thí nghiệm dọc trục
và 1 thí nghiệm trung tâm; (c) Thí nghiệm CCD

Thí nghiệm CCD được dùng phổ biến nhất trong chuỗi kế hoạch thí
nghiệm tối ưu hóa do nó có thể kế thừa các kết quả của các bước trước. Sau
khi đã thiết kế và thực thi các thí nghiệm 2k có bổ sung các thí nghiệm
trung tâm để kiểm tra vùng dừng, ta chỉ cần bổ sung thêm bốn thí nghiệm
dọc trục nữa là hoàn tất kế hoạch thí nghiệm CCD.

Một yêu cầu quan trọng của thiết kế thí nghiệm bề mặt chỉ tiêu
(RSM) là: ma trận thí nghiệm phải có tính chất “xoay được” (Rotatability);
ta quy ước gọi là tính chất tâm xoay. Nguyên nhân là do RSM được thiết kế

183
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

với mục đích tối ưu hóa, nhưng vị trí điểm cực trị lại chưa biết trước. Thiết
kế tâm xoay đảm bảo cơ hội ngang bằng cho các dự đoán về vị trí điểm cực
trị theo mọi phương.

Các tính toán đã chỉ ra rằng, để đạt được tính chất “tâm xoay”, cần
chọn khoảng cách α theo công thức:

α = 4 nF (6.1)

Với nF là số điểm thí nghiệm góc. Trong trường hợp thiết kế k biến 2 mức
đầy đủ, ta có:

k
nF = 2 ⇒ α = 2
k 4
(6.2)

Số điểm thí nghiệm trung tâm thường được khuyến nghị chọn bằng
3 đến 5 điểm cho mỗi lần lặp.

6.4.1.2. Thiết kế Box-Behnken

Thiết kế Box-Behnken được hai tác giả Box và Behnken đề xuất


năm 1960 với mục đích thiết kế các thí nghiệm 3 mức nhằm xây dựng bề
mặt chỉ tiêu. Thiết kế Box-Behnken được sử dụng có từ 3 đến 10 biến thí
nghiệm. Các thiết kế Box-Behnken thường có tính chất tâm xoay hoặc gần
như có tâm xoay. Hình 6.12a mô tả sơ đồ một kế hoạch thí nghiệm Box-
behnken 3 biến A; B và C.

184
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

+1 +1

C C

B B
+1 +1

-1 -1 -1 -1
-1 +1 -1 A +1
A

(a) (b)
Hình 6.12. (a) Sơ đồ thí nghiệm Box-Behnken 3 biến
(b) Sơ đồ thí nghiệm Trung tâm-mặt 3 biến

So với thiết kế CCD, thiết kế Box-Behnken có những ưu điểm sau đây:

- Số lần thí nghiệm cho mỗi lần lặp ít;


- Không có điểm thí nghiệm nào vượt ra ngoài khoảng giữa 2 mức đã
thiết lập cho mỗi biến. Đây là ưu điểm vượt trội của thiết kế Box-
Behnken so với thiết kế CCD. Do thiết kế CCD có các điểm thí
nghiệm dọc trục nên nhiều khi không thể thực hiện được thí nghiệm
do vượt ra ngoài vùng giới hạn hoạt động của đối tượng khảo sát.

Để khắc phục vấn đề của thiết kế CCD do điểm thí nghiệm dọc trục
rơi vào vùng không thể thí nghiệm được, người ta còn sử dụng thiết kế
“tâm xoay-mặt” (Xem minh họa trên hình 6.12b). Thiết kế này có tên tiếng
Anh là “Face-centered Design”. Đây là một biến thể của thiết kế CCD
nhưng có α=1.

6.4.1.3. Thiết kế thí nghiệm bằng máy tính

Để thiết kế thí nghiệm bề mặt chỉ tiêu bằng Minitab, thực hiện các
bước sau:

185
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Bước 1. kích menu Stat > DOE > Response Surface > Create Response
Surface Design. Trong hộp thoại mới xuất hiện (xem minh họa trên hình
6.13), chọn kiểu thiết kế trong danh sách Type of Design).

Hình 6.13. Hộp thoại thiết kế thí nghiệm bề mặt chỉ tiêu

Tiếp tục chọn số biến thí nghiệm trong danh sách Number of.

Bước 2. Kích nút Design để thiết lập các xác lập chi tiết cho thiết kế.

Với thiết kế dạng CCD, cần xác lập các lựa chọn sau (xem minh họa trên
hình 6.14):

- Chọn kiểu thiết kế trong danh sách Design phía trên cùng của hộp
thoại.
- Chọn số thí nghiệm trung tâm tại
mục “Number of Center
Points”. Có thể chấp nhận lựa
chọn ngầm định (Default) hoặc
tùy chỉnh theo ý (Custom);
- Nhập số lần lặp vào hộp
Number of Replicates;
- Chấp nhận giá trị khoảng cách α
theo ngầm định (Default); hoặc
chọn kiểu “Tâm xoay-mặt”

Hình 6.14. Hộp thoại thiết kế CCD


186
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

(Face-centered có α=1); hoặc


kích Custom để nhập giá trị α
theo ý muốn.
- Nếu muốn chia khối khi lặp,
kích chọn “Block on
replicate”.
- Kích nút OK của hộp thoại.
Hình 6.15. Hộp thoại thiết kế Box-
Với thiết kế Box-Behnken, các tùy Behnken
Hình 6.16. Lựa chọn khai báo biến cho
chọn đơn giản hơn. Ta chỉ cần khai
dạng thiết kế CCD
báo số thí nghiệm tại điểm trung tâm;
số lần lặp và quyết định có chia khối khi lặp hay không (Xem minh họa
trên hình 6.15). Kích nút OK sau khi khai báo xong các xác lập thiết kế.

Bước 3. Khai báo các mức giá trị của các biến thí nghiệm. Với thiết kế
Box-Behnken, cách khai báo biến giống như các thiết kế hai mức đã biết.
Còn với thiết kế CCD, ta có thêm tùy chọn: hoặc là nhập giá trị của các
biến tại các mức cao và mức thấp (Cube points); hoặc chọn cách nhập giá
trị các biến tại các điểm dọc trục (Axial points). Xem minh họa trên hình
6.16. Thông thường, nên chọn cách nhập Cube points.

Lưu ý là cần nhập các mức theo giá trị thực của các biến chứ không
nhập các mức đã mã hóa. Sau khi khai báo xong, kích nút OK trong các
hộp thoại.

6.4.1.4. Ví dụ minh họa

Ví dụ 6.4. Lập kế hoạch thí nghiệm bề mặt chỉ tiêu cho bài toán của ví dụ
6.3.

Giải

187
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Do đã thực hiện thí nghiệm


hai mức đầy đủ có điểm trung tâm ở
bước kiểm tra vùng dừng của hàm
mục tiêu, nên ta sẽ chọn thiết kế dạng
CCD cho kế hoạch thí nghiệm bề mặt
chỉ tiêu.

Trong Minitab, kích menu


Stat > DOE > Response Surface >
Create Response Surface Design; Hình 6.17. Lựa chọn khai báo biến
cho ví dụ 6.4
trong hộp thoại mới xuất hiện, kích
chọn số biến bằng 2. Kích nút Design, chọn kiểu thiết kế là 13 lần thí
nghiệm (cho mỗi lần lặp) – không tạo khối. Thực tế cần thực hiện một số
lần lặp để nâng cao độ chính xác của kết quả. Tuy nhiên, với mục đích
minh họa tiến trình thực hiện, ở đây ta chọn số lần lặp (Number of
replicate) là 1; kích nút OK. Kích nút Factors, chọn chức năng khai báo
biến là Cube Points và nhập giá trị các mức của các biến như ta đã thực
hiện trong ví dụ 6.3. Hình 6.17 minh họa bước này.

Kích nút OK trong các hộp thoại. Ta được kết quả là bảng kế hoạch
thí nghiệm gồm 4 thí nghiệm góc; 5 thí nghiệm trung tâm giống hệt kế
hoạch đã thực hiện ở bước kiểm nghiệm vùng dừng trước đây (Xem lại ví
dụ 6.3). Ngoài ra, kế hoạch còn được bổ sung 4 thí nghiệm dọc trục nữa.
Hình 6.17 minh họa bảng kế hoạch CCD đã được sắp xếp lại theo thứ tự
chuẩn và cho hiển thị ở dạng mã hóa để bạn đọc tiện so sánh với hình 6.9
của ví dụ 6.3. Quan sát hình 6.17, ta thấy ở cột PtType, Minitab hiển thị
giá trị -1 cho các thí nghiệm dọc trục. Như vậy, kiểu điểm thí nghiệm dọc
trục sẽ được ký hiệu là -1; còn điểm thí nghiệm góc có ký hiệu 1; điểm thí
nghiệm trung tâm có ký hiệu 0. PtType là viết tắt của cụm từ Point Type
(dạng điểm (thí nghiệm)).

188
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Các thí nghiệm


dọc trục

Hình 6.17. Thiết kế thí nghiệm CCD của ví dụ 6.4

6.4.2. Thực hiện thí nghiệm bề mặt chỉ tiêu

Như thường lệ, sau khi thiết kế xong kế hoạch thí nghiệm, công
việc tiếp theo là cho hiển thị kế hoạch dưới dạng không mã hóa và sắp xếp
theo thứ tự thực thi RunOrder. Hãy tạo thêm một cột đặt tên theo ý để
chứa giá trị của hàm mục tiêu sau khi thí nghiệm. Tiếp đó, hãyin kế hoạch
này ra giấy và thực hiện các thí nghiệm theo trình tự đã ngẫu nhiên hóa
này. Cuối cùng, ta nhập các kết quả vào cột mới tạo để phân tích số liệu.

Tuy nhiên, nếu thiết kế thí nghiệm CCD kế thừa các thí nghiệm
trước đó, ta chỉ cần thực hiện các thí nghiệm dọc trục mới được bổ sung mà
thôi. Do vậy, trước hết hãy sắp xếp lại cả bảng kế hoạch thực hiện ở giai
đoạn trước và bảng kế hoạch thí nghiệm CCD theo cùng thứ tự chuẩn
(StdOrder); sau đó copy các kết quả của các thí nghiệm cũ sang bảng kế
hoạch CCD. Ta chỉ cần in ra giấy và thực hiện các thí nghiệm dọc trục,
nhập kết quả thu được vào các ô còn trống của cột hàm mục tiêu là có thể
tiến hành phân tích số liệu thí nghiệm được.

Ví dụ 6.5. Thực hiện hoàn chỉnh các thí nghiệm CCD cho ví dụ 6.4.

Ta tạo thêm cột Y_CCD để chứa giá trị hàm mục tiêu. Sau đó copy
các kết quả tương ứng đã thực hiện trong ví dụ 6.3 (cột Y_m) sang cột này.

189
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Giả sử thực hiện tiếp 4 thí nghiệm dọc trục của bảng kế hoạch và thu được
các kết quả cần thiết. Nhập các kết quả này vào các ô tương ứng của cột
Y_CCD, ta được bảng kết quả hoàn chỉnh như minh họa trong hình 6.18.

Các thí nghiệm


dọc trục

Hình 6.18. Kết quả thí nghiệm CCD cho ví dụ 6.4

Thêm vào đó, thí nghiệm CCD còn có 4 thí nghiệm tại các điểm dọc
trục. Do vậy, trong thực tế, ta chỉ cần tiến hành 4 thí nghiệm này rồi kết
hợp với các số liệu đã thu được ở bước kiểm định vùng dừng trước đây là
đủ.

6.4.3. Phân tích kết quả thí nghiệm

Việc phân tích kết quả thí nghiệm bề mặt chỉ tiêu cũng thực hiện
tương tự như với dạng thí nghiệm 2 mức đã biết. Phân tích kết quả thí
nghiệm cần đạt được các thông tin sau:

- Mô hình hồi quy bậc cao mô tả chính xác hàm mục tiêu;
- Phân tích phương sai để đánh giá mức độ phù hợp của mô hình;

Điểm khác so với khi phân tích thí nghiệm 2 mức thông thường là ở
chỗ, ta có thể chọn dạng mô hình muốn dùng để mô tả hàm mục tiêu tùy
theo ý muốn. Một mô hình bậc 2 đầy đủ (xét đến tương tác không quá 2
chiều) cho một hàm nhiều biến có dạng:

190
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

n k
y = b0 + ∑ bi xi + ∑ xi2 + ∑∑ bij xi x j (6.3)
i =1 i =1 i< j

Trong đó, nhóm 2 số hạng đầu biểu diễn các thành phần bậc nhất
(Linear); nhóm số hạng thứ 3 biểu diễn thành phần bậc 2 (Quadratic);
nhóm số hạng thứ 4 biểu diễn thành phần tương tác 2 chiều giữa các biến.

Khi phân tích thí nghiệm, ta có thể lựa chọn một trong các dạng mô
hình : bậc nhất (Linear); bậc nhất và bậc 2 (Linear + squares - không chứa
các ảnh hưởng tương tác); bậc nhất và ảnh hưởng tương tác (Linear +
interactions – không chứa các thành phần bậc 2) và cuối cùng là mô hình
bậc 2 đầy đủ (Full quadratic). Kinh nghiệm phân tích là ban đầu, ta chọn
mô hình bậc 2 đầy đủ rồi tiến hành
đánh giá mô hình. Nếu kết quả cho thấy
có thành phần nào trong mô hình không
có ý nghĩa thống kê thì ta loại bỏ thành
phần đó cho bước xem xét tiếp theo.
Quá trình được tiếp tục cho đến khi
không còn thành phần không có ý nghĩa
và mô hình phù hợp với dữ liệu. Để
Hình 6.19. Hộp thoại lựa chọn phân tích
đánh giá ý nghĩa thống kê của các thành bề mặt chỉ tiêu, ví dụ 6.6
phần trong mô hình hồi quy, ta sử dụng
giá trị p tương ứng của thành phần đó khi phân tích thống kê. Để đánh giá
mức độ phù hợp của mô hình, ta xem xét giá trị p của phép kiểm định Lack
of fit. Cách đánh giá này đã được trình bày trong các chương trước cũng
như trong các ví dụ minh họa trên đây.

Có thể tìm hiểu thêm tiến trình phân tích kết quả thí nghiệm bề mặt
chỉ tiêu được minh họa thông qua ví dụ dưới đây.

Ví dụ 6.6. Phân tích kết quả thí nghiệm đã thu được của ví dụ 6.5.

Giải

191
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Trong Minitab, ta mở cửa sổ chứa Worksheet của thí nghiệm đã


hoàn thành. Kích menu Stat > DOE > Response Surface > Analyze
Response Surface Design. Trong hộp thoại mới xuất hiện (xem hình 6.19),
chọn tên hàm mục tiêu cho mục Responses từ danh sách bên cạnh. Trong
danh sách Analyze data using:, cần chọn kiểu số liệu mã hóa (Coded
units) để phân tích. Kích nút Term và chọn cấp độ mô hình hồi quy trong
danh sách Include the following terms là Full quadratic. Kích OK. Quay
về hộp thoại chính, kích nút Graph và chọn các dạng đồ thị muốn hiển thị
theo ý. Sau khi hoàn tất, kích nút OK. Kết quả phân tích mô hình hồi quy
sẽ được hiển thị trong cửa sổ Session.

Phía trên của màn hình kết quả là các thông tin về mô hình hồi quy
của hàm mục tiêu (Xem minh họa trên hình 6.20). Ta nhận thấy ngay tất cả
các hệ số đều có giá trị xác suất p rất nhỏ so với mức ý nghĩa α. Vì vậy, có
thể kết luận, các hệ số của mô hình này là có ý nghĩa thống kê. Viết lại
phương trình hồi quy theo kết quả hiển thị trên màn hình, ta được:

y = 476,334 + 1,779x1 − 0,765x2 − 1,431x12 − 1,931x22 + 0,58 x1 x2

Hình 6.20. Mô hình hồi quy của ví dụ 6.6

192
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Phía bên dưới cửa sổ kết quả là phần phân tích phương sai (Analysis of
Variace) cho mô hình hồi quy đã dựng. Hình 6.21 trình bày kết quả này.

Hình 6.21. Phân tích phương sai của mô hình trong ví dụ 6.6

Trước hết, nhận thấy ở mục kiểm định mức độ phù hợp của mô
hình hồi quy (Lack-of-Fit), giá trị p có giá trị lớn hơn nhiều so với mức ý
nghĩa α. Điều này có nghĩa là dạng mô hình rất khớp với dữ liệu. Xem xét
các thành phần riêng rẽ của mô hình hồi quy (Linear, Square và
Interaction), ta thấy các giá trị p của các thành phần này đều rất nhỏ.
Nghĩa là, sự có mặt của từng thành phần này đều có ý nghĩa cao trong mô
hình hồi quy.

6.4.4. Đồ thị bề mặt chỉ tiêu

Các đồ thị cho ta cách biểu diễn trực quan về mối quan hệ giữa hàm
chỉ tiêu với từng cặp hai biến thí nghiệm. Có hai loại đồ thị thường được sử
dụng là đồ thị bề mặt (Surface Plot) và đồ thị đường mức (Contour Plot).
Với các hàm mục tiêu chỉ phụ thuộc hai biến, việc phân tích các đồ thị này
cho ta nhận định khá chính xác về các điều kiện tối ưu cho hàm mục tiêu.

Với hàm mục tiêu có số biến nhiều hơn 2, ta chỉ có thể vẽ trên mỗi
đồ thị cho hàm mục tiêu phụ thuộc vào một cặp 2 biến, còn các biến khác

193
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

được giữ cố định ở một mức nào đó. Khi này, việc quan sát đồ thị để nhận
xét về các xác lập tối ưu cho hàm mục tiêu là không dễ dàng.

Ví dụ 6.7. Vẽ đồ thị bề mặt và đường mức cho mô hình trong ví dụ 6.6.

Giải. Trong Minitab, kích menu Stat > DOE > Response Surface >
Contour/Surface Plots. Với mỗi dạng đồ thị, kích nút Setup để thiết lập
các thông số. Các xác lập này bao gồm:

Chọn hàm mục tiêu muốn vẽ đồ thị trong hộp Response; ta chọn
Y_CCD.
Chọn cặp biến thí nghiệm cho 2 trục x và y trong hộp Factors; Bài
toán của ta có hai biến nên đương nhiên chọn 2 biến này (x1 và x2).
Chọn dạng các biến là dạng mã hóa hay giá trị thực để vẽ đồ thị; ta
chọn kiểu hiển thị giá trị thực khi vẽ đồ thị.
Lựa chọn mức giá trị cố định cho các biến khác không được biểu
diễn trên đồ thị. Với bài toán hai biến của ta, không cần chỉ định ở
đây.
Khi vẽ đồ thị các đường mức (Contour plot), ta còn có thể kích nút
contours của hộp thoại Setup để lựa chọn:
o Các giá trị hàm mục tiêu để hiển thị đường mức: có thể chọn
theo các giá trị ngầm định (Default), nhập số lượng mức
(Number) hay gán chính xác giá trị từng mức thông qua lựa
chọn Values. Ta nhập các giá trị (465 467,5 470 472,5 475
476,5) vào mục Values để vẽ đường contour cho các mức
giá trị này của hàm mục tiêu.
o Kiểu hiển thị đồ thị đường mức là các vùng tô đặc (Area)
hay các đường cong tại các mức (Contour lines) hay bổ
sung các ký hiệu chỉ dẫn. Ta chọn cả ba chế độ này để quan
sát hiệu ứng của các xác lập được chọn.

Hình 6.22. trình bày các đồ thị bề mặt và đường mức được vẽ với các thiết
lập nói trên.

194
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Hình 6.21. Đồ thị bề mặt (trái) và đường mức (phải) của ví dụ 6.7

Trên đồ thị contour, nhận thấy vùng tối ưu có giá trị hàm mục tiêu
lớn hơn 476,5. Ta cũng có thể xem xét lựa chọn các giá trị hàm mục tiêu
khác bằng cách kích phải chuột lên đồ thị, rồi chọn Crosshairs. Khi này rê
trên một vùng bất kỳ trên đồ thị, ta cũng thấy hộp hiển thị các xác lập x1, x2
và giá trị hàm mục tiêu tương ứng.

Tuy nhiên, cách xem xét như trên vẫn chủ yếu mang tính trực quan
và chưa chính xác. Hơn nữa, việc xác định vùng cực trị khi có nhiều hơn 2
biến bằng cách này là rất khó khăn. Công cụ tối ưu hóa giúp ta giải quyết
vấn đề này.

6.4.5. Tối ưu hóa đơn mục tiêu

6.4.5.1. Tính bằng tay

Mô hình hồi quy cho phép ta mô tả quan hệ của hàm mục tiêu phụ thuộc
vào các biến thí nghiệm dưới dạng hàm liên tục. Ta có thể chỉ ra điểm tối
ưu (đỉnh hoặc đáy của hàm, nếu có) và các điều kiện về giá trị của các biến
một cách không khó khăn.

Mô hình bậc 2 cho k biến có dạng:

n k k i −1
y = b0 + ∑ bi xi + ∑ xi2 + ∑∑ bij xi x j (6.3)
i =1 i =1 i = 1 j =1

195
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Điểm cực trị của hàm y là điểm mà tại đó các đạo hàm riêng của y theo
từng biến bằng nhau và bằng không, được mô tả như sau:

∂y ∂y ∂y
= = ... = =0 (6.4)
∂x 1 ∂ x 2 ∂x k

Trong trường hợp hàm chỉ có hai biến, ta có thể dễ dàng tìm điểm
cực trị thông qua các đồ thị bề mặt và đồ thị đường mức như ở phần trên.
Khi hàm có nhiều biến, cần sử dụng các công cụ toán học dưới đây

y = b0 + x' b + x' Bx (6.5)

Lưu ý là các ký hiệu in đứng, đậm trong các công thức là chỉ các ma trận.
Các ma trận của (6.5) được định nghĩa như sau:

⎡ x1 ⎤ ⎡ b1 ⎤ ⎡b11 b12 / 2 . . . b1k / 2 ⎤


⎢x ⎥ ⎢b ⎥ ⎢ b22 . . . b2 k / 2⎥
⎢ 2⎥ ⎢ 2⎥ ⎢ ⎥
⎢.⎥ ⎢.⎥ ⎢ . . . . ⎥
x = ⎢ ⎥; b = ⎢ ⎥; B = ⎢ ⎥ (6.6)
⎢.⎥ ⎢.⎥ ⎢ . . . ⎥
⎢.⎥ ⎢.⎥ ⎢ . . ⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎣ xk ⎦ ⎣bk ⎦ ⎣ đx bkk ⎦

Từ đó, có thể xác định điểm cực trị từ điều kiện:

∂y 1
= b + 2Bx = 0 Hay x s = − B −1 b (6.7)
∂x 2

Giá trị cực trị của hàm mục tiêu được tính bằng cách thay các giá trị
xi của ma trận xs tìm được tại điểm cực trị vào phương trình mô tả hàm
mục tiêu.

196
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Để đánh giá điểm cực trị là điểm cực đại, cực tiểu hay điểm yên
ngựa (Saddle point), cần xem xét các giá trị đặc trưng λi của ma trận B. Giá
trị λ được xác định từ điều kiện:

B − λI = 0 (6.8)

Nếu các giá trị đặc trưng λi đều âm, điểm cực trị là điểm cực đại;
nếu chúng cùng dương, điểm cực trị là cực tiểu; còn nếu các giá trị λI khác
dấu nhau, điểm cực trị thuộc dạng yên ngựa.

Ví dụ 6.8. Tìm điểm cực trị cho hàm mục tiêu trong ví dụ 6.6.

Giải. Trong ví dụ 6.6, ta đã tìm được phương trình hồi quy của hàm mục
tiêu là:

y = 476,334+ 1,779x1 − 0,765x2 − 1,431x12 − 1,931x22 + 0,58 x1x2

Thay vào các công thức (6.6), ta có:

⎡x ⎤ ⎡ b ⎤ ⎡ 1,779 ⎤ ⎡ b11 b12 / 2⎤ ⎡ − 1,431 0,58 / 2⎤


x = ⎢ 1 ⎥; b = ⎢ 1 ⎥ = ⎢ ⎥; B = ⎢ b / 2 b ⎥ = ⎢ 0,58 / 2 − 1,931⎥
⎣x2 ⎦ ⎣b2 ⎦ ⎣ − 0,765⎦ ⎣ 12 22 ⎦ ⎣ ⎦

Từ đó, tìm điểm cực trị theo công thức (6.7):

−1
1 1 ⎡− 1,431 0,29 ⎤ ⎡ 1,779 ⎤
x s = − B − 1b = − ⎢
2 2 ⎣ 0,29 − 1,931⎥⎦ ⎢⎣ − 0,765⎥⎦
1 ⎡ − 0,721 − 0,108⎤ ⎡ 1,779 ⎤ ⎡ 0,599 ⎤
=− ⎢ =
2 ⎣ − 0,108 − 0,534⎥⎦ ⎢⎣ − 0,765⎥⎦ ⎢⎣− 0,108⎥⎦

Như vậy, hàm mục tiêu sẽ đạt cực trị tại x1=0,599 và x2=-0,108 (đơn vị mã
hóa).

197
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Giá trị cực trị là:

ym = 476,334 + 1,779x1s − 0,765x2 s − 1,431x12s − 1,931x22s + 0,58 x1s x2 s


= 476,334+ 1,779.0,599− 0,765.(− 0,108) − 1,431(0,599) 2
− 1,931(− 0,108)2 + 0,58.(0,599 )( −0,108) = 476,9088

Ta có thể chuyển các giá trị mã hóa của các biến về giá trị thực như sau:

195 + 165 195 − 165


x1th = + 0,599 ⋅ = 188,985;
2 2

294 + 262 294 − 262


x1th = + (− 0,108) ⋅ = 276,272;
2 2

Để xác định tính chất của điểm cực trị, ta tính giá trị đặc trưng λ theo công
thức (6.8):

− 1,431 − λ 0,29
B − λI = 0 ⇔ = 0 ⇔ λ1 = − 0,7704; λ2 = −0,485
0,29 − 1,931 − λ

Vì cả 2 giá trị đặc trưng đều âm, ta kết luận rằng, điểm cực trị của hàm mục
tiêu là điểm cực đại.

6.4.5.2. Tính bằng máy tính

Việc xác định cực trị cho hàm mục tiêu trong Minitab rất đơn giản.
Trước hết, mở Worksheet chứa dữ liệu thí nghiệm. Tiếp đó, kích menu
Stat > DOE > Response Surface > Response Optimizer. Chọn tên cột
chứa kết quả thí nghiệm cho hàm mục tiêu cho hộp Selected. Tiếp đó, kích
nút Setup để thiết lập các giá trị xác định cách tìm cực trị. Có các lựa chọn
sau:

198
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

- Goal: chọn dạng cực trị muốn tìm ( Maximize – tối đa; Minimize –
tối thiểu hay Target : giá trị mong muốn);
- Nhập các giá trị giới hạn cho hàm mục tiêu:
∗ Lower: Nhập giá trị giới hạn dưới của giá trị hàm mục tiêu;
∗ Target : Nhập giá trị mong muốn cho hàm mục tiêu;
∗ Upper: Nhập giá trị giới hạn trên cho hàm mục tiêu.

Nếu tìm cực tiểu, cần nhập 2 giá trị Target và Upper; khi tìm cực đại,
cần nhập 2 giá trị Target và Lower. Nếu tìm một giá trị mong muốn, cần
nhập cả 3 giá trị Lower, Target và Upper. Các giá trị được nhập cần đảm
bảo nguyên tắc Lower < Target < Upper.

Kích nút OK trong các hộp thoại. Kết quả phân tích tối ưu sẽ được
Minitab hiển thị bằng đồ thị Optimization Plot và bằng văn bản trên cửa
sổ Session.

Ví dụ 6.9. Tìm cực trị cho hàm mục tiêu cho ví dụ 6.6 bằng máy tính.

Trong Minitab, kích menu Window và chọn tên Worksheet chứa


dữ liệu của thí nghiệm CCD. Worksheet này sẽ hiển thị lên phía trên. Kích
menu Stat > DOE > Response Surface > Response Optimizer. Chọn tên
cột Y_CCD cho danh sách Selected . Kích nút Setup, chọn chức năng
Maximize. Nhập giá trị tùy ý, chẳng hạn 200 cho ô Lower và một giá trị
lớn hơn, chẳng hạn 300 cho ô Target. Kích nút OK cho các hộp thoại. Đồ
thị tối ưu được Minitab hiển thị như minh họa trên hình 6.22a. Hình 6.22b
minh họa kết quả hiển thị trên cửa sổ Session.

Nhận thấy các kết quả do Minitab tính toán khớp với kết quả
ta đã tính toán bằng tay trong ví dụ 6.8. Một số sai lệch nhỏ do ta đã làm
tròn số khi tính toán trong ví dụ 6.8.

199
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

(a) (b)
Hình 6.22. (a) Đồ thị tối ưu và (b) số liệu kết quả tối ưu.

Trên đồ thị tối ưu (hình 6.22a), giá trị các biến được hiển thị trong 2
cột (x1 và x2), bao gồm giá trị thấp (Low), giá trị cao (High). Giá trị các
biến cho ra mục tiêu tối ưu được hiển thị ở giữa (Cur – viết tắt của
Current). Ta có thể nhấn chuột vào đường kẻ thẳng đứng trong từng cột đồ
thị và dịch chuyển để lựa chọn các xác lập giá trị khác cho từng biến. Giá
trị hàm mục tiêu sẽ tự động cập nhật theo. Tùy chọn này cho phép ta đánh
giá kết quả thu được nếu muốn chỉnh lại giá trị các biến. Lý do là trong
nhiều trường hợp, điều kiện vận hành đối tượng thực tế không cho phép các
biến nhận giá trị chính xác đúng như tính toán.

Trong kết quả tính toán, ta thấy có đại lượng desirability nhận giá
trị bằng 1. Ý nghĩa của đại lượng này sẽ được phân tích ở phần sau.

6.5. Tối ưu hóa đa mục tiêu

6.5.1. Cách tiếp cận

Các bài toán tối ưu thường có mục tiêu là một trong ba loại sau đây:

1. Tối thiểu hóa (Minimization): hàm mục tiêu càng nhỏ càng tốt;
2. Tối đa hóa (Maximization): hàm mục tiêu càng lớn càng tốt;
3. Hạn mức (Target): hàm mục tiêu đạt được một giá trị nào đó.

200
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Bài toán tối ưu đa mục tiêu đặt ra khi cần thỏa mãn đồng thời một
số chỉ tiêu nhất định. Chẳng hạn, ta mong muốn đạt được chất lượng sản
phẩm cao nhất, nhưng đồng thời cũng muốn đạt được giá thành là nhỏ nhất.
Nhiều khi các lợi ích của các hàm mục tiêu này lại xung đột lẫn nhau.
Chẳng hạn, chất lượng càng cao thì giá thành cũng càng lớn. Để giải bài
toán tối ưu đa mục tiêu, ta cần chấp nhận một số “thỏa hiệp” cho một số
hàm mục tiêu nào đó. Chẳng hạn, ta ưu tiên đạt chất lượng cao nhất, nhưng
do không đạt được khi đó có giá thành nhỏ nhất, nên chấp thuận rằng, giá
thành cần phải nhỏ hơn một mức nào đó.

Trong thực tế, ngay cả với bài toán đơn mục tiêu hay với mục tiêu
được ưu tiên nhất của bài toán đa mục tiêu, nhiều khi ta cũng phải chấp
nhận giá trị thua kém so với cực trị của nó. Chẳng hạn, do hạn chế về khả
năng điều chỉnh các thông số thiết bị, hay điều kiện vận hành an toàn v.v…
không cho phép thiết lập một số biến thí nghiệm ở mức giá trị như tính
toán. Do vậy, giá trị “tối ưu” của hàm mục tiêu như đã dự đoán trên mô
hình thống kê là không thể đạt được. Người ta đưa ra khái niệm mức độ đạt
được của hàm mục tiêu so với kỳ vọng. Mức độ này được lượng hóa thông
qua các đại lượng hàm kỳ vọng (desirability function) và trọng số (weight).

Trong bài toán tối ưu đa mục tiêu, hàm kỳ vọng chung (Overall
desirability) được tổng hợp từ các hàm kỳ vọng của từng chỉ tiêu. Bài toán
tối ưu hóa có nhiệm vụ là tối đa hóa giá trị hàm kỳ vọng chung. Đại lượng
mức quan trọng (Importance) được dùng để lượng hóa tầm quan trọng của
từng mục tiêu so với mục tiêu tổng thể và từ đó, tính được giá trị hàm kỳ
vọng chung.

Gọi giá trị hàm kỳ vọng của chỉ tiêu thứ i là di, hệ số mức độ quan
trọng của chỉ tiêu thứ i là ri, bài toán có tất cả n chỉ tiêu, thì giá trị hàm kỳ
vọng tổng hợp chung D được tính theo công thức:

D = ( r1 + r2 + ... rn ) d1r1 ⋅ d 2r2 ⋅ ... ⋅ d nrn (6.9)

201
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Nếu các chỉ tiêu có mức độ quan trọng (được ưu tiên) như nhau, thì
giá trị hàm kỳ vọng chung được tính theo công thức:

D = n d1 ⋅ d 2 ⋅ ... ⋅ d n (6.10)

Bài toán tối ưu đa mục tiêu được mô tả dưới dạng:

D → max . (6.11)

Các đại lượng hàm kỳ vọng, trọng số và hệ số mức độ quan trọng được lần
lượt giới thiệu trong các phần dưới đây.

6.5.2. Hàm kỳ vọng

Hàm kỳ vọng (desirability function) dùng để đánh giá mức độ đạt


được của một hàm mục tiêu so với giá trị mong muốn. Hàm kỳ vọng của
một chỉ tiêu nhận giá trị từ 0 đến 1. Về bản chất, giá trị của hàm kỳ vọng
chính là giá trị chuyển đổi của hàm chỉ tiêu sang dạng thức phù hợp để tính
toán. Người ta định nghĩa hàm kỳ vọng di của một mục tiêu thứ i thông
qua các biểu thức toán học như dưới đây.

a. Khi hàm mục tiêu yi là tối đa hóa

⎧0 khi yi ≤ Li
⎪ wi
⎪⎛ yi − Li ⎞
d i = ⎨⎜⎜ ⎟⎟ khi Li < yi < Ti (6.9)
⎪⎝ iT − Li ⎠
⎪1 khi yi ≥ Ti

Trong đó, giá trị Li là mức giá trị giới hạn vùng chấp thuận được,
còn Ti là giá trị mong muốn của hàm mục tiêu yi. wi là trọng số của hàm
mục tiêu đó. Khái niệm trọng số sẽ được phân tích kỹ hơn ở phần sau. Nếu

202
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

wi =1 có nghĩa là nếu hàm mục tiêu càng gần giá trị mong muốn bao nhiêu
thì mức độ “kỳ vọng” càng lớn bấy nhiêu (tỷ lệ bậc nhất).

Giá trị giới hạn chấp Giá trị mong muốn T


thuận L (Lower) (Target)

d=1
0<d<1
(Lý tưởng)

d=0
(Thất vọng hoàn toàn)

Giá trị hàm mục tiêu tăng, mức độ kỳ vọng tăng

Hình 6.23. Hàm kỳ vọng của bài toán tối đa hóa có trọng số bằng 1

Sơ đồ hàm kỳ vọng cho bài toán tối đa hóa có trọng số được minh
họa trên hình 6.23. Trên hình vẽ, ta có thể thấy rõ ý nghĩa của hàm kỳ vọng
tương quan với giá trị có thể nhận được của hàm mục tiêu. Hàm mục tiêu
càng lớn và tiến sát đến giá trị mong muốn thì mức độ kỳ vọng đạt được
càng cao. Khi đã đạt được bằng hoặc cao hơn giá trị mong muốn, mức độ
kỳ vọng bằng 1.

b. Khi hàm mục tiêu yi là tối thiểu hóa

⎧1 khi yi ≤ Ti
⎪ wi
⎪⎛ U i − y i ⎞
d i = ⎨⎜⎜ ⎟⎟ khi Ti < yi < U i (6.10)
⎪⎝ iU − Ti ⎠
⎪0 khi yi ≥ U i

Trong đó, Ui là mức giới hạn trên của vùng chấp thuận được khi tối
thiểu hóa. Hình 6.24 minh họa sơ đồ hàm kỳ vọng cho bài toán tối thiểu
hóa có wi =1.

203
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Giá trị mong muốn T Giá trị giới hạn chấp


(Target) thuận U (Upper)

d=1 0<d<1
(Lý tưởng)

d=0
(Thất vọng hoàn toàn)

Giá trị hàm mục tiêu tăng, mức độ kỳ vọng giảm

Hình 6.24. Hàm kỳ vọng của bài toán tối thiểu hóa có trọng số bằng 1

c. Khi hàm mục tiêu yi là đạt giá trị xác định

Nhiều khi, ta mong muốn hàm mục tiêu đạt được không lớn hơn,
không nhỏ hơn mà càng gần với một giá trị cụ thể nào đó. Chẳng hạn, ta
mong muốn kích thước gia công càng gần với một giá trị kích thước xác
định trước. Khi này, ngoài một giá trị mong muốn T, ta còn có một giá trị
giới hạn trên U và một giá trị giới hạn dưới L cho khoảng “có thể chấp
thuận được” khi hàm mục tiêu không chính xác bằng T.

Hàm kỳ vọng khi này có dạng:

⎧0 khi yi ≤ Li
⎪ wi
⎪⎛ yi − Li ⎞
⎪⎜⎜ T − T ⎟⎟ khi Li < yi < Ti
⎪⎪⎝ i i ⎠
d i = ⎨1 khi yi = Ti (6.11)
⎪ wi
⎪⎛⎜ Ui − yi ⎞⎟ khi Ti < yi < U i
⎪⎜ U − T ⎟
⎪⎝ i i ⎠
⎪⎩0 khi yi ≥ U i

Sơ đồ minh họa ý nghĩa của hàm kỳ vọng này có dạng như trên hình 6.25.

204
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Giá trị giới hạn chấp


Giá trị giới hạn chấp Giá trị mong muốn T thuận trên U (Upper)
thuận dưới L (Lower) (Target)

0<d<1 0<d<1

d=0 d=0
(Thất vọng hoàn toàn) (Thất vọng hoàn toàn)

Giá trị hàm mục tiêu càng gần T, mức độ kỳ vọng càng tăng

Hình 6.25. Hàm kỳ vọng của hàm mục tiêu đạt giá trị xác định
ố ằ
6.5.3. Trọng số

Giá trị của trọng số (weight) khi mô tả hàm kỳ vọng sẽ quyết định
hình dạng của đồ thị biểu diễn hàm này. Trên đây, ta đã thấy hình dạng của
hàm trọng số khi trọng số bằng 1.

1,0

w = 0,2
0,8
Hàm kỳ vọng d

w=1
0,6

0,4

w= 5
0,2

0,0

Giới hạn dưới L Giá trị mong muốn,T


Giá trị hàm mục tiêu y

Hình 6.25. Hàm kỳ vọng của bài toán tối đa hóa


với các giá trị trọng số khác nhau

Khi chọn trọng số càng lớn hơn 1, ta càng nhấn mạnh tầm quan trọng của
việc hàm mục tiêu gần với đích mong muốn. Ngược lại, khi trọng số nhỏ
hơn 1, ta nới rộng mức độ chấp thuận hơn khi hàm mục tiêu ở xa đích
mong muốn. Giá trị trọng số trong tính toán tối ưu được lấy trong khoảng

205
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

từ 0,1 đến 10. Hình 6.26 minh họa ảnh hưởng của trọng số w đến hàm kỳ
vọng cho bài toán tối ưu tìm cực đại. Hình 6.26 minh họa hai hàm kỳ vọng
cho bài toán cực tiểu hóa và bài toán có mục tiêu đạt giá trị xác
định.
1,0 1,0
w = 0,2
w = 0,2
0,8 0,8

w= 1
Hàm kỳ vọng d

Hàm kỳ vọng d
w=1
0,6 0,6

0,4 0,4

w=5
0,2 0,2

w=5
0,0 0,0

Giá trị mong muốn,T Giới trên, U Giới hạn dưới, L Giá trị mong muốn, T Giới hạn trên, U
Giá trị hàm mục tiêu y Giá trị hàm mục tiêu y
(a) (b)
Hình 6.26. Hàm kỳ vọng của (a) bài toán tối thiểu hóa;
(b) bài toán đạt một giá trị xác định với các giá trị trọng số khác nhau

Trên hình 6.25, ta thấy với w = 5, chỉ khi giá trị hàm mục tiêu rất
gần với giá trị đích thì hàm kỳ vọng mới có giá trị lớn. Điều này có nghĩa
chỉ các giá trị hàm mục tiêu lớn mới được coi là có ý nghĩa. Trái lại, khi
w = 0,2; các giá trị hàm mục tiêu khá xa giá trị mong đợi cũng được coi là
có ý nghĩa (hàm kỳ vọng gần với giá trị tối đa hơn so với khi w = 1).

Nhận xét tương tự cũng có thể rút ra từ các đồ thị của bài toán tối
thiểu hóa (hình 6.26a) và bài toán có mục tiêu là một giá trị xác định (hình
6.23b). Các ảnh hưởng của trọng số có thể tóm tắt như sau:

- Khi giá trị trọng số càng lớn, giá trị hàm mục tiêu càng phải rất gần
giá trị đích mong muốn mới có giá trị kỳ vọng cao.
- Khi giá trị trọng số nhỏ, giá trị của hàm mục tiêu cách xa giá trị
đích mong muốn cũng có thể có giá trị kỳ vọng cao.

6.5.4. Hệ số mức độ quan trọng

206
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Bài toán tối ưu hóa có nhiệm vụ tối đa hóa giá trị hàm kỳ vọng
chung. Trong tính toán tối ưu, thuật ngữ Importance (tầm quan trọng) dùng
để chỉ hệ số dùng để phản ánh mức độ quan trọng của từng chỉ tiêu trong
một bài toán đa mục tiêu. Muốn ưu tiên một chỉ tiêu nào đó cao hơn các chỉ
tiêu khác, ta gán cho nó hệ số mức độ quan trọng lớn hơn các hệ số mức độ
quan trọng của các chỉ tiêu kia. Hệ số mức độ quan trọng được lấy trong
khoảng từ 0,1 đến 10.

6.5.5. Ví dụ minh họa

Từ ví dụ 6.1 đến ví dụ 6.9, ta đã thực hiện một quá trình hoàn chỉnh
để tối ưu hóa một chỉ tiêu chất lượng quan trọng của một sản phẩm. Các thí
nghiệm khởi đầu, leo dốc, kiểm định vùng dừng và xác định cực trị của
thông số Y đã được thực hiện. Bên cạnh chỉ tiêu chất lượng Y, bây giờ ta sẽ
quan tâm thêm đến một chỉ tiêu quan trọng khác, chẳng hạn, giá thành của
sản phẩm. Giả sử chi phí cho sản xuất sản phẩm tại mỗi điểm thí nghiệm bề
mặt chỉ tiêu (các thí nghiệm CCD trong ví dụ 6.5) có thể tính toán được. Ta
muốn tìm tập xác lập các thông số đầu vào x1 và x2 sao cho chất lượng của
sản phẩm (thông số Y) là cao nhất, đồng thời giá thành sản phẩm (ta gọi là
thông số Z) là nhỏ nhất.

Ví dụ 6.10. Giá thành sản xuất tương ứng Z tại các lần thí nghiệm bề mặt
chỉ tiêu của ví dụ 6.5 đã được ghi lại và bổ sung vào cột Z, tạo thêm bên
cạnh cột chỉ tiêu Y_CCD đã có như hình 6.27. Tìm điều kiện tối ưu để
Y_CCD đạt giá trị lớn nhất, đồng thời Z là nhỏ nhất?

Giải

Bước 1. Trước hết, ta xây dựng mô hình hồi quy mô tả hàm Z phụ thuộc
các biến thí nghiệm. Chọn menu Stat > DOE > Response Surface >
Analyze Response Surface Design. Chỉ định cột Z cho hộp hàm mục tiêu
Responses. Chọn chức năng phân tích sử dụng biến mã hóa (Analyze data
using: Coded Units). Kích nút Terms và chọn Full quadratic để chọn sử

207
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

dụng dạng mô hình bậc 2 đầy đủ. Kích nút >> để chắc chắn tất cả các thành
phần của mô hình bậc 2 được xem xét. Kích nút OK trong các hộp thoại.
Kết quả phần các hệ số của mô hình hồi quy như hình 6.28.

Hình 6.27. Bổ sung thông tin cột giá thành Z cho ví dụ 6.5

Quan sát nhanh kết quả (hình 6.28), ta thấy ngay các thành phần
x2*x2 và x1*x2 của mô hình hồi quy đều có giá trị p (0,147 và 1,000) lớn
hơn nhiều so với mức ý nghĩa α (0,05). Điều này chứng tỏ các thành phần
này không nên có mặt trong phương trình hồi quy.

Hình 6.28. Hồi quy lần 1 cho hàm Z

Ta loại bỏ thành phần x1*x2 trước vì thành phần này có giá trị p lớn
nhất. Chọn menu Stat > DOE > Response Surface > Analyze Response
Surface Design, kích nút Terms, kích chọn thành phần AB (ký hiệu cho

208
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

x1*x2) trong danh sách Slected rồi kích nút < để loại bỏ thành phần này.
Kích các nút OK. Ta được kết quả hồi quy mới như hình 6.29.

Hình 6.29. Hồi quy lần 2 cho hàm Z

Nhận thấy vẫn còn thành phần x2*x2 có giá trị p khá lớn (0,12). Ta
tiếp tục loại bỏ thành phần này. Lặp lại các bước như trên và chọn thành
phần BB trong danh sách Selected và bỏ ra khỏi danh sách xử lý. Cuối
cùng ta thu được kết quả hồi quy và phân tích phương sai như trên hình
6.30.

Hình 6.29. Hồi quy lần 3 cho hàm Z

Mô hình hồi quy này có các thành phần đều có giá trị p rất nhỏ (nhỏ
hơn 0,1); đồng thời phân tích phương sai cũng cho thấy, mức độ phù hợp

209
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

của mô hình là tốt (giá trị p = 0,856; lớn hơn nhiều so với mức ý nghĩa α).
Đến đây, ta có thể yên tâm sử dụng mô hình hồi quy này cho bước tối ưu
hóa.

Bước 2. Tìm giá trị cực tiểu của Z. Kích menu Stat > DOE > Response
Surface > Response Optimizer. Chọn Z cho hộp Responses. Kích nút
Setup để xác lập các điều kiện tìm kiếm (Xem minh họa trên hình 6.30). Ta
chọn Goal (mục tiêu) là Minimize (cực tiểu). Vì chưa biết giá trị cực tiểu
là bao nhiêu nên ta tạm đặt giá trị mong muốn (Target ) là 0; chọn giá trị
Upper tùy ý. Kích nút OK của các hộp thoại.

Hình 6.30. Các xác lập tìm cực tiểu

Minitab sẽ cho kết quả giá trị nhỏ nhất của giá thành Z trên cửa sổ Session
như hình 2.31. Giá thành Z có giá trị tối thiểu là 791,785 nhưng ta lại kỳ
vọng nó bằng 0. Chính vì vậy, hàm mức độ kỳ vọng đạt được rất thấp. Trên
hình vẽ, ta thấy mức độ kỳ vọng chỉ là desirability = 0,120239. Tuy nhiên,
khi xét một mục tiêu đơn lẻ, giá trị này không quan trọng; miễn là ta tìm
được giá trị cực trị thực của hàm mục tiêu.

Hình 6.31. Kết quả tìm cực tiểu của giá thành Z

210
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Bước 3. Tìm lời giải bài toán tối ưu hai mục tiêu đồng thời. Ta đã biết giá
trị cực đại của Y_CCD là 476,908; còn giá trị cực tiểu của Z là 791,785.
Hai hàm này có lợi ích xung đột nhau. Ta cần xác định tập hợp các giá trị
x1 và x2 thỏa mãn hài hòa cả hai yêu cầu là Y_CCD lớn nhất, còn Z nhỏ
nhất có thể; đồng thời chỉ ra cụ thể các giá trị này.

Kích menu Stat > DOE > Response Surface > Response
Optimizer. Chọn cả Y_CCD và Z cho hộp Responses. Kích nút Setup để
xác lập các điều kiện tìm kiếm (Xem minh họa trên hình 6.32).

Hình 6.32. Các xác lập tối ưu hóa 2 mục tiêu Y_CCD và Z

Ta chọn Goal (mục tiêu) là Maximize cho hàm Y_CCD; Minimize


cho hàm Z. Với hàm mục tiêu Y_CCD, ta nhập 2 giá trị: 475 cho giới hạn
dưới ( Lower) và 476 cho đích mong muốn (Target ). Điều này có nghĩa, ta
mong muốn tìm xác lập để có được Y_CCD đạt được giá trị 476; nếu
không được, ta chấp nhận “lùi” xuống và chấp thuận giá trị 475 chẳng hạn.
Cũng tương tự, với hàm Z, ta nhập giá trị mong muốn 792 vào ô Target và
giá trị 795 vào ô Upper (giả định rằng nếu không được Z thấp đến mức
792 thì đành chấp nhận Z cao bằng 795 là cùng). Kích nút OK của các hộp
thoại. Kết quả tối ưu được trình bày trên cửa sổ Session như hình 6.33.

Hình 6.33. Kết quả tối ưu hóa đồng thời Y_CCD và Z

211
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Trên hình 6.33, ta thấy chương trình đưa ra thông báo: “*NOTE* No
optimal solution found” (Ghi chú: không tìm thấy lời giải tối ưu). Có
nghĩa là, không có tập giá trị x1 và x2 nào đồng thời cho ra Y_CCD nằm
trong khoảng từ 475 đến 476 và Z từ 792 đến 795 cả. giá trị và đồ thị tối
ưu Optimization Plot (hình 6.34).

Để tìm hiểu rõ điều này, ta


quan sát đồ thị tối ưu được hiển thị
trên cửa sổ Optimal Plot (xem
hình 6.34). Trên hình vẽ ta thấy,
nếu Y_CCD chỉ có thể đạt giá trị
cao nhất là 472,0482 đồng thời với Hình 6.34. Một phần đồ thị tối ưu hóa
đồng thời Y_CCD và Z
Z đạt giá trị thấp nhất là 793,8667.

Rõ ràng, nếu ta ưu tiên cả hai mục tiêu như nhau thì dù đã chấp
nhận một “khoảng cực trị” (Y_CCD=475÷476; Z=792÷795), ta vẫn không
thể tìm được tập thông số đầu vào đạt được cả hai mục tiêu một lúc.

Giả sử ta nhân nhượng thêm một bước, chấp nhận giá thành Z có
thể cao đến 810, miễn là đạt được mục tiêu về chất lượng. Lặp lại lệnh tối
ưu hóa (Stat > DOE > Response Surface > Response Optimizer), kích
nút Setup và nhập giá trị 810 vào ô Upper của hàm mục tiêu Z; kích nút
OK của các hộp thoại, ta được kết quả như trên hình 6.35.

Hình 6.35. Kết quả tối ưu khi nới Z lên 810

212
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Kết quả trên hình 6.35 cho ta thấy, lời giải tối ưu được tìm thấy cho
ra Y_CCD đạt giá trị 475,909; xấp xỉ giá trị mong muốn là 476 và do vậy,
đạt mức độ kỳ vọng là trên 90,9% (desirability = 0,909081). Còn mục tiêu
giá thành cũng “chấp nhận được” vì cũng rơi vào khoảng chấp thuận,
nhưng ở xa giá trị kỳ vọng (792) hơn, nên chỉ đạt mức độ kỳ vọng khoảng
31,56%. Mức độ kỳ vọng đạt được chung cho cả hai mục tiêu được tính ra
khoảng trên 53% (Composite Desirability = 0,535623).

Giả sử ta muốn cố gắng tìm giá trị Y_CCD cao hơn nữa, chấp nhận
giá thành cao hơn mức vừa tìm được (miễn là vẫn nằm trong khoảng giới
hạn là tối đa bằng 810), ta có thể nhấn mạnh “tầm quan trọng” của mục tiêu
giá thành. Chẳng hạn, ta có thể phát biểu “Chất lượng có ý nghĩa quan
trọng gấp 10 lần giá thành”. Ta thực hiện điều này bằng cách lặp lại lệnh
tối ưu hóa, vào mục Setup; nhập giá trị “hệ số mức độ quan trọng” cho hàm
mục tiêu Y_CCD bằng 5 và cho hàm Z bằng 0,1; kết quả tính toán được
minh họa trên hình 6.35.

Hình 6.35. Kết quả tối ưu khi điều chỉnh


mức độ quan trọng của các hàm mục tiêu

Kết quả trên hình 6.35 cho thấy, hàm mục tiêu Y_CCD đạt được giá
trị 476,003; cao hơn cả mức kỳ vọng (là 476); do vậy giá trị mức độ kỳ
vọng đạt được bằng 1 (tức là đạt 100% kỳ vọng). Hàm Z tăng lên chút ít,
giá trị Z rời xa hơn mức độ mong muốn và do vậy, mức độ kỳ vọng đạt

213
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

được của Z giảm xuống còn 27,21%. Tuy nhiên, bài toán tối ưu chung lại
đạt được trên 97,47% kỳ vọng đặt ra (Composite Desirability = 0,974799).

Ta có thể dừng quá trình tìm kiếm tối ưu tại đây và kết luận: tập thông số
tối ưu là: x1= 195,642 và x2=268,172; các thông số chất lượng và giá thành
lần lượt đạt Y_CCDmax=476,003 và Zmin= 805,103.

Ta có thể dừng quá trình tìm kiếm tối ưu tại đây và kết luận rằng tập
thông số tối ưu có các xác lập: x1= 195,642 và x2=268,172; các thông số
chất lượng và giá thành lần lượt đạt Y_CCDmax=476,003 và Zmin= 805,103.

Ta có thể tiến hành tính các giá trị hàm kỳ vọng bằng tay để hiểu rõ
cách đánh giá mức độ thỏa mãn điều kiện tối ưu đã thực hiện bằng máy
tính cho trường hợp được minh họa trên hình 6.35.

- Tính giá trị hàm mức độ kỳ vọng đạt được cho mục tiêu Y_CCD theo
công thức 6.12:

1
⎛ Y _ CCDmax − L1 ⎞ 475,909 − 475
d1 = ⎜⎜ ⎟⎟ = = 0,909
⎝ T1 − L1 ⎠ 476 − 475

- Tính giá trị hàm mức độ kỳ vọng đạt được cho mục tiêu Z theo công thức
6.13:

⎧⎪⎛ U − Z ⎞1 810 − 804,319 5,681


d 2 = ⎨⎜⎜ 2 min
⎟⎟ = = = 0,315611
U − T
⎪⎩⎝ 2 2 ⎠ 810 − 792 18

Hàm mức độ kỳ vọng tổng hợp được tính theo công thức 6.10:

D = d1d 2 = 0,909 ⋅ 0,315611 = 0,535622

214
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Các kết quả này đúng như đã hiển thị trên hình 6.35. Như vậy, phần
mềm thực hiện giải thuật tìm kiếm tối ưu đa mục tiêu theo đúng cách đã
trình bày theo các công thức 6.9 đến 6.14. Tuy nhiên, dễ thấy rằng việc tính
toán bằng tay cho các bài toán nhiều hàm mục tiêu là rất vất vả và không
cần thiết.

6.6. Các chú ý thiết kế thí nghiệm tối ưu

Tối ưu hóa bằng thực nghiệm thường được thực hiện thông qua việc
xây dựng mô hình bề mặt chỉ tiêu. Dưới đây là các lưu ý khi thiết kế các thí
nghiệm bề mặt chỉ tiêu:

- Số lần thí nghiệm cần thiết là tích số giữa số lần lặp (Replication) với
số điểm thí nghiệm đã thiết kế. Nói cách khác, mỗi lần lặp là một lần
thực hiện lại toàn bộ kế hoạch thí nghiệm đã thiết kế. Ví dụ, với thí
nghiệm CCD 2 biến với 5 điểm thí nghiệm trung tâm, mỗi lần lặp cần
13 thí nghiệm. Nếu lặp 2 lần, ta sẽ cần thực hiện 26 thí nghiệm. Lời
khuyên là nên chia khối cho mỗi lần lặp;
- Việc lặp lại thí nghiệm nhằm giảm bớt các sai số do nhiễu. Mục đích
lặp để xác định một cách tin cậy các yếu tố ảnh hưởng chính đã được
thực hiện ở bước thí nghiệm sàng lọc. Do vậy, nếu không có yêu cầu
gì đặc biệt với thí nghiệm tối ưu hóa, một lần lặp là đủ;
- Nếu việc thực hiện thí nghiệm CCD gặp khó khăn, có thể chọn dạng
kế hoạch Box-Behnken.
- Nếu có ba biến thí nghiệm, kế hoạch thí nghiệm Box-behnken chỉ cần
15 lần chạy sẽ tiết kiệm hơn so với kế hoạch CCD cần 20 lần chạy;
- Nếu có 5 biến thí nghiệm, kế hoạch CCD với 32 lần chạy sẽ tiết kiệm
hơn kế hoạch Box-behnken với 43 lần chạy;
- Cần thực hiện thí nghiệm kiểm định vùng dừng (vùng lân cận cực trị)
để khẳng định là mô hình hồi quy bậc nhất là không còn phù hợp trước
khi thực hiện các kế hoạch thí nghiệm bề mặt chỉ tiêu.

215
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

6.7. Kết luận chương

Chương này đã trình bày một cách có hệ thống từng bước của một quá
trình tối ưu hóa cho một hay nhiều chỉ tiêu đồng thời bằng phương pháp bề mặt
chỉ tiêu. Cần phân biệt hai thuật ngữ: phương pháp thí nghiệm bề mặt chỉ tiêu
(Response Surface Method) và thí nghiệm bề mặt chỉ tiêu (Response Surface
Design). Phương pháp bề mặt chỉ tiêu (RSM) là cách thức khảo sát và tìm vùng
cực trị hoặc vùng đáp ứng các giá trị xác định cho các hàm mục tiêu bằng cách
xây dựng các bề mặt chỉ tiêu. Phương pháp này được thực thi thông qua các giai
đoạn: thí nghiệm khởi đầu; leo dốc/xuống dốc; kiểm định vùng dừng (nếu tìm cực
trị) và cuối cùng là thiết kế, thực thi và phân tích thí nghiệm bề mặt chỉ tiêu. Thí
nghiệm bề mặt chỉ tiêu gồm 2 dạng chủ yếu là thí nghiệm hỗn hợp tâm xoay
(CCD) và thí nghiệm Box-Behnken. Việc phân tích bề mặt chỉ tiêu để tối ưu hóa
hay đáp ứng yêu cầu đạt được một khoảng giá trị xác định cho các hàm mục tiêu
được thực hiện dễ dàng, nhanh chóng và chính xác bằng máy tính. Các kỹ thuật
thiết kế nâng cao khác như thiết kế Taguchi, thiết kế trộn (Mixture Design)… sẽ
được trình bày trong một tài liệu khác.

Câu hỏi chương 6

1. Mục đích của thí nghiệm tối ưu hóa? Phương pháp bề mặt chỉ tiêu là gì?
2. Nếu hàm mục tiêu không có cực trị, có nên khai thác phương pháp bề mặt
chỉ tiêu không? Tại sao?
3. Nêu nguyên tắc xác định bước và hướng leo dốc?
4. Thí nghiệm bề mặt chỉ tiêu bao gồm các dạng kế hoạch nào?
5. Khi nào nên sử dụng thiết kế CCD; khi nào nên dùng thiết kế Box-
Behnken?
6. Khái niệm đường mức (contour)? Cách vẽ các đường mức?
7. Tóm tắt cách xác định cực trị của bài toán tối ưu đơn mục tiêu bằng thực
nghiệm?
8. Tại sao trong bài toán tìm cực trị, ta cần chỉ ra giá trị mong muốn của hàm
mục tiêu?
9. Cách tiếp cận bài toán tối ưu đa mục tiêu?
10. Hàm kỳ vọng là gì? Tại sao cần sử dụng hàm này trong bài toán tối ưu đa
mục tiêu?
11. Phân biệt vai trò của tầm quan trọng (Importance) và trọng số (Weight)?
12. Thực hành các ví dụ trong bài.

216
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

PHỤ LỤC 1.
MỘT SỐ BẢNG THỐNG KÊ

P1.1. Bảng tra giá trị p cho phân phối chuẩn; p = Φ ( −∞ < Z < Z p )
Zp 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
-3,00 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
-2,90 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
-2,80 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
-2,70 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
-2,60 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
-2,50 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
-2,40 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
-2,30 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
-2,20 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
-2,10 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
-2,00 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
-1,90 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
-1,80 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
-1,70 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
-1,60 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
-1,50 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
-1,40 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
-1,30 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
-1,20 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
-1,10 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
-1,00 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
-0,90 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
-0,80 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
-0,70 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
-0,60 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
-0,50 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
-0,40 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
-0,30 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
-0,20 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
-0,10 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
-0,00 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641

217
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

Zp 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,00 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,10 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,20 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,30 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,40 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,50 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,60 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,70 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,80 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,90 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,00 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,10 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,20 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,30 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,40 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,50 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,60 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,70 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,80 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,90 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,00 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,10 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857,
2,20 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,30 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,40 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,50 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,60 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,70 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,80 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,90 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,00 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990

218
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

P1.2. Bảng giá trị tp cho phân phối Student-t có p = P(t p < t < ∞ )
p
0,001 0,0025 0,005 0,01 0,025 0,05 0,10
1 318,289 127,321 63,656 31,821 12,706 6,314 3,078
2 22,328 14,089 9,925 6,965 4,303 2,920 1,886
3 10,214 7,453 5,841 4,541 3,182 2,353 1,638
4 7,173 5,598 4,604 3,747 2,776 2,132 1,533
5 5,894 4,773 4,032 3,365 2,571 2,015 1,476
6 5,208 4,317 3,707 3,143 2,447 1,943 1,440
7 4,785 4,029 3,499 2,998 2,365 1,895 1,415
8 4,501 3,833 3,355 2,896 2,306 1,860 1,397
9 4,297 3,690 3,250 2,821 2,262 1,833 1,383
10 4,144 3,581 3,169 2,764 2,228 1,812 1,372
11 4,025 3,497 3,106 2,718 2,201 1,796 1,363
12 3,930 3,428 3,055 2,681 2,179 1,782 1,356
13 3,852 3,372 3,012 2,650 2,160 1,771 1,350
14 3,787 3,326 2,977 2,624 2,145 1,761 1,345
15 3,733 3,286 2,947 2,602 2,131 1,753 1,341
16 3,686 3,252 2,921 2,583 2,120 1,746 1,337
17 3,646 3,222 2,898 2,567 2,110 1,740 1,333
18 3,610 3,197 2,878 2,552 2,101 1,734 1,330
19 3,579 3,174 2,861 2,539 2,093 1,729 1,328
20 3,552 3,153 2,845 2,528 2,086 1,725 1,325
21 3,527 3,135 2,831 2,518 2,080 1,721 1,323
22 3,505 3,119 2,819 2,508 2,074 1,717 1,321
23 3,485 3,104 2,807 2,500 2,069 1,714 1,319
24 3,467 3,091 2,797 2,492 2,064 1,711 1,318
25 3,450 3,078 2,787 2,485 2,060 1,708 1,316
26 3,435 3,067 2,779 2,479 2,056 1,706 1,315
27 3,421 3,057 2,771 2,473 2,052 1,703 1,314
28 3,408 3,047 2,763 2,467 2,048 1,701 1,313
29 3,396 3,038 2,756 2,462 2,045 1,699 1,311
30 3,385 3,030 2,750 2,457 2,042 1,697 1,310
40 3,307 2,971 2,704 2,423 2,021 1,684 1,303
50 3,261 2,937 2,678 2,403 2,009 1,676 1,299
60 3,232 2,915 2,660 2,390 2,000 1,671 1,296
80 3,195 2,887 2,639 2,374 1,990 1,664 1,292
100 3,174 2,871 2,626 2,364 1,984 1,660 1,290
3,090 2,807 2,576 2,326 1,960 1,645 1,282

219
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

P1.3. Bảng giá trị χ 2p theo p = P (0 < χ 2 < χ 2p ) và số bậc tự do ν


p
0,005 0,01 0,025 0,05 0,1 0,9 0,95 0,975 0,99 0,995
1 0,00 0,00 0,00 0,00 0,02 2,71 3,84 5,02 6,63 7,88
2 0,01 0,02 0,05 0,10 0,21 4,61 5,99 7,38 9,21 10,60
3 0,07 0,11 0,22 0,35 0,58 6,25 7,81 9,35 11,34 12,84
4 0,21 0,30 0,48 0,71 1,06 7,78 9,49 11,14 13,28 14,86
5 0,41 0,55 0,83 1,15 1,61 9,24 11,07 12,83 15,09 16,75
6 0,68 0,87 1,24 1,64 2,20 10,64 12,59 14,45 16,81 18,55
7 0,99 1,24 1,69 2,17 2,83 12,02 14,07 16,01 18,48 20,28
8 1,34 1,65 2,18 2,73 3,49 13,36 15,51 17,53 20,09 21,95
9 1,73 2,09 2,70 3,33 4,17 14,68 16,92 19,02 21,67 23,59
10 2,16 2,56 3,25 3,94 4,87 15,99 18,31 20,48 23,21 25,19
11 2,60 3,05 3,82 4,57 5,58 17,28 19,68 21,92 24,73 26,76
12 3,07 3,57 4,40 5,23 6,30 18,55 21,03 23,34 26,22 28,30
13 3,57 4,11 5,01 5,89 7,04 19,81 22,36 24,74 27,69 29,82
14 4,07 4,66 5,63 6,57 7,79 21,06 23,68 26,12 29,14 31,32
15 4,60 5,23 6,26 7,26 8,55 22,31 25,00 27,49 30,58 32,80
16 5,14 5,81 6,91 7,96 9,31 23,54 26,30 28,85 32,00 34,27
17 5,70 6,41 7,56 8,67 10,09 24,77 27,59 30,19 33,41 35,72
18 6,26 7,01 8,23 9,39 10,86 25,99 28,87 31,53 34,81 37,16
19 6,84 7,63 8,91 10,12 11,65 27,20 30,14 32,85 36,19 38,58
20 7,43 8,26 9,59 10,85 12,44 28,41 31,41 34,17 37,57 40,00
21 8,03 8,90 10,28 11,59 13,24 29,62 32,67 35,48 38,93 41,40
22 8,64 9,54 10,98 12,34 14,04 30,81 33,92 36,78 40,29 42,80
23 9,26 10,20 j 11,69 13,09 14,85 32,01 35,17 38,08 41,64 44,18
24 9,89 10,86 12,40 13,85 15,66 33,20 36,42 39,36 42,98 45,56
25 10,52 11,52 13,12 14,61 16,47 34,38 37,65 40,65 44,31 46,93
26 11,16 12,20 13,84 15,38 17,29 35,56 38,89 41,92 45,64 48,29
27 11,81 12,88 14,57 16,15 18,11 36,74 40,11 43,19 46,96 49,65
28 12,46 13,56 15,31 16,93 18,94 37,92 41,34 44,46 48,28 50,99
29 13,12 14,26 16,05 17,71 19,77 39,09 42,56 45,72 49,59 52,34
30 13,79 14,95 16,79 18,49 20,60 40,26 43,77 46,98 50,89 53,67
35 17,19 18,51 20,57 22,47 24,80 46,06 49,80 53,20 57,34 60,27
40 20,71 22,16 24,43 26,51 29,05 51,81 55,76 59,34 63,69 66,77
45 24,31 25,90 28,37 30,61 33,35 57,51 61,66 65,41 69,96 73,17
50 27,99 29,71 32,36 34,76 37,69 63,17 67,50 71,42 76,15 79,49
55 31,73 33,57 36,40 38,96 42,06 68,80 73,31 77,38 82,29 85,75
60 35,53 37,48 40,48 43,19 46,46 74,40 79,08 83,30 88,38 91,95
70 43,28 45,44 48,76 51,74 55,33 85,53 90,53 95,02 100,43 104,21
80 51,17 53,54 57,15 60,39 64,28 96,58 101,88 106,63 112,33 116,32
90 59,20 61,75 65,65 69,13 73,29 107,57 113,15 118,14 124,12 128,30
100 67,33 70,06 74,22 77,93 82,36 118,50 124,34 129,56 135,81 140,17

220
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

P1.3. Phân phối F: Bảng giá trị của F ứng với mức p=0,05
1

2 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120
1 161,4199,5215,7224,6230,2 234,0236,8238,9240,5241,9243,9245,9248,0249,1250,1251,1252,2253,3254,3
2 18,5119,0019,1619,2519,30 19,3319,3519,3719,3819,4019,4119,4319,4519,4519,4619,4719,4819,4919,50
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 8,53
4 7,71 6,94 6,59_ 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5,80 5,77 5,75 5,72 5,69 5,66 5,63
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,40 4,36
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,94 3,87 3,84 3,81 3,77 3,74 3,70 3,67
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,23
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,22 3,15 3,12 3,08 3,04 3,01 2,97 2,93
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 2,94 2,90 2,86 2,83 2,79 2,75 2,71
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 2,77 2,74 2,70 2,66 2,62 2,58 2,54
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,72 2,65 2,61 2,57 2,53 2,49 2,45 2,40
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2,54 2,51 2,47 2,43 2,38 2,34 2,30
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,53 2,46 2,42 2,38 2,34 2,30 2,25 2,21
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,46 2,39 2,35 2,31 2,27 2,22 2,18 2,13
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2,33 2,29 2,25 2,20 2,16 2,11 2,07
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 2,12 2,08 2,04 1,99 1,95 1,90 1,84
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,09 2,01 1,96 1,92 1,87 1,82 1,77 1,71
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,01 1,93 1,89 1,84 1,79 1,74 1,68 1,62
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,92 1,84 1,79 1,74 1,69 1,64 1,58 1,51
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,84 1,75 1,70 1,65 1,59 1,53 1,47 1,39
120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,96 1,91 1,83 1,75 1,66 1,61 1,55 1,50 1,43 1,35 1,25
3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,75 1,67 1,57 1,52 1,46 1,39 1,32 1,22 1,00

221
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

P1.4. Phân phối F: Bảng giá trị của F ứng với mức p=0,01
1

2 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120
1 4052 4999 5404 5624 5764 5859 5928 5981 6022 6056 6107 6157 6209 6234 6260 6286 6313 6340 6366
2 98,5099,0099,1699,2599,30 99,3399,3699,3899,3999,4099,4299,4399,4599,4699,4799,4899,4899,4999,50
3 34,1230,8229,4628,7128,24 27,9127,6727,4927,3427,2327,0526,8726,6926,6026,50 26,41 26,3226,2226,13
4 21,2018,0016,6915,9815,52 15,21 14,9814,8014,6614,5514,3714,2014,0213,9313,8413,7513,6513,5613,46
5 16,2613,2712,0611,3910,97 10,6710,4610,2910,1610,05 9,89 9,72 9,55 9,47 9,38 9,29 9,20 9,11 9,02
6 13,7510,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,72 7,56 7,40 7,31 7,23 7,14 7,06 6,97 6,88
7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,47 6,31 6,16 6,07 5,99 5,91 5,82 5,74 5,65
8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,67 5,52 5,36 5,28 5,20 5,12 5,03 4,95 4,86
9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 5,11 4,96 4,81 4,73 4,65 4,57 4,48 4,40 4,31
10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,71 4,56 4,41 4,33 4,25 4,17 4,08 4,00 3,91
11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,40 4,25 4,10 4,02 3,94 3,86 3,78 3,69 3,60
12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 4,16 4,01 3,86 3,78 3,70 3,62 3,54 3,45 3,36
13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 3,96 3,82 3,66 3,59 3,51 3,43 3,34 3,25 3,17
14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94 3,80 3,66 3,51 3,43 3,35 3,27 3,18 3,09 3,00
15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,67 3,52 3,37^ 3,29 3,21 3,13 3,05 2,96 2,87
20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 3,23 3,09 2,94 2,86 2,78 2,69 2,61 2,52 2,42
25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13 2,99 2,85 2,70 2,62 2,54 2,45 2,36 2,27 2,17
30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 2,84 2,70 2,55 2,47 2,39 2,30 2,21 2,11 2,01
40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,66 2,52 2,37 2,29 2,20 2,11 2,02 1,92 1,80
60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,63 2,50 2,35 2,20 2,12 2,03 1,94 1,84 1,73 1,60
120 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,56 2,47 2,34 2,19 2,03 1,95 1,86 1,76 1,66 1,53 1,38
6,63 4,61 3,78 3,32 3,02 2,80, 2,64 2,51 2,41 2,32 2,18 2,04 1,88 1,79 1,70 1,59 1,47 1,32 1

222
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

PHỤ LỤC 2.
CĂN BẢN SỬ DỤNG MINITAB
P.2.1. Khởi động và giao diện Minitab

Có 2 cách để khởi động Minitab: kích kép chuột vào biểu tượng
Minitab trên nền Desktop hoặc Start > Program > Minitab Solutious >
Minitab 15 Statistical Software English. Màn hình làm việc của Minitab
cũng bao gồm các menu, thanh công cụ tương tự các ứng dụng Windows
khác.

Màn hình làm việc của Minitab bao gồm 2 cửa sổ: Session và
Worksheet (Xem hình P1). Cửa sổ Session hiển thị các kết quả tính toán
dưới dạng văn bản. Ta cũng có thể nhập các câu lệnh cần thực hiện tại đây.
Bạn đọc quan tâm đến cách thực hiện bằng câu lệnh, hãy tham khảo các
sách hướng dẫn sử dụng Minitab.

Hình P.1. Màn hình làm việc của Minitab 15

Một kế hoạch thiết kế và phân tích thí nghiệm được lưu dưới dạng
một đề án (Project) của Minitab. Mỗi đề án được lưu trên đĩa dưới dạng
một file có đuôi .MPJ. Các dữ liệu thí nghiệm được chứa trong các
Worksheet có định dạng như các bảng tính Excel. Một đề án có thể có một

223
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

hoặc nhiều Worksheet. Ngầm định sau khi khởi động, Minitab mở sẵn một
file đề án mới có sẵn một Worksheet trắng.

P2.2. Làm việc với dữ liệu

Một Worksheet có thể chứa tới 4.000 cột và 10.000.000 hàng. Các
cột được ký hiệu bằng C1, C2…; các hàng được đánh số thứ tự. Ta có thể
nhập các dữ liệu dạng văn bản, dạng số… vào các ô của một Worksheet
bằng cách kích chọn ô cần nhập rồi gõ vào đó. Cũng có thể copy các bảng
dữ liệu từ MS. Word; MS. Excel rồi dán vào Worksheet. Cũng có thể kích
menu File > Open Worksheet rồi mở các file dữ liệu đã tạo trước đó.
Minitab cho phép mở các file dạng MS.Excel một cách bình thường. Ngoài
ra, Minitab cũng có thể mở dữ liệu chứa trong các file văn bản dạng text
(.TXT), dạng CSV (Comma-Separated Values).

Các thao tác chỉnh sửa dữ liệu cũng tương tự như khi làm việc với
các dạng bảng biểu trên các phần mềm khác. Tuy nhiên cần lưu ý là
Minitab không cho nhập công thức tính cho từng ô dữ liệu như trong Excel.
Mỗi cột dữ liệu trong Minitab phải có cùng định dạng, hoặc là văn bản
(Text), hoặc là số (Numeric), hoặc là ngày giờ (Date/Time).

Ngay bên dưới hàng chứa tên các cột (C1, C2…), Minitab để dành
một dòng trống có màu xám (xem hình P1). Ta có thể nhập tên muốn đặt
cho các cột vào đó. Thường sử dụng chức năng này khi sử lý các dữ liệu
riêng lẻ; còn khi thiết kế và xử lý số liệu thí nghiệm, ta chỉ cần đặt tên cho
cột chứa kết quả thông số đầu ra mà thôi.

P2.3. Quản lý tập tin Minitab

Như đã biết, một tập tin đề án của Minitab có thể chứa nhiều
Worksheet. Quá trình thí nghiệm của ta có thể có nhiều giai đoạn và cần
nhiều dạng thiết kế thí nghiệm khác nhau. Mỗi khi một lệnh xây dựng kế

224
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

hoạch thí nghiệm được thực hiện, Minitab lại lưu trữ kết quả lên một
Worksheet nằm trong đề án hiện thời.

Để lưu trữ tập tin đề án thí nghiệm lên ổ cứng máy tính, kích menu
File > Save Project hoặc nhấn Ctrl S. Muốn lưu tập tin đề án với tên khác,
chọn File > Save Project As… Toàn bộ các Worksheet và thông tin trên
cửa sổ Session, các đồ thị… sẽ được lưu trong một tập tin có đuôi .MPJ, có
tên do ta tự đặt. Muốn tạo một đề án mới, kích menu File > New… và chọn
Minitab Project trong hộp thoại. Nên chú ý thường xuyên lưu cất nội dung
của đề án đang thực hiện.

Khi thiết kế thí nghiệm, các kế hoạch thí nghiệm được Minitab xây
dựng và lưu trữ trên các Worksheet. Nếu Worksheet hiện thời là
Worksheet trắng (chưa có dữ liệu), Minitab sẽ lưu lên Worksheet này. Trái
lại, Minitab sẽ tạo một Worksheet mới và lưu kết quả thiết kế thí nghiệm
lên đó.

Minitab cho phép lưu trữ riêng từng Worksheet thành một tập tin
riêng biệt có đuôi .MTW. Sau này, mỗi khi ta ra lệnh mở tập tin này,
Minitab sẽ copy nội dung trên Worksheet vào một Worksheet mới của file
đề án đang mở. Mọi thao tác ta thực hiện trên đề án sẽ không ảnh hưởng
đến file MTW gốc. Để lưu nội dung sửa đổi nếu có của Worksheet đè lên
file gốc, chỉ cần kích File > Save Worksheet. Nếu muốn lưu vào một tập
tin mới khác, kích menu File > Save Worksheet As… Lưu ý là không nên
ra lệnh Close cho Worksheet đang mở - Minitab sẽ xóa bỏ nó khỏi đề án và
không khôi phục lại được. Muốn tạo thêm Worksheet mới, kích menu File
> New… và chọn “Minitab Worksheet” trong hộp thoại. Lời khuyên là
nên lưu cất các Worksheet thành các tập tin riêng biệt sẽ thuận tiện cho
việc truy cập chúng trong quá trình làm việc với tập tin đề án.

Các đồ thị (Graph) được Minitab tạo ra theo yêu cầu của người
dùng thông qua menu Graph hoặc trong quá trình thực hiện lệnh phân tích
số liệu thí nghiệm. Muốn chỉnh sửa từng thành phần của đồ thị như định

225
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

dạng tiêu đề, kích cỡ đường nét… , ta kích kép lên thành phần đó và chỉnh
sửa theo ý muốn. Để lưu từng đồ thị thành một tập tin đồ họa riêng biệt,
kích menu File > Save Graph As… Minitab cho phép lưu thành các file
dạng ảnh thông dụng (JPG, BMP, TIF…), đặc biệt là dạng Enhanced
Metafile (EMF) cho phép ta có thể chèn và sửa trong MS Word.

Các thông tin trong cửa sổ Session có thể được chọn, copy và dán
sang các ứng dụng sử lý văn bản khác. Cũng có thể lưu cất toàn bộ nội
dung thông tin trong cửa sổ này bằng cách kích menu File > Save Session
Window As… Nếu ra chọn chỉ một phần nội dung cửa sổ rồi mới ra lệnh
lưu cất, Minitab sẽ chỉ lưu phần được chọn.

Trong môi trường Minitab, có thể có rất nhiều đối tượng được tạo
ra, bao gồm cửa sổ Session, các Worksheet, Graph… Để truy cập đến đối
tượng nào (xem, copy, chỉnh sửa), ta kích menu Window rồi kích chọn tên
đối tượng đó.

Trên đây là tóm tắt các thao tác căn bản, giúp bạn đọc làm quen với
môi trường Minitab. Để sử dụng cho mục đích thiết kế và sử lý số liệu thí
nghiệm, hãy mở Minitab, gõ các ví dụ trong từng chương của tài liệu này
và thực hiện các bước theo hướng dẫn.

226
Quy hoạch thực nghiệm trong kỹ thuật – Nguyễn Văn Dự & Nguyễn Đăng Bình

TÀI LIỆU THAM KHẢO

1. Raymond H. Myers, Douglas C. Montgomery, and Christine M.


Anderson-Cook, Response Surface Methodology: Process and
Product Optimization Using Designed Experiments, John Wiley &
Sons, Inc., 3rd Edition, 2009.
2. Paul G. Mathew, Design of Experiments with Minitab, ASQ Quality
Press, 2005.
3. Jiju Antony, Design of Experiments for Engineers and Scientists,
Elsevier Science & Technology Books, 2003.
4. Douglas C. Montgomery, Design And Analysis Of Experiments,
John Wiln & Sons, Inc., 5 th Edition.
5. Angela Dean and Daniel Voss, Design and Analysis of
Experiments, Springer 1999.
6. NIST, Engineering Statistics Handbook, 2006.
7. Phạm Văn Lang và Bạch Quốc Khang, Cơ sở lý thuyết Quy hoạch
thực nghiệm và Ứng dụng trong kỹ thuật nông nghiệp, Nhà xuất bản
Nông nghiệp, 1998.
8. Bùi Minh Trí, Xác suất thống kê và Quy hoạch thực nghiệm, Nhà
xuất bản khoa học và kỹ thuật, Hà Nội, 2006.
9. Nguyễn Minh Tuyển, Quy hoạch thực nghiệm, Nhà xuất bản khoa
học và kỹ thuật, Hà Nội, 2005.
10. Nguyễn Văn Tuấn, Phân tích số liệu và tạo biểu đồ bằng R, Nhà
xuất bản khoa học và kỹ thuật, Hà Nội, 2006.

227

View publication stats

You might also like