Professional Documents
Culture Documents
Bai Thuc Hanh
Bai Thuc Hanh
Nếu công cụ này đã được cài đặt thì ta sẽ thấy mục “Data analysis” xuất hiện trong trình
đơn “Tool” như Hình 1.1 hoặc đã hiển thị trên thanh công cụ “Data”.
Hình 1.1: Công cụ phân tích “Data analysis” trong trình đơn “Tool”.
Tuy nhiên, ở một số máy, khi cài đặt thì chức năng này không được đưa vào. Vì vậy ta
chọn “Add-In” ở mục “Tool” để cài phần công cụ này vào.
Sau khi bấm vào Add-In, màn hình sẽ xuất hiện một hộp chọn lựa, ở đây ta chọn vào ô
có dòng chữ “Analysis ToolPak” rồi bấm OK, chương trình sẽ tự động đưa công cụ phân
tích vào. Bây giờ trong mục “Tool” đã có công cụ “Data analysis” sẵn sàng cho việc xử lý
số liệu (Hình 1.1).
2. Các chức năng trong công cụ phân tích
Bấm vào “Data analysis” ta sẽ thấy xuất hiện hộp chọn lựa có nhiều chức năng khác
nhau như Hình 1.2. Dưới đây xin giới thiệu công dụng của các chức năng chính có liên
quan đến phần thực hành của môn học.
Descriptive Statistics
Phần này giúp phân tích thống kê mô tả cho một dân số như tính trung bình, độ lệch
chuẩn, số trung vị.
Regression
Phân tích tương quan hồi quy tuyến tính. Các hàm số nào biến đổi được qua dạng tuyến
tính đều có thể dùng chức năng này để phân tích. Ngoài ra cũng có thể vẽ các đồ thị
tương quan hồi quy nhờ vào chức năng đồ thị sẽ trình bày sau.
Tất cả các chức năng trên sẽ được áp dụng cụ thể trong Phần 2.
PHẦN 2. BÀI TẬP VÀ THỰC HÀNH XỬ LÝ SỐ LIỆU
Các bài tập trong phần này tương ứng với các chương trong bài giảng môn học Thống
kê ứng dụng và phương pháp thí nghiệm. Các bài giải được trình bày ngay trong mỗi
chương.
Bài tập 1.1: Hai dây chuyền sản xuất mì gói A và B có số liệu trọng lượng tịnh ghi nhận
như sau:
Bảng 1.1: Trọng lượng tịnh gói mì (g).
A B
Trọng lượng (g) Số gói Trọng lượng (g) Số gói
90-94 3 90-94 1
94-98 4 94-98 2
98-102 15 98-102 6
102-106 7 102-106 8
106-110 9 106-110 8
110-114 2 110-114 17
114-118 2 114-118 6
Bài tập 1.2: Cho một dân số y có trung bình µ = 100. Tính xác suất của dân số lớn hơn
110 (hay P (110<y)) khi phương sai là 81 và 100. Phương sai phải bằng bao nhiêu để
xác suất này là hiếm xảy ra?
Bài tập 1.3: Kiểm tra trọng lượng tịnh của hộp cho S = 25.8 g. Hỏi số mẫu n phải bằng
bao nhiêu để |y - µ| ≤ 4 g với độ tin cậy 95%?
2. Chương 4: So sánh một và hai dân số
Đây là trắc nghiệm được sử dụng khi mẫu khá lớn (n > 30 với số liệu khó lấy mẫu và n >
100 với số liệu dễ lấy mẫu) và thông tin về dân số như phương sai là biết trước.
Nhà sản xuất chế tạo ra một thiết bị mà chuông sẽ reo lên khi nồng độ CO trong không
khí đạt 10 mg/m3. Để kiểm tra thiết bị này chúng ta cho khí CO vào trong một hộp kín
chứa không khí và ghi nhận giá trị nồng độ CO mà tại đó thiết bị reo chuông. Kết quả 18
lần đo như sau: 10.25; 10.37; 10.66; 10.22; 10.44; 10.38; 10.63; 10.40; 10.39; 10.26;
10.32; 10.35; 10.54; 10.33; 10.48; 10.68 mg/m 3. Giả sử rằng đã biết phương sai σ2 =
1.0434 (mg/m3)2. Hãy kết luận thiết bị này có đạt chuẩn hay không?
Đây là trắc nghiệm được sử dụng khi số mẫu nhỏ và thông tin về phương sai dân số
không biết trước. Lúc này ta dựa vào phương sai mẫu S2 để tính Sy và t. Ví dụ như sau:
đo thân nhiệt của 25 con cua trong không khí ở nhiệt độ 24.3oC như sau:
Bài 2.3a: Kiểm tra xem sau khi dùng thuốc 1 tuần với liều lượng 10 ppm/kg thể trọng/ngày
thì cơ thể có giảm cân hay không? Giá trị khác biệt khối lượng giữa sau và trước khi
dùng thuốc của 12 người như sau: 0.2; -0.5; -1.3; -1.6; -0.7; 0.4; -0.1; 0.0; -0.6; -1.1; -1.2;
-0.8. Hãy trắc nghiệm và cho kết luận.
B. So sánh 2 dân số
Bài tập 2.1b. Độ pH của dung dịch nước quả được đo đạc từ mẫu ở các bình chứa khác
nhau lấy từ hai kho bảo quản A và B. Hỏi đã đầy đủ chứng cớ để cho thấy có sự khác
biệt giữa hai kho bảo quản này?
Kho A: 1.68 1.72 1.70 1.51 1.81 1.91 1.49 1.68 1.54 1.83
Kho B: 2.01 1.99 2.11 1.85 2.00 1.73 1.97
Bài tập 2.2b. Kiểm tra nồng độ coliforms (trên 100 mL) trong dịch thực phẩm từ 5 kiểu
đóng gói cho kết quả dưới đây. Trong đó nhóm đối chứng là không có xử lý nhiệt được
so sánh với nhóm có xử lý nhiệt. Hỏi có đủ chứng cớ để nói rằng nồng độ coliforms say
khi xử lý nhiệt là ít hơn so với đối chứng không?
Bài tập 3.1: Bố trí một thí nghiệm kiểu ngẫu nhiên hoàn toàn để tìm ảnh hưởng của chất
phụ gia lên độ giòn của bánh. Chất phụ gia được pha vào theo các tỷ lệ 10%, 15%, 20%
và 25% theo trọng lượng chất rắn của bánh và được nướng trong lò nướng ở nhiệt độ
120 oC. Hãy trình bày bảng thí nghiệm.
Bài tập 3.2: Ở bài tập trên, biết rằng lò nướng gồm có 1 tầng và có thể chứa được vừa
đúng 8 bánh. Biết rằng khi ta cài đặt một nhiệt độ nướng, nhiệt độ thực tế bên ngoài gần
cửa khác với nhiệt độ bên trong gần vách lò. Hãy trình bày bảng bố trí thí nghiệm theo
các yêu cầu sau:
a. Bố trí thí nghiệm để tìm ảnh hưởng của chất phụ gia pha theo các tỷ lệ đã cho lên độ
giòn bánh. Yêu cầu của thí nghiệm là giảm tối đa ảnh hưởng vị trí xếp bánh lên kết
quả đo.
b. Cũng với bài toán như trên nhưng trong trường hợp lò chỉ có thể chứa 6 bánh. Lúc
này nên chọn các tỷ lệ chất phụ gia như thế nào trong khoảng 10-25%?
c. Vẽ sơ đồ biểu thị quy trình bố trí thí nghiệm kiểu khối ngẫu nhiên đầy đủ cho cả 2
trường hợp a và b.
d. Làm thí nghiệm câu a với các nhiệt độ 120, 130 và 140oC.
Bài tập 3.3: Nếu như thao tác công nhân cũng là yếu tố ngoại cảnh ảnh hưởng đến độ
giòn của bánh. Hãy bố trí kiểu Latin bình phương cho hai trường hợp a và b của câu 2.
4. Chương 6 và 7: Thí nghiệm 1 yếu tố
Bài tập 4.1: Thí nghiệm này thực hiện khi chỉ có một yếu tố thay đổi và điều kiện ngoại
cảnh thật đồng nhất. Ví dụ, phân tích ảnh hưởng của thời gian nấu lên hàm lượng vitamin
C (mg/kg) có trong thực phẩm (Ví dụ 6.1 ở chương 6 của bài giảng). Hãy phân tích kết
quả Bảng 4.1
Bài tập 4.2: Thí nghiệm này thực hiện khi chỉ có một yếu tố thay đổi và điều kiện ngoại
cảnh không đồng nhất. Ví dụ phân tích độ cứng của bánh bằng 4 đầu đo khác nhau (A,
B, C và D). Vì nhiệt độ lò nướng không đồng đều nên ta tiến hành đo độ cứng trên 4 vị
trí khác nhau của bánh. Số liệu cho trên Bảng 2.5 (Ví dụ 7.1 chương 7 của bài giảng).
Nhà nghiên cứu muốn tìm ảnh hưởng của nồng độ chất ô nhiễm lên sự phát triển của
cây trồng. Khảo sát gồm có 4 nghiệm thức (4 mức độ ô nhiễm A, B, C, D) mà phòng thí
nghiệm chỉ có sẵn 4 lồng kính để trồng. Như vậy mỗi lần lặp lại phải thực hiện ở mỗi thời
gian (tháng) khác nhau. Ở đây yếu tố chính là mức ô nhiễm, và hai yếu tố ngoại cảnh là
lồng kính và thời gian. Để loại trừ sai số do ảnh hưởng của lồng kính và thời gian, ta bố
trí kiểu Latin như sau, trong đó “cột” tương ứng với lồng kính và “hàng” tương ứng với
thời gian. Các ký tự A, B, C và D tương ứng với mức ô nhiễm. Kết quả giá trị đo là trọng
lượng chất khô (g) của cây sau mỗi đợt trồng cho ở bảng sau:
Bảng 2.6: Trọng lượng chất khô (g) ứng với 4 mức ô nhiễm (A, B, C và D).
Bài tập 5.1: Thí nghiệm 2 yếu tố để tìm ảnh hưởng của nhiệt độ sấy và xử lý ngâm đường
đến độ mềm của sản phẩm sấy. Quả được cắt lát với bề dày như nhau rồi đem sấy
(không xử lý ngâm đường), hoặc có xử lý ngâm ở dịch đường nồng độ 25% (yếu tố A).
Yếu tố B là nhiệt độ sấy: 50oC và 60oC. Mỗi thí nghiệm được lặp lại 3 lần. Các yếu tố
khác được giữ không đổi. Độ mềm sản phẩm được đánh giá qua lực cắt (Newton). Kết
quả như trên Bảng 5.1 sau (Bảng 8.4 của Chương 8 trong bài giảng):
A (%)
B (oC)
0 25
a1b1 a2b1
150.6 173.8
50
128.9 161.3
137.2 155.6
a1b2 a2b2
225.1 320.4
60
210.6 301.9
218.5 296.4
Bài tập 5.2: Trong thí nghiệm 2 yếu tố về độ mềm sản phẩm ở Bảng 5.1 trước đây (mục
5.1), nếu mỗi buổi chúng ta sấy được 2 mẻ, mỗi ngày làm 3 buổi (sáng, chiều và tối).
Nếu như nhiệt độ khí trời có ảnh hưởng đáng kể đến kết quả thí nghiệm thì chúng ta bố
trí mỗi buổi thành một khối. Số liệu cho như Bảng 5.2 dưới đây (Bảng 5.2 tương tự như
Bảng 5.1 nhưng mỗi lặp lại xem là một khối).
Bảng 5.2: Lực cắt đo từ sản phẩm sấy (N)
A (%)
B (oC) Khối
0 25
a1b1 a2b1
Sáng 150.6 173.8
50
Chiều 128.9 161.3
Tối 137.2 155.6
a1b2 a2b2
Sáng 225.1 320.4
60
Chiều 210.6 301.9
Tối 218.5 296.4
Bài tập 5.3: Trong thí nghiệm 2 yếu tố về độ mềm sản phẩm ở Bảng 5.1 trước đây (mục
5.1), nếu mỗi buổi chúng ta sấy được 2 mẻ, mỗi ngày làm 4 buối (sáng, trưa, chiều và
tối). Nếu như nhiệt độ khí trời có ảnh hưởng đáng kể đến kết quả thí nghiệm thì chúng
ta bố trí mỗi buổi thành một khối. Ngoài ra công nhân cũng là yếu tố ngoại cảnh. Thí
nghiệm được tiến hành với 4 công nhân và bố trí theo kiểu Latin bình phương (4x4). Số
liệu cho như Bảng 5.3 dưới đây.
Công nhân
Buổi
1 2 3 4
Khi cần xét đến sự tương quan giữa một biến số (biến phụ thuộc) lên một yếu tố nào đó
(biến độc lập) thì ta dùng phương pháp phân tích tương quan hồi quy.
Nếu quan hệ giữa biến phụ thuộc và biến độc lập có dạng đường thẳng thì tương quan
đó gọi là tuyến tính. Nếu chỉ có một biến độc lập thì tương quan gọi là tuyến tính đơn.
Y = b0 + b1X (2.1)
Bài tập 6.1: xây dựng mô hình tương quan của số liệu trong bảng sau (Số liệu không lặp
lại).
x y
1 7.6
1.2 8
1.4 9
1.6 7
1.8 10
2 8
2.2 11
2.4 14
2.6 10
2.8 16
3 18
3. 20
3.4 18
Bài tập 6.2: xây dựng mô hình tương quan của số liệu trong bảng sau (Số liệu có lặp
lại).
X Y X Y
1 2.3 5 2.0
1 1.8 5.6 3.5
2 2.8 5.6 2.8
3.3 1.8 5.6 2.1
3.3 3.7 6 3.2
4 2.6 6 3.4
4 2.6 6.5 3.4
4 2.2 6.9 5.0
4.7 3.2
Bài tập 6.3: Trong ví dụ dưới đây, nhà nghiên cứu nhận thấy kết quả ẩm độ cuối cùng
trong quá trình sấy có liên quan đến 4 thông số nhiệt độ sấy (Z1), lưu lượng không khí
sấy (Z2), tốc độ cung cấp (Z3) và ẩm độ ban đầu của vật liệu (Z4). Số liệu được mã hóa
thành các biến x1, x2, x3, x4 cho trên Bảng 6.3. Nhà nghiên cứu muốn dùng mô hình sau
để thiết lập tương quan hồi quy cho kết quả:
Biến đã mã hóa
Thí nghiệm
X1 X2 X3 X4 Y
1 1 1 1 -1 0.0883
2 1 1 -1 1 0.0186
3 1 -1 1 1 0.2366
4 -1 1 -1 1 0.0326
5 1 -1 -1 1 0.0237
6 -1 -1 1 -1 0.1802
7 -1 1 1 1 0.2736
8 -1 -1 -11 -1 0.0333
9 -1.682 0 0 0 0.1328
10 -1.682 0 0 0 0.0446
11 0 -1.682 0 0 0.1238
12 0 -1.682 0 0 0.0538
13 0 0 -1.682 0 0.0155
14 0 0 -1.682 0 0.2492
15 0 0 0 -1.682 0.0435
16 0 0 0 -1.682 0.1440
17 0 0 0 0 0.0752
18 -1 -1 -1 1 0.0455
19 1 1 -1 -1 0.0151
20 -1 1 -1 -1 0.0257
21 1 -1 -1 -1 0.0189
Bài tập 6.4: Thí nghiệm về ẩm độ cân bằng của đường Maltodextrin (Xmd) và hỗn hợp
đường Maltodextrin-Sucrose (X) theo 3 nhiệt độ (T) và 6 ẩm độ tương đối của không khí
(Rh) cho trên Bảng 6.4.
Bảng 6.4: Ẩm độ cân bằng (% cơ sở khô) của đường theo nhiệt độ (K) và ẩm độ tương
đối của không khí.
T Rh X Xmd
298 .1130 2.520 3.369
298 .2251 4.376 5.128
298 .3110 6.019 6.688
298 .4361 8.600 8.639
298 .5289 10.882 9.423
298 .6886 16.949 11.195
308 .1125 2.414 3.259
308 .2135 4.013 4.868
308 .3205 5.749 6.270
308 .4317 8.067 8.221
308 .4991 9.418 8.641
308 .6696 14.798 10.412
318 .1116 2.296 3.148
318 .2037 3.675 4.597
318 .3278 5.423 5.853
318 .4320 7.426 7.558
318 .4693 8.113 7.858
318 .6526 13.256 10.389
Ta có thể dùng mô hình Henderson cải biên (phương trình 2.5) để tìm các hằng số trong
quan hệ giữa X, Rh, và T. Phương trình Henderson:
Hãy dùng phần mềm tính toán để tìm các hệ số trong phương trình 2.5
PHẦN 3. CÁC BÀI TẬP LÀM THÊM
Bài tập 1 (so sánh 2 dân số): Để nghiên cứu ảnh hưởng của việc tiêu thụ đường sucrose
lên áp suất máu, nhà nghiên cứu chọn 9 người để thử nghiệm. Mẫu đối chứng là áp suất
máu của 9 người được đo trước khi sử dụng đường. Mẫu so sánh là giá trị áp suất máu
của những người trên đo được sau 13 ngày dùng đường với liều lượng 50 g/ngày. Kết
quả áp suất máu cho trên bảng sau:
Bài tập 2: Để sản xuất cây lùn, một nhà làm vườn tiến hành thí nghiệm để khảo sát hiệu
quả của 4 hóa chất lên giảm kích thước cây trồng. Thí nghiệm bao gồm mẫu đối chứng
(không xử lý) và 4 xử lý hóa chất (A, B, C, D). Mỗi xử lý tiến hành cho 7 cây trồng trên 7
chậu (7 lặp lại). Thí nghiệm tiến hành trong nhà kính. Chiều dài đốt cây (cm) đo được
trên bảng sau:
Chậu Hóa chất
Không xử lý A B C D
1 9.9 8.5 4 10 9.5
2 9.6 7.4 5.8 7.7 11.2
3 10.5 7.5 5.1 8.1 10.3
4 9.9 8.5 5.8 9.8 9.3
5 8.0 9.5 5.7 11 7.6
6 8.9 8.5 4.6 9.8 8.3
7 11.5 10.4 6.2 8.1 9.9
Bài tập 3. Thí nghiệm cảm quan được tiến hành để khảo sát ảnh hưởng của công thức
phối trộn lên độ mềm của hamburger. Các thành viên nếm thử gồm 9 người được hỏi để
cho điểm về độ mềm hamburger (1 đến 9 điểm). Điểm 1 khi “quá mềm” và điểm 9 khi
“quá dai”. Kết quả cho điểm như sau:
a. Phân tích số liệu theo kiểu RCBD để loại trừ ảnh hưởng của thành viên nếm lên
kết quả đo. So sánh sự khác biệt giữa các công thức dùng phương pháp LSD.
b. Giả sử số liệu của thành viên 8 ứng với công thức D bị thất lạc. Dùng kỹ thuật xử
lý số liệu thất lạc để đánh giá số liệu này và tiến hành phân tích phương sai.
Bài tập 4. Một thí nghiệm được tiến hành để khảo sát ảnh hưởng của nấu vi ba và
thời gian làm tan chảy thịt đông lên nồng độ ATP của thịt. Thí nghiệm được lặp lại 4
lần cho kết quả trên bảng sau:
Thời gian nấu Thời gian làm tan Nồng độ ATP (µmol/g mô thịt)
(giây/g mô thịt) (phút) Lần 1 Lần 2 Lần 3 Lần 4
0 2.5 2.3 2.2 2.6
a. Đây là thí nghiệm 2 yếu tố bố trí kiểu ngẫu nhiên hoàn toàn (CRD). Hãy phân tích
phương sai và giải thích kết quả.
b. Nếu mỗi lặp lại tương ứng với một tuần. Giả sử điều kiện môi trường xung quanh
(ẩm độ và nhiệt độ) có ảnh hưởng đến kết quả thí nghiệm. Bây giờ mỗi lần lặp lại
được xem là một khối để giảm bớt ảnh hưởng của các tuần thí nghiệm lên kết
quả. Hãy phân tích phương sai theo kiểu khối đầy đủ ngẫu nhiên (RCBD) và giải
thích kết quả.