You are on page 1of 269

TS.

NGUYEN VAN ĐƯC(CHỦBIÊN)

PHƯƠNG PH ÁP
K IỂ M T R A

THỐNG KÊ
SINH HỌC

lite

x*<. '^ ị.Ặ

4®^
r r 7

NHÀ XUẤT BẢN


KHOA HỌC VÀ KỶ THUẬT
TS.NGUYỄN VĂN ĐỨC (chủ biên)
PGS.TS. LÊ THANH HẢí

PHƯƠNG PHÁP KIỂM TRA


THỐNG KÊ SINH HỌC

NHÀ XUẤT BẢN KHOA HỌC VÀ KỶ THUẬT


Ckịu trách nhiệni x u a t h a n : P G S. 'l'S. 'r ò DÀNG H ẢìẢJ
Biên tập : N G U Y ẺN KIM L O N íN G
Sửa b à i : N íỉU Y K N K I.M L O N í N G

Vèhìa : H Ư Ơ N G L A rA N

. ^ 2 — ^ 1 -.? 978 . 19.20.7,2001


KHKT - 2002

NHÀ XUẤT HẤN KHOA HỌC VÀ KỲ THUẬT


70 T rần H iín g Đ ạ o - Hà N ội

In 700 cuốn, khổ 16 X 24 tại xường in II Nhà in KHCN


Giấy phép xuất bàn sỏ' 978-19 cãp ngày 20-7-2001
In xong và nộp lưu chiếu tháng 5 năm 2002
LỜI NÓỈ ĐẦU

H iệ n n a y , k h o a h ọ c c ô n g n g h ệ n ó i c h u n g v à c ô n g n g h ệ s in h h ọ c n ó i
r iê n ị ỉ đ ã v à đ a n g t r ỏ th à n h m ộ t đ ộ n g lự c vô c ù n g q u a n tr ọ n g , t h ú c đ ẩ y lự c
lượng sòn xuất ngày một phát triển nhanh, mạnh và vừng chắc. Nhờ có
khoa học công nghệ mà hiệu quả của các ngành sinh học ứng dụng tăng
n h a n h k h ô n g c h ỉ vé n ă n g s u ấ t cao, c h ấ t lư ợ n g s ả n p h ẩ m t ố i m à h iệ u q u ả
kinh tế củng được nâng lên rõ rệt. sở dì đạt được hiệu quả cao như vậy
c h í n h là n h ờ k ế t q u ả c ủ a các c ô n g t r i n h n g h iê n cứ u k h o a h ọ c c ô n g n g h ệ
trong những thập kỷ qua.
Được sự quan tám cua Đầng và Nhà nước đến công tác nghiên cứu
khoa học công nghệ nên ngành công nghệ sinh học non trẻ của nước ta ngày
càng tiến bộ vờ đạt nhiều thành tích: năng suất sinh học nói chung và trong
n ô n g n g h iệ p n ó i r iê n g n g à y m ộ t nàng ca o và c h ấ t lượng ngày m ộ t t ố t h ơ n .
S o n g , n à n g s u ấ t v ẫ n c h ư a đ á p ứ n g đ ư ợ c h iệ u q u ả k in h t ế c a o v à c h ấ t lư ợ n g
sản phàm của ngành vẫn chưa đáp ứng được nhu cầu của người tiêu dùng.
V ì v ậ y , c ô n g tá c n g h iê n cứ u k h o a h ọ c c ô n g n g h ệ c ầ n p h ả i đ ư ợ c là m n h iề u
hơn nữa nhằm tìm ra những công nghệ có năng suất cao, chất lượng tốt và
có hiệu quả kinh tế trong điều kiện môi trường sinh thái ở nước ta.
Như chúng ta đã biết, trong nghiên cứủ khoa học, sau khi kết thúc thi
nghiệm cần phải thực hiện các phương pháp phân tứh, tính toán đê xác
định sự ảnh hưởng của từng nhân tô thi nghiệm nhằm tìm ra hiệu quả cao
nhất khí sử dụng chúng. Song, điều quan trọng nhất ỉà sau khỉ đã xác định
được sự ánh hưởng của từng Iihán tố thi nghiêm cần phải thực hiện các
phương pháp kiêm tra thông kê thích hỢp để khẳng định liệu giữa các nhân
tô đó có sự sai khác không và nêu có saỉ khác thi ý nghĩa sai khác đó ở mức
độ nào? Mục đích của các phương pháp kiếm tra này là khẳng định chắc
chắn những thành quá nghiên cứu đê những công trinh nghiên cứu khoa
hục công nghệ trở thành những tiến bộ kv thuật trong sản xuất nhằm nâng
hiệu quá kinh tế của ngành ngày một cao hơn.
Đê góp một phần nhỏ vào công tác nghiên cửu khoa học công nghệ, đặc
biệt trong việc kiểm tra khắng định sự sai khác giữa các nhân tố thí nghiệm
có ý nghĩa hăy không và nếu có thì ý nghĩa đó ở mức độ nào, cuốn sách
"Phương pháp kiểm tra thống kê sinh học" này giới thiệu với bạm đọ(
một sô'nội dung cơ bản về:
1. Chuyển dạng số liệu trước khi phân tích.
2. Kiểm tra độ tin cậy của số trung bình mẫu.
3. Kiểm tra sự sai khác giữa các sô trung binh mẫu.
4. Kiểm tra sự phù hợp giữa tần suất thực tế và lý thuyết.
5. Phương pháp phân tích phương sai.
Cuốn sách trình bày tương đối đầy đủ các phương pháp kiềm tra mức
độ tin cậy của sô trung binh, kiềm tra sự sai khác giữa các số trung binh
mẫu và mức độ sai khác giữa chúng, đặc biệt giới thiệu các phương pháp
chuyển dạng sô liệu trước khi phân tích, nếu chúng không thỏa mãn điều
kiện. Cuốn sách sẽ giúp bạn đọc củng cố thêm những kiến thức về toán sinh
học cơ bản, đặc biệt là các mô hình ứng dụng cho từng loại mục đích, yêu
cầu và nội dung cụ thể củng như các phương pháp kiểm tra thống kê mới
nhằm khẳng định các công trinh nghiên cứu của mình chắc chắn hơn. Với
những kiến thức hỗ trợ này, những công trình nghiên cứu đó nhanh chóng
trở thành những tiến bộ khoa học phục vụ đắc lực cho sản xuất. Tác giả hy
vọng rằng, cuốn sách sẽ trở thành một tài liệu tra cứu và ứng dụng trong
học tập và nghiên cứu về ngành toán thống kê sinh học của sinhviênđại
học, học viên làm thạc sĩ và tiến sĩ cũng như cho các cán bộ nghiên cửu và
giảng dạy ỏ các trường cao đẳng uà đại học trong lĩnh vực sinh học.
Cuốn sách không thê tránh khỏi những thiếu sót, rất mong được bạn
đọc góp ý đ ể tác giả hoàn thiện hơn trong lần tái bản sau. Tác giả vô cùng
trân trọng mọi sự đóng góp ý kiên của bạn đọc uà xin chân thành cảm ơn.

TIẾN Sỉ NGUYỄN VẢN ĐÚC


CHƯƠNG I

CHUYỂN DẠNG số LIỆU TRƯỚC KHI PHÂN TÍCH

A. TẠI SAO PHẢI CHUYỀN DẠNG?

T r o n g b ấ t c ứ m ộ t t h í ìigliiộiiì siiìh họ(* ììào, s a u k h i x á c đ ị n h đ ư ợ c các


tlì ò n^ S(V t h ô n g k ẻ cơ bà ìì c ủ a iừ u ịi n h â n lo ỉiluí s ố t r u n g b i n h m ẩ u (X) ,
độ l è c h chuẩn (Standard (leviatioM S[)). sai số c h u ẩ n (Standard error -
S E ) , h ộ sô" b i ế n d ị (coeíTicient oí’ v a n a t i o n • CV), vv, c ầ n p h ả i t h ự c h i ộ n
niột iố phương pháp kiếììì tra thòng kè siiilì học ììhât định n h ằm kh ẳn g
d ị n h s ự ả n h h ư ơ n g c ủ a l ừ n g n h ả n t ố và Iiìiii* (iộ ý n g h í a c ủ a s ự s a i k h á c c ủ a
c ác r h â n t ố đó.

H ơ n n ữ a , c h ú n g t a d à biết r ằ ì i g sô t r u n g b ì n h m ẫ u và độ lệ ch c h u ẩ n
m ầ u là h a i g i á t r ị t í n h dược c ú a niảu tìộc t r ù n g cho h a i t h a m s ố t r u n g
b ì n h (ụ ) v à đ ộ l ệ c h c h u ẩ n (ơ) c ủa q u a ĩ i ' í h e và l u ô n có s ự b i ế n đổi d ặ c
t r ư n ỉ c h o m ỗ i t í n h t r ạ i ì g c ủ a q u a ỉì th ề (lo. Sụ p h â n bô" c ủ a bộ sô' li ệ u c ú a
t ừ n g t h í n g h i ệ m t ạ o n é n mộ t d ư ờ n g cong (‘hu ã iì nià t ạ i dó s ẽ b i ể u t h ị m ộ t tý
lệ nl ấ t đ ị n h c ủ a d i ệ n tí c h được khéị) hỏ\ ^ ơ. N h ư v ậ y , c ác t h a m sô^ t h ô n g
kê ỊJ và ơ của quần thê đưực bieu thị íivn íống the toàn bộ những thông số
thôn^C k ẽ c ú a cá c m ầ u t h í ĩìKlìiẹìiK (ỉó la sù í r u n g b ì n h m ẫ u ( X ) và d ộ lệch
c h u n n (SD). T r o n g q u á t r ì n h xứ lý: Ị)liâĩì Íírỉì sỏ liôii r á c t h í n g h i ệ m , c h ú n g
ta c h ỉ đưỢ c p h é p d ừ n g X và S D v i cái' g ia t r ị d ó c h i h iế u t h ị đ ặ c t r ư n g c h o
t h í n g h iệ m đ ó c h ứ k h ô n g p h á i (‘ho (‘;1 (Ịuan thô lỏn.

H ơ n n ử a , h ầ u h ôt các t h ô n g sỏ thỏiìg kứ íỊiian t r ọ n g c ủ a m ẫ u d ể u p h ụ


t h u ộ : v à o s ô t r u n g b ì n h n ìẫ u và (lộ r h u á n m ẫ u . Vì v ậ y , xá c (lịnh c h í n h
x á c p á t r ị t r u n g b ì n h vn dộ lệch clìuàn vùn ìììầu là d i ề u co’ b á ii n h á i c ủ a
q u á : r ì n h p h â n t í c h k i ể m t r a thỏn^^ kê s inh học. f)e c á c t h ô n g sô t h ô n g kĩ*
s i n h h ọ c t h u d ư ợ c c ủ a bộ sô liệu có V iighÌM Iiliầiiì k h a n g đ ị n h d ú n g c ác kôt
q ư ả : ủ a t h í n g h i ệ m đỏi hôi giá trị tíììlì v iìi\ t ì u n g h ì n h m ẫ u p h ả i c h í n h xác.
G i á :rị t r u n g b ì n h m ẫ u chì (l úng và rlì inh x;u‘ khi và d u y n h ấ t s ự p h ả n bỏ
c ủ a j u ầ n i h e h a y c ủ a n h ó n i lììầu thí ìì.uhiỏin ph ải t u â n t h e o s ự Ị ) h a n bỏ

;)
chuẩn. Điều kiện để một quần thể hay một thí nghiệm đưỢc cỏng nnihận
phân bô"chuẩn là chúng phải thoả mân các điều kiện cơ bản sau:
1. Được phân bô" theo phương trình toán học G auss. Bản chất cờ bán
của phướng trình G auss được trình bày như sau:

1 ___( x - n ) ’ / 2 o ’

2. Đường cong của sự phân bô”chuẩn có tính đôì xứng và hai duôi ((tail)
của đưòng cong chuẩn càng cách xa trung tâm càng tiên sát trục hojành
nhưng không bao giò gặp trục hoành.
3. Tống diện tích tạo bỏi giữa đường cong chuẩn và trục hoành là niột
đđn vỊ hay biểu thị theo phần trăm là 100%. Vậy, theo tính chất toán học
thì sự phân bô' của mẫu th í nghiệm sẽ có:
- 68,26% của diện tích ấy bị chiếm khi tham số trung bình dó (được
cộng thêm một giá trị ơ về cả hai phía (± lơ ). Hay nói một cách khácc, có
68,26% số mẫu quan sát nằm trong phạm vi ụ ± lo;
- 95,44% của diện tích âV bị chiếm khi tham số trung bình đó được ;± 2ơ
(n ± 2 ơ);

- 99,99% của diện


tích ấy bị chiếm khi
tham s ố trung bình đó
được ± 3ơ (|.i ± 3ơ).
Tính châ”t này là tính
chất cđ bản nh ất và
được sử dụng một
cách rộng rãi nh ất cho
việc kiểm tra sự phân
bố chuẩn của số liệu
trước khi thực hiện Hinh 1. Đường cong chuẩn cùa sự phản bố cố tinh đối xứng
các phưđng pháp phân
tích kiểm tra thốhg kê sin h học (hình 1).
4. B ất kì giầ trị quan sá t nào (n) dựa trên đường cong chuấn cũng đưực
chuẩn hoá bỏi một số đđn vị độ lệch chuẩn của số liệu quan sát đó so vói
t h ^ ì số trung bình ụ và đxtec biểu thị bằng giá trị z mà giá trị z dược biểu
thị theo công thức sạu: t>

z=
trong đó:
- z là tỷ lộ giữa trung ỉ)ình <ỉộ lệclì ịr\ùi\ lììẫu ihí nghiệm và quần thế có
chửa mẫu dó với dộ lộclì chuan:
• X là sỏ trung bình Iiìau cua niầu tlìí nghiệiìi;
- ụ là t h a m sô t r u n g hìììh c u a (Ịuan í!iò:

- ơ là độ ỉộch c h u ắ n c ua q u ẩ n t h e

T ỉ o n g t h ự c tê, t h a m sỏ u và c h a u n h u ’ klìỏiig x á c đ ị n h (lược vì q u ầ n


t h ố (Ịuá lớn n o n th a m ,S'Ô và ơ đư ợ c th a y h ằ n g X và S D c ủ a m ẫ u t h í
Iiglìiộiti. V ậ y , c ô n g t h ứ c z (liiộc viôt i h e o t í n h c h ấ t ( l ạ n g m ẫ u t h í n g h i ệ m là:

X)/SD

T rư òng hỢp m ẫu nhó thì có ihỏ thay 7 a - i. Theo tính chât toán học thì:

- N ô u g i á t r ị z t í n h diĩỢc > l,9(ì (l.H,,) thì k h á n ă n g c ủ a sô li ệ u dưỢc r ú t


r a t ừ q u ầ n t h ể n g ẫ u n h i ê n lìoậc q u a n sát t h u (lược t ừ t h í n g h i ộ i n sẽ < 0 ,0 5
và trong triiòng hỢp đó xác suất thông kê của sự sai khác tại thí nghiệm dó
tliìỢc gọi là có ý ì ì g h ĩ a t h ò n g kờ ò m ứ c p=0,0r), và

' N ê u g iá t r ị z l í n h diíộc < 1,96 thì k h á n ă n g c ủ a sô^ liộu q u a n s á t


cỉổ dưỢc I*út r a t ừ q u ầ n t h ể n g ầ u Iihi ên sè > 0,05 và t r o n g t r i ĩ ò n g hỢp dó x á c
suất thông kê của sự sai kliác của thí nghiộìiì (ỉược gọi là khòng có ý nghía
t h ô n g k ê ồ m ức p=0,05.

• Tươiìg tự, áp d ụ n g với các niửc Ị)-0,01 và P” 0,001.


L i í u ý, có 95^-0 s ỏ l i ệ u (ịuaìì s á l sò nãiii tron g p h ạ m vi ụ ± l , 9 6 ơ dỏi VỚI
trư òn g hỢp sứ d ụ n g cá hai duòi. Vạy, Irong truờng hỢp chỉ sử d ụ n g một
cỉuỏi (liay một chiểu) cùa cỉưòng cong Ị)hân bỏ chu án thì giá trị dó chi là
p ±1,600.

Hơn nữa, khi muôn so sánh các thòng vSÒ tliông kê như các sô trung
bình thì dếu phải ch ấp thuận gìả tlịnh là phương sai của các m ầu pluii bằiig
n h a u hoặc tương tự giôn g nhau. T h ế nhưng, trong thực t ế có rât n h iều mẫu
dưỢc rút ra từ các quần thế nià quần thô dó không có sự phân b(/chuẩn, thí
clụ d ạ n g phân bô" nhị thức, (lạng Poisson hoặr phân bỏ' nhị thức: âni, v.v.
T rong trường hợp m ẫu lấy ra íừ quan thố hoạc bộ s ố liộu llui được từ thí
n g h iệ m nià quần th ế hoặc ih í nghiẹiiì (ỉó kliỏiìg tuân iheo phan bô ch u an
ihì kêt quá thực hiệii các phương pháị) kiéìii tra th ông kê sinh học sẽ không
ch ín h xác. Vì vậy, dê kôt quá phân tíclì và kiểm tra thông kê sinh học của
bộ sô liộu đúng, đòi hói phái thực lìiộn phương pháp ch u y ển dạng sô liệu
trước khi lièn hành các hùíic pìvằn tích và kiếm tra ihông kề sinh học.
Thực hiện phép chuyển dạng số liệu là làm giảm sự phụ thuộc . của
phương sai đôi với số trung bình hay làm cho phương sai bền vững hớrn vì
bộ sô" liệu sau khi chuyển dạng sẽ tuân theo sự phân bô* chuẩn. Vì \vậy,
chuyển dạng số liệu là chuyển những giá trị thô của tất cả các sô’ liệu qiuan
sát thí nghiệm thành những giá trị dẫn suâ”t toán học sao cho sau khi
chuyển dạng, bộ số liệu mới sẽ tuân theo sự phân bố chuẩn, cho phương sai
bền vững hơn nhưng bản châ't không bị thay đổi.
Vì vậy, để thực hiện được các phương pháp kiểm tra so sánh cát : sô'
trung bình hay phân tích phướng sai có kết quả đúng, bộ số liệu phải Ivuân
theo phân bố chuẩn và chúng có một phương sai chung hay các phương sai
mẫu tưđng tự bằng nhau. Với bất kì một thí nghiệm nào, nếu bộ sô liệu Ithu
được từ các yếu tố thí nghiệm hay từ các mẫu lấy từ quần thê ra khtông
tuân thủ theo phân bô' chuẩn sẽ dẫn đến kết quả của phép phân ttích
phương sai hay các phưđng pháp kiểm tra thống kê sinh học của bộ số liiệu
đó sẽ không chính xác. Có nghĩa là những bộ số liệu mà khi phân uích
phương sai mà các phương sai mẫu không Ị)ằng nhau hoặc tướng tự nhiau
thì các kết quả đó cũng không có giá trị.
Tóm lại, vối những bộ số liệu mà chúng không tuân thủ theo phân bô'
chuẩn dẫn đến các phưđng sai của các mẫu không bằng nhau hoặc gần mhư
không bằng nhau thì chúng cần phải được chuyển dạng trưổc khi thực h.iện
phép phân tích phưđng sai hoặc các phương pháp phân tích kiểm tra thõng
kê sinh học khác vi nếu không chuyển dạng thì kết quả sẽ không đúng.
Mục đích của phép chuyển dạng sô* liệu là làm cho những số liệu đó
chuyển thành dạng số liệu mới mà dạng số liệu mối này có đủ điều k:iện
như tuân theo phân 00' chuẩn và các phương sai mẫu sẽ bằng nhau đe khi
thực hiện xử lý, phân tích và kiểm tra thống kê sinh học thu được kết quả
đúng. Có nghĩa là bộ sô' liệu đã chuyển dạng này vừa cỏ sự phân bố chưẩn
vừa có các phưđng sai bằng nhau nhưng vẫn giữ nguyên vẹn bản chất của
các nhân tố thí’nghiệm đó. Chuyển dạng số liệu là để làm tàng mức độ
chính xác khi thực hiện các phép phân tích và kiểm tra thống kê sinh học.
Thê nhưrig, Kầu hết các nhà sinh học thưòng không thích thực hiện
phép chuyển dạng số liệu bỏi vì họ cảm nhận rằng hình như bộ số liệu đã bị
biến đổi sai lệch sau khi thực hiện phép chuyển dạng. Sự mặc cảm này thực
chất là không đúng vì bộ số liệu sau khi chuyển dạng không làm mất đi bât
kì một thông tin nào mà chỉ có thể biểu thị ở một dạng khác. Nói đúng hơn,
các kết quả phân tích từ bộ sô" liệu sau khi đã chuyển dạng biểu thị theo
một thước đo mới hay đơn vỊ đo mối mà thước đo mới này khác với thước đo
cũ trước khi chuyển dạng nhưng chúng vẫn giữ nguyên bản chất của các

8
n h â n tô th í n gh iệm . Thước (i<; mới này (iã làm cho bộ sô liệu sau khi đã
ch u y ển d ạ n g sẽ thoả m ãn những yêu cầu của hầu hết các phưđng pháp
kióni tra th ố n g kê sin h học. T ấ i cả mọi |)hép chuyển d ạ n g sô’ liệu đểu có đặc
đióm c h u n g là;

Thước do cũ Thước đo mới

Sô’ liệu X|, X, ...... x„ chuyến dạng th ành x’|, x’„

Chuyên dạng Ihành

X, ------------------------ > . x ’|

X , ------------------------ > x ’ ,

---------------------- > x ’„

P h ép ch u y ề n d ạ n g s ố liệu không bao giờ làm th ay đổi bản ch ấ t và làm


m ấ t đi n h ữ n g th ô n g tin của các nhân lô thí nghiệm và vì vậy kh ôn g thế xảy
ra n h ư ỏ n h ữ n g d ạ n g sau:

Không thê chuyên clạiig th àn h

> x',

x „ ----------------------> x’.,
Nôu thự c h iện vổi bâ’t kì một phép kiểni tra thôVig kê sin h học nào, thí
dụ p h â n tích phương sai, khi dược thực hiệu vái X (sô” liệu cũ) và với X’ (số
liệu mới: sa u khi đã ch u yên d ạn g của X) thì giá trị F của hai bộ s ố liệu dó
k h ô n g th a y đổi, c h ứ n g tỏ rằng |)hép chuyên dạng sô' liệu kh ôn g làin thay
đôi bản c h ấ t sô liệu.

Đé thực h iện các phương pháp kiểnì tra th ốn g kê sin h học, đặc biệt
p h ép p h ân tích p h ư ơn g sai có kết quả đúng, ba diều kiện cơ bản cần phải có
củ a bộ sô’ liệu là;

- b ộ sô’ l i ệ u p h ả i được t u â n t h e o Ị)h ân bô’ c h u â n ;

- các p h ư ơ n g sai của m ẫ u b ằ n g n h a u hoặc g ầ n b ằ n g n h a u ;


• k h ôn g có môi liên quan ràng buộc giữa các phưđng sai và các giá trị
trung bình.
Tóin lại, nếu m ột bộ sô liệu mà kiiòng thoá m ãn n h ữ n g y êu cầu trên
thì k h ô n g th ê thực h iện bất kì niột phương pháp p h ân tích kiểm tra th ống
kô sin h học nào. Nói đ ú n g hơn, n ếu thực hiện các phương pháp Ị)háin tích
th ô n g kê sin h học các bộ s ố ỉiệu mà ch ú n g kh ôn g thoá m àn các yêu 'Cẩtu đó
thì ch ú n g vẫn cho các k ết quả, so n g các kết qua dó k h ôn g ch ín h x á c . N h u
vậy, b ất kì m ột bộ s ố liệu nào mà k h ô n g thoá m án n h ữ n g yêu cầu plaảai bô
ch u ẩn thì kết quá của bâ"t kì của phương pháp p h â n tích th ô n g kê siinl '1 học
nào cũ n g đểu k hông có giá trị. Có n g h ĩa là dô tính toán và áp cỉụ ngĩ các
phương pháp trong p h ân tích th ố n g kê sin h học của b ấ l kì niộl hàiìi SC) lìào
thi biên sô" biến dổi phải thoá m ăn n h ữ n g yêu cầu p h ân bố c h u ẩ n rilì ù d à
nẻu ti'èn thì kết quá thực hiộn các phư ơng pháp kiếm tra ih ỏ n g kẽ si:iih h()(‘
mỏi đúng.

B. CÁC PHƯƠNG PHÁP CHUYỂN DẠNG s ố LIỆU

Gia sử, ớ inột bộ sô liệu thu được từ một thí nghiệm, khi mỗi íSÔ liệu
quan sá t cù n g được tă n g th êm hoặc giảm bớt bởi một h ằ n g sô’ nào đó liiì
theo tín h ch á t toán học giá trị tr u n g b ìn h m ẫu dó cù n g tăỉig lôn h o ặ c giám
xu ôn g d ú n g b ằ n g h ằ n g sô’ đó và p h ư ơn g sai của c h ú n g cũ n g sẽ tă Iig lên
bằng bình phương h ằ n g s ố đó. Trong thực tiêti có n h iêu phương p h á p (Ic
ch u y ên d ạ n g sô liệu, son g phô biến và th ô n g d ụ n g n h ấ t là hai p h u tín g pháp
sau:

- p h ư ơ n g p h á p c h u y ề n d ạ n g sô liệu t h u ậ n ;

- phướng pháp ch u yên d ạ n g sô'liệu kh ôn g th u ậ n .

Phương pháp ch u v ển d ạ n g s ố liệu Xỉiy ra th eo hai d ạ n g tliuiẠn và


không thuận.

I. PHƯƠNG PHÁP CHUYỂN DẠNG s ố LIỆU THUẬN

1. Dạng cơ bản
Trong lĩnh vực sin h học nói ch u n g , s ố liệu th u dược từ các th í nighiộiii
pliííi áp d ụ n g ch u y ến d ạ n g s ố liệu đế p h ân tích th eo d ạ n g th u ậ n :xás’ ra
tươiig đôi nhiều. Phư ơng pháp ch u y ế n d ạ n g sô’ liệu th u ậ n có th ể biièi thị
theo phương trình cơ bản n hư sau:

X’ = a + bX

10
trong dó:
- a và b là các h ằ n g sỏ;

- X ’ là iMốn sò^ mới h a y (‘on là l)iên s(V(lã c l ì u y ế n d ạ ì i g ;

• X là b i ế n sô c ủ ( b i ế n sỏ haiì cỉáu c h u a chuyÍMì d ạ n g h a y c òn gọi b i ế n SC)


Kốc).

2. Tính chất cơ bản


Phải n h ấ n m ạ n h rằng Iihìiíìg sự biỏiì (lối do pỉìương pháp ch u yển d ạng
sô liộu th u ậ iì k h ôn g làm thay d(M l)aìì chất inà cùiig không làm th a y dôi
hình dạng phân bỏ. Nếu X là ^ná trị tiuiì^ l)ình ìììẫu dược rút ra từ inột
q u a n thô lììà (ỊUần t h ế dó tuâĩì ih e o Ị)hâiì bỏ clìuán với t h a m sỏ t r u n g b ìn h
là M, cỉộ lỌch ch u ẩn là ơ, thì ịi\í\ trị z (Z là (liộn liVh tạo bới giữa đường cong
c l ì u â ỉ ì với đ ư ò n g t h ắ n g nlìộiì hai (tắu iììút c ủ a d ư ờ n g c o n g c h u ẩ n l à m t i ệ m
cậi i và (liĨMì UVh đ ó b ầ n g 1 d(ín vị) lu ôn lu ỏ n tlìoá íìiíìn p h â n bỏ c h u ẩ n :

T ừ c ô n g t h ứ c đó, có th ô xác đ ị n h dược giá t r ị z t h o ả m â n p h â n bỏ


c h u ẩ n với g i á t r ị t r u n g b ì n h b ằ n g 0 và độ lộclì c h u â n b ằ n g 1 . K h i c ộ n g c ù n g
một ^iá tì ị hoặc n h â n cù n g một hầng sô n h ấl dịnlì vỏi từng sô^ liệu quan sá t
của llìí ỉìglìiộiri ta nói rằng dã thực hiện Ị)lìÓỊ) chuyen dạiig số liệu. Từ bộ sô^
liộ u b a n đ ẩ u (X) đ ư ự c c h u y ế ì i d ạ n g llìài ih bộ sò* liộu mới {X’), l ứ c là X, d ă
đùực ('huyổn th à n h X,’ theo mỏi liên qua!) X’ " a + bX. Phép ch u y en d ạn g bộ
sỏ li ệ u h a n đ ầ u (X) t h à n h bộ sỏ liệu mỏi X’ = a + bX sõ k h ò n g l à m t h a y dôi
h ì n h d ạ n g p h â n bô c ủ a c h ú n g (liíỢc gọi là s ụ ch uy ôi ì d ạ n g sô li ệ u t h u ậ n .

Tóm lại, phương pháp chuyên clạĩig sô liộu th u ậ n k hông làm thay dổi
hiíih (lạììg plìâĩì bô" của sô liêu và han chất của chúng. Thực lìiộn phép
c h u y ên (lạng s ố liộu tlìihận (liỉíH’ niììilì !ì<'‘n rA(‘ sô liệu 10, 20 và trong sờ
dồ 1.

Do S(V li ệ u đ ã bị c h u y ế n (lạng nìm kéo t h e o s ự t h a y dôi t ổ n g c ác t ô n g


b ì n h p h ư ơ n g v à t r u n g b ì n h tô n g các bìnli p h ư ơ n g n h ư n g b á n c h a t v ẫ n
k h ô n g t h a v dổi. N h ò v ậ y , k hi t h a y (lối dơn vị t ính, t h í d ụ n h ư t ừ s a n g “C,
lừ nìììì hoặc cni sang inch ihì lỉà (‘huyên (lạĩig số liệu theo chiều ihuận nià
k h ô n g bị làìiì t h a y d ổ i b ả n c h â í sô liệu.

N h ư vộ>% dến d â y ta không cỏn bân khoủn khi thực hiộn các phép tính,
phaii tích và kiểm tra tlìỏng kỏ sinh học dối với bộ sô liộu dả clìuyôn d ạ n g
đỏ nữa. Đô k h a n g d ịn h bàỉi chất bộ số liệu sau khi ch u yên d ạn g k hòng thay

11
đổi, giá trị p" th ố n g kê (tỷ s ố củ a các M S S đối với EMS) của bộ s ố liệu trước
và sa u khi ch u y ển d ạ n g p h ải được n g h iê n cứu một cách tỷ mỉ trong n h ữ n g
phần sau.
Sờ đổ 1. Chuyển dạng số lỉệu thuận: đơn vị đâ chuyển dạng

3. K i ể m t r a g i á t r ị F t r ư ớ c v à s a u k h i c h u y ể n d ạ n g

T h í d ụ 1. Kết quả th u được tạ i m ột th í n g h iệm n g h iên cứu sử d ụ n g


hai loại thuốc diệt ve bò t ể chức tại T ru n g tâm n gh iên cứu bò và d ồ n g cỏ Ba
Vì. S a u m ột tu ần, s ố ve còn lại trên hai nhóm gia súc (nhóm m ẫu s ố 1 và 2)
được trình bày ỏ b ả n g 1. H ãy xác đ ịn h giá trị F?
B ầ n g 1. S ố ve trên hai nhóm gia súc

Nhóm mẫu số 1 2

Số ve (số liệu gốc) 2 3 4 14 15 16

Kết quả ph ân tích phướng sai của bộ s ố liệu gốc dược trình b ày ở báiig
2.
Bảng 2. Bảng phân tích phương sai anova^'^ của bộ số iiệu gốc
(trưởc khi thực hiện p hép chuyển dạng s ố liệu)

Nguổn biến DF ss MS

Giữa các nhóm 1 216 216 216


Trong các nhóm (sal sổ) 4 4 1

(1) Xem giải thích chi tiết thuật ngữ và phương pháp ỏ chương V.

12
ghi chú;
- DF là độ tự do cùa mồi nguổn biến;
- ss là tổng các bình phương;
- MS lả trung binh tổng cac binh phương;
- F là g iá trị tỷ lệ g iừ a M S g iữ a c á c n h â n íố VỚI M S s a i s ố tr o n g c á c n h â n tố .

Do sự chênh lệch tần suâì sô liệu (Ịuan sát ỏ bộ sô liộu gôc giữa nhóm
lììau sô 1 và 2 quá lớn, dẫn dốn chúng klìỏng tuân theo phân bô chuẩn nên
bộ sô liộu (ỉó cần phải dưỢc chuyổn dạng truớc khi phân tích. S au khi thực
h iện phép c h u y ê n d ạn g bộ S() liộu trên theo phương trình X’ = 3 + 2X, thu
được bộ sô liệu mới trình bày lại báng 1.3. Đê so sánh kết quả tính được từ
bộ sô liệu gôc với bộ sô" liệu dà chuyôn dạng liệu ch ú n g có thay đôi không
thì giá trị F của niỗi bộ sô" liệu plìái dược tíiih.

Bảng 3. Sò ve đả chuyển dạng trên cố hai nhóm gia súc


Nhỏm mẫu 1 2

X* (số liệu mới) 7 9 11 31 33 35

ghi chú;
- 1 v à 2 là h a i n h ó m m ẫ u thí n g h iệ m ;

- X’ là số ve đâ chuyển dang theo phương trình X’ = 3 + 2X, cố thể gọi là số liệu mới.

Kôl quá ph ân tích phương sai cúa bộ sô liệu sau khi đã ch u yển d ạng
dưỢc trình bày tại b án g 4.
B ầ n g 4. Anova của bộ số liệu đâ chuyển dạng

Nguồn biến DF ss MS F

Giửa cảc nhóm 1 ’864 864 216


Saisố 4 16 4

Rõ ràng, n ếu thực h iện phép phãn tích phướng sai với hai bộ s ố liệu: X
là sô' liệu củ (gôc) và X’ là sô" liệu rnới sau khi đă chuyển d ạn g của X thì giá
trị F của h ai bộ sô^ liệu đó hoàn toàn không thay đổi (F = 216), ch ứ n g tỏ
rằ n g phép ch u y ển d ạn g s ố liệu thuận không làm thay đổi bản ch ất về các
k ết luận của th í nghiệm .

4. Thí dụ minh họa


T h í d ụ 2. Kết quả sử dụng nãni loại thuôc diột cỏ A, B, c, D và E được
tín h theo đơn vị khôi lượng vật châ't khô cỏ dại còn lại (g/m ‘) và kết quả

13
tính toán th ôn g kẻ cơ bán của bộ sô" liệu về hiệu quả sử (lụng nã 111 loại
thuốc đó dược trình bày ỏ b ả n g 5.
B ả n g 5. Kết quả sử dụng năm loại thuốc diệt cỏ
»
Mẩu thuốc A B c D E

216 12 14 56 85
270 22 18 40 128
354 60 52 108 66
302 14 12 34 77
234 22 14 70 159

X 275,2 26,0 22.0 61.6 103.0


3039.2 382,0 286.0 870.8 1532,5
c 55,1 19,5 16,9 29.5 39.1

ghi chủ;
• A. B. c, D, E là năm loại thuốc diệt cỏ:
• X là trung bình mẫu;
- ơ là độ lệch chuẩn:
- !à phương sai.

Nhận xét
Giá trị tru n g bình, phương sai và độ lệch ch u ẩ n của các m ầu thí
n gh iệm khác n h au rât lớn. M ẫu A có giá trị tru n g bình và phương sai quá
ch ên h lệch so với các m ẫu khác, N ế u sắp xếp ch ú n g th eo trật tự nhâ't định
thì giá trị tru n g binh của ch ú n g c ủ n g biểu thị ch u n g m ột trật tự tương tự
n hư phướng sai. Vì vậy, giữa ch ú n g có môi liên quan với nhau.

Từ n h ữ n g k ết quả tính toán n ày ch ử n g tỏ bộ sô liệu trôn k hông tuân


theo sự phán bố chuẩn vì các phương sai của chúng khác nhau quá lỏiì. Vúi
bộ sô" liệu này, cùng có thê thực hiện phép phân tích phương sai hoặc các
phương pháp kiểm tra thống kê khác đưỢc, song kết quả của các phương
pháp kiểm tra đó sẽ không có giá trị vì bộ sô' liệu không tuân theo sự phân
bố chuẩn. Rõ ràng, '"đưa vào rác rưởi thi kết quả thu được cùng rác
rưởv\ Vì vậy, đốì vói n h ữ n g bộ s ố liệu khôn*g tu ân th eo ph ân bô" ch u ẩ n cần
phải đưỢc thực hiện phép chuyến dạng đế tạo thành bộ sô^ liệu mới tuân
theo sự phân bô"chuẩn trước khi thực hiện các phép phân tích thông kê học,
dặc biệt đốì với phương pháp phân tích phưđng sai.

14
M. PHƯƠNG PHÁP CHUYÊN DẠNG s ố LIỆU KHÒNG THUẬN • * •

1 . Khái niệm
T r o n g l ì n h v ự c s i n h học IIỎI c h u n g , các hộ sỏ li ệ u t h u đượ c t ừ cá c i h í
iigỈHỘiii c a n phíii á p d ụ n g cliuytMì d ạ ì ì g sô liệu l ì i ì o c k h i p h ả n t íc h t h e o
cl ạ n ^ k h ô n g t h u ậ n x á y r a n h i ế u hơn so voi d ạ n g l l ì u ậ n . H ơ n n ữ a , p h ư ớ n g
p h á p c l ì u y e n clạng scY li ệu k h ô n g i h u ậ n tronií llìực t i ễ n inổi lá Ị) hưdng Ị)háỊ)
(]uan t iọ n g vì nó k hôn g chỉ Ị)hỏ biỏn inà kêi (ịua Ị)hân tích kiếm ti-a thông
kô s a i q u á ì i h i ể u n ê u c h ú n g k h ô n g dược c h u y ể n ciạĩig. P h ư ơ n g p h á p c h u y ê n
d ạ n g sỏ l iộ u k h ô n g t h u ậ n l à m t h a y dối h ì n h clạng đ ư ò n g c o n g p h â n bô^ v à
p lu íờ ìì g s a i c ủ a bộ sô li ệ u có ỉi ê n q u a n d ô n giá trị t r u n g b ì n h n h i ề u h ơ n so
vỏi híUìg sỏ n h ú n g t á t n h i ê n b à n chiVl vaìì kỉìỏ ng bị t h a y dổi.

TAt n h i ê n , n h ữ n g bộ sô" li ệ u k h ô n g t h o a m à n n h ữ n g y ê u c ầ u d i ề u k i ộ n
c ủ a phoỊ) p h â n t í c h p h ư ơ n g sai và các p h é p k iể m t r a t h ô n g k ê s i n h học k h á c
i h ì b ắ t b u ộ c p h á i d ư ợ c c h u y ế n d ạ n g t rư ớ c khi t h ự c h i ệ n c á c p h ư ơ n g p h á p
k i ê n i t r a t h ỏ n g kô. T r o n g t h ự c lô, loại t h í n g h i ệ m m à bộ sô^ li ệ u t h u d ượ c
k h ô n g t u ủ n t h e o p h â n bô' c h u ắ n , k h ô n g cỏ p h ư ờ n g s a i c h u n g , n ià k h i
c l ì u y ô n d ạ n g t h ì c ù n g k h ô n g m a n g l í n h clìấ l lỷ lệ t h u ậ n v à h ì n h d ạ n g c ù n g
bị i h a y dổi là Ị)hỏ hiến.

2. Các kiếu chuyến dạng sô liệu không thuận


2.1. Giới thiệu chung
{'( r ấ t Ii h i ế u k i ể u c h u y ô n (lạng sô liộu k h ô n g t h u ậ n , n h ư n g p h ò b i ế n là
c á c p h ư ơ n g p h á p c h u y ế n d ạ n g theo h à m sỏ càn, lo g a r ii, tỷ lệ lo g a r it , th ừ a
sôl lu ỹ th ừ a và n g h ịc h đ ả o . P h é p t h a y t h ê mỗi niột sô' li ệ u t h í n g h i ộ n i h h n g
m ộ i s ố l i ộ u mới đ ả đ ư ợ c c h u y ê n d ạ n g t h e o c ãn , t h í d ụ c á n b ậ c 2 , h o ặ c t h e o
Iiiột luv t h ừ a , t h í d ụ b ì n h p h ư ơ n g , h o ặ c t h e o h à m s ố l o g a r i t , t h í d ụ l o g a r i t
t ự n h i ê n , v.v, h ầ u h ế t c h ú n g d ề u là n h ữ n g kiế u c h u y ể n d ạ n g sò" li ệ u k h ô n g
t h u ậ n . C á c k i ể u c h u y ể n d ạ n g n à y làin t h a y đổi k h ô n g c h ỉ h ì n h d ạ n g p h â n
bỏ^ nià còn làm th ay dôi tống các bình phương (SS) và dộ lệch ch u ân (SD)
c ủ a m ẩ u tl ìí n g h i ệ m .

Do có n h i ề u c á c h c h u y ể n d ạ n g S(í liộu k h á c n h a u v à m ứ c d ộ h ữ u h i ộ u
c u a !1 KÌ c á c h c ủ n g k h á c n h a u n ê n cầ n p h á i l ì m c á c h c h u y ê n d ạ n g p h ù lìỢp
n h ấ t và tố t n h ấ t c h o mỗ i bộ iỳố liệu. N h ữ ì ì g t h í d ụ s a u đ â y s ẽ c h ứ n g m i n h
s ự khiK* l ì h a u c ủ a c á c k i ê u cl ìu yò n d ạ n g sô liệu và c á c h c h ọ n k i ể u c h u y è n
d ạ i ì g p h ù hỢp vỏi n h ữ n g bộ sô liệu m a n g n h ữ n g (ỉậ(! t h ù r i ê n g c ủ a nó.

Nnư ch ú n g ta đà biêt, mục đích của phép chuyển d ạ n g sô liộu ỉà làiìì


tăìig n.ửc* tỉộ chính xác các kết luận thí nghiệm khi thực hiện plìãn tích
kiỏni l a th ố n g kẽ sin h học. Muòn tăng mức dộ chính xấc trong các phéị)

15
p h â n tích th ô n g kê sin h học, phải tìm xem phương pháp ch u y ê n d ạ n g sô
liệu nào sẽ cho bộ số liệu niối có phân bô'gần với phân hô chuân và phương
sai gần bằng nhau hơn.
Đ ế giúp cho việc tìm đưỢc kiểu loại ch uyển d ạ n g thích hợp n h à t cho
mỗi bộ sô liệu n h ằ m có được các phương sai b ằ n g n h a u hoặc g ầ n b ằ n g n h a u
thì s a u khi ch u y ể n d ạ n g phải xác định đưỢc độ lệch giữa phương sai m ẫ u
lỏn n h á t và phương sai m ẫu nhỏ nhâ't rồi sau đó xác đ ịnh tỷ lệ giữa ch ú n g .
N ế u tỷ lệ giữa c h ú n g cà n g g ầ n giá trị 1,0 hay 100% thì có th ể k ế t lu ận r ằ n g
kiểu c h u y ề n d ạ n g đó là thích hđp nhát. T ất n h iên , nếu tỉ lộ đó đ ú n g b ằ n g 1
thì k iêu ch u y ền d ạ n g đó là tôt nhâ't, so n g trong thực tiễn rất ít khi đ ạt được
kết quả đó. T ỷ lệ giữa các phương sai đó gọi là tỉ lệ c h ên h lệch cực đại của
các phương sai và kí hiệu là Prucciur
N h ư vậy, đế’ xác định kiểu ch u y ể n d ạ n g s ố liệu nào là tôt Iihất, cần
phải xác định giá trị Feụe ,iại- Kiểu chuyên dạng số liệu Iiào inà giá trị F, ,1 „
c à n g g ầ n 1,0 bao n h iêu thì phép ch u y ển d<ạng đó cà n g th ích hợp với bộ s ố
liệu ấy bấy n h iêu . Rõ ràng, trưóc khi thực hiện phân tích kiểm tra t h ố n g kê
sin h học bộ s ố liệu, cần n g h iê n cứu xác định giá trị J,ị„ củ a mỗi k iểu
ch u y ể n d ạ n g để chọn d ạ n g thích hỢp n h ất cho mỗi bộ sô' liệu. Công thức
tín h giá trị n h ư sau:
Phương sai mẫu lớn nhất

cưc đải

Phương sai mẫu nhỏ nhất

2.2. Thi du• minh hoa•

Sử dụng lại thí dụ 2 đã trình bày ỏ trên vê “hỉệu quả của năm loại
thuốc diệt cỏ" để so sánh giá trị F,.ự,, của các kiểu chuyển dạng sô' liệu
k h ôn g th u ậ n khác n h au .
K ết quả tính toán củ a bộ sô liệu gốc chưa chuyến d ạ n g vê X , Ơ-, S D và
Fc.i< đ.,1 được th ể h iện ỏ b ả n g 6.
Bàng 6. Kết quà cùa số liệu gốc chưa chuyển dạng
Mẫu thuốc X SD

A 275,2 3039.2 55.1


E 103.0 1532,5 39,1
D 61,6 870.8 29,5
B 26,0 382,0 19,5
c 22,0 286.0 16,9

^cưc đ» = 3039.2/286
= 10,6

16
2 .2 .1 . Kết quả tính toán củữ bộ sô liệu gổc đã chuyển dạng theo căn bậc
2 về X , c/. SD và F,,„ được thẻ'hiện ở hảng 7.
B á n g 7. Kết quà của bộ sỏ liệu gốc đâ chuyển dạng theo căn bậc 2

Mẩu thuốc X rr' SD

' A 16.52 2.41 1.64


E 10,01 3,54 1,88
D 7,68 3,28 1.81
B 4.87 2.90 1.70
c 4.48 2.41 1,55

Pcucd.. =3,54/2,41
= 1.5

2 .2 .2 . Kết quả tính toán của bộ sô'liệu gốc đã chuyển dạng theo hàm sô
logarit về X, ờ^, SD và được thể hiện ở bảng 8.
B ả n g 8. Kết quả của bộ số liệu gốc đâ chuyển dạng theo hàm số logarit

Mẫu thuốc X SD

A 5,602 0,039 0,198


E 4,579 0,135 0,367
D 4,034 0,211 0,459
Đ 3.080 0,394 0,628
c 2.921 0.353 0,594

=0.394/0,039
= 10,1

2 .2 .3 . Kết quả tính toán của bộ sô liệu gốc đã chuyển dạng theo tỷ lệ
100Ix về X, ờ^, SD và F,ự,.,Ị„, được thê’hiện ở bảng 9.
Bảng 9. Két quà của bộ §ỏ liệu gốc đâ chuyển dâng theo tỷ lệ 100/x
Mẩu thuốc X SD

A 0.375 0.0052 0,072


E 1.080 0,1347 0,367
D 1.916 0,6551 0,810
B 5.247 6,7288 2.594
c 6,020 6,2200 2.494

^cut dai = 6,7288/0,0052


= 1300

17
2.2.4. Nhận xét
- Các kiểu chuyển dạng sô"liệu trên đây có kết quả vê X, ơ' và SD khác
nhau dẫn đến Pcựcđni khác nhau rõ rệt.
- Kiểu chuyển dạng theo hàm sốlogarit tuy F<.„cdạ, (10,1) thấp hơn Fr,„
ở sô"liệu gốc (1 0 ,6 ), song vẫn cao hđn nhiểu so vói Fcụ<,,|,„ của kiểu chuyên
dạng theo căn bậc 2 (1,5). Vậy, kiểu chuyển dạng sô" liệu theo cản bậc 2 ỏ
th í dụ này là thích hỢp n h ất vì có Peucdạịlà ĩ,5 gần vói giá trị 1,0 hơn so với
các phép chuyển dạng số liệu khác.
- Phương sai (ơ^) và SD biểu hiện mức độ chênh lệch nhỏ nhất đ kiểu
chuyển dạng theo căn bậc 2 .
2.2.5. Kết luận
Kiểu chuyển dạng sô"liệu tôt nhất trong phạm vi các kiểu chuyền dạng
vừa được thử nghiệm cho bộ sô" liệu trên đây là kiểu chuyển dạng số liệu
theo cản bậc 2 . Vì vậy, nên sử dụng kiểu chuyển dạng sô' liệu theo càn bậc 2
cho bộ số liệu trên đây vì giá trị F<.ụ,,dạ, nằm gần vói giá trị 1,0 nhất.
T h i d ụ 3 . Kết quả của m ột thí n g h iệm n gh iên cứu sin h học vể h iệu
quả sử dụng thuốc diệt ve cho thấy “Kết quả số ve còn lại trên bò sau khi
phun ba loại thuốic diệt ve Tj, T2 và T3” ỏ một đàn bò nuôi tại Phù Đổng
được trình bày theo bảng 1 . 1 0 . Hãy xác định kiểu chuyển dạng số liệu thích
hợp nhất cho bộ sô' liệu trên?
Bàng 10. số ve còn lại sau khi phun tiiuốc T,. T 2 và T]
Mấu thuốc diệt ve T, . Tj T3

12 31 80
16 38 100
17 25 105
14 36 70

Xác định các đặc điểm của bộ sô" liệu ban đầu thông qua các tham sô
thống kê cơ bản khác nhau như X, SD và được trình bày tại bảng1 1 .
B ổng 11. Kết quả của bộ số liệu chưa chuyển dạng
Mẫu thuổc diệt veT, TjT3

X 14,5 32.5 88.8


SD 2.1 5.8 16,5

Fcuc<u, = 16.5*/2.1'
= 62

18
Nhận xét
■ Sự sai khác giữa các SD chác chắn có ý ngliĩa.
‘ ,iạ, I‘â t lớn, n ê n k h ả n ă n g có t h ê lớn hciii b ấ t c ứ g iá t r ị của
kió.i c h u y ể n d ạ n g n à o .

- Rõ ràn g , SD có t ư ớ n g q u a n vỏi các giá trị t r u n g b ì n h : k h i X c à n g lố n


t h ì S D c ũ n g c à n g lớn.

Kết quả phản tích phươtig sai anova và tính toán các giá trị X, SD và
F,, ,Ị,„ của bộ sô'liệu đã chuyển dạng theo căn bậc haỉ được trình bày tại
bả.g 12.
B ả n g 12. Anova của bộ số liệu đâ chuyển dạng theo căn bậc 2
Mẳu thuốc diệt ve T, Tj Tj

X 3,80 5,68 9,39


SD 0,27 0,52 0,89

=0,89^/0.27^
= 10,5

Nhận xét
■Sự sai khác giữa các SD chắc chắn có ý nghĩa.
• .1... t u y đ ã g i ả m (1 0, 5) so vối F<.,„ ỏ s ố liệu b a n đ ầ u (62) s o n g g iá
t r ị l à y v ẫ n c ò n lớn.

- S D v ẫ n biểu h iện rõ r à n g có tương quan với các giá trị tru n g bình.

V ậ , kiêu ch u y ể n d ạ n g n à v vẫn chưa phù hỢp, cần th iế t tìm m ột kiểu


chiyên hóa sô*liệu khác có thê phù hđp hđn so với dạng chuyển dạng số liệu
c.ãi bậc 2 vừa n êu trên.

Kết quả tính toán cấc giá trị X, SD vả của bộ sô'liệu đã chuyển
dạig theo hàm sốlogarit được trình bày tại bảng 13.
B ảng 13. Kểi quả của bộ số liệu đã chuyển dạng theo hàm số logarit
Mẫu thuổc diệt ve T, T; Tj

X 2,67 3,47 4,47


SD 0,145 0,187 0.191

= 0,191^/0,145^
= 1.7

19
Nhận xét
- Sự sai khác giữa các SD chắc chắn không có ý nghĩa.
- ^cụcdại đã giảm xuống thấp (1,7) so vổi F<.„, ,1,^, ỏ số liệu C c ả n bậc 2 (10,5).
• SD cùng biểu hiện theo trật tự như của số trung bình nhưng khả
năn g không bị ràng buộc tưđng quan vỏị các giá trị trung bình.

Kết quả phân tích phương sai và tính toán các giá trị X, SD và F,.„;
của bộ sô'liệu đã chuyển dạng theo hàm nghịch đảo 1000/X được trình
bày tại bảng 14.
B ảng 14. Anova của bộ số liệu đâ chuyển dạng theo hàm nghịch đào (1000/X)

Mẳu thuốc diệt ve T, Tj Tj

X 7 0 ,1 3 1 ,6 1 1 ,6

SD 10,26 6,15 2,23

Pcucía, = 1 0 ,2 6 ^ /2 .2 3 ^

= 21

Nhận xét
- Sự sai khác giữa các SD có thể có ý nghĩa.
- Fcục d,ú lớn hđn so với Feụt dạ, ở số liệu' chuyển hoá theo căn bậc 2 và
hàm số logarit.
-Kết quả không phù hỢp bằng kết quả ở kiểu chuyển dạng sô liệu kiều
căn bậc 2 và hàm số logarit.
Kết luận
Giữa các kiểu chuyển dạng số liệu nêu trên, kiểu tốt lìh ất đôl vói bộ sô"
liệu này là sử dụng kiểu chuyển dạng theo hàm số logarit vì = 1,7 là
giá trị nhỏ hơn so vói các giá trị của các kiểu chuyển dạng khác.

T h í d ụ 4 . K ết quả của một th í nghiệm sin h học n gh iên cứu so sánh


kết quả sử dụ ng năm ioại thuốc tẩy giun Tj, T.2 , T;ị, và T-, cho thấy sô
trứng giun còn lại sau khi sử dụng năm loại thuốc giun đó thu được sẽ
trình bày ỏ bảng 15. Hãy tìm kiểu chuyển dạng sô' liệu thích hợp nhất cho
bộ sô' liệu trên?

20
Bảng 15. số trửng giun sau khi sử đụng nâm loại thuốc và kết quả
Mẳu thuốc tẩy giun T, T, Ĩ3 T4 Ts

2 9 10 23 44
3 7 12 29 54
3 8 9 18 42
5 10 16 22 51
4 9 22 27 40
2 12 18 26 55
3 15 17 15 60

X 3.1 10.0 14,9 22.9 49.4


SD 1.07 2.71 4.71 5.01 7.53

Pcuea,, =(7,53)^/(1,07f
= 49

Đ ê b iết được k iểu ch u yển d ạng s ố liệu thích hđp n h ấ t của bộ s ố liệu
n;y c ầ n tiế n h à n h k h ả o sá t a n o v a và của một s ố kiểu ch u y ển d ạ n g
ccbản th ư ờn g h ay sử d ụ n g sau đây (bảng 16 và bảng 17).

B à n g 16. Kết quà của bộ sô' liệu đã chuyển dạng theo căn bậc 2

Mẫu thuốc tẩy giun T, Tj Tj T4 Ts

X 1,75 3,14 3,81 4.75 7.01


SD 0.296 0,413 0,618 0,541 0.537

Pcucd., =0,618^/0.296^
= 4.4

B ả n g 17. Kết quà của số liệu đâ chuyển dạng theo hàm số logarit

Mẳu thuốc tẩy giun T, T, T3 T< T5

X 1,10 '2,27 2.65 3,11 3.89

SD 0.335 0.255 0.330 0,236 0,154

Ĩ (JCđat = 0,335^/0,154^

= 4.7

21
Nhận xét
Kết quả của hai kiểu chuyển dạng sô"liệu này không khác nhau dáng
kể vì c h ú n g đều có giá trị F<.ụe<iại tư đng tự b ằn g n h au (4,4 và 4,7). Nói ch u n g ,
chúng nhỏ hơn nhiều so với ,|ạ, của bộ số liệu ban đầu (F^„, = 49) và
không có mốì liên quan chặt giữa SD và số trung bình vói nhau. Như vậy,
có thể sử dụng bất cứ kiểu chuyển dạng nào trong hai kiểu đó cũng điíỢc,
song nếu có thể tìm thêm một kiểu khác sao cho giá trị F,,ụ, ,ia. nhô hđn ìiữa
thì kết quả sẽ mang lại chính xác hơn.

2.3. Phương pháp chọn kiểu chuyển dang


Từ những kết quả phân tích của các kiểu chuyến dạng số liệu trêiì có
thể rút ra những cách chọn hữu hiệu nhất cho mỗi bộ số liệu. Nguyên lý
chung để chọn kiểu chuyển dạng sô" liệu thích hỢp là dựa trên giá trị trung
bỉnh, giá trị độ lệch chuẩn, gỉá trị phương sai mẫu và dạng phân bố số liệu
và đặc biệt là gùi trị Fcựt: dạr Có năm kiểu chuyển dạng số liệu thông dụng
nhất, thưòng được áp dụng cho các thí nghiệm khác nhau gồm;
1 . Chuyển dạng sô'liệu theo hàm sô^logarit.
2. Chuyển dạng số’liệu theo căn bậc 2 .
3. Chuyển dạng sô' liệu theo phân bô' nhị thức âm.
4. Chuyển dạng sô' liệu theo hàm đối sin.
5. Chuyển dạng số liệu theo tỉ số nghịch đảo. •

Nội dung, phưđng pháp phân tích và đặc biệt sử dụng từng kiểu
ch u y ế n d ạ n g sao cho p h ù hỢp với đặc t ín h củ a bộ s ố liệu sẽ được trìn h bày
cụ thể sau đây.
2.3.1. Kiểu chuyển dạng aốliệu theo hàm sổlogarit
Phương pháp chuyển dạng sô* liệu theo hàm số logarit được sử dụng
thích hợp nhất khi bộ sô' liệu gốc có những đặc tính sau:
a. Phương sai lớn hơn giá trị trung bình của mẫu
Thí dụ 5. Sản lượng sữa (SLS) trung bình hằng ngày (kg/ngày) của 88
bò lai Fi (Hà-Ấn) ở chu kì sữa thứ ba nuôi tại Nông trường Phù Đổng. SLS
thực tế và giá trị đâ chuyển dạng theo hàm sô' logarit được trình bày tại
bảng 18.

22
Báng 18. SLS thực tè và giá trị đã chuyển dạng theo hàm số logarit

SỐlượng bò SLS Giá trị tinn theo

[(N)] [(kg/ngày)] hàm sổ logarlt

2 3 0.477
4 4 0,602
6 5 0.699
8 6 0.778
11 7 0.845
11 8 0.903
10 9 0.954
8 10 1.000
6 11 1.04

5 12 1.08

4 13 1.11
3 14 1.15

3 15 1.18

2 16 *1.2Q

2 17 1.23

1 18 1.25
1 19 1.28
1 20 1,30
88 822
9.35

14,21

N h ậ n xét

S ự -ph ần bô" bộ s ố liệu trên rõ ràng là không tuân th eo p h ân b ố ch u ẩ n


vì phuơng sa i lón hđn giá trị trung bình mẫu. Vì vậy, bộ s ố liệu đó phải
được ch u y ển d ạ n g, có th ể chuyên theo hàm sô logarit. K ết quả của phép
ìogarii được trìn h bày ở cột sô' 3 tại bảng 18. Vf'ii bộ s ố liệu mới đă ch u yển
d ạ n g này có sự p h ân bô" tương (ỉối chuẩn và sự phụ thuộc của phưdng sai
vào trung b ình củ n g đã đưỢc loại bỏ. Cũng cần nhớ rằ n g h ầu n h ư k hông
bao gij p h ép ch u y ền d ạ n g sô liệu đạt được một cách h oàn toàn ch ín h xác
th eo phân b ố ch u ẩn . Vì vậy, cần ứng dụng phương pháp ch u y ển d ạn g sô'

23
liệu theo hàm số logarit trước khi phân tích bộ số liệu này.
b. Khi có một sô'giá trị quan sát của mẩu bằng 0
Thí dụ 6 . Người ta lấy mẫu kiểm tra trứng giun của 1 2 người sau một
tuần sử dụng thuốc tẩy giun thu được kết quả trình bày tại bảng 19.

Bảng 19. Số trứng giun thu đLfỢc sau một tuần tẩy giun
Mễu số Số trứng n+1 Logaritcủa
(n) (n+1)

1 0 1 0
2 0 1 0
3 4 6 0.699
4 2 3 0,477
5 58 69 1.771
6 1 2 0.301
7 0 1 0
8 22 23 1.362
9 6 6 0,788
10 7 8 0,903
11 17 18 1.255
12 1 2 0.301

Nhận xét
n = 12,
X = 9 ,7 5 ,

ơ2 = 281

Có ba mẫu không có trứng giun nào hay nói cách khác chính xác hơn
là có ba mẫu thí nghiệm có tần suất quan sát = 0 .
Kết luận
Bộ số liệu này không thể tuân theo phân bố chuẩn vì có nhiều tần suất
= 0 và giá trị phương sai lón hđn số trung bình nên phẩi được chuyển hóa
theo hàm sô' logarit. Song, do có những tần suất quan sát = 0 mà theo tính

24
chát cúa logarit thì logarit = 0 klìôiig có nghìii. Vi vậy, trước khi lây logarit
phái cộng th êm m ột h ằn g số, thí dụ liằng sô 1 vào từng sô liệu quan sát
trôn. S au khi có bộ sô liệu mới dã cộiig thêm hằng sô 1 (X’ = X + 1), lấy
loịííii it của mỗi tầ n s u â t quaii sát Iiiởi (logarit X’). Kôt quá bộ sô’ liệu mới dã
cộng th êm h ằ n g sô’ "!" và giá trị logaiit của'l)ộ ,'.ỏ liệu mới dược trình bày ớ
cột 3 và 4 của b ả n g sô’ liệu gốc (hảng 19). 8(V liệu ^au khi ch u yến d ạ n g theo
hàm sô logarit xong, tiếp tục thực hiện các |)hóp tíĩih ihôVìg kê sin h học ỏ bộ
sô liệu mới và th u được nhùng kết quíi mới.

Nhận xét về bộ sô liệu dã chuvèìì dạiiị’ theo ỉogarit sau khi đã cộng
'thèm hằng sô 1 (X = x + 1)
n = 12

X = 0 ,6 0 1 .

ơ- = 0.3412
K hông CÒII m ẫu thí nghiệm Iiào của X' oó tầii suất quan sá t = 0.

Rõ r.àiig, s a u khi chuyên d ạ n g bộ sô liệu clã cộng th êm h ằ n g sô 1 thì


mọi sô liệu q u an s á t mới đểu có thê lấy được giá Irị theo hàm s ố logarit, giá
trị phương sai đã giảm và nó nhỏ hđn giá tiị trung bình. N h ư vậy, bộ sô’
liệu mới đã gần n h ư tuân theo phân bô" chuân nên cỏ th ề thực hiện các
phép p h ân tích th ô n g kê sinh liọc,

c. Thi nghiệm có nhiều nhán tô và giá trị của mỗi nhăn tỏ


đõ tạo ra một tỷ lệ giữa chúng với nhau
D ạ n g th í n g h iệ m này có ííiá ti ị độ lộch cliuẩn biến đồi tỷ lệ vói giá trị
tru n g bình m ẩu. Bộ s ố liệu kiêu n ày thưòng có khoảng cách và biến dộng
lớn. Thí dụ; đ ếm sô’ côn trùng hoặc sô trứng KÌIIII «au khi sử d ụ n g các loại
thuốc tẩy khác n h a u hoặc sỏ”ve sau khi phun llìuỏc ve ớ bò, v.v.

2.3.2. Chuyên dạn g theo cản bậc 2

Phương p h áp ch u yên dạng sô’ liệu theo căn l)ậ(; 2 dược sử d ụ n g thích
hợp nhát trong những trường hợp l)ộ sô liệu có nhữnịỊ đặc tính sau:
a. Phương sai của mẫu gần như tương đương giá trị trung binh
T h í d ụ 7. S ố ve đôni dưỢc ỏ mười l)ò ặữa nuôi tại T ru n g tâm n gh iên
cứu bò và đ ồ n g cỏ Ba Vì thu được trên niột đơn vị diện tích l m ‘ sau niột
n gà y phu n th u ôc trừ ve A dược trình bày à bảng 20, H ãy xác định kiểu
chuyển dạng thích hỢp nhất.

25
Bảng 20. số ve đếm được (con/m^) ở mười bò sữa
Bò số Số ve Căn bậc 2
số ve

1 4 2
2 6 2.46
3 3 1.73
4 3 1,73
5 9 3
6 4 2
7 6 2,45
8 2 •
1.4
9 5 2,24
10 2 1.4

Tổng 44

Đặc tính của bộ sô liệu gốc


n = 10
X = 4,4
ơ'^ = 4,3

Nhận xét
Kết quả thu được của bộ sô" liệu trên cho thấy giá trị trung bình mẫu
(4,4) gần tương tự bằng giá trị phưđng sai mẫu (4,3) cho nên nó cần dược
chuyển dạng theo căn bậc 2 là thích hỢp nhất. Kết quả của số liệu dã
chuyển dạng theo càn bậc 2 được trình bày ở cột sô' 3 tại bảng 20. Từ những
kết quả số liệu sau khi đã chuyển dạng sang căn bậc 2 , các thông sô' thống
kê mẫu tính được như sau:
X = 20,4
ơ = 0 ,5 0 6 9

ơ-" = 0 ,2 5 6 9

Kết luận
Kết quả khảo sát anova của bộ số liệu đã chuyển dạng theo cản bậc 2
cho thấy bộ sô liệu mối đã thoả mãn các điều kiện để thực hiện các phương
pháp phân tích và kiểm tra thông kê, đó là giá trị phưđng sai mẩu nhỏ hơn
giá trị trung bình và phân bô' gần như chuẩn.

26
h. P h ư ơ n g s a i m ẫ u tương đ ư ơ n g với tr u ĩìíỊ bỉììli m ầ u và có s ô 'liệ u q u a n
sát = 0

T h í d ụ 8 . S ố ve đếm dưỢc ớ s á u bò s ừ a lìuòi tại T r u n g t á m n g h i ê n c ứ u


bò v à d á n g cỏ B a Vì t r ê n Iiìột (ỉơn vị d iộ n tích liiì' s a u m ộ t n g à y p h u n t h u ô c
t r ừ ve B v à m ộ t sô^ k ế t q u â p h â n tích c ủ a hộ HÔ lìộu gỏc và c à n b ậ c 2 dư ợc
t r ì n h hÀy ở b á n g 21.

B ảng 21, sò ve va kết quả phản tích ở sau bò sữa

BÒ sỏ Sò ve vn n+0.5 0,5
(n)

1 6 2.45 6,5 2.55


2 2 1.4 2.5 1,581
3 3 1.73 3.5 1,871
4 0 không có nghĩa 0.5 0.707
5 1 1 1.5 1.225
6 5 2,24 5.5 2.345

Độc tinh về bộ sô liệu gốc


n = 17,

X = 2,83,

o - = 3,2.

l)( có sô l i ệ u q u a n s á t só ve c ú a bò sô '1 có t ầ n s u í í t = 0 n ê n b ộ sô li ệ u
d ó k h ô :i g t h ê s ử d ụ n g c h u y è n d ạ n g t h e o cãii bậc 2 vì t h e o t í n h c hâ' t c ủ a c ă n
bậ(; 2 t,1 Ì nó k h ô n g có ý n g h ĩ a với giá tr ị = 0. Vi vậy, t r ư ớ c k h i c h u y ề n d ạ n g
t h ( “0 cãii b ậ c 2 c ầ n c ộ n g t h ê m niộ t l i ằ n g sô’ vào mỗi sỏ li ệ u t r ê n , t h í d ụ , c ộ n g
t l i ô i u c,r> v à o t h í d ụ n à y . K ê l (Ịiiá ('ủ a h ộ sỏ liộu lìiở i là k ế t q u ả d ã c h u y ề n
d ạ n g s a n g c ă n b ậ c 2 được t r ì n h b à y ở cột sô’ 4 và tạ i b á n g 2 1 .

Đệx tinh vé sô liệu sau khi dã chuyên dọng theo căn bậc 2
X = 3.33,

= 0,691 7,

= 0 .4 7 8 .

K á lu ậ n

K ('t q u ả p h â n t í c h c ủ a s ố l iệ u in ớ i s a u k h i d ã c h u y ê n d ạ n g t h e o c ă n b ậ c

27
2 của bộ sô" liệu đă cộng th êm 0,õ vào sô^ liệu gô"c cho th ấ y bộ S(/ liệu mối dà
thoả m ã n các điều kiện để thực h iện các phương pháp p h â n tích Ị)hương sai
hoặc k iểm tra th ô n g kê vì giá trị phương sai m ẫu nhỏ hơn giá trị tru n g bình
v à có s ự p h â n bô" g ầ n vối p h â n b ô " c h u ẩ n .

c. Những thí nghiệm thuộc loại đếm các sự kiện ít xảy ra


N h ữ n g thí n gh iệm ngh iên cứu về n h ữ n g sự kiện xảy ra trong vù trụ vì
loại sô" liệu này thường tu ân theo phân bô^ th eo d ạn g Poissoìi là loại có đặt:
tính p h ư ơn g sai m ầu bằng giá trị tru n g bình Iiìẫu củ n g có thô áp dụ n g kiểu
ch u y ên d ạ n g sô" liệu theo căn bậc 2.

2 . 3 . 3 . C h u y ể n d ạ n g th e o p h ả n bô n h ị th ứ c ă m

Phép chuyền dạng số liệu theo phân bô’ nhị thức âni dược sử dụng
thích hđp n h ấ t khi m iêu tả một k h o ản g điêu k iện tự n h iên nià ỏ tló các mục
tiêu được tổ n g hợp lại. Đặc tính cơ bản của bộ sỏ liệu cần đưọo ch u y ên d ạ n g
s a n g nhị thức âni là giá Irị phương sai m ẫu lớn hởn tru n g bình niẫu.
N g h iê n cứu sự phân bô" kí sin h trù n g giữa các vật nuôi là một th í dụ thích
hđp cho k iểu ch u y ến d ạn g sô* ìiệu này.

a. Thí dụ 9. N g h iê n cứu xác định sô’ lượng bọ ch ét ỏ 80 chó B ecgiê


hoàn toàn độc lập và ngẫu n h iên tại Trường nuôi dạy chó n gh iệp vụ 24 Sơn
Tây, kết quả đưỢc trình bày tại bảng 22.
Bảng 22. số bọ chét ỏ 80 chó Becgié

Số bọ chét 0 1 2 3 4 5 6 7 8
Số chó 18 25 15 10 7 2 2

Kết quả khảo sát anova thu được từ số liệu gốc qua các thông số thống
kê mẫ u là;

n = 80,

x = 1,78,

ơ = 1,61,

= 2 ,5 9 .

N h ư vậ y , g iá tr ị p h ư ơ n g s a i lớ n h ơ n g iá tr ị tr u n g b in h m ẫ u và phép
ch u y ể n d ạ n g sô liệu theo p h ân bô" nhị thức âni là thích hợp n h ất. Các bưổc
tín h to án cụ th ề như sau:

28
Tinh h ( • Sỏ k

■ ■ .

1.78- •
2.59 - L78

= 3.91
T in h tẩ n íiuẩt m o n g đợi tư ơ n g ứtìiỊ vài

k h ả n ă n g c ủ a m ỗ i lớp tầ n s u ấ t ( p , ,J

Đ ô i với tr ư ờ n g h ợ p sô ve = 0

= (1 +
k
= (1 + 1,78/3.91) '
= 0,231

Vì v ậ y , f ' „ , „ = n
= 0,231.x80

T in h F t ừ các g iá tr ị củ a X và k:
X
F
x’+ k

1.78
Ĩ 7 9 4 3.91

= 0 ,;nH

Đ ố i v ớ i t r ư ờ n g h ợ p s ô 'v e = 1

p„.,, = (k/1) X F x p„=„,

= (3,91 x O , : n ; ỉ x 0 ,2 31)

=-■ 0 ,2 8 3

V ìvậy, f = p ,, „ x n

= 0 , 2 8 3 X 80

= 22.64.

29
Đối với trường hợp s ố ve = 2

p,x=., = ^ xF xP ,,= „

= (1/2)(3,91+1) X 0,313 X 0,283


= 0,217
Vì vậy, f = P ( x = 2. x n
= 0,217x80
= 17,36
Tương tự, sử dụng cách tính như vậy và thu được kết quả cùa những
số còn lại như sau:
P(x=3) = 0,134 f^1u=3) = 10,72

p<x=l) = 0,072 (x=l) = 5,76


P(x==5) = 0,036 ^ (x=5) = 2,88
P(x=(ỉ) = 0,017 ^ (x=(i) = 1,36
p(x=7) = 0,008 - = 0,64
* (x=7ì
p (x=8) = 0,003 * (x=8) = 0,24
b.Kết luận
Qua kết quả tính được của tần suâ‘t mong đợi cho thấy bộ sô liệu sau
khi chuyển dạng đã tuân theo sự phân bô"nhị thức âm.
2.3.4. Chuyến dạng số liệu theo hàm đối sỉn
Khi thí nghiệm có nhiều nhân tô", nià các nhân tô thí nghiệm đó biểu
thị theo đơn vị tỷ lệ %, thí dụ % mỡ sữa, % đạm sữa bò, % protein trong
thức ăn, % tiêu hoá, v.v, thì loại sô" liệu này thích hỢp cho kiểu chuyền dạng
theo hàm đôì sin (arcsine) vì loại số liệu này thường tuân theo phân bô'
dạng nhị thức và không bao giò đốì xứng nhau.
a. Các bước tính của chuyên dạng số liệu theo hàm đối sin
K iểu c h u y ể n d ạ n g sô' liệu th eo h à m đối sin đòi hỏi phải tiến h à n h theo
h ai bước ch ín h s a u đây:
• lây căn bậc 2 của mọi sô"liệu quan sát;
- t ì m g i á t r ị góc s a o c h o s i n c ủ a góc đ ó b ằ n g g iá t r ị n à y .

Thí dụ cụ thề như nếu X = 0,25 thì Vx = 0,5, vậy sin ‘ 0,5 = 30“ dẫn
đến hàm đôl sin 0,25 = 30®. Chú ý, nếu đđn vị tính của bộ số liệu quan sát
là % thì phải chia nó cho 1 0 0 trưóc khi thực hiện phép chuyển dạng số liệu

30
vì }iàm sô sin bao giờ c ũ n g b iểu th ị b ằ n g đơn vỊ đo độ.

Lưu ý, trong h ầ u h ế t các m á y tín h th ô n g kê bỏ túi có th ể â’n n ú t sin '


đê giúp ch o việc tín h củ a p hép ch u y ế n d ạ n g n ày m ột cách n h a n h chóng.
b. T h í d ụ m i n h h o ạ và cá c bước tiế n hành

Thí dụ 1 0 . Mức độ ô n h iễm công n g h iệp ở biển được đo qua 7 m ẫu của


cá bơn. Tỷ lệ (%) của d iện tích da cá bơn bị n h iễm trên mỗi đơn vị d iện tích
đưỢc trìn h bày ở b ả n g 23. Hãy xác định kiểu ch u y ên d ạ n g s ố liệu thích hỢp
c h o bộ sô" l i ệ u n à y .

B ả n g 23. Tỷ lệ % diện tích da cá bơn bị nhiễm

Đơn vị mẫu Tỷ lệ nhiễm Hàm đôi sin


của tỷ lệ nhiễm

1 0,25 30,0
2 0,31 33.8
3 0,21 27,3
4 0,24 29,3
5 0,30 33,2
6 0.29 32,6
7 0,22 28,0

c . Đ ặ c đ iế m bộ sô' liệ u g ố c (c h ư a được c h u y ể n d ạ n g ) v à bộ s ố liệ u đã


c h u y ế n d ạ n g th e o h à m sô đ ô i s in

Sô' liệu gốc Sô" liệu sa u khi

đã c h u y ể n d ạn g

n=7 n=7

X = 0 ,2 6 X = 3 0 ,6

S D = 0,04 S D = 2,6

ơ- = 0 ,0 0 1 6 ơ- = 6,7 8 3 4

N h ư vậy, k ết quả tín h được từ bộ sô 'liệu sau khi đã c h u y ế n d ạ n g th eo


h àm đối sin là phư ơng sai = 6 ,7 8 3 4 và giá trị tr u n g b ình X = 30,6. N h ư
vậy, bộ số liệu mới (sau khi đã c h u y ể n dạng) h oàn toà n thoả m ã n đ iều k iện
đế thực h iện phép p h ân tích p h ư ơn g sai và các ph ư d n g pháp k iểm tra th ô n g
k ê s i n h h ọc k h á c .

31
2.3.5. Chuyển dạn g theo tỉ s ố nghịch đảo
Phương pháp chuyến dạng sô* liệu theo kiểu tỉ sô”nghịch dáo thích hớp
cho những trưòng hỢp cụ thề sau;
a. T h í n g h iệ m có n h iề u n h ă n tô m à các
n h â n tô 't h í n g h iệ m b iêu th ị th eo tỷ lệ %
N h ữ n g loại th í n g h iệ m biểu thị đđn vị tính là tỷ lệ % n h iễ m bệnh củ a
vật nuôi với một căn bệnh nhầ”t định. Sở dĩ sử dụng phép ch u y ê n dạng s ố
liệu theo tỷ số nghịch đảo là vì ỏ đây ngưòi ta niuôVỉ biết tại địa điểm dó tìm
thấy tỷ lệ sô’ con vật bị bệnh có ý nghĩa hdn, so vối tồng sô và thời gian tìm
thây con vật bị bệnh đó. Lấy lại thí dụ 1.3 dể chửng minh điểu đó.
b. T h í n g h iệ m có n h iề u n h â n tô 'm à tr o n g đ ó đ ộ lệch c h u ầ n
tỷ lệ t h u ậ n vái cá c b in h p h ư ơ n g tr u n g b in h các m ẫ u

c. CHUYỂN KỂT QUẢ ĐÃ CHƯYỂN d ạ n g t r ở l ạ i Gốc

Như chúng ta đă biết phướng pháp chuyển dạng sô liệu là đưa bộ sô"
liệu gốc không tuân theo sự phân bố chuẩn về dạng sô' liệu mới tuân theo
phân bô chuẩn để làm cho phưđng sai bền vững nhằm thực hiện các phép
tính tìm các thông sô”thốhg kê thích hớp. Trong những thí nghiệm mà bộ sô
liệu sau khi đă phải chuyển dạng để thực hiện phưdng pháp kiểm tra thống
kê sinh học cho thích hdp thì sau khi thu được kết quả từ bộ số liệu mối,
phải trình bày các kết quả vừa tìm được theo thưóc đo hay đdn vị gốc dùng
ban đầu (khi chưa chuyển dạng) để dễ dàng hiểu chính xác mục tiêu của thí
nghiệm. Hđn nữa, chuyển kết quả trở lại thưốc đo ban đầu sẽ dễ dàng thực
hiện việc so sánh vối nhiểu sô" liệu của nhiều quần thể. Ngoài ra, kết quả
sau khi chuyển trở lại thước đo ban đầu mới chính là kết quíĩ thực của thí
nghiệm.
Nhự vậy, phép chuyến kết quả từ các bộ sô" liệu đã chuyến dạng trở lại
theo thưỏc đo ban đầu hay đơn vị gổc là cần thiết và hầu như bắt buộc cho
mọi thí nghiệm.

1. CHUYỂN ĐỔI KẾT QUẢ TRỞ LẠI THEO THƯỚC ĐO BAN ĐẦU

Nếu một phép chuyến dạng sô”liệu đã được thực hiện thì đã tạo nên
một bộ số liệu môi thoả mãn cho việc thực hiện các phương pháp phân tích

32
và kiêin tra thôVig kê sin h học. Từ dó, tất cả các phép p h ân tích n h ư so sá n h
cát: giá trị tru n g bình, kiểm tra k h oản g tin cậy, tưđng ph ản , v.v, đ ều đâ
được thực hiện trên bộ sô liệu mới. Kết quả thu đựơc sau khi chuyển dạng
đều k h ô n g phải là n h ững kết quả thực của thi nghiệm . Hđn nữa, k ế t quả
thu dưỢc sau khi chuyển dạng thường rả’t khó biện luận và giải thích sự
viộc đô người đọc hiểu một cách dễ d à n g và chuâi! xác. Tóm lại, nếu m ột th í
n g h iệm do đ iểu kiện sô’ liệu thu được không tuân th eo sự p h ân bô" ch u ẩ n
Iiên dã p h ầi ch u y ển dạng thì sau khi phân tích và thực h iện các phưđng
pháị) k iểm tra th ô n g kê sinh học các kết quả đó cần th iế t phải ch u y ển đổi
tn ỉ lại th eo thước đo ban đầu.

Thế nhưng, phải ỉàm phép chuyển đổi kết quả trỏ lại theo thước đo
ban đầu như thế nào và loại kết quả nào thì có thể thực hiện được phép
chuyển dối là một vấn để cần được nghiên cứu. Đê giải quyết được vấn đề
đó, các quy định cđ bản cho phép chuyển đôi kết quả trỏ lại theo thưốc đo
ban đầu cần phải được nắm vững. Vậy, những kết quả nào thì được chuyển
đoi trd lại theo thưốc đo ban đầu?
Đế’ áp d ụ n g các phép chuyển đổi kết quả trở lại th eo thước đo b a n đầu,
trước hết cần phải nắm vững những quy định cđ bản sau đây mà chúng cần
phải tu â n thủ:
1. Chỉ được thực hiện phép chuyển đểi kết quả trỏ lại thước đo ban đầu
đôi với các giá trị c ố định như giá trị tru n g bình. N goài ra, các giá trị h a i
đáu inút của khoảng cách củng có thể được áp dụng cho phép chuyển đổi
kêt quả trở lại.
2.Không được phép thực hiện phép chuyên đổi kết quả trỏ lại thước đo
ban đầu đối vối các loại giá trị về khoảng cách như sai số chuẩn, phưđng
sai, khoáng tin cậy, LSSR và LSR (xem chi tiết ỏ chưdng sau).
Tóm lại, nếu ở một sô’ thí nghiệm nào đó inà ngưòi ta yêu cầu trình bày
Cíu: kỏt. quả vừa thu được vdi bộ số liệu sau klii dầ tíhuyển dạng trỏ lại theo
thước đo ban đầu thì duy nhất các kết quả được chuyển đổi trỏ lại là các giá
trị cố định ni;ư giá trị trung bình mà không chuyển đổi các kết quả biểu
hiện vể khoảng cách như sai số chuẩn, phiídng sai, khoảng cách tin cậy (trừ
trường hợp các giá ♦.rị đầu mút của khoảng cách tin cậy).

II. CÁCH CHUYỂN ĐỔI KẾT QUẲ TRỞ LẠI THƯỚC ĐO BAN ĐẦU

Cách chuyển đổi kết quả phân tích, kiểm tra thông kê sinh học trỏ lại

33
theo thưốc đo ban đầu cho các kiểu chuyến dạng sô’ liệu gốc thông dung nhu
sau:
1. Đối vối ph ép ch u y ến d ạ n g sô” liệu th eo h à m sô lo g a rit X thì p h ép
c h u y ể n đổi kết quả trỏ lại là p h é p đ ố i lo g a rỉt. T hí dụ, đế chuyên clôi kết quá
1,380 từ phép chuyển đổi số liệu trở lại thưỏc đo ban đầu thì phái lấ/ giá trị
đôì logarit của nó. Giá trị đôi logarit của 1,380 là 24.
2 . Đôì với phép ch u y ển d ạ n g sô' liệu theo h à m s ố lo g a r it (x+1) thì p h ép
c h u y ể n đổi k ết quả trở lại là p h é p đ ố i lo g a rit rồi lây kết quả t r ừ đi 1. T hí
dụ, để chuyển đổi kết quả 1,0414 trỏ lại đơn vị ban đầu thì phái lấy giá trị
đỐì logarit của nó được bao nhiêu rồi trừ đi 1 . Giá trị đối logarit của 1,0114
là 1 1 , sau đó lấy 1 1 - 1 = 1 0 .
3 . Đối với phép ch u y ể n d ạ n g s ố liệu th eo că n b ậ c 2 củ a X thì p h ép
chuyển đổi kết quả trỏ lại là phép binh phương của giá trị dó. Thí dụ, đé
chuyển đổi kết quả 3,464 trỏ lại theo thước đo ban đầu thì phải là'y bình
phương của chính nó. Bình phương giá trị 3,464 = 12.
4 . Đôì với phép ch u y ể n d ạ n g s ố liệu th eo c ă n bậc 2 của (x + 1) t i ì pl\ép
chuyến đổi kết quả trở lại là phép bình phương cuả (x+1). Thí dụ, đê chuyến
đổi kết quả 3,937 trỏ lại thước đo ban đầu thì phải lấy bình phưcng của
3,937. Bình phương 3,937 = 15.
5. Đối vói phép chuyển dạng số liệu theo hàm đối sin thì phép chuyển
đổi kết quả trở lại là lấy giá trị binh phương của hàm sô'sin đó. Thi dụ, đế
chuyển đổi kết quả 28,2 trỏ lại theo thước đo ban đầu thì phải lấy giá trị
của hàm sôTsin và sau đó lấy bình phương chính kết quả của hàm sốsin đó:
(sin 28,2)2 = 0,2233.

III. THÍ DỤ MINH HỌA

Lấy lại thí dụ 2 đã được trình bày trên đây khi nghiên cứu về hiệu
quả sử dụng thuốc diệt cỏ cho thấy “hiệu quả của năm loại thuốc diệ: cỏ (lại
A, B, c, D và E vôi mức xác suâ't p = 0 ,0 1 ”. Từ bộ số liệu gốc đó, thuc hiện
phép chuyển dạng số liệu theo căn bậc 2 thu được kết quả của bộ số liệu
mới đưỢc trình bày ỏ bảng 24.

34
B ầ n g 24, Kết quả đả chuyển dạng theo cân bậc 2

Mẩu thuốc A B c D E

14.7 3.5 3.7 7,5 9,2

16,4 4.7 .4.2 6.3 11.3


18,8 77 7.2 10.4 8.1
17.4 3.7 3.5 5.8 8.8
15,3 4.7 3.7 8.4 12,6

X 16.52 4,86 4,46 7,68 10,0


2,70 2.83 2.41 3,35 3,54
ơ 1,64 1.68 1.55 1.83 1,88

B á n g 25. Anova số liệu đâ chuyển dạng theo căn bậc 2

Nguồn biến DF ss MS F p

Giữa các mẫu 4 483,03 120,76 40,7 p<0,00‘


Sai só 20 59,28 2,96

ghi chú:
- DF là độ tự do của mỗi nguổn biến;
- s s ià tổng các binh phương;
> MS là trung binh binh phương:
- F là giá trị kiểm tra độ tin cậy (F=MS của mẫu/MS sai số);
- p ià xác suất của thí nghiệm.

Sư sai k h ác của sô tru n g bình thực hiện theo phép kiểm tra thôVig kê
1% sự sai k hác có ý n g h ĩa nhỏ nhất (LSD) là:

1% LSD = 2,8Õ ^ 2 ,9 6 x 2 /5

16,52 + 3,10
Khẳng đ ịn h sự sa i khác giữa các s ố trung bình (bảng 26).

B ắ n g 26. Sự sai khác giữa các số trung bình

3iừa các mẫu B E

3iá trị trung bình 4.46 4.86 7,68 10,0 16,52

35
ghi chú:
- 4,46; 4 , 8 6 ; 1 6 , 5 2 là giá trị X của các mẫu tưong ứng c. B, , , A
là không có sự sai khác giữa các sỏ' trung binh mẫu.

Khoảng tin cậy (K) đổi với giá trị trung binh
Giả sử, với 99% của K đôi vỏi giá trị trung bình của mẫu A đòi hỏi xác
định, ta làm như sau:
99% K = 16,52 ± 2,85 ^2,96/5
= 16,52 ±2, 19
Như vậy, khoảng tin cậy đổ ìà từ 14,33 tới 18,71.
Để kết quả của bộ số liệu đã chuyển dạng được biểu diễn trở lại t h e o
thước đo hay đđn vị ban đầu, đòi hỏi phải làm phép chuyển đổi kết quả trở
lại đđn vị gốc bằng cách lấy bình phưđng các giá trị đó. Thứ tự các bước làm
như sau; tính giá trị X cho cả hai bộ số liệu trước và sau khi đã chuyển
dạng (bảng 27).
B ả n g 27. Giá trị X của hai bộ số liệu

Mẫu (loại thuốc) A B c D E

Chưa chuyển dạng 275,2 26.0 22.0 61,6 103,0


Đâ chuyển dạng 272.9 23.6 19.9 59,0 100,0

Nhận xét
Tất cả các giá trị trung bình tính được của bộ số liệu sau khi đã chuyển
dạng đều nhổ hơn giá trị trung bình của sô”liệu ban đầu. Song, một sô tác
giả đến đây đã nhầm tưỏng và kết luận rằng số liệu sau khi chuyển dạng
đă bị sai lệch nên đã đưa ra một số công thức đề điều chỉnh chúng. Tiếc
thay, đó là một sự nhầm lẫn đáng tiếc vì bản chất của bộ số liệu sau khi
chuyển dạng vẫn không thay đổi, có nghĩa là sự sai khác giữa các sô trung
bình vẫn giữ nguyên. Vấn đề này sẽ được minh họa ỏ bảng 28 sau khi ta
sắp xếp chúng theo một trật tự từ nhỏ đến lốn.
B ả n g 28. Giả trị X của bộ số liệu đã chuyển dạng
Mẫu (loại thuốc) c B D E A

X đă chuyển hoá 19.9 23.6 59,0 100.0 272.9

36
'I'h ;o t h ư ố c đ o mói, s a u k h i (ỉã c h u y ể n d ạ n g t h e o c ă n b ậ c 2 t h ì g i á t r ị
t r u n g t ì n h là 16 ,5 2, t h ấ p n h ấ t là 14,:ỉ3 v à c a o n h á t là 18,71 . N h ư v ậ y , g i á
t r ị 16,52 n ằ m c h í n h g i ữ a c ủ a k h o á n g t i n c ậ y dó. C ó t h ế m i n h h ọ a k ê t q u ả
d ó t h e o sơ đ ồ 2 .
Sơ đồ 2. Khoảng tin cậy cùa số trung bình đà chuyển dạng theo căn bậc 2

14,33 16,52 ■ 18,71

C h u y ể n đổi k ế t q u ả t r d lại th ướ c đo b a n đ ầ u ở t h í d ụ n à y là l ấ y b ì n h
phươnị: giá trị vừa tìm được sau khi dà chuyên dạng sang thưỏc đo căn bậc
2. Bình phương các giá trị trung bình là 16,Õ2' = 272,9; thấp nhâ*t là 14,33'
= 205,4 và cao nhất là 18,71' = 350,1. Nhưng cần nhó rằng, vối các giá trị
h a i đ ầ u m ú t c ủ a k h o ả n g c á c h n h ư ở t h í d ụ n à y là 14, 33 v à 18,71 t h ì có t h ể
chuyển hoá trở lại được nhưng cũng dừng hiểu nhầm rằng khi đã tính được
hai giá trị đó ta áp dụng công t h ứ c X ± SE (SE là sai số chuẩn) để tính giá
t r ị t h ấ p n h ấ t v à c a o n h ấ t vì ở đ â y h a i giá t r ị đó k h ô n g đốì x ứ n g q u a g i á t r ị
t r u n g DÌnh. N h ư v ậ y , g i á t r ị 16,52 ' k h ô n g n ằ m ở vị t r í c h í n h g i ữ a c ủ a
khoảnị: tin cậy, dẫn đến giối hạn khoảng tin cậy của bộ số liệu này là từ giá
t r ị t r u n g b ì n h ( 2 7 2 ,2 ) - 6 7 , 5 đ ế n giá t r ị t r u n g b ì n h (2 7 2 , 9 ) + 77,2. C ó t h ể
trình bày minh họa theo sơ đồ 3.
Sa đố 3. Khoảng tin cậy của số trung binh theo thước đo ban đầu

205,4 272,9 ■ 350,1


_ l _____________^_________________ 1

Những sai lầm trong quá trinh chuyên dổi kết quả trở lại thước
đo gốc
Niững sai lầm thưòng niắc phải là;
Một sô ngưòi đă phạm phải sai lầm khi thực hiện phép chuyến đổi kết
quá tri lại, họ đã chuyển đổi trỏ lại cả các giá trị kết quả biểu thị bằng
khoán? cách như sai sốchuấn, độ lệch chuân, phưđng sai, v.v.
Lay lại kết quả thí dụ 2 trên dây vê “hiệu quả của năm loại thuốc diệt
cổ dại’ vói mức p = 0,01 cho sô* liệu loại thuốic A với kiểu chuyển dạng theo
cán bậ* 2 để làm sáng tỏ điều đó.
Tieo thưôc đo căn bậc 2 họ dã thu được kết quả:
99% K = 16,52 ± 2,85
= 16,52 ±2,19 ■.
Tí đây, họ đã hiểu sai và làm phép chuyên hoá trỏ lại cho tâ"t cả mọi
giá t rị kôt quả của SD và phương sai:

37
- Bình phương giá trị SD^
99% K = 16,522 + 2,85 >/2,96^ /5
= 16,522 + 3 77

- Bình phương c ả hai g i á trị, đ ó là:


K = {16,52)2 ±(2,19)^
= 279,9 ± 4,8
Như vậy, cả hai cách làm đó đều cho kết quả sai.
Ngoài ra, một số ngưòi lại sử dụng giá trị LSD để chuyến đổi kết quả
trỏ lạ i theo thước đo ban đầu cũng dẫn đến kết quả sai. Thí dụ, tại kết quả
ở th í dụ trên, họ đã bình phương kết quả 3,10 dẫn đến kết quả là 9,60 và
thực h iện phép thử LSD thì k ết quả cho thấy duy nh ất chỉ có sự sai khác
giữa mẫu c và B là không có ý nghĩa.
Khi chuyển đổi kết quả trỏ lại thưốc đo ban đầu họ đã dùng những giá
trị có liên quan với nhau như phưđng sa i vối trung bình hoặc độ lệch chuẩn
vói trung bình. Nếu các phương sai tỷ lệ thuận vói giá trị trung bình có
nghĩa là một đồ th ị hồi quy tuyến tính giữa phưđng sai và trung bình đã
thừa nhận là một đưòng thẳng, đó là đồ thị của một đường thẳn g mà inột
trục là phưdng sa i còn trục kia là giá trị trung bình (sđ đồ 4).
So đỗ 4. Sự sai phạm khi chuyển đổi kết quà trỏ lại thước đo ban đẩu

Trong trường hợp này bộ s ố liệu đó nên dùng phép chuyển dạng theo
căn bậc 2.
Tưdng tự, nguòi ta bị mắc sai lầm trong trưòng hỢp nếu các độ lộch
ch u ẩn tỷ lệ th u ận với giá trị trung bình có nghĩa là một đưòng thẳng tuyến
tín h giữa giá trị độ lệch chuẩn và giá trị trung bình. Đồ thị đó là một đường
th ẳ n g mà m ột trục là giá trị độ lệch chuẩn còn trục kia là giá trị trung bình
(sơ đo 5).

38
Sơ đố 5. Sự sai phạm khi chuyển đổi kếí quả trở íại thước đo ban đầu

X
T 'o n g tr ư ờ n g h ợ p n à y bộ sô liệu đó n ên d ù n g p h é p c h u y ể n d ạ n g th eo
h ờ m sò 'ỉo g a rìt.

IV. KẾT LUẬN •

Piương pháp chuyển đối kết quả phân tích thốhg kê sinh học của các
bộ s ố i ệ u s a u k h i đ ã được c h u y ê n d ạ n g t r ỏ lại t h e o t h ư ố c đo b a n đ ầ u h a y
t h e o t i ư ó c đ o gốíc là p h é p c h u y ể n k ế t q u ả t í n h đ ư ợ c c ủ a b ộ s ố l i ệ u đ ã đ ư ợ c
chuyểi dạng quay trở lại theo đơn vị tính hay thưóc đo ban đầu. Phướng
p h á p c h u y ế n đ ổ i k ế t q u ả t r ở lại t h e o t h ư ó c đo b a n đ ầ u là c ầ n t h i ế t v à t r o n g
m ộ t só t r ư ò n g hỢp là b ắ t b u ộ c . P h é p c h u y ể n đổi k ế t q u ả t r ở lạ i b a n đ ầ u d u y
n h ấ t ( h ỉ đưỢc t h ự c h i ệ n đ ố i vỏi các k ế t q u ả m à g i á t r ị c ủ a n ó l à c ố đ ị n h v à
k h ô n g đ ư ợ c p h é p t h ự c h i ệ n đôi với các giá t r ị b i ể u h i ệ n v ề k h o ả n g c á c h h a y
co n i ố l i ê n q u a n .

M i ư v ậ y , c h ú n g t a y ê n t â m r ằ n g , t ừ đâ}' b ấ t c ứ b ộ sô” l i ệ u n à o d ù ! 1 Ó có
tuân iheo phân bô”chuẩn hay không cùng có thể thực hiện các phương pháp
phân úch kiểm tra thôVig kê sinh học một cách chính xác vì chúng ta đã có
c á c p l ư d n g p h á p c h u y ể n d ạ n g sồ liệ u t h i c h hỢp t r ư ớ c k h i p h â n t í c h v à k i ể m
tra thìng kê sinh học.

39
CHƯƠNG II

KIỂM TRA MỨC Độ TIN CẬY sô' TRUNG BÌNH MẪU

A. KHÁI NIỆM •

Để xác định đặc điểm sinh học của cả một quần thể lớn giông vật nuôi
hay giống cây trồng thì trong thực tiễn không mây ai làm vì rất kh ó k h ă n
và tốh kém do việc thu thập số liệu của tất cả mọi cá thế của quần thể lón
là vô cùng phúc tạp. Khái niệm một quần thể, thí dụ một giông vật nuôi
hay một giống cây trồng là một tập hợp vô cùng lốn, gồm tất cả mọi cá thể
của giống vật nuôi hay cây trồng có cùng những tính chất. Vấn đề đặt ra là
phải làm như thế nào dể xác định được đặc điểm sinh học của một quần thể
to lân như vậy? Thí dụ, xác định khối lượng sơ sinh của giông lợn Móng Cái
hay xác định cao khum của giông bò vàng Việt Nam, vv. Vậy, có cần thiết
nghiên cứu một đặc điểm sinh học nào đó trên cả một quần thề vô cùng lớn
không? Để trả lồi cho câu hỏi đó, trước hết chúng ta cần xem xét quần thể
là gì? Nghiên cứu các đặc tính của quần thể phải làm như thế nào?

I. QUẦN THỂ

Chúng ta trỏ lại câu hỏi trên đây ”Liệu khôi lượng sd sinh của quần
thể giống lợn Móng Cái có phải là 0,58kg không?”. Thực sự, khó có thể trả
lòi câu hỏi đó một cách chính xác bởi vì không thể cân được tất cả mọi cá
thể lợn con sinh ra của quần thể giống lớn Móng Cái trên mọi nơi mọi lúc vì
quần thể đó lớn vô cùng. Trong thực tế, chỉ có thể cản được một số lượng cá
thể nhất định của giông lợn đó mà thôi. Thí dụ, có thể cân đưỢc tất cả lợn
con sinh ra tại một sô' trại lợn Móng Cái như Nông trưòng Thành Tô, Đông
Triều hay Trại lợn giông Tràng Bạch.
Vậy, thu thập số liệu của cả một quần thể lớn là vô cùng khó khản nên
chúng ta cần tìm ra một cách tính toán thông qua bộ sô' liệu của một số

40
mâu thí n g h iệm với kích cờ nhất (lịnh dù (lại (liộn cho qu ần th ê đê từ dó
khắng định đặc tính sinh học của íỊuan thố. Thí dụ, từ sô^ liệu thu dược tại
n h ừ n g đ à n lợn M óng Cái của Nỏng triùíng Tlìànlì Tỏ, Đông Triểu, Trại lợn
g iỏn g Tràng Bạch, v.v có th ế tính toán xác dịnh (lưỢc giá trị tru n g bình khôi
lượng sơ sin h cúa lợn M ón g Cái là 0,r)8kg tliì chínli giá tri này biểu thị cho
đặc diếm khôi lượng sơ sin h của quần thê giông lựn M óng Cái. Thực chât,
để xác đ ịnh khôi lượng sơ sinh của quần triô giống lợn M óng Cái cũ n g có
thỏ Ihu th ậ p đưỢc đầy đủ s ố liộu của tất cả mọi cá th ể giông lợn dó n h ư n g
vô cùn^ khó k h ản và rất tôn kóni. Hơn nữa, củng không cần th iêt làm như
vậy, nén trong thực tê k h ôn g mấy ai và có lẽ không bao giò ngưòi ta tổ chức
ngh iên cứu trên cả m ột quần the lớn.
Tem lại, q u ần thê có thể dược coi là mội tập liỢp sô" liệu vô hạn và các
th a m sô" th ôn g kê h ầu n h ư không thể xác (lịnh (lược trên các quần th ể to lớn
n hư vộy. Vậy, làm n h ư t h ế nào đế kết quả tính dưỢc từ các m ẫu th í n g h iệm
thực sư biểu thị đặc trư n g cho quán thể? Kích cỡ m ẫu bao nh iêu , áp d ụ n g
phương pháp p h ân tích nào, ... để kết quá thu được từ các thí n g h iệm sẽ
biêu thị đặc trư ng cho qu ần thể? Với nhưng lý do đó, ch ú n g ta có th ể suy
n ghĩ răng chí có m ẫu th í nghiệm mối có thế có giói hạn và có th ể tính được
các thông sô" thôVig kê đ ể biểu thị cho các đặc tính sin h học của quần thể.
M uôn kết quả của m ẫu th í nghiệm biếu thị đúng đặc trưng của q u ần thê
thi phương pháp n g h iê n cứu, mô hình bố trí thí nghiệm , chọn m ẫu, chọn
phươn? pháp phân tích phải thích hỢp và diính xác vói từng loại nhân tố
và dựa vào đặc trư n g của các nhân tố đó.
N^oài ra, từ n h ữ n g m ầu thí nghiệm hay sô^ liệu thu thập trong thực
tiễn có th ê tă n g dần kích cỡ hay dung lượng mẫu lên b ằn g cách cộng th êm
sô liệu vào các mẫu càng nhiều càng tốt với khá nảng có thề thực hiện đưỢc
để khi p h ân tích tín h toán xác dịỉih các thỏng sô' th ôn g kê sẽ có độ chính
xác cao hơn n h ằ m biểu thị đúng đặc trưng cho quần thể. Thực chất, n g h iên
cứu trên toàn bộ sô' liệu của quẩn thể mới cho ta kết quả đúng, song trong
thực té kh ôn g th ể hoặc k h ôn g bao giò làiiì đưỢc cỉiều dó. Hay nói m ột cách
đúng hơn là có thê làm được Irẻỉi niột (ỊUẩiì llìể lớn nhưng vô cùng tôn kém
và cùng kh ôn g cần th iế t vì nếu la biết lấy mẫu, chọn niô h ìn h thí n gh iệm
và p h in tích đ ú n g n g u y ê n tắc thì kết quả phán tích của m ẫu th í n g h iệm sẽ
đại diện cho q u ần thể.

Trong thực tế, tham sô^ trung bình (|.i) và dộ lộch chuẩn (ơ) của qUcần
th ê là n h ữ n g th a m sô" củ a quần thể va thưòng không được xác định. Một
d iều quan trọng cần phải nhấn mạnh rằng một khi qu ần th ê đă được xác
định tnì các th a m sô^|i và ơ phải cỏ^định. Do thực tiễn các th am sô của quần

41
thê thưòng không thể xác định được nên không trình bày chi tiêt vê phần
quần thề mà chỉ đi sâu vào mẫu thí nghiệm,

II. MẨU THÍ NGHIỆM

1. Khái niệm
N h ư đã trình bày ở các phần trên đây, đề xác định đ á n h giá đạc điềni
của một quần thề như một giông vật nuôi hay một loại cây trồng, trong
thực tiễn khó có th ế làm được vì m ột q u ần th ế là vô cù n g lớn. Vì vậy, (íần
thiết phải lây mẫu của quần thê đó đê tính toán và xác định các thông sô
thốhg kê về một đặc tính hay một tính trạng nào đó. Những thông sô* thông
kê được xác định từ mẫu sẽ đại diện, biểu thị đặc trưng cho các tham số của
quần thế mà chúng ta muôn nghiên cứu.
Mâu thí nghiệm là một đđn vị nhỏ, một tập hđp số liệu hay một phần
nhỏ của một quần thể đưỢc sử dụng để xác định các đặc điểm dặc trưng cho
quần thể. Mầu là một tập hỢp số liệu của cùng một kiểu loại hay tính chất
trong quần thế đó. Mẫu dùng đề tính toán các thông sô* thông kê, mà chúng
sẽ biểu thị cho các tham số đặc trưng cho các quần thê có chứa mẫu đó. Vì
lý do đó, việc lấy mẫu từ quần thê hay chọn mô hình, tô chức bô tri thí
n g h iệ m là vô c ù n g q u a n tr ọ n g vì nó sẽ đóng góp một p h ần cơ bản q u yết
định mức độ tin cậy và hiệu quả của thí nghiệm, đồng thòi biêu hiện mức
độ chính xác đại diện đặc trưng cho quần thể.
Như chúng ta đã biết, mẫu càng lớn thì mức độ chính xác càng <;ao
nhưng mẫu càng lớn thì mức độ tôVi kém cũng càng cao. Vì lý do đó, eần
phải xác định mục đích, yêu cầu và mức độ chính xác đòi hỏi của mỗi một
thí nghiệm khi nghiên cứu vê mỗi một đặc tính đế xác định kích cd hay
dung lượng mẫu của từng thí nghiệm cần bô* trí hay lượng mẫu cần thiết
lấy ra từ mỗi quần th ể đ ể th u đưỢc k ế t quả đúng. Cách ch ọn kích cõ th í
nghiệm hay độ lớn của mẫu được trình bàỳ cụ thể trong những phần sau
đây.

2. Chọn dung lượng mẫu


Quá trình bô' trí thí nghiệm là lập kế hoạch để lấy đủ lượng thông tin
cần thiết cho một mục tiêu nghiên cứu nhất định dã đề ra. Rõ ràng, khi
lượng mẫu càng lớn tức là nguồn thông tin thu được càng nhiều thì mức độ
chính xác càng cao nhưng kéo theo mức độ tốn kém củng càng lớn. Vì vậy,
cần xác đ ịnh độ lón củ a mỗi th í n g h iệm h a y kích cỡ m ẫu bao n h iêu là đủ đê

42
xác định chính xác đặc tính ta cần nghiên í;ửii. Giả sử rằng, muôn xác định
khôi lượng lợn lai ba máu Duroc (DR) XỊLarge White (LW)xLancirace (LR)]
cùa một đàn lợn có khôi lượng trung bình X. sai sô nhỏ hơn õ kg và mức dộ
tin cậy 95% th ì cần th iết phái có dung lượng mau bao n h iêu là thích hỢp.
N h ư đã trìn h bày ở phần trên, với niức' độ tin cậy 95% của tru n g bình
niẫu thì sô mẫu sẽ nằm trong phạm vi |.i ±2 ơ của X của sự phân bô chuẩn.
Như vậy, có thê lập công thức tính dung lượiig mẫu như sau:
2ơ _

vn
1'ừ đó su y ra d u n g lưỢng inẫu cần th iết cho thí n g h iệm trên đây là;

n = (2 ơ )-/5 -

= 4 ơ -/2 õ

Rõ ràng, n ếu ơ đưỢc xác định thì dung ìượng mẫu sẽ đưỢc xác định.
Song, thí nghiệm chưa triển khai hay nói cách khác chúng ta đang cần xác
định dung lượng mẫu cho mỗi thí nghiệm thì chưa thế có được giá trị ơ.
Trong thực tế, ngưòi ta thưòng dùng giá trị độ lệch chuẩn của những thí
nghiệm tương tự trưóc hoặc sự hiểu biết vê khoảng mà những số liệu đó sẽ
rdi vào để ước tính giá trị n. Theo tính chât cúa sự phân bố chuẩn Gauss,
khoảng 95% những sô"liệu sẽ rơi vào diện tích quét bởi đường cong chuẩn có
giói hạn là ±2 ơ hay nói một cách khác là diệii tích z của 4ơ. Như vậy, 1/4
cùa khoảng đó là ơ.
(ỉiả sử, chúng ta biết 95% của trung bình khôi lượng lợn lai ba máu
DR(LW xM C) sẽ rơi vào k h oản g dó là 84 kg thì ơ sẽ b ằng 21 và d u n g lưỢng
niẫu cần là:
n = 4Ơ-725

= (4)x(21)t25
= 70,56
n^71
Tương tự, với một thí dụ khác khi khói lượng trung bình của tô hỢp lai
ba máu ngoại DR(LWxLR) là 100 kịĩ thì dung ìượng mẫu (n) sẽ là:
n = 4 Ơ-/2 Õ
= (4)x(2õ)"725 vì ơ = 25

= 100

43
Vậy, d u n g lượng m ẫu cần t h iế t đề bô" trí thí n g h iệm n g h iê n cứu khổí
lượng lợn lai ba m áu DR(LW xLR) là 71 cá tKế.

N ếu m uôn có sai s ố tín h toán < 5 kg thì có thế chọn mức ± l ơ . T ừ dó có


th ế su y ra có k h o ản g 68% sô’ liệu rđi vào k h oản g đó mà sa i sô tín h toán sẽ
<2,5kg. N h ư vậy, các n hà n g h iê n cửu sẽ xác định được d u n g lượng niẫu c ầ n
th iế t để n g h iên cứu của từ n g th í n gh iệm h a y m ẫu lây ra từ q u ần th ế d ự a
th eo mức độ yêu cầu ch ín h xác của mỗi đặc tính cần n g h iên cứu.

Có n h iều phưđng p h áp chọn sô lượng m ẫu khác n h a u tu ỳ thuộc v à o


bản ch ất và đặc trư n g củ a từ n g loại th í n gh iệm khác n hau. Song, các loại
th í n gh iệm th ô n g d ụ n g n h á t được áp d ụ n g là:

• loại thí n g h iệm đơn vị sử d ụ n g biếu thị theo %;

- loại thí nghiệm dùng để so sánh hai kết quả.


Sau đây, sẽ trình bày cụ thể hai loại thí nghiệm thưòng được sử dụng
nhiều trong lĩnh vực sinh học.

2.1. Loại thí nghiệm biếu thị theo %


T h í d ụ 2.1. Tại m ột th í n g h iệ m n gh iên cứu về sự p h ản ứ n g thuốc, n ếu
khả n ă n g p biểu thị 1 cá th ề s ẽ p h ản ứn g thuốc. Vậy, cần bao n h iê u cá th ể
đế đủ bô trí thí nghiệm biết rằng hy vọng sai sô”mong đợi của tính toán
<0,04 vối kh ả n ă n g x ả y ra tưdng ứ n g là 90%. Giả sử ngưòi ta m u ốn cỏ p
tương ứng là 0,6.

Cách giải
Do hệ sô' tin cậy là 1 -a = 90%, nên a = 0 , 1 0 và aJ2 = 0,05. Giá trị z
tương ứng diện tích là 0,05 ở đuôi trên của phân bố z là ct/2 = 1,645. Như
vậy:

l,64 5 ơ „ = 0,04 hoặc 1,645

= 0,0 4

Vối p = 0,6, s u y ra q = 0,4, th a y vào công thức có th ể tín h được tần s u ấ t


q u a n s á t phải có là:

n = 406.

Lưu ý, trong trưồn g hđp n ếu p và q kh ôn g được xác đ ịnh thì nên sử


d ụ n g 2 giá trị đó b ằ n g nhau: p = q = 0,5.

44
2.2. Loại th i nghiệm so sánh hai kết quả
T h í d ụ 2 .2 . S o sánh hiệu quá hai phương pháị) u ống thuốc được b ố trí
cho h,ii n h óm n gưòi th í nghiệm ró cùng (luiig lượng niẫu như n hau. Thòi
g ian thí n g h iệ m k h o ả n g 8 phúi. N êu sai số tính toán cho phép là m ột phút
và khi năng xảy ra là 95% thì cần l)ao nhi(‘“u ihành viêii cho mỗi nhóm?
C ách g iả i
Theo bài ra ta có phưđng trìiih;

2 d *? l. ,
Ịn , n,
Po ƠJ = Ơ2 = ơ và dung lượng hai mẫu ỉìị và bằng nhau nên: 4ơ = 8 ,
từ dó ta có th ế s u y ra ơ = 2. T hay ơ = 2 vào phương trình trên, có th ể tính
dược iung lượng mẫu cần thiết cho thí nghiộin, dó là n = 32 ngưòi.
Pến đây, d u n g lượng mầu cần thiết lấy ra lừ quần th ế hay bô" trí tại
một ĩhí nghiệm có thể đưỢc xác định. Từ những dung lưỢng mẫu thí
nghiệm đó, có thể xác định những thông sỏ thống kê cơ bản như sô" trung
bình, sô" chính giữa, độ lệch chuẩn, sai sô^chuẩn, hệ sô" biến dị, khoảng tin
cậy, \.v. N h ữ n g thông sô" thông kê đó có thể dùỢc biểu thị bàng sơ dồ, đồ thị,
h ìn h vẽ v à h ìn h ch âm theo nhiều dạng khác ììhau. Trong n h ữ n g th ôn g sô"
thông kê của n h ó m m ẫu, sô tru n g bình và sai sô chuẩn là hai th ông sô" quan
trọng n h ấ t vì nó b iểu th ị đặc trưng cho bán chất cơ bản n h ấ t của m ẫu. S ố
trung bình m ẫu và sai sô" ch u ẩn sẽ được trình bày chi tiế t về mức độ tin cậy
của nó trước khi th ực h iện các phương pháp kiểm tra th ô n g kê sin h học đê
so sáiih sự sa i k h ác giữa các inẫu.

B. KIỂM TRA MỨC ĐỘ TIN CẬY s ỗ TĨÌƯNG BÌNH MẨư

I. TẠI SAO PHẢI KIỂM TRA?

'Trong thự c tiễ n , đế thực hiện được các Ịìhương pháp kiểm tra th ôn g kê
sin h lọ c th u ậ n lợi, dễ d à n g và có kết quả chính xác, th ôn g thường ngưòi ta
nghión cứu sự tác đ ộng của các nhân t ố để dự đoán n ên áp d ụ n g phương
p h áp k iểm tra n ào là thích hợp n h ấ t rồi từ đó niới bô trí th í n g h iệm h ay bô"
trí cá:h lấy m ẫ u th í n g h iệm cho phù hợp.

45
Trung bình mẫu là thông sô"thống kê quan trọng nhâ”t trong các thông
s ố thôVíg kê đă n êu trên. Đ ế sử d ụ n g sô* tru n g b ình m ẫu đ ú n g th eo bản cỉiấ t
của nó, dựa theo các đặc điểm cơ bản của toán sinh học, việc kiểm tra inức
độ tin cậy số trung bình mẫu là một trong những vấn dề quan trọng và cần
thiết nhất trưỏc khi thực hiện các phương pháp phân tích kiểm tra khác.
Sau khi kết thúc thí nghiệm, tính toán các giá trị trung bình của các
nhân tô" thí nghiệm hay các mẫu có nhiều lúc nhìn thấy giữa chúng biếu
hiện sự khác nhau về số trị tính toán được thì có thề làm cho mọi người dễ
bị nhầm tương rằng giữa chúng có sự khác nhau. Tuy sô’ trị các giá trị
trung bình giữa chúng có khác nhau, song sự sai khác đó về mặt thông kê
có ý nghĩa hay không thì phải dùng các phương pháp kiểm tra so sánh mới
có thế biết được chính xác.
Thế nhưng, trước khi thực hiện các phương pháp so sánh sự khác nhau
giữa các số trung bình mẫu thì cần phải xác định xem liệu các sô' trung
bình mẫu đó có đáng được tin cậy hay không? Nếu các sô* trung bình mẫu
đó không tin cậy thì phép kiểm tra so sánh giữa chúng sẽ vô nghĩa. Mục
đích việc kiểm tra mức độ tin cậy của số trung bình mẫu là khẳng định số
trung bình niẫu có đưỢc tin cậy hay không. Nếu số trung bình mẫu có độ tin
cậy thì cho phép tiếp tục thực hiện các phương pháp kiểm tra thống kê đế’
khẳng định sự sai khác giữa các số trung bình mẫu bằng những phương
pháp khác nhau.
Nguyên nhân chính làm cho số trung bình mẫu không đáng tin cậy có
thể do nhiều nguyên nhân nhưng cd bản nhất là do dung lượng mẫu chưa
đủ lón, cách lấy mẫu hay bô' trí thí nghiệm không đúng phưđng pháp hoặc
mức độ biến dị của quần thế quá cao. Vì vậy, trước hết tác giả muôn được
giới thiệu những phương pháp kiểm tra mức độ tin cậy của số trung bình
mẫu và sai sô' chuẩn trước khi thực hiện các phương pháp kiểm tra thống
kê sinh học về sự sai khác giữa các số trung bình mẫu và phân tích phưđng
sai.
«

II. PHƯƠNG PHÁP KIỂM TRA

ỉ. Nhắc lại một s ế phép tinh thông kê sinh học cơ bản của mẫu
Thí dụ 2.3. Tại một thí nghiệm nghiên cứu về sự tồn dư thuốic trong
máu đả xác định được hàm lượng thuốc sunfa chứa trong máu đo được của

46
8 bện h n h â n sau 1 giờ d ù n g với lióu 2g !à 70,9 62,1 30,4 89,3 34,5 85,1
8 6 , và 6 9 ,0 (f.ig/inl). H ãy xác (lỊnli các giá U'Ị thõng ke sin h học cơ bản m ầu
n hư trung bình, độ lệch, bình phương (ỉộ lệch cúa l)ộ sô liệu đó.

1 .1 . Tinh độ♦ lệch


♦ chuẩn
Dựa vào S() liộu hàm lượng thuốc sunía chửa trong m áu thu đưỢc sau 1
giíỉ (X ,\ kết quả về độ lệch từ giá li ị Irung bììih (X, - X ) và tru n g bình binh
phương (X,- X của nó được trình bày ỏ báĩìg 2.1.

B ả n g 2.1. Hàm lượng, độ lệch, binh phương độ lệch của sunía trong máu

X, X,- X ‘ (X,- x f

70,9 4,95 24,5025


62,1 -3,85 14,8225
30,4 -35,55 1263.8025
89,3 23,35 545,2225
34.6 -31,45 989,1025
85,1 19,15 366.7225
86,3 20,35 414.1225
69,0 3,05 9,3025

I 527.6 0,00 3627,6000

ghi chú:
X, là giá trị quan sát hàm lượng sunía của bệnh nhân thứ i
X là trung bình cộng của tất cả mẫu thí nghiệm.

1 .2 . Tính các giá trị thống kê mẫu


X = IX /N

= 527,6/8

= 65,95

ss =V( X, - x) ^
= ,1627,6

ơ- =ss/(n-l)
= 518,229

ơ = 2 2 ,7 6

C ách tín h b ằ n g m á y tín h cầm tay

47
Bằng phương pháp sử dụng máy tính cầm tay đơn giản, giá trị lổng các
bình phương (SS) có thê thu được theo công thức ngắn gọn sau dây:
S S = IX,-' - n x ^

Với công thức này việc tính toán sẽ đơn giản hơn bơi vì nó dễ dàng hơn
đế thu được tống các bình phương thô so vối cách tính toán cấu trúc với các
độ lệch như trên.
Tính th eo từ n g s ố quan s á t của bộ sô" liệu thô:

ss.h, = Xr'
= 70,9'- + 6 2 ,r- + . . . + 69,0-

= 3 8 4 2 2 ,8 2
Tính theo các độ lệch giữa từng sô vài giá trị trung bình của bộ sỏ liệu
thô:
SS. i,)Kh.i> = X,- - n X -
= 3 8 4 2 2 ,8 2 • 8 (65,90)-
= 3 6 2 7 ,6

2. Kiểm tra mức độ tin cậy

2 .1 . Khái niêm

Như ch ú n g ta đã biết, m ẫu thí n g h iệm là một p h ần nh ỏ cùa q u ầ n thể


cho nên mức độ tin cậy của số trung bình mẫu thí nghiệm phụ thuộc rất lởn
vào cách lấy mẫu, dung lượng mẫu và mức độ biến dị của quần thể. Số
trung bình của các mẫu thí nghiệm khác nhau thì mức độ tin cậy cũng khác
nhau, thậm chí khi số trung bình mẫu giôVig nhau nhưng mức dộ tin cậy có
lúc cũng khác nhau. Vì vậy, sau khi xác định được giá trị trung bình mẫu
cần phải kiểm tra mức độ tin cậy của chúng truớc khi thực hiện các phép
phân tích kiểm tra thôVig kê sinh học khác.

2.2. Các bước kiếm tra


Để kiềm tra độ tin cậy của số trung bình mẫu các bước cơ bán cần phải
tiên hành như sau:
Tính giá trị t thực nghiệm (t,J

t . „ = ^Ị—
^ .

S/yỉ^

48
troiiịí đó:

X là giá trị thông kê trung bình mẫu;


n là iham sô’ trung bình cùa (ịuầii thể;
s là dộ lệch chuẩn;
11 là dung lượng mẫu.
a. T im g iá tr ị t lý th u y ế t (ti,)

Tìni giá trị t lý th u y ế t (t|,) bàng cách tra bảng t với độ tự do (DF) = n-1
và xác: suâ't thường sử dụng ơ ba mức độ p=0 ,0 õ; p=0 , 0 1 và p= 0 ,0 0 1 .
b. S o s á n h g iữ a g iá tr ị t th ự c n g h iệ m và tị,

Nếu giá trị:


• t,„ < tức là p (t,„) > 0,05 thì số trung bình mẫu đó không đáng tin
cậy;

• tii. > t„|,- tức là p (t,„) < 0,05 thì sô trung bình mẫu đó tin cậy ở mức
95%,
• tin > tii.oi tức là p (t,n) < 0,01 thì sô’ trung bình mẩu đó tin cậy ỏ mức độ
99%;
• tiii > W )1 tức là p (t,„) < 0 ,0 0 1 thì số trung bình mẫu đó tin cậy ỏ mức
độ 99,9%.

2.3. Thi du• mình hoa


Thí dụ, xác định mức độ tin cậy của sô trung bình mẫu được tính từ bộ
sô liệu thí dụ 2.3 vể “hàm lượng thuốc sunfa chứa trong máu đo được của
tám bệnh nhân dùng vối liều 2 g sau 1 giò uôtig” được trình bày ỏ bảng 2 .2 .
B áng 2.2. Hàm lưt«ig thuốc sunfa chứa troiig máu của tám bệnh nhân

BN 1 2 3 4 6 6 7 8

HL 7 0 .9 6 2 .1 3 0 ,4 8 9 ,3 3 4 ,5 8 5 .1 8 6 ,3 6 9 ,0

ghi chú:
-BN là bệnh nhân số 1.2. 3...
- HL là hàm lượng thuốc (|jg/ml).

Áp dụng công thức tính giá trị t thí nghiệm như sau:

49
65.95 0-

^in ~~
22.76/2,83
= 8,20
Với DF = 8 - 1 = 7 và xác suất a mức p=0,05, p=0 ,0 1 và 1» = 0 ,0 0 1 dể
xác định giá trị t|,:
^o.o.") ~ 2,4

^0,01 ~ 3>5
to.ooi ~ 5 ,3

N h ư vậy, giá trị ttn (8,20) > to.ooi (5,3) nên giá trị trung bình về hàni
lưỢng thuốc sunfa trong máu sau khi uôVig 1 giờ với liều 2 g của láni bộnh
nhân có độ tin cậy rất cao, đó là 99,9%.

3. Xác định khoảng tin cậy của số trung bình mẫu


3.1. Khái niệm
Biên độ khoảng tin cậy của số trung bình của một nhóm sô liộu rộng
hay hẹp phụ thuộc vào mức độ tin cậy và sai số của số trung bình mầu. Mức
độ tin cậy của số trung bình mẫu càng cao và sai số của số trung bìiih mẫu
càng lớn thì biên độ khoảng tin cậy càng rộng. Ngược lại, nếu mức độ tin
cậy của số trung bình mẫu càng thấp và sai số của số trung bình niầu càng
nhỏ thì biên độ khoảng tin cậy của số trung bình càng hẹp.
Như chúng ta đã biết, khoảng tin cậy của số trung bình thường được
dùng là trung bình mẫu vì quần thể thưòng là vô hạn hoặc vô cùng lân nên
không thể thu thập được đầy đủ số liệu và tính toán dưỢc tham sò' trung
bình của quần thể. Do vậy, từ đây vể sau chúng ta chỉ đề cập đến khoảng
tin cậy của sô trung bình mẫu. Nêu muốn sử dụng khái niệm khoảng tin
cậy của số trung bình quần thể thì nên hiểu đó là giá trị trung bình ước
lượng.

3.2. Công thức tinh


Thưòng thường, các thí nghiệm nghiên cứu trong lĩnh vực sinh học nói
chung người ta sử dụng 3 mức độ tin cậy là p=0,05; p=0,01 và p=0,001 để
đánh giá mức độ tin cậy của số trung bìnhs Mức độ tin cậy tuỳ thuộc vào
tính chất và yêu cầu của mỗi vâ'n đề trong từng thí nghiệm. Những công
thức xác định biên độ khoảng tin cậy của sô' trung bình mẫu được trình bày
cụ thể như sau:

50
X - 1„ „5 S D / J n < n ắ X + t,i ,)5 Vn

X • t„„, SD/ Jn < n < X + t,.i„ SD/ Vlĩ


X ■ t„ SD/ Jn < |i < X + t„,H„ S D / J n

trong dó:
Xlà giá trị trung bình mẫu;
|.i là t ham số trung bình tỏng thể;
Sl) là dộ lệch chuẩn;
n là dung lượng mẫu;
hoặc to,„i hoặc to.iK)! là những giá trị t lý thuyết tại các mức độ tin
cậy khác nhau.
3.3. Thi du

minh hoa

Thí dụ, xác định biên độ khoảng tin cậy của sô’ trung bình mẫu được
tính từ bộ sô' liệu ỏ thí dụ 2.3 chưđng II về “hàm lượng thuốc sunfa trong
máu đo được của tám bệnh nhân uống vối liều 2g sau 1 giờ là 70,9 62,1
30,4 89,3 34,5 85,1 86,3 69,0 (ng/ml) .
3.3.1. Các bước tính toán cụ thể
Trong lĩnh vực sinh học nói chung, người ta thường sử dụng ba mức độ
tin cậy với p=0,05; p=0,01 và p=0,001.
a. Mức độ tin cậy p=0,05
Với mức độ tin cậy p=0,05 thì độ tin cậy là 1 - p = 0,95 và DF = 8 - 1 =
7 thì t|, ỏ mửc độ tin cậy p=0 ,0 õ này là to,05 = 2,4. Thay các giá trị trung
bình, sai số của số trung bình và t), sẽ xác định được khoảng tin cậy của số
trung bình:
K = 65,95 ■2,4 X8,2 5 Mẩ 65,95 + 2,4 X8,2
= 46,27 < ^ < 85,63 .
b. Mức độ tin cậy P^O.Ol
vỏi mức độ tin cậy p=0 ,0 1 thì độ tin cậy là 1 - p = 0,99 và DF = 8 - 1 =
7 thì tjt ở mức độ tin cậy p=0 ,0 1 này là to,oi = 3,5. Thay các giá trị trung
bình, sai sô' của số trung bình và t|, sẽ xác định được khoảng tin cậy của số
trung bình:
K = 65,95 • 3,5 X 8,2 < n < 65,95 + 3,5 X 8,2

= 37,25 < n < 94,65

51
c. Mức độ tin cậy p=0,00I
Với mức độ tin cậy p=0,001 thì độ tin cậy là 1 - p = 0,999 và DF = 8 - 1
= 7 thì 1 |J ớ mức độ tin cậy p=0 ,0 0 1 này là = 5,3. Thay các giá trị Iruiig
bình, sai số của số trung bình và t|, sẽ xác định được khoảng ùn l ậy cú;i sò
trung bình:
K = 65,95 - 5,3 X 8,2 < < 65,95 + Õ.3 X 8,2
= 22,49 <n< 109,41'
3.3.2. Kết luận
Như vậy, có thể tin đến 95, 99 và 99,9% rầng số trung bình về hàni
lượng thuốíc sunfa tồn dư trong máu sau một giờ uông vói liêu 2 g của tám
bệnh nhân nằm trong khoảng từ 46,27 đến 85,63; từ 37,20 dến 94,65 và từ
22,49 đến 109,41 }Jg/ml, tương ứng. Tâ”t nhiên, còn 5; 1 và 0 , 1 % khá năng sô
trung bình nằrn ngoài khoảng đó.

c . SAI SỐ CHUẨN

I. NHẮC LẠI MỘT SỐ KHÁI NIỆM THỐNG KÊ c ơ BẢN

Như chúng ta đâ biết, mỗi mẫu chỉ có-một sô* trung bình và chỉ 1 mà
thôi. Sô' trung bình của mỗi mẫu biểu thị mức độ tập trung ở trung tâm của
mẫu. Song, sô trung bình của niỗi mẫu có được tin cậy hay không phụ thuộc
vào mức độ biến dị của quần thê và dung lượng mẫu. Ngoài sô trung bình
(x), sai số chuẩn (SE) và mức độ tin cậy cũng là những tham số thông kê
rất quan trọng để đánh giá mức độ phân tán của mẫu và biểu thị sai số của
số trung bình. Vì vậy, chúng ta cần nhắc lại hai khái niệm dó.

1 . Sai số chuẩn
Sai sô chuẩn {Standard error • SE) là một thông sô* thông kê sinh học
rất quan trọng đế đánh giá mức độ phân tán của mẫu và chính nó biểu thị
sai sô"của số trung bình. Lưu ý, sai số ồ đây không phải là sai phạm hay sai
sót do người thiết lập hoặc thu thập số liệu mà sai sô”là do sự chênh lệch cđ
học có hệ thông của số liệu mà phương thức chọn mẫu là một trong những
nguyên nhân chính gây nên. Mục đích tính SE là để xác định mức độ phân
tán của giá trị trung bình mầu và giói hạn tin cậy của mẫu thí nghiệm.

52
M.n m ẫu th í n gh iệm với sự |)liãn h(Vclui;iii sẽ có một độ lệch c h u ẩ n
(staiuh id (ieviatioii) riên g của nó và dựớc gọi l;'i (lộ lệch ch u á n củ a các
ti unK l ìnli m ẫu (SD). Độ lệch chuân oúa iruníí l)iiih mẫu sẽ đưa ra tên gọi
riénịí (ùa nó là sai sỏ c h u ẩ n (SK) cua sô ti unR l)ình khi nó được biểu d iễn
(liíới t> lộ cù a ch íiih nó với cản l)ậc 2 cúii cỉung lượng mầu. Công thức c h u n g
dô tínl Sl<' là:

SE ~ ll lẫu
\ D u n g lượng niầu

Vn

2. Xác định khoảng tin cậy


Niu' c h ú n g ta đã biết ỏ các phần trôn dây, mục (lích tính SE là đ ể xác
dịiih n ứ c độ p h ân tá n củ a sò’ trung bìtih và khoang giỏi h ạ n tin cậy của
m au. Vậy, giới hạn k h o á n g tin cậy (lượo xác dịiih vỏi inục đích tìm giới h ạn
trôn V.I dưới cửa sô tru n g bình mẫu với các Iiiửc (!ộ tin cậy n h ấ t đ ịn h đưỢc
XíU' dị;ili. K lioáng tin cậy (K) dược xác địiih theo cùiig thức sau:

K = () ± (t SE)

II. MÕT SỐ TRƯỜNG H ộp ĐẶC BIỆT CẦN lưu ý

C ù i liíu ý ràng, giá trị sai sò chuấn cũng !ìhư k h oản g tin cậ y ph ụ
iliuộc vào bán ch ấ l, đơn vị tính của mỗi inột ihi nghiệm . Có n h iề u thí
n ịĩlú ộn có n h ữ n g loại dơn vị tíiih khác nhau íhi cách tính S E và k h o ả n g tin
cậy cCĩiịĩ khác n h au . C á c h tín h các loại S E dặc hiệt k h á c n h a u râ"t d ễ bị
n liầ n ilẩ n tron g quá trinh p h ân lích tính toán ihông kĩ' học.

S ú s ố c h u ẩ n được xác dịiih theo công ihức tiôn là điều h iển n h iên .
Song, tu ỳ th uộc vào tín h c h ấ t các kiôii sô liộụ cùa ihí n gh iệm khác n h a u thì
ciich tính sai s ố ch u ẩ n c ũ n g khác nhau. Thí dụ, Iiiột số thí n g h iệm sử d ụ n g
(l(in V tín h b ằ n g % hoặc m ộ t s ố sò' liộu bị trùng lặp ihì cách tính S E c ũ n g có
n h ữ n í điêni khác nhau. M ục đích tính sai sô chuấn vần là dê xác clỊnh giỏi
h ạn t n cậy của niẫu. S a u đây, ỉà cách tính sai sô ohuân và k h o án g cách của
chúní::

-đơn vị tính của sô liệu là "'o;

- m ột sô’ sô* liệu q u an sát cúa niaii bị trùnị>; lập;

53
- độ lệch của các số trung bình.

1 . Đơn vỊ tính của bộ số liệu là phần trảm

Công thức tinh SE và giới hạn tin cậy với mức độ tin cậy đã
1 .1 .
được xác định
Nếu thí nghiệm mà số liệu thu được biểu thị trên đđn vị tính là phần
trăm (%) thì sai số chuẩn sẽ đưỢc tính theo cồng thức sau:

. ( n -l)
trong đó:
- p là tỷ lệ (tính theo %) của nhân tô”thí nghiệm;
- n là dung lượng mẫu.
Nếu thí nghiệm mà số liệu thu được biểu thị trên đơn vị tính là phần
trăm thì giới hạn hay khoảng tin cậy (K) vâi mức độ tin cậy được xác định
theo công thức sau:
K = p + (t SE)
trong đó;
-p là tỷ lệ giữa yếu tố thí nghiệm vối yếu tố tổng thể;
-t là giá trị lý thuyết;
-SE là sai số chuẩn.
1.2. Thi du• minh hoa•
Thí dụ 2.4. Tính SE và gối hạn tin cậy của một thí nghiệm khảo sát
qui luật di truyền học vói kết quả thu được có tỷ lệ giữa màu lông loang
trăng đen 60 cá thể trong tổng số 80 cá thể của một quần thể chim cút.
Các bước tính toán cụ thề
Xác định tỷ lệ giữa một yếu tô' thí nghiệm vỏi tổng thể;
p — P ị/ P t á n g Ih ế

= 60/80
= 0,75
Tính SE theo công thức sau:

54
~ ----------- - ........ - --------------------- --------------- - ---------------- ------------------------------------

\' ( n- l )

^ ịo/7>(ì~OJ5)

\l (80-1)
= 0 ,049
T ín h giới hạn tin cậy vối mức dộ tin cậy 95"<> thu dưỢc kết quả như
sau:

K = 0,75 1 ( 1 , 9 6 x 0,049)

= 0,7Õ± 0,096

2. Trường hỢp một sô* sô liệu quan sát của mau bị trùng lặp
2.1. Công thức tính SE và giới hạn tin cậy với mức độ tin cậy
Nêu một sô sô" liệu quan sát bị trùng lặp trong một số mẫu thí nghiệm,
tức là số liệu đó được tính hai lần thì sai số chuẩn của bộ sô' liệu đó sẽ được
tính SE theo công thức sau:

c n - ÍN?N,(N,-r)

liong dó:
N| là dung lương mẫu lâV lần 1 ;
là dung lương mẫu lấy lần 2 ;
r là sô' liệu lấy lần thứ hai nhưng nó đã bị lập lại lần thứ nhất.
T ron g trường hỢp, bộ sô" liệu cỏ những sô liệu bị tr ù n g lặp thì phương
|)háp xác định khoảng tin cậy với nnlíf độ tin cệy dươc tính theo công thức;
K = p ± (t SE)
2 .2 . Thỉ du minh hoa
Thí dụ 2.5. Tính SE và khoảng tin cậy K của một thí nghiệm "xác
dịnh khôi lượng gà con niới nỏ của đàn gà Rốt-Ri nuôi tại T ru n g tâm
n gh iên cứu gia cầm T h u ỵ Phương" mà kết quả thu đưỢc n h ư sau: lần thư
nhiVt cán 2 0 0 con m ái, lầ n thứ hai cân 450 con trôVig n h ư n g trong sô’ 450
con trông cân lần thứ h ai thì phát hiện ra có 15 con mái bị tr ù n g lặp đã cân
l;'in thứ nhât.

55
Cách giải bài toán
Như vậy, mỗi một cá thể bị trùng lặp sẽ biểu thị inột khả năng là
450/15 = 30 cá thề trong quần thế dó. N h ư chúng ta đã biêt vỏi 2 0 0 cá thê
lấy lần thứ nhất và đã đưỢc đánh dấu và mỗi một cá thê bị đánh dấu đại
diện cho 30 cá thể trong quần thể đó nên số cá thế của quần thể d ó là 30 X
2 0 0 = 6000 cá thể. Môi tương quan này được xác định dầu tiên bơi Lincoln
nên người ta gọi chỉ sô”đó là “chỉ sô" Lincoln”.
Chỉ số Lincoln (LI) được xác định theo công thức sau:
LI N, xN^
r
trong đó:
Nj và N-2 là số mẫu quan sát của các quần thể tướng ứng:
r là số cá thể bị trùng lặp.
Cách tính SE và khoảng tin cậy (K) nghiễm nhiên phải thay đổi do có
những cá thể bị trùng lặp ỏ lần lây thứ nhất bị lấy lại cho lần mẫu thứ hai
nên đă gây nên sai số mẫu. Trong trường hợp này, công thức tính SE sẽ
thay đổi và được tính như sau:

NfN.2 (N 2 - n ijịỊặ |, )
SE =
i lạp)

200‘^450(450 -15)
i (15V^
= 1523

Khoảng tin cậy K cũng phải được thay đổi cách tính. Ví dụ, với mức độ
tin cậy 95%, tại thí nghiệm này do có sự trùng lặp khi lần lấy mẫu thứ hai,
trong số 450 con có 15 con bị trùng đã cân lần thứ nhâ't nên khoáng tin cậy
sẽ được tính như sau:
K = 6000 ± (1,96 X 1523)
= 6000 ± 2985
= 3015 >K > 8987
Như vậy, vỏi 95% mức độ tin cậy, số gà con sẽ có 8985 con là giỏi hạn
cực đại và 3015 ỉà giói hạn cực tiểu.

56
3. l)ộ lệch của các số trung bình
Đối với n h ữ n g thí n gh iệm nià muốn so sánh các s ố tru n g bình b ằn g sự
ch ên h lệch giữa c h ú n g thì giá Irị SK và khoiiiig Ún cậ y (K) củ n g th a y đôi.
Giá trị S E của độ lệch đó đưỢc linh (lự;) tlKH) Ãố ludng m ẫu khác n h au như
sau:

3.1. Trường hỢp mẫu lớn

SE,...,. +
\ (ti I + n. , )
K hoáng lin cậy (K) của (lộ lệch trung bìnli của quần thể thực vối sô’
lượng m ẫu lớn được tính theo công ihức sau:

K — (X| - x^) t timi, IIII ,.n

3.2. Trường hợp niảu nhỏ

op _ Í ^ I -D S ị-'+ (n ./-D S v (n , H-n.,)


^--- -............... .... ---------------
\ (11 ] + 1 1 2 - 2 ) (n,n 2 )
Khoáng tin cậy của độ lệch ti ung bình cúa quần thê thực với sô’ lượng
mầu nhó dược tính theo công thức sau:
K = (Xi - Xj) 1 1„„„. , n SE|,.,||
Tóm lại, trong các th í nghiệm nghiên cửu vô lĩnh vực sin h học, nếu
chọn mẫu đúng theo phương pháp ngau nhiôn, dung Iượng mẫu phù hỢp,
q u ầ n thô đó tu â n theo p h ân bô chuán và kliỏng có mửc dộ biến dị lớn thì
giá trị tính được của các th ông số thông kê nhu X và SD của m ẫu sẽ gần
đ ú n g với giá trị của các th a m sô'n và n cùa quần thổ.

Đ ến đây, mức độ tin cậy của sỏ trung bình m ẫu và k h oán g tin cậy
của c h ú n g đã đưỢc xác định. Như vạy, các tliôiig sỏ thống kê tru n g binh
m ẫ u đã có đủ điều kiện để thực hiện phép kiếm tra thông kẽ sin h học n h ằm
x á c định ch ín h xác sự sai khác giữa các s ố Irung binh m ẫu của các n h ân tố
thí nghiệm hay giữa các nhóm mẫu cúa cùng nliân tô thí nghiệm cùng như
k h o ả n g Un cậy tương ứ n g với các mức (lộ khác nliau.

57
CHƯCMGIII

Sự SAI KHÁC GIỮA CÁC sô' TRUNG BÌNH MẪU

Trong các thí nghiệm sinh học nói chung, khi có từ hai nhân tỏ thí
nghiệm trỏ lên hay thậm chí hai nhóm mẫu thí nghiệm cùng nhân tố trớ
lên, sau khi đã xác định được giá trị trung bình và kiểm tra được độ tin cậy
của chúng cần thiết phải khẳng định sự sai khác của tất cả các nhâii tô
thông qua các phưđng pháp kiểm tra thông kê sinh học. Mục dích của
phương pháp kiểm tra thôVig kê sinh học nhằm khẳng định giữa cáv sô
trung bình mẫu đó hoặc giữa bất kì hai haỵ nhiều cặp số trung bình trong
tất cả các số trung bình đó có sự sai khác nhau hay không và nếu có sự sai
khác thì về mặt thống kê ở mức độ nào? Hay nói một cách khác, sự sai khác
giữa các số trung bình mẫu có ý nghĩa thống kê hay không và nếu có ý
nghĩa thì ỏ mức độ bao nhiêu?
Trong thực tiễn, sau khi tính toán được các giá trị trung bình của các
nhân tô"thí nghiệm hay các nhóm mẫu mà có biêu hiện sự chênh lệch nhau
về số trị thì rất dễ làm cho chúng ta bị nhầm tương rằng giữa chúng có sự
khác nhau. Tuy sô”trị của các giá trị trung bình mẫu giữa chúng có khác
nhau, song sự sai khác đó vể mặt thôVig kê sinh học có ý nghĩa hay không
thì cần phải dùng các phép kiểm tra thông kê sinh học mới có thể trả lòi
được chính xác.
Như vậy, sau khi xác định được mức độ tin cậy của sô trung bìiih mẫu,
cần thiết phải kiểm tra sự sai khác giữa các số hoặc giữa các cặp sô trung
bình mẫu. Trong lĩnh vực sinh học nói chung, có râ*t nhiều phương pháp đề
kiểm tra so sánh sự sai khác giữa các trung bình mẫu, song không phải
dùng bất kì một phưđng pháp kiểm tra nào cho bất kì một mô hình thí
nghiệm nào cùng được mà trước hết phải biết rõ câu trúc của mỗi Iihân tô'
trong từng thí nghiệm để từ đó nên sử dụng phưđng pháp kiềm tra nào ià
thích hỢp nhằm mang lại kết quả chính xác nhất. Việc nghiên cứu trong
lĩnh vực sinh học, đưa kết quả nghiên cứu sinh học nói chung và nông
nghiệp nói riêng vào sản xuất, các phương pháp kiểm tra thống kê sinh học
cơ bản và thông dụng đề so sánh các giá trị trung bình của các mẫu hoặc

58
cát n h â n tô" thí n g h iệm là việc hì‘t sức íỊuan tì ọng. Các phương pháp kiêm
tra th ô n g kê sin h học cơ bản và thôiìg dụ u ịf Ị)iiục vụ trong n g h iên cứu và
Síìn xuât đà được sử dụng là:
1 . Phương ph áp kiểm tra bằng g i á t r ị t.

2. Phưdng ph áp kiểm tra bàng so sáììh hội S(V.

3. P hư ơng ph áp kiểm tra bằiìg so sánh tiùỉng phán.

4 . Phưcỉng pháp kiểm tra bằng so sánh lường phản trực giao.

A. PHƯƠNG PHÁP KIỂM TRA bẰNG giá trị T

Phương pháp kiếm tra bằng giá Irị t (sludeiit test method) hay còn gọi
phop kiểm tra t là một trong những phiíơng pháp kiểm tra thông kê sinh
học cơ bản nhất và ứng dụng rộng rãi nhât trong lĩnh vực thông kê sinh học
nói chung để so sánh sự sai khác giữa các sô trung bình của các mẫu hay
giữa các nhân tô thí nghiệm. Phương pháp kiếm Ira t tuy rất thuận tiện và
đơi> giản niiưng vẫn đạt độ chíiih xác oao. Đồng thời, nó vừa dễ dùng cho
các nhà nghiên cứu, vừa dễ hiếu clio ngưòi dọc và vừa được sử dụng vào
nhiêu loại mô hình thí nghiệm khác nhau. Vì vậy, phưđng pháp kiểm tra t
đưỢc trình bày rất cụ thể vừa lý luận thực tiễn vừa miêu tả từng bưốc tính
toán cụ thể cho từng loại hình ihí nghiệm khác nhau. Song, trước khi đi
sâu vào các phương pháp kiểm Ua t, cần ivlìắc lại mấy vân đề cd bản sau
đây nhằiiì giúp cho việc tìm hiểu và áp dụng chúng một cách dễ dàng.

1 . Sự phân bô* t
Đê sử dụng hiệu quả phương pháp kiếm tra t, trưóc hết cần nắm vững
giá trị t được phân bô”như thế nào và cách sử (lụng giá trị t ỏ bảng t ra sao?
Phương pháp kiểm tra t nói chung là để so sánh giá trị t tính được của thí
nghiệm (tị-N) vỏi giá trị t tương ứng ở biíng Ị)hân bô' t (ti„i„g) hay còn gọi t lý
thuyết (tn-). Vì vậy, trưỏc khi đi vào phan tìm hiểu phương pháp kiểm tra t,
tác già xin được nhắc lại cách tra cứu và sử dụng giá trị t tại bảng phân bố
t. 1 'rvíốc hết, xem lại câú tạo bảng phân bố t.
1 .1 . Cấu tạo của bảng phán bốt
Câu tạo của bảng phân bô t (phần phụ lục) dưỢc trích dẫn và trình bày

59
một cách n g á n gọn bao gồm các p h ần cơ ban sau (b an g 3.1).

Bảng 3. t. Cấu tạo cùa bảng phân bô t

10 5 2.5 0.5 0,25 0,05


20 10 5 1 0.5 0.1
Phần tràm 90 95 97.5 99,5 9975 99.95
DF 1 3,08 6,31 12,71 63,66 127,32 636.61

13 1,35 1.77 2.16 3.01 3.37 4,22

ghi chú:
- G iá trị p là k h ả năng chấp thuận g lả t h u y ế t c ủ a p h ư ơ n g pháp k iể m t r a h a y c ò n g ọ i là x á c

suất hoãc độ tin cậy của phương pháp kiểm tra. Nói cách khác cụ thể hơn, giả trị p ỉà diện tích tạo
bỏi giữa phần hình cong với trục hoành nằm ngoài giá trị t vừa xác định. Trong sinh học nói chung,
giá trị này thường được sử đụng ở ba mức: p=0,1%; p= 1 % và p=5%. Tất nhiên, giá trị này phụ
thuộc vào mức độ chinh xác đòi hỏi của từhg loại nhân tổ và của từng thí nghiệm.
- Phần trâm biểu thị tỷ ỉệ tính bằng % được chấp thuận giả thuyết, cụ thể hơn là. giá trị hàng
phần trăm của bảng phân bố t nói lên khả năng đúng của sự việc hay giả thuyết trèn là 99.9%;
99% và 95% của điện tích hinh tạo bỏi giữa đưởng cong chuẩn và trục hoành ià đúng. Giá trị % tại
bảng thưởng biểu thị theo cách tính sử dụng cả hai đuôi của đường cong chuẩn. Thông thường,
các thí nghiệm trong lĩnh vực sinh học được chấp nhận với mức từ 95% trỏ lên. Cũng như giá trị p,
giá trị % nảy phụ thuộc vào mức độ chính xác đòi hỏi của từng loại nhân tố và của từng kiểu hình
thí nghiệm khác nhau.
- DF là độ tự do. Độ tự do là biểu hiện mức độ sô mẫu hay sỏ nhân tỏ không phụ thuộc trong
một thí nghiệm. Độ tự do được xác định bằng một đơn vị nhỏ hơn so với tổng số mầu hay số nhân
tổ thí nghiệm.

1 .2 . Cách sử dụng bảng phân b ố t


Đế giúp cho việc thực h iện p h ươn g pháp kiểm tra t n h a n h ch ón g và
ch ín h xác\ trưỏc h ết cần phải n h ắc lại cách sử dụ ìig b á n g t. Thực chât
phương pháp kiêm tra t là dè so s ả n h giá trị t tín h dược cúa thí nghiộin
giữa các n h ó m m ẫu h ay n h â n tô" th í n g h iệm và giá trị t tương ứng tra cửu ở
b ả n g p h ân bô' t vói s ố độ tự do và m ức độ tin cậy đã dược xác định. Vì vậy,
p h ầ n n ày sẽ giởi th iệu lại cách sử d ụ n g tra cứu xác định giá trị t tại b ản g t
m ột cách cụ thể.

Giả sử, tại m ột th í n g h iệm , sa u khi đã tính được giá trị t của các n hân
tố thí nghiệm với DF = 13 có ý nghĩa hay không và nếu có, ý nghĩa dó (il niức
độ nào thì phải tra cứu tìm giá trị t tạ i b ả n g t. Cách tra cứu tìm giá trị l là
giá trị tìm thấy tại điểm góc vuông cỏ hàng biểu thị DF = 13 và cột biêu iliị
niức độ ý nghĩa p nào đó. Sau khi tra cứu xác định được giá trị t, so sánh sự

60
sai khác giữa giá u ị t thí ngliiÍMii (tix) và ^ĩia trị t Ira cứu dưỢc ở bảng t
(t|... „). Các bước tra cứu b ảng t dưự(' làm thử tự như sau:
1. T h ứ n h â t xác định giá trị lại góc vuông tạo bới giữa h à n g có D F =
13 %’à cột biểu thị mức độ sai khác (F) Ciìn tliiòt dã khang dịnh. Giả sử !â'y
giá trị p = 2 0 %, thì giá trị là l,.1 õ, Xlìung cầii lúu ý rằiig giá tiị t này có
hai khá Iiăng xảy ra:
a. Nếu khi so sánh mà không doán ilược sò trung bình nào lớn hđn so
vỏi số còn lại thì áp dụng với cá liai duỏi của hinlicong phânbô’ chuẩn và
t io iig trư ờng hỢp đó thì p niỗi bên chi có giá trịbang một nửa giá trị đó, tức
là = 10%. Trong trường hỢị) dó, cỏ hai giá trị l nằm về hai phía (thường
gọi là hai đuôi) của dường coiig chuãn dó là: -1,35 (bên trái) và +1,35 (bên
phiii).
b. Nêu khi so sánh mà có ihê cloán được sò trung bình này lớn hơn so
với sô' trung bình kia thì áp dụng với một cluôi của hình cong theo sự phâỉi
bố chuân thì p có giá trị đúng bằng chính nó, có nghĩa là p = 2 0 %. Trong
trường hựp đó, chỉ có một giá ti ị l nằm về một phía (một đuôi) của đưòng
cong chuân đó là:
■n ếu là phía ph ái thì giá Irị cló là +1,30;

■nêu là phía trái thì nó là -1,3Õ.


2. Thứ hai từ giá trị t vừa tra cửu dưỢc ỏ báng t, có thế kết luận rằng
khã nãng t > 1,35 hoặc < -1,35 là 2 ()"o hay p = 20"».
Lưu ý, khi dã doán biết clược hướng cúa hai số trung bình tức là sô'
ỉìày lớn hơn sô' kia hay ngược lại thì chỉ áp dụng theo sự phân 00' t theo một
duòi (hay còn gọi là một chiều). Đôì với [)hé|) kiếm tra khi bình phương
(•/-), Ị)hifdng pháp so sánh sự phù hỢp giữa giá trị lý thuyết và thực tiễn và
phương pháp kiểin tra F, phuđiig ị)háp sơ sánh tỷ lệ giữa các trung bình
b'mh phương giữa các nhân tô vầ trung bìiih bìlìlì |)hương trong các nhán tô
hoặc sai s ố thì lu ôn luôn áp dụng theo Ị)hân b(Y một chiều.

1.3. Kết luận sau khi tra cứu t tại bảng


Sau khi tra cứu xác định duợc giá ti ị t tại báng t, phép so sánh để kết
luẠn sự sai k h ác giữa các n h ân tố h:iy m ầu thí nghiệm sẽ tiến h à n h so sá n h
giữa giá trị t tính được của thí nghicMii với giá tfị t tra cứu ở bảng với cùng
sô* dộ tự do và mức độ tin cậy, rút ra kêt luận:
1. Thứ nhâ*t nếu giá trị t tính dược của thí nghiệm lớn hơn giá trị t tra
cứu ổ bảng vổi cùng DF và mức dộ tin cậy thì kết luận sự sai khác giữa các

61
mẫu hay nhân tô’ thí nghiệm có ý nghĩa, cụ thê:
a. Nếu giá trị t tính được của thí nghiệm lớn hơn giá trị t ớ bảng; với
cùng DF ở mức độ p bằng bao nhiêu, thí dụ p = 1 0 %hoặc 5%, thì rút ra kết
luận ràng sự sai khác giữa các mẫu hay nhân tô* đó vối sự so sánh cá hai
đuôi của đưòng cong là có ý nghĩa ở mức đệ chính xác 95% hoặc 97,õ‘-’ó và
được kí hiệu p<0,05 hoặc p<0,025.
b. Nếu giá trị t tính được của thí nghiệm lớn hđn giá trị t ớ b ả n g vói
cùng DF ở mức độ p bằng bao nhiêu, thí dụ p = 5%, thì rút ra kết luận l ằng
sự sai khác giữa các mẫu hay nhân tô" đó với sự so sánh chỉ niột phía của
đưòng cong là có ý nghĩa ở mức độ chính xác 95% và được kí hiệu p<0,05
(tuỳ theo bên trái hay bên phải để đưa dấu (■) hoặc (+) vào cho thích hỢp.
2. Thứ hai nếu giá trị t tính được của thí nghiệm nhỏ htín giá trị t ỏ
bảng với cùng DF thì kết luận sự sai khác giữa các mẫu hay nhân tố đó là
không có ý nghĩa, cụ thể:
a. Nếu giá trị t tính được của thí nghiệm nhỏ hơn giá trị t ơ bảng vối
cùng DF ở mức độ p bằng bao nhiêu, thí dụ p = 1 0 %, thì rút ra kết luận
rằng sự sai khác giữa các mẫu hay nhân tô đó với sự so sánh cả hai phía
của đưòng cong là không có ý nghĩa ỏ mức độ chính xác 95% và đưỢc kí hiệu
P>0,Ủ5.
b. Nếu giá trị t tính được của thí nghiệm nhỏ hơn giá trị t ỏ bảng vỏi
cùng DF ở mức độ p bằng bao nhiêu, thí dụ p = 5%, thì rút ra kết luận rằng
sự sai khác giữa các mẫu hay nhân tô"đó với sự so sánh một phía của đường
cong là không có ý nghĩa vôi mức độ chính xác 95% và đưỢc kí hiệu p>0,05.

2. Giả thuyết không


Bất cứ phương pháp kiểm tra thống kê sinh hoc nào cũng phải có giả
thuyết không. Nội dung của giả thuyết không là giả sử giữa các số trung
bình mẫu cần so sánh không có sự khác nhau rõ rệt. Vì vậy, giả thuyết đó
người ta gọi là giả thuyết không tức là “không có sự sai khác” giữa các sô'
trung bình mẫu cần so sánh và được kí hiệu là Ho- Để kiểm tra giả thuyết
không đó có được chấp nhận hay không, ngưòi ta dùng một phép kiểm tra
thống kê để kiểm tra giả thuyết không đó là giả thuyết kháng không và
nó được kí hiệu H|
• « I.

Thí dụ, tại một thí nghiệm có hai nhóm mẫu, sau khi đã xác định dược
giá trị trung bình mẫu của thí nghiệm, cần phải so sánh sự sai khác giữa

62
ch u n g V(3i n h a u thì giả th u y ết khônK (H,i) và giả th u yét k h á n g k h ôn g (H,)
là:

a. Giá thuyêt không (H„) là U| - i:,;


b. liá th u y ế t k h á n g khôiig (H,) có thể là:

y, í Pv d ù n g tron g trường hợ|) klii sử dụng cá hai đuôi của sự p h ân bô'


đưỡn^ cong ch u ấn ;

U| < dùng trong trưòng hỢp chi sử dụng một đuôi trái của sự phân
bô đườrg cong ch u ẩn ;

U| ^ u- d ù n g trong trường hợp chì sử dụng một đuôi phải của sự ph ân


bỏ'dưòi g cong ch u ẩ n .

Cầa lưu ý rằng, giá trị t tại bảng ơ bất kì cuốn sách nào củ n g là giá trị
tương úng củ a độ tin cậy p dược sử d ụ n g'th eo hai đuôi của sự p h ân bô"
đưdng cong ch u â n . Vì vậy, trong trường hợp nêu chỉ sử d ụ n g một đuôi phải
hoạc lr.ú của sự p h â n bô”đưòng cong chuẩn thì giá trị p chỉ b ằ n g 1/2 giá trị
p của b ín g. T h í dụ, t-, = 2,5% thì có thê hiểu ràng:

• M3U d ù n g cả hai đuôi của đưòiig cong chuẩn thì p - 2,5% + 2,5% = 5%
= 0,0õ;
- n ìu chỉ d ù n g m ột đuôi của đưòng cong chuẩn thì p = 2,5% = 0 ,025.

Phương pháp kiếm tra t là niột trong những phương pháp kiểm tra
thống hê sinh học cơ bản nhất và đưỢc sử dụng nhiều nhát khi so sánh các
sô’ trunỉ bình mầu giữa các nhâii tô' thí nghiệm với nhau. Có nhiều phương
pháp k êm tra t khác nhau nhưng quan trọng và ứng dụng nhiều nhất là;
- phương pháp kiểm tra t gộp;
- phương-p h áp kiểm tra t giả;
- phương pháp kiểm tra t cặỊ).

I. PHtơNG PHÁP KIỂM TRA T GỘP

1. Đặc điểm chung


Ptương pháp kiểm tra t gộp là một trong những phương pháp
kiom t:a t được sử dụng một cách thông dụng nhất khi tất cả các số trung
bình mẫu hay nhân tô"thí nghiệm được gộp lại với nhau.
Háu hết các thí nghiệm trong lĩnh vực sinh học, điều kiện các mẫu độc
lập và không có môi liên quan ràng buộc với nhau theo từng nhóm thì

63
p hư ong pháp kiểm tra t tôt n h ấ t là phương pháp kiểm tra t gộp. N'hưng,
n h ư c h ú n g ta đã biết phương pháp kiêiiỉ tra t gộp cù n g chỉ được d ù n g khi
bộ sô”liệu đó dưỢc thu từ một quần thề mà quần thế đó phải được tuá.n theo
s ự p h â n bô c h u ấ n và cá c p h ư ơ ìig s a i c ủ a c h ú n g p h ả i b ằ n g n h a u h o ặ c g ầ n
bằng nhau. Nếu bộ sô’ liệu thu đưỢc của thí n gh iộm k h ô n g có (lủ cátC (liều
k iện đó thì kh ôn g n ên sử d ụ n g phương pháp kiêm tra t gộp. N ói dúiìịg hớii,
trưốc khi sử d ụ n g phưđng pháp kiểm tra t gộp này bộ s ố liệu dó c ầ n |)hải
dược thực h iện phép ch u y ển d ạ n g sô' liệu đề bộ s ố liệu mới có đủ cáíC d iều
kiện đê phân tích như đã trình bày ò chương I.

2. Nhửng thi dụ minh họa


Thí dụ 3.1. Tại một thí nghiệm nghiên cứu vê khá Iiảiig lăng trọng
củ a đàn bò th ịt b ằ n g phương pháp vỗ béo của Viện ch ăn íìuỏi quốc ịgia sử
d ụ n g hai loại thức ăn: thức ãn giàu protein (1) và thức ăn tận d ụ n g tron g
nông n gh iệp (2). Kết quả vê tốc độ t ă n g trọng (kg/tháng) củ a h ai d à n bò th í
nghiệm được trình bày ở bảng 3.2. Hãy xác định giữa hai loại thức àn đó có
gây ản h hưởng khác n h a u lên tốc độ tă n g trọng của đàn bò không?

B ả n g 3.2. Tăng trọng cùa đàn bò (kg/tháng) vòi hai loại thức ăn

TA, 19.1 24,0 28,6 29,7 30,0 34,8


TA, 12,0 13,0 13,6 20,5 22,7 23,7 24.8

ghi chủ;
- TA, và TAj là hai loại thức ăn;
-19.1; 2 4 , 0 ; 2 4 . 8 là tăng trọng (kg/th) của các bò ăn hai loại thức ăn tương ứng.

Kêt quả các thông số thôVig kê cớ bản vể tàng trọng tính dược >từ thí
nghiệm trên của mỗi loại thức ăn là:
Thức ăn 1 (TA|): Ĩ1 | = 6 ,
X, = 27,70,
s, =5,4433.
Thức ăn 2 (TA^): n, = 7,
X . , - 1 8 ,6 1 ,

82 = 5,5498.
Do y êu cầu của th í n g h iệm n ày là so sá n h mức độ ả n h h ư ỏ n g củia hai
loại thức ăn trên đến tăng trọng đàn bò, vi vậy sau khi đã xác định đựtỢc các
giá trị trung bình và độ lệch chuan của từng loại thức ăn khác nhau, cần

64
gộ|) hai giá trị đó để so sánh. Gộp hai giá trị phương sai S|- và s./ để tính
giá trị phương sai chung (S- gộp và kí hiệu s \ ) theo công thức sau:
g 2 _ DF,xSf +DF2 xS^
” DFi + DF2
= (6 - l ) x 5,4433''^ + (7- l ) x 5,5498^
re- 1 ) +(7-1)
= 30,27
DFg = (6 -l) + (7-l)
= 11
Xị -X 2
Jsỉọ „(l/n i+ l/H ,)
^ 27.70 -18,61
^30,27(1/6 +1/7)
= 2,97
Và giá trị t,j ở bảng t thu được là: 2,72 thì có ba khả năng xảy ra:
1. Thứ nhất. Giả thuyết không (Ho): Pi = ụ>
Giả thuyết kháng không (H,): Pi ^ P2
Phương pháp kiểm tra này sử dụng cả hai phía của phân bố đưòng
cong chuẩn vì chưa xác định rõ mẫu nào lớn hơn. Như vậy, giá trị tgẠp tính
được (2,97) > giá trị tbáng (2,72) ở mức p < 0,02 nên có thể rút ra kết luận giả
thuyết không vừa nêu trên "hai loại thức ăn trên không gây nên sự sai
khác rõ rệt về tốc độ tăng trọng của đàn bò” là hoàn toàn không có lý. Hay
nói cách khác, hai loại thức ản trên đã gây nên sự sai khác rõ rệt về tốc độ
tàng trọng của hai đàn bò thí nghiệm với độ-tin cầy là 98%.
2. Thứ hai. Giả thuyết không (Ho): Pi = Mii
Giả thuyết kháng không (H,): Pi > ụ-2
Chú ý, phép kiểm tra này chỉ sử dụng một đuôi của sự phân bô"đưòng
cong chuẩn vì ý đồ ngưòi ta muôn khẳng định giá trị trung bình mẫu 1 lốn
hơn mẫu 2 . Khả năng xảy ra: t|ị > tpN(2,97) là p < 0 ,0 2 . Như vậy, giá trị txN
tính đưỢc lốn hơn giá trị nên có thể rút ra kết luận giả thuyết hai loại
thức ăn trên không gây lên sự sai khác về tốc độ tăng trọng là hoàn toàn
không có lý. Hay nói cách khác, hai loại thức ãn trên đã gây lên sự sai khác
rõ rệt vê tốc độ tăng trọng của hai đàn bò thí nghiệm với độ tin cậy là 98%.

65
3. Thứ ba. Giả thuyết H„: Pi = ụ. 1

Giả thuyết kháng không (Hi): Pi < P2


Rõ ràng, phưđng pháp kiếm tra t này chỉ sử dụng một duôi của ổự
phân bô* đưòng cong chuẩn vì ý đồ ngưòi ta muốn khẳng dịnh giá ti ị trung
bình mẫu 1 nhỏ hdn inẫu 2 . Khả năng xảy ra: t|, < 2,97 là p > 0,98. Như
vậy, giá trị tpN tính được nhỏ hơn giá trị nên có thê kết luận: giá tliuyêt
không là hai loại thức ăn trên không gây lên sự sai khác dến tóc độ tàng
trọng là hoàn toàn có lý. Hay nói cách khác, hai loại thức ãn trôn dã khùng
gây nên sự sai khác về tốíc độ tăng trọng của hai đàn bò thí nghiộni (U|<p,).
Thí dụ 3.2. Nhiễm thuỷ ngân là một trong những vâ'n dề rất nguy
hiểm đến sức khoẻ cho mọi vật nuôi và con người. Đề so sánh sự nhiễm
thuỷ ngân của ngưòi có thế bằng nhiều con đường như từ míớc uông có
chứa thuỷ ngân hoặc thức ăn như cá mà cá đã bị nhiễm thuỷngân. Sò liệu
sau đây miêu tả sự nhiễm thuỷ ngân methyl của một nhóm 6 nịỊưừi pliụ nữ
và 9 ngưòi đàn ông thu được bằng phương pháp bắn các hạt phán xạ dánh
dấu vào người đề xác định niức độ nhiễm thuỷ ngân. Hây kiểm tra sự sai
khác về mức nhiễm thuỷ ngân ỏ hai giới tính đó?:
Nhóm phụ nữ: 52 69 73 88 87 56
Nhóm đàn ông: 72 88 87 74 78 70 78 93 74
Từ bộ sô" liệu trên, giá trị trung bình và sai số chuẩn của mỗi nhóm
ngưòi đã được tính toán và kết quả đó được trình bày ở bảng 3.3.
B á n g 3 .3. Trung bình và độ lệch chuẩn vể sự nhiễm thuỷ ngân
Nhòm thi nghiệm_________ n_______ X_________ SD

Nhóm phụ nữ 6 70,83 15,09


Nhóm đàn 6ng 9 79.33 8,08

ghi chủ:
n là SỐ người của mỗi nhỏm;
X ià trung binh mỗi nhóm;
SD là độ lệch chuẩn mỗi nhóm.

Kết quả phân tích về sự nhiễm thuỷ ngân ở hai giỏi tính khác nhau là
một thí dụ nên sử dụng phương pháp kiểm tra t gộp.
Từ kết quả thống kê cđ bản trên, phương sai gộp (Sg^) có thể được tính
theo công thức sau:

66
^ DF, xS'f + DF. xS 5
“ D F, + D F.^ "
= 5(^5.09)^ +8(8.08)^
5 +8 .....
= 127J3
Độ lự do (DF) ớ đây là độ tự do gộp, tức là dộ tự do của mẫu thứ nhất
cộng vỏi clộ tự do của mẫu thứ hai. DF gộp ở phương pháp kiểm tra này là 5
+ 13.
Giá trị t thực nghiệm (t|M) được tính theo công thức;

*-TN = - 7 =^— = =
^S“(l/n, +l / t i 2 )
= 7 0 -8 3 -'7 9 ,3 3
127,73(1/6 + 1/9)
= -1,43
Với độ tựdo DF gộp là õ + 8 =13. Tại đây, có thế xét hai trường hdp so
sánh sự khác nhau và khoảng tin cậy của chúng như sau;
G iả th u y ế t không ơ đây là H(,: P) = ụ.;
Giả th u y ết kháng không (H,): Pi U;,
Giá trị của p là:
P = 2 x P r ( t > 1,43)
Từ bảng phân bố t, giá trị 1,43 nằm giữa hai giá trị 1,35 ứng với 2 0 %
và 1,77 ứng vói 1 0 %. Từ đó có thể rút ra kết luận niức độ nhiễm thuỷ ngân
methyl ở trong hai nhóm người giới tính khác nhau là hoàn toàn giống
nhau vì t (1,43) < t ,3 bảng (1,77) và p = 0,10 cho nên cần phải chấp nhận
giả thuyết không trên, có nghĩa lồ sự sai khác giữa hai số trung bình mẫu
trên là không rõ rệt.
Tính khoảng tin cậy (K)
Sự khác nhau giữa hai giá trị trung bình của quần thể, Pj = P2 được
xác định bởi sự khác nhau giữa hai giá trị trung bình mẫu. Giá trị đó tương
ứ n g 7 0 ,8 3 - 7 9 ,3 3 = -8,5 vói inức độ tin cậy p=95% đôl vói sự sai khác giữa
ỊJ| và được xác định bởi công thức sau;

K= X ,- Xj±l(p=.y,, ^Sp(l/n, + l / n 2

ớ đây, giá trị đối với độ tự do bằng 13 ta có thể xác định được
khoảng tin cậy đôi với H| • P;; ỏ mức p=95% là;

67
K = -8,5 ±2,16x5,96
= -8,5+12,87
= -21,37 đến 4,37
Đôi vói mức độ p=99% thì khoảng tin cậy đối với ụ Ị - ụ -2 sẽ là:
K = -8,5 ±3,01 x-5,96
= -8,5 ± 17,93
= -26,43 đến 9,43
Thí dụ 3.3. Sô' liệu thu được ỏ một thí nghiệm vỗ béo của TS. Nguyễn
Văn Đức về tỷ lệ nạc thông qua độ dày mở lưng đo tại điểm Pv (gốc xương
sườn cuối thứ hai cách sống lưng 6 cm) tại Xí nghiệp chăn nuôi và thức ăn
gia súc An Khánh trên hai giông lợn Landrace và Đại Bạch. Kết quả thí
nghiệm được tính toán và trình bày cụ thể như sau:
Giống lợn Đại Bạch (ĐB) có tii= 6 , X 1 = 2,43 và độ lệch chuẩn của số
trung bình (SEM) = 0,09.
Giống lờn Landrace (LR) có n2 = 6 , X2 = 1,99 và độ lệch chuẩn của sô'
trung bình (SEM) = 0,13. Hãy so sánh độ dày mõ lưng của hai giông lỢn
trên. SEM cổ thể được tính theo công thức:

SEM=ạ
vn
Từ đó, có thể tính Sj theo công thức sau:
Sj = Ựn7 X SEM

=s X. 0,09
= 0,2205
Tưđng tự, Sa = ^/rĩ7 X 0,13
= 0,3184
Từ đó, có thể gộp các phương sai để tính s /
e 2 _ 5(0,2205)^ + 5(0,3184)^
* 5 +5
= 0,075
2.43 -1,99
V,075(l/6 + l / 6 )
= 2,7828

68
Như vậy, với DF = 1 0 , giá trị (2,78)1 > t|„ bảng (2,76) là p<0,02. Từ
đó, rút ra kết luận hai giông lợn LR và ĐB có độ dày mỡ lưng khác nhau rõ
rệt (P < 0,02). Trong trường hợp dung lượng: mẫu quan sát ở hai nhóm mẫu
bầng r.hau, phưdng sai gộp s -'có thế được tĩnh như sau;
2

* 2

Cìng thức tính phưdng sai gộp Sg- được áp dụng vào thí dụ trên.
_ (S]" + S 2 )

= 0,075
Gíá trị này hoàn toàn giống hệt giá trị tìm được theo cách tính dung
lượng Iiẫu không bằng nhau đ trên.
Thí dụ 3.4. Tổng sô”20 người được đưa vào thí nghiệm nghiên cứu về
mức đ) ảnh hưởng của hai loại thức ăn (TA)' gây ảnh hưởng đến hàm lượng
choles:erol trong máu. Hai mưđi người đó được chia làm hai nhóm hoàn
toàn r.gẫu nhiên, mỗi nhóm mưòi ngưòi. Hai nguồn thức ăn đó là ngô và
đậu xanh. Thí nghiệm được kéo dài trong ba tuần. Sau ba tuần ngưòi ta
thu đưdc kết quả của hai nhóm đó và trình bày tại bảng 3.4. Lưu ý, trong
loại thí nghiệm này, số liệu bắt buộc phải hoàn toàn độc lập vối nhau.
B ổng 3.4. Hàm luạng cholesterol trong màu ở hai nhóm
Nguổn TA Ngô Đậu xanh

Ngưòi 1 4.57 Nguớl 1 5.66


TNsố 2 3,54 TNsố 2 5.22
3 473 3 4.24
4 3.33 4 4.57
5 398 5 4,24
6 2,82 6 3.67
7 4.81 7 5.92
8 4,42 8 3,77
9 3.20 9 2,89
10 3 18 10 3,82

X 3,86 4.40
SD 0734 0.954
SEM 0,232 0.302

c loại thí nghiệm này, tất cả các mẫu thí nghiệm đều độc lập vôi nhau
và sô" iệu thu được ỏ các mẫu hoàn toàn ngẫu nhiên. Trong trường hợp này,

69
phương pháp kiềm tra l gộp (t^ộp) và phân tích phưđng sai theo mô hình
một nhân tô" là hai phương pháp kiểm tra tò"t nhất. Liíu ý, khi sử dụng
phương pháp kiểm tra t gộp cần phân biệt cách dùng một hoặc hai duói của
đường cong phân bố chuắn.

3. Khi chỉ dùng một đuôi của phân bố đường cong chuẩn
Đốỉ vối phương pháp kiêm tra t khi chỉ dùng một đuôi của phân bô
chuẩn chỉ đưỢc dùng trong loại thí nghiệm, đặc biệt riêng của nó dó là sự
khác nhau của các giá trị trung bình mẫu đã khang định đưỢc hướng lớn
hớn hay nhỏ hơn. Vì vậy, loại thí nghiệm này có thể duy nhất chi sử dụng
một đuôi. Trong thực tiễn, có rấl ít thí nghiệm sử dụng phưdng pháp kiểm
tra chỉ dùng một đuôi của phân bô' chuẩn vì các giá trị trung bình đều biểu
hiện theo một hưóng nhất định ít xảy ra. Trong truòng hỢp này, giả thuyết
là:
Giả thuyết không ở đây là H(): Pi = ụ.,
Giả thuyết kháng không (H|): Pi < ụ.> sẽ thoả mãn vối các trung bình
mẫu X] < X.) thì mới được kiểm nghiệm bởi H,. Giá trị p của phép kiểm tra
được xác định theo công thức sau:
P = 2 xPr(t> 1,43)
Tại đây, không có “2 x” ở về phía tay phải và điều quan trọng dáng chú
ý là giá trị p chỉ bằng nửa giá trị p mà chúng ta đã kiểm nghiệm trước dây
vói phương pháp kiểm tra dùng cả hai đuôi.của đường cong chuẩn. Vì vậy,
trong trưòng hợp này thay vì giá trị p là 1 0 % < p < 2 0 % bằng giá trị p ỉà:
5%<p< 10%.
Tưdng tự, đôi với những trung bình mẫu chỉ có một hướng bên trái thì
ta cũng xác định như cách xác định này nhưng giá trị 1,43 phải mang dấu
âm (-). Cũng tính tương tự như trên, giá trị mức độ tin cây p thường đưđc
sử dụng với hai mức độ 90% và 95%.
Cần lưu ý rằng, giá trị t tra cứu ở bảng t là giá trị biểu thị cho phép
kiểm tra t cả hai đuôi. Vì vậy, khi so sánh với phương pháp kiêni tra t chi
dùng một đuôi của đưòng cong chuẩn thì chỉ dùng một nửa của g»á trị t đó.
Binh phương trung binh trong thống kê (MS) là các giá trị dược tính
toán bởi tổng của các bình phương SS), SSv, ss„ chia cho độ tự lio tương
ứng DFi, DF2, .... DF„ của nó. Bình phướng trung bình là giá trị tính toán
của phưdng sai Sj^, s„^ là tất cả các giá trị tính toán của o'^ phương
sai đó là chung cho các mẫu của quần thể. về mặt kỹ thuật, những giá trị

70
nàv là n h ữ n g th a m sô khônơ sai lệch đối với ơ' và được biếu thị bời E(Sj") =
E(Sr) (S p -) =

4. Một số điểm cần lưu ý khi sử dụng t gộp


Pluíđng pháp kiểm tra t gộp đòi hỏi nhữiig diều kiện sau:
- pluíớng sai m ẫu phái hoàii toàii dộc lộp, không ràn g buộc lẫn nhau;

• quần thê phải tu â n theo sự phân bỏ chuẩn;

■ |)hudiig sai các mẫu và quần thê phái bằng nhau hoặc gần như bằng
nhau.
S(i (lĩ, phương pháp kiểm tra t gộp đòi hỏi phải có những điểu kiện trên
dâv là vi các nhóm mẫu pliíii dộc lập vổi nhau bơi vì nếu các sô" liệu của
nhóm mẫu dó có inôi liỏii quan với các nhóm mầu khác thì phương pháp
kiiMU tra t gộp này không thè dùng dược mà phái sử dụng một phương pháp
kieiii ti a khác, dó là phương pháp kiêm tra t cặp mà sẽ được đề cập trong
phán tiếp sau.
Như dã trình bày ở phần trên, quần ihế phải được phân bô" chuẩn thì
IIKÍÌ có giá trị đúng khi sử dụng phương pháp kiểm tra t gộp. Có một số thí
nịiiiiệm, các sô”liệu thu được trong các thí nghiệm đó không tuân theo sự
phâỉi hô cliuấn và các phưđng sai của chúng không bạng nhau thì những
ti-ưòiíg hợp dó, cũng như các phương pháp phân tích thống kê sinh học
khác, trước khi sử dụng phương pháp kiểm tra t gộp này cần phải sử dụng
piiéị) chuyển dạng sô' liệu. Nếu không sử dụng phép chuyển dạng các số
liệu dó tliì kêt quả của phương pháp kiểm tra t gộp này sẽ sai.

5. Trường hỢp không dùng phương pháp kiểm tra t gộp


Cáu lưu ý rằng, nếu niộl thi nghiệm inà sô liệu phụ thuộc lần nhau
nliư nghiên cứu độ nhiễm dộc troiig nưỏc ơ Iren inạL sông và dưới đáy cùng
niột vị trí nào đó mà sử dụng phương pháp kiểm tra t gộp thì kêt quả sẽ bị
sai lệch nhau. Nguyên nhân dẫn đến sự sai lệch đó ià do tất cả những biến
đôi giữa các mẫu nằm ẩn vào sai sô”trong các mẫu. Thí dụ, sự sai lệch giữa
rác vị ti í mẫu đã nằm ẩn vào bên trong của sai số làm cho mức độ chính
xác cua sự so sánh sẽ giám di giữa các inực nưỏc. Vì vậy, nếu sử dụng
pluídng pháp kiêm tra t gộp sẽ dẫn dên kết quá sai. Thí dụ 3.5 sẽ chứng
minh cụ thể hơn.
Thi dụ 3.5. sử dụng 12 ngiíòi vào thí nghiệm vởi hai loại thức ăn khác
nhau: ngô và mạch để kiêm tra ánh hưởng của chúng đên hàm lượng

71
cholesterol trong máu. Trong thí nghiệm này, mỗi người đều được lặp lại cả
hai loại thức ăn đó và mỗi loại thức àn được kéo dài hai tuần. Trong thí
nghiệm này, sô' liệu đã tạo thành từng cặp và giữa hai nhân tố đó, chúng
phụ thuộc với nhau. Như vậy, mỗi ngưòi đều có một cặp gồm hai sô liệu
tương ứng (mục III về phương pháp kiểm tra t cặp). Số liệu biểu thị kết quả
thí nghiệm được trình bày ở bảng 3.5.
Báng 3.5. Hàm lượng cholesterol trong máu vỏi hai loại thức ăn
Loại thức ăn Ngô Mạch Độ lệch

Ngưởi TN số 1 4,61 •3.84 0,77


2 6.42 5 57 0.85
3 5,40 5.85 -0.45
4 4.54 480 -0.26
5 3^98 3 68 0,30
6 3,82 2,96 0.86
7 5.01 4,41 0.60
8 434 3,72 0^62
9 380 3.49 031
10 4.56 3,84 0.72
11 535 5,26 0,09
12 3,89 3.73 0 16

X 4,64 4.26 0.38


SD 0.79 0.91 0.43
SEM 0,23 0.26 0.13

Tại bảng tổng hỢp số liệu của thí nghiệm “ảnh hưởng của các loại thức
ăn đến hàm lượng cholesterol trong máu” cho thấy Xehénhlệch= ^iníu-h* độ
lệch chuẩn của sự chênh lệch (SDchênh lệch) không mang theo mối quan hệ SD
của mẫu độc lập mà chúng phụ thuộc lẫn nhau. Xác định SD,,ị,f.ni, lệch từ
SD„ge và SD„ạjh đòi hỏi phải tính được hiệp phương sai đối vối cả hai mẩu.
Nếu Xj biểu thị cho số liệu của mẫu thứ nhất và X2 biểu thị cho số liệu của
mẫu thứ hai thì hiệp phưdng sai (COV) sẽ được tính toán như sau:

C O V ( x „ Xọ) =^ -----------------
n-1
ở đây, tổng các tích giữa các độ lệch sẽ được xác định theo các cặp và
được biểu thị qua bảng 3.6.
B á n g 3.6. Độ lệch và tích các độ iẻch cùa hai loại thức ăn
Mẳu số (X,- X ,) (X,- X ,) (X,- X ,)(Xj- X j)

1 -0.03 •0,42 0,014


2 1.78 •1.31 2,323
3 0.76 1.59 1,201
4 •0.10 0.54 -0,066
5 -0 66 -0.58 0,386
6 -0.82 •1.30 1,072
7 0,37 0.15 0,064
8 -0.30 -0,54 0 165
9 -0.84 -0 77 0651
10 •0,08 -0,42 0035
11 0.71 1,00 0,705
12 .0,75 •0.53 0401

s 0,04 0.03 6,953

Từ đó, hiệp phương sai của hai ioại thức ăn dược xác định như sau:
COV(x„ X.) = 6,953/11
= 0,6320
Phương sai của sự chênh ỉệch có thể được tính từ phương sai mẫu độc
lập và hiệp phương sai tưđng ứng.
Var(xj- x.i)= Var(X|)+Var{x,)-2 COVíXị.Xa)
= 0,625 + 0,828 - 2 X 0,632
= 0,189
SD(x,- X ,) = VÕã89
= 0,435
ghi chu
- Giá trị 0,625 chính là độ lệch chuần của mẫu thửnhảt bình phương, SD,^ = 0.79^,
' Giá trị 0.828 chính là 0.91^ và là đô lệch chuẩn bình phương cỏa mẫu thứ hai.

Giá trị F tại điểm 1 và 11 dối với tấi c;i các yếu tô"thí nghiệm là: F„vi,
1 „ = 9,26 (bảng 3.7).

Vậy, giá trị ^ õ v lil) = tn


= v^26
= 3,04

73
Như vậy, nếu hiệp phương Síìi được chuẩn hoá bơi chia IIÓcho tích cúíi
các dộ lệch chuẩn của hai mẫu, nó sẽ trỏ thành hộ số tương quaii (i ).
_ COV(Xj , x .,)
* ""ãDĨTSDT
= 0,632/(0,79x0,91)
= 0,88

II. PHƯƠNG PHÁP KIỂM TRA T GIẨ

1. Khi nào sử dụng phương pháp này?


Như đã nêu trên đây, phương pháp kiêm tra t gộp đòi hỏi phái chấp
nliận giá thuyết các phương sai quần thổ bằng nhau. May mán thay
phưdng pháp kiểm tra này không quá nhạy cảm vôi những sự chấp thuậii
nhâ”t là khi kích cỡ mẫu gần như bằng nhau. Trường hỢp nià phương sai
không bằng nhau có thể do nhiều nguyên nhán nhưng có thê nguyòn nhâii
chính là do các nhân tô thí nghiệm phụ thuộc lẫn nhau, chúng có thê cùng
tác động ảnh hưởng đên cùng một cơ thê sông hay giữa chúng có sự ràng
buộc ỉẫn nhau. Trong trường hdp này không thế dùng phương pháp kiôiii
tia t gộp inà cần phải dùng phương pháp kiểm tra khác. Có niộl Ị)hưdiig
pháp kiêni tra gán tươiig tự phưtíng pháp kiểm tra t gỘỊ), đó là pliiídng
pháp kiểm tra t giá và dược kí hiệu là t’.
Trong nhữiig trưòng hỢp inà sự đòi hỏi về phân bố chuẩn có thê cìã
được thoả mãn nhưng phương sai chung hình như không dược thoỉi niãn
hoặc ngưòi ta không để cập đến thì phương pháp kiểm tra t’sẽ phù hỢp.
Hay nói một cách khác là giả thuyết ơ| = o.^ = ơ là không có lý. Công thức
tính t' dược biểu hiện như sau:

/rii +S 9 /n.>
ớ đây, Pi - p ., = 0 vì giả th u y ế t k h ô n g (H„) là P| =
Trong trường hỢp này, giới h ạ n tin cậ y đối với Pi • ụ -2 sè là:

,sf ^
X, - X, ± bang
n..
Trong trường hđp sử dụng phưđng pháp kiểm tra t’, clộ tự do dược ký
hiệu bằng DF’ và được xác định theo công thức sau:

74
p ^^ ĩ ^ 1 ^ 2 [ ^ **

(Sf / lìỊ)“ (Sv / n . , )■


»11 1

2. 1 ’hi dụ minh họa


T h i d ụ 3 .6 . Trong một thi nghiệm vế y học, người ta m uôn tă n g nhịp
tim lôn, bằng cách đã sử dụng 35 người đàn ỏng và 35 người đàn bà làm thí
n g h iệm và k ết quả th í n gh iệm (lược phân tích cho thấv;

- T ung bình sô'lần tim dập trơng niộl |)hút ớ nhóm người đàn ông ỉà
6 ,2 .'ỉ (X = 6,23) lần/phút và SI) của sự thay dôi dó là 7,50.

- T ung bình tàng nhịp tim ò nhóm Iigười (làn bà là 3 ,2 2 lần/phút và


SD của sự thay đối đó là 2,17.
Vỏ giá trị tr u n g bình ấy, (lã có (lầy dù diêu kiện th ôn g kô dê k ế l luận
sụ riai khác giữa đàn ông và dàn bà chưa? Có thê dùng phương pháp kiểm
tra t ỉíộu và t’ để so sánh kết quá đó.

2 .1 . Trường hợp thực hiện phương pháp kiểm tra bằng t gộp

Q 2 - 34(7.50)- + 3 4 (2 ,17)-
3 4 + ;m

_ 1912,5 + 160.1
~68

= 30,48

Với DK = 68

Do tần suất số liệu ớ hai nhóm người (làn òng và đàn bà b.ằng nhau,
vậy có tiiỏ tính t gộp n h ư sau:

6,23 - 3 , 2 2 _
3 0 ,4 8 (1 /3 5 ^ r /3 õ )

= 2,25

Kê, luận
S a i k h ác giữa hai nhóm Iigưòi dó có ý nghĩa (2% < p < 4%).

Khoảng tin cậy với mức 95% ià 0,4 - 5,6.


Khoảng tin cậy với mức 99% là -0,5 - 6,5.

75
2.2. Trường hợp thực hiện hằng phương p h á p t g iả
. _ 6,23 - 3,22
t’ =
7,50*'^/35+ 2,17-/35
= 3.01
1,607 + 0,1345
= 2,28
D F= — (1.607+0.1345)^
1,607''^/34+ 0,1345''^/34
= 39,65
Nhận xét
• Sai khác giữa hai nhóm đó có ý nghĩa (2 %< p < 4%).
- Khoảng tin cậy Pdànông - PdànbA. với mức 95% là 0,4 - 5,6.
- Khoảng tin cậy PđAnông • p,làn bà. với mức 99% là -0,5 - 6,5.
2.3. Kết luận
Nếu làm tròn số thì DF = 40 và giá trị tg (2,25) cũng tướng tự t’ (2,28)
và từ đó cũng có thể rút ra kết luận giốhg như trên.
Thí dụ 3.7. Sô liệu thu được của một thí nghiệm vỗ béo lỢn do TS.
Nguyễn Văn Đức tổ chức tại Nông trường Thành Tô “nghiên cứu tốc độ
tăng trọng (g/ngày) của hai giốhg lợn Landrace và Đại Bạch từ 90 đến 180
ngày tuồi”, từ tháng 7 đến tháng 10 năm 2000 thu được kết quả như sau:
GiôVig lỢn Landrace (LR) có n| = 8 , Xị = 756,75 và SD) = 47,140
Giống lớn Đại Bạch (ĐB) có n2 = 10, X2 = 780,10 và SDy = 25,571
Hây kiểm tra sự sai khác của kết quả tăng trọng giữa hai giôVig lợn
trên tại Nông trường Thành Tô.
Trước hết, chúng ta nhận thấy SDj và SD^ không bằng nhau, vậy
phưđng pháp kiểm tra tp„ (t’) là phù hỢp và chấp nhận giả thuyết sau:
Giả thuyết không (Ho); Pi = Pa
Giả thuyết kháng không (H,): ụ, ụ.,. Vậy giá trị t’ sẽ được tính theo
công thức sau:
756,75 - 780,10
^2222,21/8 + 653,88/10
= 1,26

76
_ (2222.21/8 i- 6 5 3 ,8 8 /10)^
(2222,21/8)- (653,88/10)^
+
9
= 10,24
Như vậy, với cách tính này giá trị DF" không biểu hiện một số nguyên
inà là niột sô thập phân nên ta |)hái làm tròn sô’ trước khi tra cứu ỏ bảng
phân bô t. Trong trường hỢp này, tại bảng phân bô chuẩn t, sử dụng giá trị
t tại điểm có DF = 1 0 vì ta làm tròn số giá trị 10,24 = 1 0 .
Tại đây, tra cứu giá trị t ở báng t tại điểm DF = 10 và giá trị ti„ đôì vói
xác suất 5% là 2,23. Với phương pháp kiêm tra sử dụng cả hai đuôi của
đưòng cong chuẩn, H|: ụ, thì giá trị t tính được là -1,26, nằm giữa hai
giá trị -2,23 và 2,23. Như vậy, xác suất t > 1,23 hoặc t < -1,26 sẽ > 5%
nên nó sẽ nằm giữa hai giá trị 30% và 2 0 %. Từ đó, có thể kết luận đượí;
rằng giíi thuyết không (H„) là hoàn toàn có lý. Hay nói một cách khác về
mặt thống kê sinh học thì hai giống lợn LR và ĐB không biểu hiện sự sai
khác rõ rệt về tốc độ tảng trọng.

III. PHƯƠNG PHÁP KIỂM TRA T CẶP

1. Khi nào sử dụng phương pháp này?


Trong thực tê có nhiều thí nghiệm khảo sát inửc độ ảnh hưởng của một
hay nhiều nhân tố trên cùng một hay nhiều cđ thể sinh vật. Trong trưòng
hợp các nhân tố cùng ảnh hưởng lên một cơ thể sống thì rõ ràng những
nhân tô â’y phụ thuộc lẫn nhau. Loại thí nghiệm này phải được thực hiện
phương pháp kiểm tra t cặp để đánh giá ý nghĩa thống kê về sự sai khác
giữa các nhân tố đó, bởi vì hai nhân tố đó hoàn toàn không độc lập vỏi
nhau.
Trong trườrig hợp có nhiều nhân tô cùng ảnh hưỏng lên một cđ thể
sinh vật thì những nhân tô”ấy phụ thuộc lẫn nhau. Thí dụ, ảnh hưởng của
hai loại thức ăn lúa mạch và ngô đôì với hàm lượng cholesterol trong máu
là một thí dụ điển hình về loại hai nhâii tô' thí nghiệm ảnh hưỏng lên cùng
một cơ thề sinh vật, vì vậy chúng phụ thuộc lẫn nhau.

2. Thí dụ minh họa


Sử dụng 1 2 người vào thí nghiệm vói hai loại thức ăn khác nhau: ngô
và lúa mạch đế kiểm tra ảnh hưỏng của chúng đến hàm lượng cholesteroì

77
trong niáu (thí dụ 3.5). Trong thí nghiệm này, inỗi người dều dưực lậ|) lại
cá hai loại thức ăn đó và mỗi loại thức ăn được kéo dài hai tuần. 'rronỊĩ thí
nghiộni này sô liệu đã tạo thành từng cặp của hai nhân tô’ đỏ, chúiig phụ
thuộc vỏi nhau. Như vậy, mỗi ngưòi đều có một cặp gồm hai -sò liệu tươiig
ứng. Sô"liệu đó được trình bày ở bảng 3.Õ.
Nhận xét. Tại thí nghiệm này, các mẫu thu được hoàn toàn không độc
lập với nhau và hai loại thức ăn đều ảnh hưởng lên cùng mỗi một cơ thê
siiih vật, có n gh ĩa là các sô’ liệu thu dược trên cù n g một h à n g cùa b á n g là
một cặp kết quíi do được của cùng niột người. Như vậy, bộ sô liệu này là bộ
sò liệu gồni 12 cặp sô”liệu thu đưỢc của 12 người.
Trong trường hợp này, phương pháp kiểm tra t gộp và phâii tích
phương sai theo kiểu một nhân tố là không phù hợp và nếu sử dụiig chúng
để phân tích cho thí nghiệm này thì kết quả sẽ không đúng. Vì vậy, bộ số
liệu này cần phải phân tích kiểm tra theo phương pháp so sáiih từng cặp
với nhau và nó dược gọi ỉà phương pháp kiểm tra t cặp.

3. Phương pháp kiểm tra t cặp và cách xác định khoảng tin cậy
Phương pháp kiểm tra t cặp và cách xác định khoang tin cậy của
phương pháp t cặp sẽ được trình bày cụ thể dưới đây.
Giả thuyết không (H,)) là không có sự ảnh hưởng khác nhau giữa hai
loại thức ăn trên, H„:
Giá thuyết kháng không (H|) là có sự ảnh hưóng khác nhau giùa hai
loại thức ăn Irên, H,: * \ìm:uh-
Khái niệm về tổng độ chênh lệch hay các hiệu của các cặp theo giả
thuyết sẽ là: |i,.|,ó„h Iọ<h “ 0 . Phương pháp kiểm tra t cặp là một thí dụ của
phương pháp kiểm tra t được thực hiện đôì với bộ số liệu của dộ chênh lệch
của các mẫu. Cách tính giá trị t đưởc làm nhrví sa\r
_ ^ c h ô n h lệch “ H chônh lệch

^ c h ô n h lệch ^ y^^chônh lệch

_ (0,38-0)
0,434/^/Ĩ2
= 3,04

Với độ tự do chênh lệch là 1 1 , xác suâ*t trong phạm vi 1 % < p < 2 %và
giá trị t cặp là 3,04, có thể tính được khoảng giới hạn tin cậy của t cặp.
Đế’ tính đưỢc khoảng tin cậy của t cặp đối vỏi = ụ,,,.,,!,, khoảng '.in

78
cậy tương ứìig đôi với p,h,.„h lịrh (ỉộ ch ên h lệch của nhóiiì
niầu. Vòi ĩiìức độ tin cậy 95%, khoang liĩi cạy (K) dược tính b ằn g công thức
của gìá rị rhônh lộch như sau:

\ í-iỉ(‘‘ììiì

= 0 ,3 8 ±
v l2
= 0,38 ± 0,28

4. Sử dụng phương pháp phân tich phương sai đế kiểm tra t gộp và
t cặp
Tixng thi nghiệm vỏi thí dụ 3.5, phưdng pháp kiêm tra t cặp vừa được
sử dụnị và giá trị t cặp tính diitíc !à 3,04 vỏi DF = 1 1 và bình phương của
giá trị I (3,0'1) trong th ô n g kê này (9,26) ỉà Iiiộl giá trị th ố n g kê F với DF = 1
và II,

Kh)áng ÚM cậy (K) với mức (iộ xác suất 95"'» (lò’i vỏi chênh lệch giữa
ílự« phưđng pháp ị)hân tích phương sai là;

K = x„„-,-x.„,„i,.tt,|...v„,vS-(l/nj + l / n ^ )

= 4,64 - 4,26 ± 2,20 v 0 .0 9 4 0 ( Ĩ 7 Ĩ 2 T Ĩ 7 Ĩ 2 )

= 0,38 ± 0,28
= 0.10->0,6(5
Như vậy, giá trị k h oả n g tin cậy K xác dịnli thoo phương pháp ph án
lích phương sai tư ơng đương vỏi giá trị K tính tliiực à phương pháp kiểm tra
t cặp như đã trình bày ở mục 3.
( 'ô i g thức sử d ụ n g để tính khoáng tin cậy K c ù n g tương tự như cách
tínli K J phương p h á p kiêm tr a t gộp nhưng sủ (iụng -S.TÌ số t r u n g bình bình
phương lừ phương pháp plìâii tícli phương sai thay cho Sgộp . Khái niệm sai
sô* nàv à trên thực tê đã đưỢc chuấn hóa đôi với các sô* đo cặp đôi và nhỏ
hơn so /ới s^" nêu sự phân cặp dôi sô liệu dó dã thóa inãn theo một nghĩa
(sõ đượ( mô tả cụ thể ỏ phần sau).
Gii trị F cùng có thể tính (ỉược bằng <:ách thực hiện phương pháp
phân tích phương sai (anova) trong thí Iighiộin theo hai nhân tô"(bảng
3.7).

79
Bảng 3.7. Anova vế thi nghiệm hàm lưdng cholesterol trong máu với hai loại TA khác nhau
Nguổn biến DF ss MS F p

Giữa số liệu 11 14,939


GiOacàcmẫu 1 0.870 0,870 9.26 O.OKP<0.03
Sai SỐ 11 1034 0.094
Tổng 23 16,843

ghi chú;
- DF là độ tự do của mỗi nguồn biến;
- ss là tổng các bình phương;
- MS là trung bình binh phưong;
- F là giá trị tỷ lệ giữa MS giũa các nhản tố với MS sai số;
- p lả mức độ xác suất thi nghiệm.

Thí dụ 3.8. Đề đo sự ô nhiễm môi triíòng về hàm lượng kẽmtrong


nưôc tại sáu điểm của một khúc sông và mỗi điểm đo ở haimực nưốc khác
nhau: trên bề mặt và dưới đáy sông, kết quả được trình bày ở bảng 3 .8 .
Bàng 3.8. Độ nhiễm Zn ỏ hai miA: nuớc
Vị trí ở đáy ở bể mật €3Ộchênh lệch X

1 0.43 0,415 0.015 0,4225


2 0,266 0,238 0028 0,2520
3 0,567 0.390 0 177 04785
4 0,531 0,410 0.121 0.4705
5 0,707 0,605 0 102 0,6560
6 0716 0,609 0,107 0,6625

X 0.53671 0.44450 0.0917 0.4903

Từ bảng số liệu đó có thể tính được các tham số thống kê cd bản sau;
Srhẻnh lịch'^ “ 0 , 0 0 3 6 8 ,

n=6
. ^ 0 ,0 9 1 7
^chênh lộch
/0 ,0 0 3 6 8 /6

= 3 ,7 0

p < 0 ,0 2
tg bảng = 2,57. Như vậy, t„„h>

80
Kết luận
Sự sai khác về hàm iượng kẽni giữa hai niựo nưỏc trên bể mặt và dưói
cỉáy sôiig có ý nghĩa rõ rệt. Gia thuyết không là không có sự sai khác nhau
vê hàm lượng kẽm giữa hai inựo nưóc trên bể mật và dưỏi đáy sông là hoàn
toàn không được châp nhận.
Rõ ràng, trong trường hđp này không thể dùng phép kiểm tra t gộp bởi
vì liàni lượng kẽni trên bề mặt và dưới đáy sông cùng được lấy tại mỗi điểm
c:úa dòiig sông cho nên các sô’ ỉiệu đó không độc lập vỏi nhau. Nếu sử dụng
phưđiig pháp kiểm tra t gộp thì kôt quả sẽ là:
= Q.53671 - 0 ,4 4 4 5 0
0,025(1/6 + 1/6)
= 1,01
Như vậy, so sánh kết quá này vỏi giá trị t bảng cho thấy giá trị p sẽ là:
0,30<p<0,50. Rõ ràng rằng kết quả kiểm tra bằng t gộp này khác hẳn so vói
kết quá kiểm tra theo t cặp trên.
Lấy lại số liệu ở thí dụ 3.8 về “hàm lượng kẽm nước sông ở hai mực
nước của 6 điểm” rồi sử dụng phương pháp phân tích phưđng sai để có thể
so sánh vỏi phương pháp kiểm tra theo giá trị t cặp. Cụ thể tính toán theo
trình tự như sau và các kết quả được trình bày tại bảng 3.9.
B à n g 3 .9 . Anova vé độ nhiểm Zn của hai mực nưàc cùng vị trí
Nguồn biến DF ss MS F p

Giữa các mẫu 5 0,2381 0,0476 26,02 <0,001


Giừa mực nước 1 0.0253 0,0253 13.81 <0,025
Sai sổ 6 0.0091 00018
TSS 11 02725

Tính giá trị hiệu chỉnh:


CF= 12x0,49033'*
Tính tổng các bình phương ỏ các điểm:
SS,Ị„, = 2(0.4225'^+....+ 0,6625) - CF
= 0,2381
Tổng bình phương của cấc vị tri (hai mực nước):
= 6(0,53671^ +• 0,44450^ - CF
= 0,0253

81
Tính tổng tất cả các binh phương:
SStón* = 0,430^ + 0,266'^ + ... + 0,609^ - CF
= 0,2725
Từ đó tính giá trị F tương ứng tại điểm 1 và 5.
Fi 5 = 13,81, suy ra giá trị t vói độ tự do = 5 như sau:
ta= V13.81
= 3,71.
Nhận xét
Giá trị t tại cách tính của phân tích phương sai tương ứng là ;ỉ,71
trong lúc đó giá trị t tính ỏ phương pháp kiểm tra t cặp là 3,70. Hai gTÌá trị
này coi như bằng nhau vì sự lệch giữa hai giá trị đó là 0 ,0 1 có thế doi cách
làm tròn số trong quá trình tính toán.

s. Mỏ rộng phương pháp kiểm tra t cặp


Phưđng pháp kiểm tra t cặp nói chung có thể được mỏ rộng áp dụng
cho những thí nghiệm có nhiều nhân tố thí nghiệm hay nhiều nhóm s<ố liệu
hđn.
Thí dụ 3.9. So sánh tỉ lệ hấp phụ ba dạng thuốic aspirin sau khi uôVig
vối liều 600 mg và hàm lượng của thuốc aspirin ở dạng salicylate được chiết
xuất từ nưỏc tiểu sau 1 giờ uống thuốc. Ba dạng thuốc viên được thiử cho
một nhóm mưòi ngưòi: loại thứ nhất là axetil salicylate canxi (A) và haú loại
tiếp theo là 2 dạng viên asprin phảng (C và E) được trình bày ỏ bảng 3 . 1 0 .
B ing 3.10. Hàm luạng thuốc aspirin trong nuớc tiểu của ba dạng thuốc
Dạng thuốc
Nguỡi thi nghiêm A c E X

1 18,4 10.1 16.9 15,13


2 11.1 9.0 9.8 9.86
3 14,8 16.7 18.1 16,53
4 21.6 26.1 14.2 20,63
5 23.6 16,0 12.7 17.43
6 18.4 19.6 16.0 18,00
7 42.2 18,2 25.8 29.73
8 22,4 19.5 13.9 18,60
9 37,0 27,2 15.9 26J0
10 33.8 18,4 15.8 22,66

X 24,33 18.08 15.91 19.44

82
Kii gặp loại thí nghiệm này, do có nhiếu nhân tô' nên phường pháp
kiểm (ra hữu hiệu nhất là ph<ìn tích phướng sai vì nó nhanh hơn so với
phưdn^ pháp kiểm tra t cặp theo từng cặp. Tât nhiên, phân tích phương sai
chi cho ta kết quả tổng hợp chứ không thé so sánh từng cặp nhỏ vói nhau
được, '■'ừ bảng số liệu 3.10 trên, có thể tính dược các tham số thống kê cơ
bản và các kết quả đưỢc trình bày ở bảng 3.11.
CF = 30(19,44)"
= 11337,408
TSS= 18,4''+ll,l- + ...+15,8--CF
= 1762,17
= 3(15,13-+9,96- + 2 2 ,6 6 '') - CF
= 823,37
= 10(24,33^+18,08-^+15,912). CP
= 382,23
ESS = TSS - dạng thuốc s s - nhóm mẫu s s
= 1762,17-382,23-823,37
= 556,58

Báng 3.11. Anova hàm liẠỉng thuốc aspirin trong nuớc tiểu
Nguồn biến DF ss MS F p

Giữa các nhóm 9 823,37 91.49 4,96 0,01 <p< 0.01 l


Giữa các dạng 2 38223 191,11 6,18 0.005<p<0,0
Sai sô 18 556.58 30,92
Tổng 29 1762,17

Tiong thực tế hầu hết các thí nghiệm có nhiều nhân tố sau khi thực
hiộn Cfc phương pháp kiểm tra bằng t chỉ cho ta biết kết quả so sánh tổng
hợp ch í không thể thực hiện so sánh từng cặp nhỏ với nhau. Vậy, khi muốn
so sánh từng cặp nhỏ với nhau thì phưđng pháp kiểm tra so sánh từng cặp
bằng so sánh bội sô là phương pháp kiểm tra thích hớp nhâ't.

B. PHƯƠNG PHÁP KIỂM TRA BẰNG s o s á n h b ộ i s ố


9

PFương pháp kiểm tra bằng so sánh bội số là phương pháp khảo sát

83
mức độ ý nghĩa thông kê sự sai khác giữa các số trung bình của các nhâĩi tô
thí nghiệm và giữa những cặp giá trị trung bình của chúng với nhau. Thí
dụ, trong một thí nghiệm có nhiều nhân tố hay nhiều nhóm mầu cúa cùng
một nhân tô", sau khi sơ bộ thực hiện các phép tính sô học đơn giản như
tính tổng sô"lưỢng mẫu, giá trị trung bình, độ lệch chuẩn,... có thê tóm tắt
các kết quả đó ỏ bảng 3.12.
B ả n g 3.12. Tóm tắt các kết quả cơ bản để phục vụ cho anova
Mẩu thí nghiêm 1 2 ... k

Tần số quan sát n, ... n„


Giá trị trung bình X, X2 ... Xk
Độ lệch chuẩn Si S2 ... s„

ghi chú:
- 1 ,2 ..... k lả số mẫu thí nghiệm,
• Hi, ri2..... rìk ỉà tần số quan sát hay tần suất mẫu.
- X,, X 2, X | , là trung bình mẫu,
- s,. $2..... Sk là độ lệch chuẩn.

Phương sai (ơ“) chung được tính toán bằng cách gộp các phương sai
mẫu Sj^ lại với nhau. Sau khi thực hiện phân tích phương sai và phương
pháp kiểm tra F mà thấy giả thuyết không là không có lý hay nổi cách khác
là giả thuyết không Hq: Ịii = ÌÌ2 “ “ Pk bị loại bỏ thì ta đã có thể châp nhận
có sự sai khác giữa các số trung bình. Thế nhưng, khi giả thuyết không đâ
không được chấp thuận thì giữa các cặp trung bình trong tất cả các số
trung bình cũng có thể có sự khác nhau đáng kể.
Cần hiểu rằn g Ho: ]X\ = P2 = ••• = Pk th ưòng h iểu nó th e o n gh ía là giá
thuyết bao trùm. Có rất nhiều phương pháp kiểm tra bằng so sánh bội số,
nhưng thông dụng nhất là:
- Sự lệch nhau (khác nhau) có ý nghĩa nhỏ nhất (LSD),
. SNK,
- Duncan,
- Boníerroni.

I. PHƯƠNG PHÁP KIỂM TRA s ự LỆCH NHAU


CÓ Ý NGHĨA NHỎ NHẤT

1. Giới thiệu chung


Trong cùng một thí nghiệm, ngưòi ta sử dụng một lúc nhiều nhân tô

84
thi nghiộin với mục đích đế kiểm tra sự sai khác giữa các nhân tô’đó xảy ra
nluí thê nào. Thê nhưng, khi kiếm ua đã tliấy sự sai khác giữa tất cả các
yôu lô' tiìí Iiglìiệnì có ý nghĩa thì liệu các sự sai khác giữa các giá trị trung
bìiih của các nhóm phụ với nhau hay giữa các cập nhóm phụ đó có ý nghĩa
hay k h ô n g thì p h ư ơ n g p h á p so sá n h s ự lệch n h a u có ý n g h ĩa n h ỏ n h ấ t
(LSD) sẽ trá lòi câu hỏi đó một cách ihích hợp nhát.
Quá trình khai thác một Iihóin trung bình và thu thập sự sai khác
giữa chúiig có ý nghĩa hay không thường được gọi là “sựphântách trung
bình”. Những phương pháp đã mô lá trên dây không nhữngáp dụng cho
các mẫu có độ lớn bằng nhau mà còn có thê á|) dụng cho các mẫu có độ lớn
khôiig bằng nhau. Song, cần lưu ý rằng phương pháp LSD chỉ cần thiết làm
khi |)hép kiêm tra F của anova đã khang dịnh sự sai khác giữa các nhân tô"
thí nghiệm có ý nghĩa.
Đê nghiên cứu ý nghĩa thông kê sinh học của sự sai khác giữa các cặp
giá trị truiig bình với nhau, có thc sử dụng phường pháp LSD vói mức độ
tin cậy nhất định. Thường nguời ta sử dụng ở hai mức dộ tin cậy là 5% và
r ’o. 'riií dụ, với mức 1% LSD đôi vói các giá trị trung bình sẽ đưỢc tính theo
công thííc sau:

1%LSI) = -Ịỹ,- X2/n


trong đó:
- t là giá trị đưỢc tra cứu ờ bảng phân bô t với mức độ tin cậy 1%;
- S" là sai số bình phương trung bình;
- 11 l<à tần số quan sát của mẫu.
Sau khi đã xác định được giá trị LSD, sắp xếp những giá trị trung bình
theo niột trật tự nhất định từ lớn dến nhỏ hoặc ỉigược lại. Thí dụ, trật tự đó
ò thí nghiệm trên là: A >c >E rồi ỔOgánh độ lệch giữa các cặp sô' trung bình
với giá trị LSD và gạch chân dưới những cạp số trung bình nào mà độ lệch
giữa chúng nhỏ hđn giá trị LSD tương ứng. Từ đó, rút ra kết luận vể sự sai
khác giữa các cặp số trung bìiih của các mẫu thí nghiệm.

2. Thí du• minh hoa


Thí dụ 3 . 1 0 . sản lượng sữa (SI^S) hằng ngày (kg/ngày) ở đàn bò hạt
nhân nuôi tại Trung tâm nghiên cửu bò và đồng cỏ Ba Vì khi sử dụng bốn
loỉỊÌ thức ăn khác nhau (TAi, TAv, TA,Ị và TA,) được mô tả tại bảng 3.13. So
sánh mức clộ ảnh hưởng của bốn loại thức ãfi đó đến sản lượng sữa của đàn
bò.

85
Báng 3.13. SLS (kg/ngày) từng bò với bốn loại thức ãn
Loại thức ân TA, TA2 TAj TA4

S IS 10 11 9 6
10 14 10 5
13 14 11 7

X 11 13 10 6

ghi chú
TA, là các ỉoạl thức ăn;
- SLS ià sản lưọng sữa của tcmg bò;
- X là trung bình SLS của mỗi loại thức ân.

Bâng 3.14. Anova vể SLS đàn bò với bốn loại thức ân


Nguổn biến DF ss MS F p
«

Giũâ các mẫu 3 78 26 13 0,00KP<0,005


Trong các mẫu 8 16 2
Tổng 11 94

ghi chú:
• DF là độ tự do;
- ss là tổng các bình phuong:
• MS là trung bình binh phuong:
• F là kết quả phốp kiểm tra tỷ lệ MS giữa các mẫu và MS trong các mẫu:
• p là khoảng mức đỏ tin cậy.

Biện luận và so sánh các cặp trung bỉnh với giá trị LSD
Từ kết quả trên cho thấy, giả thuyết không Hq: Pi = ụ2 = ••• = Pk là
không có lý, có nghĩa là loại bỏ giả thuyết không đã nêu trên. Như vậy, bốn
ỉoại thức ản đó ảnh hưỏng rõ rệt đến sản lượng sữa. So sánh thức ăn số 1 và
số 2 nếu sử dụng phương pháp kiểm tra t để so sánh sự khác nhau giữa
mâu số 1 và mẫu số 2 thì các bưóc tính tiến hành như sau;
^ _(Xi-X2)-(^i-H2>
Vs^2/n
11-13
V2,0x2/3
= -1,225

%
trong đó:
- S^' = 2 ,0 ,
• n = 3 cho mỗi nhóm mẫu.
Vậy, tn = - 1,225, với p>0,05; 2,31
Vậy, giả thuyết không ở đây hoàn toàn có lý và kết quả của phưđng
pháp kiểm tra cho thây sự khác nhau giữa eác sô trung bình mẫu số 1 và 2
là không có ý nghĩa. Từ công thức trên, có thế viết lại giá trị t sang dạng
công thức sau:
IX I - X ị I > tu Ị) |. I p ^f, I v S 2 /n

Như vậy, tg 5 yls^2ln là s ự khác nhau có ý nghĩa nhỏ nhất


[ ) |. (P = . , )

(LSD). Với giá trị độ lệch hay sự sai khác của bâ't kỳ một cặp trung bình
nào mà lón hơn giá trị LSD này đều thế hiện có ý nghĩa khác nhau vói mức
độ p = 0,05.
LSD = tsDK,= >/s~2/n
= 2,31 X J2x2/S

= 2,67

Sử dụng kết quả này để so sánh sự sai khác giữa bất kì cặp giá trị
trung bình nào. Tất cả những cặp giá trị trung bình có độ lệch lón hơn giá
trị 2,67 này thì sự sai khác giữa các cặp trung bình đó đều có ý nghĩa ỏ tnức
độ p = 5%.
Từ kết quả 5% LDS = 2,67 đó là một giá trị chung để tổng hỢp các kết
quả của việc so sánh sự sai khác của tâ”t cả các cặp giá trị trung bình với 5%
LSD. Sau khi đã xác định được các giá trị trung bình của các mẫu, tiến
hành sắp xếp chúng theo một trật tự nhâ”t định (thường là từ nhỏ đến lân).
Xác định độ lệch giữa các sô trung bình sau khi đã sắp xếp theo một trật tự
nhát định đó, cụ thể có những trường hỢp như sau:
a) 10 - 6 = 4 -♦ sự khác nhau này (4) > 2,67 nên ụ., P:, vì vậy giả
thuyết không trên đây không dược chấp nhận;
b ) 11 - 10 = 1 sự khác nhau này (1) < 2,67 n ên Ịi;j = vì v ậ y giả
thuyết không trên dây được .chấp nhận;
c) 13 • 10 = 3 sự khác nhau này (3) > 2,67 nên P2 * Ma vậy giả
thuyết không trên đây không được chấp nhận;
d) 13 • 11 = 2 -> sự khác nhau này (2) < 2,67 nên ịi2 = Pi vì vậy giả
thuyết không trên đây được chấp nhận.

87
Tiếp đó, gạch chân các cặp giá trị trung bình mà độ chênh lệch vổ sụ
sai khác giữa chúng nhỏ hơn giá trị 2,67. Kết quả đó được trình bày ở bíiiig
3.15 vói mức độ tin cậy 5%.
Bẩng 3.15. số trung bình và sự sai khác giCtì chúng
Mẫu thi nghiêm sô' 4 3 1 2

Giá trị trung bình 6 10 11 13

Như vậy, bất kì các cặp sô* trung bình nào nià không có gạch châ n nôi
vối nhau đều có sự khác nhau rõ rệt vối mức độ tin cậy 5%, có nghĩa l.à các
sô"trung bình đưỢc liên k ế t v ỏ i nhau bằng m ộ t gạch chân l à không có Siự sai
khác rõ rệt. Giá trị trung bình của mẫu số 4 là 6 biểu hiện sự sai kh.ác rõ
rệt vói bất kì giá trị trung bình của mỗi mẫu nào. Ngược lại, giá trị trung
bình của mẫu số 1 vừa không có ý nghĩa sai, khác vỏi mẫu số 3 và cũng vừa
không có ý nghĩa sai khác vói mẫu sô”2 , nhưng giá trị trung bình của niẫu
sô' 3 lại có ý nghĩa sai khác rõ rệt vối mẫu số 2. ■
Trong việc sử dụng phương pháp kiểm tra LSD, sự lựa chọn mức đfộ sai
khác có ý nghĩa cần phải được xác định một cách rất chặt chẽ. Nhìn chiung,
hai mức độ tin cậy 5% và 1% là được sử dụng nhiều trong quá trìn h áp
dụng phương pháp kiếm tra LSD, nhưng kết luận về sự sai khác tâ"t nihiên
có thể khác nhau. Điều đó sẽ được chứng minh ở phần tiếp theo.
Như kết quả đă tính đựđc ở phần trên, nếu dùng với mức độ tin cậ y õ%
trong phưđng pháp kiểm tra LSD thì sự sai khác giữa số trung bình inẫu số
3 và sô”2 có ý nghĩa rõ rệt. Vậy, vối mức độ tin cậy 1 % thì sự sai khác giữa
hai số trung bình mẫu 3 và 2 ấy có ý nghĩa rõ rệt không? Với mức đ(ộ 1 %
LSD cũng được tính như công thức trên, song giá trị t ỏ mức tin cậy p = 1 %
sẽ được thay với giá trị ỏ mức p=5% đã trình bày trên đây.

l%LSD = t,p=,.,,\/s^ x 2 /n
Với số liệu ỏ thí nghiệm trên, giá trị 1 % LSD được tính theo công thức
như sau:
1 % LSD = 3,36ự2,0x2/3
= 3,88
Kết quả được sắp xếp theo trật tự và sự sai khác giữa chúng cũng (được
biểu hiện tại bảng 3.16.

88
B ỏ n g 3.16. S ố tr u n g b in h v à s ư s a i k h á c g iừ a c h ú n g
M ầ u th í n g h iệ m s ô 4 3 1 2

Giá trị trung binh 6 _10_____ ỊJ_____ 13

K êì lu ậ n

Với mức tin cậy 1 %LSD, sự sai khác giữa mẫu sô’3, 1 và 2 là không rõ
rệt. ỉ)iôu này khác với kết luận ỏ lììủc 5% LSD. Từ kôt quả 1 %LSD, khoảng
tin cậy ớ mức độ 1 %là:
K = 3,36

= 3,88
rần phai nhâVi mạnh lại rầng, trong thực tế phương pháp kiểm tra
L S i) du y n h ấ t được tiến h à n h nếu Ị)hương pháp kiểm tra V tại b ả n g p hân
tích piiương sai (anova) đã kết luận có sự sai khác rõ rệt. Trưòng hỢp
p hương pháp k iếm tra F kh ôn g biếu hiện sự áai khác rõ rệt giữa các giá trị
tru n g l)ình thì k h ôn g cần th iết sử dụng Ịihương |)háp kiểm tra LSD bơi vì
giíi thuyết không H(,: Pi = ụ-. = = Pk tlã được chấp thuận, có nghĩa là
không có khả nâng để phân biệt sự khác nhau giữa các cặp trong tổng thể
chúng.

3. So sánh phương pháp kiểm tra t cặp, anova và LSD

3.1. Thi du• minh hoa•


Lây lại thí dụ 3 . 9 đã nêu trẻii về “lỉ lệ hấp phụ thuốc aspirin sau
khi uô’ng vỏi liều 600 mg qua hàm lưựng của thuôc aspirin ơ dạng salicylate
đưỢc chiết xuâ”t từ nưốc tiểu sau một giờ uống thuốic vói ba dạng thuốc viên
dược áp đụng cho một nhóm imíòi người: loại thứ nhất là axetil salicylate
lan-M (A) và luại thứ hai {(.') va loiil thử ba (K) la hai d ạ n g viên asprii)
phang”.

3.2. Các bước tinh cơ bản và phân tích phương sai


Kết quả tính toán và phân tích cđ bán của bộ số liệu trên được trình
b ày ừ b á n g 3.17.

B ả n g 3 .17 . Tần suất vầ trung bình của ba dạng thuốc


Loai thuổc A c E X

Tấn suất quan sát 10 10 10 10,00


X 24,33 18.08 15,91 19,44

89
Từ bảng 3.17 trên, có thế tính được các giá trị các tham sô thống kê
khác như:
CF = 30(19,44)'-
= 11337,408
TSS = 18,42 + 1 1 , 1 2 + ... + 15,82 - 11337,408
= 1762,17
ss,„,u, = 3(15,13-+9,96-+... +22,66-) ■11337,408
= 823,37
ss.ụ.„„»..v. = 10(24,33^+ 18,08-+ 15,91^) • 11337,408
= 382,23
ESS = TSS - dạng thuôc s s - loại thuốc s s
= 556,58
B ả n g 3 .18. Anova về hấp phụ cùa ba loại thuốc aspirin
Nguổn biến DF ss MS F p

Giữa các bệnh nhân 9 823,37 91,49 4,96 0,01<P<0.016


Giữa các dạng thuốc 2 382,23 191.11 6 18 0.005<p<0.01
Sai sổ 18 556 58 30.92
Tổng 29 1762,17

3.3. So sánh các cặp mầu bằng LSD


Như vậy, qua phương pháp kiểm tra F cho thâV giữa các niẫu có sự sai
khác đáng kề. Từ đó, tiếp tục sử dụng phướng pháp kiếm tra LSD tại mức
0 , 01.
1 %LSD = 2 ,8 8 Ự30,92x2/10
= 7,16
Sau khi đã xác định được giá trị 1 % LỔD, sắp xếp những giá trị trung
bình trên theo một trật tự nhâ't định từ lốn đến nhỏ hoặc ngược lại rồi xác
định sự sai khác có ý nghĩa giữa các cặp trung bình đó. Kết quả đó được thê
hiện tại bảng 3.19.
B à n g 3 ,19 . Biểu thị sự sai khác giữa ba loại thuốc
Loai thuốc A c E

Giá trị trung binh 24.33 18.08 15,91

90
Như vậy, vỏi mức k iêm tra 1% LSD, sự sai khác giữa giá trị tru n g bình
củii loại th uôc A và c k h ô n g biểu hiện rõ rộl. Tưđiig tự, sự sai khác giữa c
và E cù n g k h ô n g rõ rệt. N h ư n g sự sai khác giũa A và E có biểu hiện rõ rệt.

Từ th í dụ trên, có th ể tính dược giá trị khoảng ch ên h lệch th í n g h iệm


nhò n h â t L S S R và LSR vối sô lượng sô trung bình là 2 và 3 được biểu h iện
trên b ả n g 3.20.

B á n g 3 .2 0 . Giá tri LSSR và LSR của 2 và 3 số trung bình


Số lưọng 2 3
Số trung bình m ẫu

LSSR 2,97 3,61


LSR 5,22 6,35

LSR = LSSR X SD

= LSSRx v S“ / n

tron g đó:

- s là sai sô bình phương trung bình;


• n là tần suâ’t của inỗi inẫu ( 1 0 );
• LSSR là khoảng chênh lệch thí nghiệm có ý nghĩa nhỏ nhất;
• LSR là khoảng chênh lệch có ý nghĩa rihò nhất.

II. PHƯƠNG PHÁP KIỂM TRA SNK

1 . Khi nào sử dụng phương pháp này?


Trong một thí nghiệm, khi tất cả các giá trị trung bình của quần thế
đều bằng nhau, nhưng nếu càng lây tàng sô niẫu lên thì khoảng chêch lệch
giữa những giá trị trung bình mẫu nhỏ nhíVl và lớn nhát càng lớn hơn,
trong trường hỢp đó phương pháp kiểm tra LSI) không còn thích hỢp nữa.
Sở dĩ, phép kiểm tra LSD không cỏ thể sử dụng ti ong trường hỢp này là vì
sự sai khác giữa hai sô’ trung bình niẫu đó được so sánh vối khoảng chênh
lệch nghiên cứu có ý nghĩa nhỏ nhát (LSSR) X Js'~ /2 mà LSSR lại phụ
thuộc vào DF của s^, 30' mẫu đưa vào kiểm tra và giá trị p (mức độ tin cậy)
được lựa chọn. Bảng giá trị LSSR này được trình bày ở phần phụ lục. Trong
triíờng hợp này, phương pháp kiểm tra bằng SNK (student keul nevvman)
là phương pháp kiểm tra thích hỢp nhất. Trừớc hết, xác định khoảng chênh
lệch cực đại (K,„, ,iại) của toàn bộ sô lượng sò trung binh. Giá trị K„„. ,Ị,,ị được

91
tính như sau: lâV giá trị tru n g bình lớn n h â t trừ di giá trị tru n g b h ìh Iihổ
n h ấ t trong tât cả các giá trị tru n g binh h iện có, cụ thê:

(iại X Itỉn mhiVt ' ^ nhõ nhái

K hoảng ch ên h lệch S N K ià tỷ lệ giữa k h oá n g ch ên h lệch cực dại v à {Ịộ


lệch ch u ẩn của chúng:

SNK = ""^nhonhất
\/í/n
Mẫu ồố của công thức trên là giá trị độ lộch chuẩn tính toán dược của
một giá trị tru n g bình, có n gh ía là sai s ố ch u ẩ n của s ố tru n g bình và dược
tính th eo công thức:

s/ yfn
Giá trị có ý nghĩa nhỏ nhất dối vối khoảng chênh lệch SNK sẽ đưỢc
trình bày ở bảng SNK (phụ lục). Nhửng giá trị này phụ thuộc vào dôi
với S ’ , s ố lượng s ố trung bình ỏ trong n h óm sẽ dược kiểm tra với mức (iộ sai
khác dã dược chọn.

2. Các bước tính


Các bưổc tính toán của phương pháp kiểm tra SNK được trình l)ày
theo thứ tự sau đây:

2 .1 . Tinh giá trị sai số chuẩn (SE) từ độ lệch chuẩn của một giả
trị trung bình
Công thức tín h S E n h ư sau:

SE= V s ^
trong đó:
- s là sai sô”của bình phương trung bình;
- n là tần suất quan sát của mỗi mẫu;
- DF là độ tự do của sai số.

2 .2 . Tra cứu giá trị khoảng chênh lệch SNK


Tra cứu giá trị khoảng chênh lệch SNK có ý nghĩa nhỏ nhất (LSSR) dôi
vỏi 2, 3, k sô”tru n g bình th eo các mức độ tin cậy khác n h a u . Tại đây, UVy
mức độ tin cậy p = 0,05, kết quả trên bảng 3.21:

92
B ả n g 3,21, Giá tn LSSR đối VỚI S.6 số trurìg binh
Số lượng số trung biiìh 2 3 4

LSSR 3,26 4.04 4.53

2.3. Nhân LSSR với giá tri SE đê xác (tịnh khoảng chênh lệch cồ
ỷ nghĩa nhỏ nhất (LSR)
Kôt quá của các phép tíiih tiên dược trình bà y tại bảng 3.22.
B ả n g 3.22, Giá trị LSSR va LSR của các sỏ trung binh
Số lượng số trung bình 2 3 4

LSSR 3.26 4,04 4.53


L S SRx S = LSR 2.66 3.30 3,70

2.4. Sấp xếp các sổ trung binh theo một trật tự nhất định về độ
lớn rồi thực hiền những phép so sánh cần thiết
a. So sánh giá trị trung bình nhỏ nhất và lớn nhỉVt vối LSR vối sô lượng
số niầu tliaiii gia lân nhẫ’!. Nếu giá Irị này lỏn hơn giá trị LSR tra cứu ở
báng với sỏ lượng inẫu nhất dịnh thì kết luận rằng độ chênh lệch giữa
chúiig có ý nghĩa.
b. So sánh khoảng chênh lệch của nhóm có (n-1 ) sô trung bình, ở thí dụ
này n = 4. Cách làm và kết luậii iướng tự như (ỉôi vối n sô trung bình nêu
trên.
c. Tiếp tục so sánh khoảng cliênh lệch cúa nhóm có (n-2 , n-3, 2 ) sô"
trung bình. Cách làm và kết luận tưdng tự như đối với n số trung bình trên.
Đối với những phép so sánh klioáng chônii lệch giữa số lượng số trung
bìiih nhỏ hởn so với sốlượng số trung bìiih lởn h(in đã thực hiện thì chỉ thực
hiộn phép kiêiii tra khi mức độ cliênh lệch của só lượng sô trung bình nhiều
hơn dã kết luận là có ý nghĩa.
Lập b ản g tóm tắt vối mức (ỉộ 1'-1I hoặc 5% SN K và kết quả đó được sắp
xếp th eo trật tự tả n g dần theo (ỉộ lỏn và gạch chân các cặp sô' tru n g bình
mà sự sai khác không có ý nghĩa.

3. Úng dụng cho các loại thí nghiệm khác nhau

3.1. Loai thi nghiệm chỉ có môtyếu tỏ'


Hãy lây lại thí dụ 3.10 đã nêu Irên vê "sán lượng sữa bò ánh hưởng

93
bởi sử dụng bôVi loại thức ăn” để minh hoạ loại thí nghiệm chỉ có một ỉìhân
tô’ (bảng 3.23).
Bẩng 3.23. SLS của bò với bốn loại thức ăn khác nhau
Mâu thí nghiệm TA, TA, TA3 TA,

10 11 9 6
10 14 10 5
13 14 11 7

X 11 13 10 6

a. Tính giá trị sai sô'chuẩn SE


Công thức tính SE là:
SE= y Í 2 ^
= 0,816
vỏi DF = 8
trong đó:
- 2 "là sai sô'của bình phưdng trung bình;
- 3 là tần suất quan sát của mỗi mẫu.
b. Tra cứu bảng giá trị khoảng chênh lệch thí nghiệm có ý nghĩa nhỏ
nhất (LSSR) đối với khoảng chênh lệch của 2, 3, 4 sô'trung bình
Tại đây, có thể lấy mức độ sai khác có ý nghĩa ở mức 5%. Các số đó
được biểu hiện trên bảng 3.24.
c. Nhán LSSR với giá trị tinh toán SD của một giá trị trung binh để
xác định khoảng chênh lệch có ý nghĩa nhỏ nhất (LSR)
Các giá trị LSSR và LSR được biểu hiện tại bảng 3.24.
d. Sắp xếp các số trung bình theo một trật tự nhất định rồi thực hiện
những phép so sánh cần thiết
Bổng 3.24. Sô' frung bình và sự sai khác giũtì chủng

Nhóm mẫu sô' 4 3 1 2

Trung bình nhóm mẫu 6 10 11 13

94
So s á n h giá trị trung bình nhó nhât và lớn nhất với cả bôìi sô" tru n g
bìỉìh. Tại th í dụ Lrên, giá trị trun^ bìnli lởn ììhất (13) ở nhóm m ầu sô" 2 và
nlh) ỉih á i (6) ỏ n h óm mẫu sỏ 4. Sụ khác nhau dó là dộ chênh lệch cực đại vối
nlìôni có ‘1 giá trị trung bình. Độ chènh lệch cực (lại ỏ nhóm mẫu này là 13 -
6 “ 7. N h ư vậy, giá trị này lớn hơn giá trị 3,70 của LRS nên sự sai khác đó
có ý n g h ía.

N ôu chỉ so s á n h k h oản g chÔ!ìh lệch của ìilìóm có (n-1) sô^ tru n g bình thì
ở thí dụ trên có h ai khoảng chênh lệch là sự sai khác giữa m ẫu sô" 2 và 3 và
sự khác íìhau giữa mẩu sô^ 1 và 4. Giá trị sai lộclì giữa các sô" tru n g bình của
mầu sỏ 2 và 3 là 13 - 10 = 3 và giá trị này nhỏ hơn 3,30 của LSR vổi 3 sô"
tru n g b ình. N h ư vậy, sự sai khác này không có nghía. Trong lúc đó, sự sai
khác giữa các sô trung bình của mẫu số 1 và 4 là 11 - 6 = 5 và giá trị này (5)
> 3,33 n êu lên sự khác n h a u giữa chúng lả có ý nghĩa.

Đối với n h ữ n g giá trị trung bình liền kề tức là so sá n h hai s ố tru n g
bình, mức dộ ch ên h lệch phải lỏn hơn 2,66 tlù dược gọi là có ý nghĩa. N h ư
vậy, giữa giá trị tru n g bình mẫu sô 3 và 4 đưỢc biểu hiện rõ ràng có ý nghĩa
vế sự sai khác vì 10 - 6 = 4. Giá Irị này (4) > 2 ,6 6 nêu sự khác nhau giữa
ch ú n g có ý n gh ĩa.

Lưu ý rằng, đ ến đây k hông cán thực hiện thêm bâ't cứ một sự so sá n h
nào k hác nữa bơi vì n h ữ n g cặp giá trị trung bìiih liền k ề khác giữa 1 và 2
(K M 1=2) củ n g n h ư giữa 1 và 3 (11-10=1) khi đã đưỢc kết lu ận k h ô n g có sự
sai k hác ỏ trên giữa m ẫu sô' 3 và 2. Từ đó, có thể trinh bày b ằ n g b ả n g tóm
tát 3.25 vổi mức độ õ% SNK vổi kết quả đưỢc sắp xếp theo trật tự tăng đần:
B ắ n g 3 ,25 , Biểu thi mức độ sai khác 5% SNK

Nhóm mẩu số 4 3 1 2

Giá trị trung binh 6 10______u ______ 13

Cần lưu ý rằng, LSR đôi với một khoảng chênh lệch có hai sô" tru n g
bình thì g iô n g n h ư LSD.

3.2. Loạỉ thí nghiệm có hai yếu tố


Thí dụ 3,11, H ãy p h ân tích và so sánh bôn thành p h ần dinh dưõng
th ức án k h ác n h a u ở ba công ty A, B và c với kết quả được trình b ày tại
b ả n g 3.26.

95
B à n g 3.26. bốn thánh phẩn dinh dưỡng thức ân của ba công ty

Công ty A
DD, 0,83 0,39 0,66
DDj 3 15 247 2 75
Doà 0,70 1,09 0 ,8 0
DD, 2^92 1,86 2,90
Công ty B
DD, 1,90 3,14 2.77
DD; 4,47 3,89 4,19
DD3 3 43 1^86 262
dd] 3,25 355 3 85
Công ty c
DD, 1.95 1.34 3,06
DD, 3,65 4,25 3,11
DD3 2.47 •2.18 3,16
ddÌ 3.54 3,83 4,55

ghi chú:
- DD,, DDj. DDj và DD< là bốn thành phấn
dinh dưông thức ăn của ba công ty A, B và c

a. Tính giá trị trung bình theo mỗi thành phần dinh dưỡng của các
công ty khác nhau và biểu diễn trên bảng tương ứng của bộ sô liệu
B ả n g 3.27. Bốn thành phẩn dinh dưỡng thức ăn của ba công ty

Công ty Thành phẩn dinh dưỡng X công ty


thức ăn

DD, DD, 0 D3 DD,

A 0,627 2,790 0,863 2,560 1.710


B 2.613 4 183 2.637 3,550 3.246
c 2.11 3.670 2.603 3.973 3.091

X 1.786 3,548 2.034 3,361 2,682= X

b. Tính tống các bỉnh phương


CF = 36 X 2,862^
= 258,834
ss,ổ„, = 0,83=" + 0,39^ +0.66-' +4,55'-' - 258,834

96
= 17,:^')]
l ) F = tô n g sô sô l i ệ u (n) - 1
= 3(i - 1
= 3f,

ss„„ = 9(1.78(r+ - 258,834


= 21,9.12
DF|,I) = sô loại (linh dưỡiig - 1
= 4-1
= 3
s s ,,,= 12( 1J 10' + 3,246- + 3,091-) - 258,834
= 17,111

= sô c ô n g ty - 1
= 3-1
=2
SSu„„.,„u = 4 0 , 6 1 4 - 2 1 , 9 4 2 - 17,111
= 1,Õ6

tó<- “ ^ ^ ^ tlin h (ỈIHỈHK

= 2x3
=6
ss,,,„-, = 47,391 ■40,614
= 6,777

DF = DF„-„„ - ....
= 35 - 11
= 24

c. Lập bảng anova tống hợp


B ả n g 3 .2 8 . Anova về bốn thành phấn DD thức ân của ba công ty
N^uón biến DF ss MS FP

Gứa các OD 3 21.942 7,314 25,94 p< 0.001


Gửa các công ly 2 17,111 8,556 30 34 p< 0,001
ĨLdng tác (DDxCty) 6 1,561 D.260 0,92 p >0 1
Scì số 24 6,777 0,289
Teng 35 47.391

97
d. Nhận xét
■F tính giữa các dinh dưỏng (25,84) vâi DF = 3 nên nó lớii hơii giá trị F
của bảng vỏi DF = 3 và 24 (7,55) d mức p=0 ,0 0 1 .
• Tương tự, F tính giữa các công ty (30,34) với DF = 3, như vậy F giữa
các công ty lốn hơn giá trị F của bảng vói DF = 2 và 24 (9,34) ớ niức
p=0 ,0 0 1 .
- F của các tương tác nhỏ hớn 1 nên các tương tác không biểu thị sự sai
khác rõ rệt.
Vì vậy, giữa các thành phần dinh dưỡng thức ãn và giữa các công tv
biểu thị sự sai khác rất rõ rệt hay sự sai khác giữa các thành phần diiih
dưởng thức ăn và giữa các công ty có ý nghĩa rất lổn. Trong lúc dó, giữa các
tương tác không biểu thị sự sai khác rõ rệt có thề do sự sai khác giữa các
loại dinh dưâng khá bền vững ỏ trong mọi công ty.
e. Lưu ý
■Loại thí nghiệm này có hai nhân tô"chính đó là các thành phần dinh
dưởng thức ăn và các công ty.
- Nhân tô”chính “dinh dưỡng” được biểu thị theo cột và nhâĩì tò’ (íhinh
“công ty” được biểu thị theo hàng.
- Tương tác là cách viết ngắn gọn của “tương tác giữa các công ty và các
thành phần dinh dưông thức ăn”.

4. Kết luận
Như vậy, phương pháp kiểm tra SNK có thề được sử dụng đói với
những thí nghiệm có nhiều cặp trung bình nhàm so sánh về khoảng chônh
lệch mà khoảng chênh lệch của chúng biểu hiện theo kiểu liên tục, có nghĩa
là khoảng chênh lệch liên tục từ k, k-1 , k-2 ,..., k-n của hai sô" trung bình
liền kể sẽ được kiểm tra theo một trật tự nhất định đó.

III. PHƯƠNG PHÁP KIỂM TRA DUNCAN

Phương pháp kiểm tra bằng bội sổ khoảng chênh lệch của Duncan là
một sự thoả hiệp giữa bất kì hai sô”hạng đầu và cuổì của tập hợp sô" trung
bình.

1. Khi nào sử dụng phương pháp này?


Phương pháp kiểm tra bằng bội số khoảng chênh lệch của Duncan

98
cũiig {!ưực dựa trên ngu3'ên lí cluiiig của phương pháp kiểm tra bội số
klioiiiiịi: chrMìh lệch thí ngh iệm và các bước tiến hành c ủ n g tướng tự n h ư đôi
VUI pliiíơng pháp kiểm tra SNK, Phương Ị)háp kiêin tra bằng bội sô* khoảng
cách cùa D u n can du y chỉ có niội (ìiểiii khác VỎI S N K là ở dây b ảng k h o ả n g
chênh lệch nghiên cứu có ý nghĩa nhò nhíVt (LSSR) sẽ được dùng riêng cho
phép kiôiii tra D u n can . B ản g tra cứu khoảng chênh lệch n g h iên cứu có ý
n gh ĩa nhổ n h ấ t được trình bày ở phần phụ lục.

2. Thí dụ minh họa


V('ii thí dụ 3.10 đã nêu trên đây vê "sảnlượng sữabò khi sửdụng bốn
loại ihức ăn khác nhau” dược dùng lại đê minh hoạcách tính toánvà cách
sử d ụ n g phương pliáp kiêm tra Duncan.

2.1. Các bước tinh


a. Tinh giá trị sai sô chuấn SE từSD của sô trung bình
Còng thức tính SE như sau:
SE = \ / ^ 3
= 0,816
trong đó:
2- ià sai sô của bình phương trung bình;

3 là tầ n s ố q u an sá t của mỗi mẫu.

Tại thí nghiệm này, DF = 8


b. Tra bảng giá trị khoảng chênh lệch thí nghiệm có ý nghĩa nhỏ nhất
(LSSR) đôi với khoảng chênh lệch của 2, 3, 4 sổ trung bình tại bảng
Duncan theo các mức độ tin cậy khác nhau (0,01 và 0,05)
Tại dây, thí dụ lây mức độ sai khấc cố ỷ nghía ò niửc p=5%, các giá trị
đó được biểu hiện bảng 3.29.
B á n g 3.29. Giá trị LSSR có 2, 3, 4 số trung bình vối p=0,05
Số lượng sô' trung bình 2 3 4

LSSR 3,26 3,39 3.47

c. Nhân LSSR với giá trị tinh toán SE để xác định khoảng cách có ý
nghĩa nhỏ nhất (LSR)
Kết quả cụ th ế được trình bày tại bảng 8.30.

99
B ắ n g 3.30. Glá trị LSSR và LSR ờ mức p=0,05
Sô' lưọng số trung bình 2 3 4

LSSR 3,26 4,04 4,53


LSSR X SE = LSR 2,66 2,77 2,83

d. Sắp xếp các số trung binh theo một trật tự nhất định rồi thực hiện
những phép so sánh cần thiết ( bảng 3.31).
B ả n g 3.31. So sánh SLS trung binh khi sử dụng bốn loại thức ăn
Mẳu số 4 3 1 2

10 11 13

So sánh giá trị trung bình nhỏ nhất và lớn nhất vối cả bôn sô tning
bình. Trong thí dụ trên, giá trị trung bình lỏn nhất là ở mẫu số 2 (13) và
nhỏ nhất là ở mẫu sô' 4 (6 ). Sự khác nhau đó là dộ lệch dối vổi nhóm eủa
bốn giá trị tru n g bình đó là 1 3 - 6 = 7. N h ư vậy, giá trị n.ày lớn hơii giá trị
2,83 thu được ỏ bảng Duncan ỏ mức tin cậy p = 0,05, nên sự sai khác đó có
ý nghĩa.
So sánh khoảng chênh lệch của nhóm có (n-1 ) số trung bình. Nếu chỉ
so sánh khoảng chênh lệch của nhóm có (n-1 ) sô' trung bình Ihì ơ thí dụ
trên có hai khả năng, đó là sự sai khác giữa mẫu số 2 và 3 và sự khác nhau
giữa mẫu số 1 và 4. Độ lệch giữa các sô trung bình của inẳu sô 2 và 3 là 13 -
1 0 = 3 và giá trị này lớn hđn 2,77 của LSR vối ba số trung bình. N h ư vậy,
sự sai khác này có nghĩa. Đồng thời, sự sai khác giữa các sô’ trung bình của
inẫu sô' 1 và 4 là 11 - 6 = 5 cùng lổn hớn 2,77 nên cũng có ý nghĩa.
So sánh khoảng chênh lệch của hai số trung bình liền kể. Đói với
những giá trị trung bình liền kề tức là so sánh hai số trung bình, mức độ
chênh lệch phải lốn hơn 2,66 thì có ý nghĩa. Như vậy, giữa giá trị triing
bình mẫu sô"3 và 4 được biểu hiện rõ ràng có ý nghĩa về sự sai khác vì 10 -
6 = 4 và giá trị này 4 > 2,66.

Khác với phường pháp kiểm tra SNK, ở phương pháp kiểm Ira Duncan
cần có sự so sánh giữa những cặp giá trị trung bình liền kề nhau giữa 1 và
2 : (13 - 1 1 = 2 < 2 ,6 6 ) cũng như 1 và 3 ( 1 1 - 1 0 = 1 <2 ,6 6 ). Tuy sự sai khác
giữa chúng không có ý nghĩa nhưng phải thực hiện hai phép kiểm tra Iiày
vì giữa mẫu sô' 3 và số 2 đã được kết luận có sự sai khác ở trên.
Từ những kết quá đó, có thể trình bày theo trật tự tăng dần của cáo sô'

100
iruỉiK bình theo b ản g tóm tát của plìúơiỉg pháp kiốiiì tra D u n can và k ết quả
so sánlì của ch ú n g (bảng 3.32).

B á n g 3.32. K ế í q u ả c ủ a p h ư ơ n g p h á p k iể m tr a D u n c a n
M ẩu TA TA, TA, TA, TA^

G iá tr ị t r u n g b in h 6 10________ 1 1 13

2 .2 . Kết luận
N h ư vậy. th eo phương phấỊ) kiôni tra của D u n can thì sự sai khác giữa
các sò trung bÌ!ih của nhóm lììẫu TA sỏ 3 và-sô 2 cùng có ý nghĩa chứ không
như kôt quâ của phép kiểiiì tra SNK dà thực hiộn trước đây là không có sự
sai khác rõ rệl.

IV. PHƯƠNG PHÁP KIỂM TRA BONPERRONI

P h ư ơ ììg p h á p k iế m tra của Bonỷerroni c ù n g là một trong những


p h ư ơ n g p h á p k iể m tra b ằ n g bội sỏ so sá n h críc sô tr u n g b in h với n h a u
nhưng với yêu cầu dề thực lìiệii niộl loạt cặp so sánh nhất định. Các bưỏc
tiến hành của phương pháp kiểm tra Boníerroni cùng tương tự như phương
pháp kiổni Ira LSD.

1. Khi nào sử dụng phương pháp này?


Khác với phương pháp kiểm tra LSD, giá trị t ở phương pháp kiểm tra
LSD là giá trị t ửng với một DF nào dó và ơ một mức độ tin cậy p nào đó thì
tại phươĩig pháp kiểm tra Bonícrroni, giá trị t sẽ biến đểi đối với bất kì một
dộ lự do iiào dó và vói mỗi giá trị p dã hiộu chỉnh theo số lượng số cặp
ining bìiìih so sánh yêu cầu dế plìừdỉìg ịúìằị) kiếm tra thực hiện một loạt so
sáìih nhâ't (lịnh. Như chúng ta dã biêt, khi có một số mẫu nhắt định (k) thì
có thê xác định dược những cập so sánh tương ứng. Sô" cặp so sánh có thể
lín h đưỢc b ằ n g côn g thức k (k-l)/2, kết quá dược trình bày tại b ản g 3.33.

B ả n g 3,33. S ố cặp s o s á n h đ ố i v ớ i s ố m ẫ u t h ỉ n g h iệ m
S ố m ẫ u th í n g h iệ m 2 3 4 5 ... k

S ốcăpsosá nh 1 3 6 10 ... k(k-1)/2

Với mức độ tin cậy p = 0,05 ihì t của LSD sử đụng với giá trị p = 0,05

101
nhưng giá trị p áp dụng cho phương pháp kiểm tra Boníerroni sẽ được tỉnh
như sau:
p _ Po.o:-)
^ íỉ<>nffnoni
k (k -l)/2
Thí dụ, nếu k = 4 thì có thế có tâ”t cả sáu phép thử giữa các cặp giá trị
trung bình được kiểm tra.

2. P h ư ơ n g p h á p tín h

Nếu mức độ tin cậy p = 0,05 đã đưỢc chọn, giá trị đã thu đưdc đối
với mức độ tin cậy là:

p _ p0,05

= 0,05/(4(4-l)/2]
= 0,0083
Nếu mỗi phưdng pháp so sánh thực hiện vối sự liều lĩiih mạo hiêm này
sẽ dẫn đến mạo hiểm tổng thể đối vối tất cả fcác phưđng pháp so sánh ở mức
độ 5%. Những giá trị không đòi hỏi là phải thường xuyên đầy đủ từ các
bảng t chuẩn nhưng có thể có được một cách dễ dàng bằng cách sử dụng
chương trình phần mềm mỉnitab.
ĐỐì vối thí dụ trên, vồi mức độ tin cậy p ở mức 0,05 và DF = 8, thì
giá trị P|k.nf.irom là 0,0083. Như vậy, vối t bảng đối vối sáu cặp so sánh là
3,48 thì phưđng pháp kiểm tra này sẽ được thể hiện như sau;
Bonferroni 5% LSD = 3,48 >/2x2/3
= 4,02
Cũng sắp xếp các số trung bình theo trật tự nhất định như các phương
pháp trên đây và tìm các sự sai khác giữa những cặp trung bình rồi đeni so
sánh vái giá trị Boníerroni 5% LSD là 4,02. Giá trị nào của độ lệch giữa hai
số trung bình nhỏ hơn giá trị 4,02 thì sự sai khác giữa chúng không có ý
nghĩa và giữa chúng sẽ đưỢc nôì vói nhau bằng một gạch chần. Kết quả đó
được trình bày như sau:
- giữa mẫu số 4 và 3 -> 10 - 6 = 4 < 4,02: sự sai khác trên không có ý
nghĩa;
- giữa mẫu sô' 4 và 1 -> 11 - 6 = 5 > 4,02: sự sai khác trên có ý nghĩa;
- giữa mẫu SỐ4 và 2 13 - 6 = 7 > 4,02: sự sai khác trên có ý nghĩa;

102
■ giữa mẫu sô 3 và 1 -> ] 1 - 10 = 1 < 4,02: không có ý nghĩa của sự sai
kháo:

• giữa mẫu sô 3 và 2 -> i;ỉ - 10 = 3 < 4,02: không có ý nghĩa của sự sai
khác;

• giữa mẫu số 1 và 2 13 - 11 = 4 < 4,02; không có ý nghĩa của sự sai


khác,
Từ đó, có thế rút ra kết luận Iihư dã trình bày tại bảng 3.34.
Bàng 3.34. Kết quà cùa p h ư ơ n g p h á p k iể m tra Boníerroni
Mầu s ố thứ tự 431 2

Giá trị trung bình 6 10 11 13

Sô’ lượng các cặp trung bình niẫu đê sử dụng phưdng pháp so sánh
thoo phương pháp Bonferroni có thể đưỢc hình thành từ một số cặp k số
tn in g bìiih là k(k -l)/2.
Với mức độ tin cậy 5% và sáu cặp sô trung bình so sánh, giá trị t bảng
đưỢc thoả mãn vối phép kiểm tra chỉ dùng một đuôi của đưòng cong phân
bò chuẩn là 0.0Õ/6 - 0,0083. Nhưng nếu sử dụng cả hai đuôi của đường
cong phân bô chuẩn thì diện tích phần đuôi đó sẽ là 0,0083/2 = 0,00416.
Như vậy, phía bên trái của giá trị t đòi hói là 1 - 0,00416 = 0,995833. Tại
dây, người ta cỏ thể sử dụng chương trình phần mềm minỉtab để so sánh.
Giá trị t tính được theo chương trình phần mèm mỉnỉtab là 0,995833. Giá
trị này dũng bằng giá trị vừa tính được ở trôn đây.

V. S Ọ S Á N H CÁC P H Ư Ơ N G P H Á P KIÉM tra


B Ằ N G BỘ I S Ố KHÁC N H A U

Nếu dầy đủ các phưđng pháp kiểm tra vể các cặp trung bình đưỢc thực
hiện, một diều hiển nhiên rằng inột hoẠc nhiều phương pháp kiểm tra sẽ có
ý nghĩa khác nhau. Sử dụng lại thí dụ trên ‘'sán lượng sữa của đàn bò sữa
ăii bôn loại thức ăn khác nhau” đê so sánh các phướng pháp kiểm tra khác
nh:‘U vơí k = 4 và p = 0,05.
1. Phương pháp kiểm tra LSD cần phải thực hiện;
•kiêm tra Pi = ụ< với p = 0,05;
- kiêni tra ụ I = p i với p = 0,05;

103
- kiểm tra Pi = pI với p = 0,05;
- kiểm tra ~ p i với p = 0,05;
• kiểm tra ụ.2 = Pi với p = 0,05;
- kiểm tra P:i = ụ 1 với p = 0,05.
Vậy, khả năng không có bất cứ niột cặp so sánh giữa hai riô trung bìiih
nào trong số đó có ý nghĩa là (0,95)‘‘. Do đó, xác suất đô có ít 11 hất inộl cặp
so sánh có ý nghĩa là 1- (0,95)*’ = 0,265. Vì vậy, mức dộ trệch xa thí ngliiộni
giá trị p là 0,265 chứ không phải 0,0õ. Do vậy, phương pháp kiem ti a LSD
là rất tự do theo nghiâ phương pháp kiểm tra đó sẽ tìm được nliiỏu sự sai
khác hđn so vối thực tế có.
2. Phương pháp kiêm tra S N K và Bonferroni thì dêu sứ (lụng cho Iiiột
thí nghiệm có dung lượng mẫu lớn vói giá trị P'chứ không phai chỉ ửng
dụng cho sự so sánh giữa các cá thế với nhau. Đó là hai phướng pháp báo
thủ, có nghĩa là chúng sẽ mất đi những sự sai khác mà trong thực tế có thổ
tồn tại.
3. Ẹhương pháp kiểm tra bội s ố khoảng cách Duncan là một sự thoả
hiệp giữa bâ”t kì hai sô" hạng đầu và cuôì nào của tập hỢp sô trung bình.

4. Tóm lại, các thí nghiệm nghiên cứu trong lĩiìh vực sinh học khi có
nhiều nhân tô" hay nhiều nhóm mẫu cần so sánh thì sau khi t hực hiện
những phép tính cơ bản trên các mẫu như tần số, giá trị trung bình, sai sô
chuẩn, ... cần thiết thực hiện phép phân tích phương sai và các phương
pháp kiểm tra thốhg kê khác. Giả thiết bao trùm chung là P| = ụ_, = ... = P|(
thì phải hình thành những phưđng pháp kiểm tra bằng bội sô so sáiih nêu
phương pháp kiểm tra t khi so sánh hai số trung b'mh vối nhau hoặc F ở
phân tích phương sai có ý nghĩa, có nghĩa là giả thiốt Pi = |1 . = = Pis khôiig
được chấp nhận.

Thi dụ minh họa


Thí dụ 3.12. Sản lượng sữa (SLS) bò tVung bình hằng ngày (kg/ngày)
của bốn nhóm giống 1: HF; 2; l/2HFxl/2LS; 3; 3/4HFxl/4LS và 4:
5/8HFx3/8LS và mỗi nhóm giống có bôn con, thu được tại một đàii bò cao
sản nuôi tại Trung tâm nghiên cứu bò và đồng cỏ Ba Vì được trình bày tại
bảng 3.35.

104
Bảng 3.35. SLS của bốn giống bò cao sàn ờ Trung tâm BaVi
Giống bò SLS (kg/ngày)

1.(HFj 32.03
2. (1/2HFx1/2LS) 27,66
3. (3MHFx1/4LSj 30,40
4. (5/8HFx3/8LS) 23,18

(^ua báng phân tích 3.35 có thổ khẳng dịnli SỊÍ sai khác có ý nghĩa ở
mức 1^<0,05. Giá trị F thông kẽ c h o |)hé|) k iế m tra Pi = = ụ.í = M|. Như
vậy. KÌíi thuyết không (Hi,) không có sự kháo nhau giữa các giông bò này đã
bị loại hó. Dồng thài, ơ bảng phân tích phương sai cũng đã xác định được
sai sỏ ciia trung bình bình phương là 7,032, SE = 1,326, DF = 6 và n = 4. Sử
dụiig mức dộ tin cậy p = 0,01 cho tất cá các phương pháp kiêm tra khác
Iihau nli.ằin so sánh kết quả của các phưđng pháp kiểm tra đó. Kết quả cụ
t h ê t h u d iíd c c ủ a t ừ n g p h ư đ n g Ị)há|) Iihư sa u :

1. Phiíơng pháp kiềm tra LSD

1.1. Cách tỉnh cụ thế như sau


1 % 1-SD = 3,71 X / 7 .0 3 2 x 2 /4

= 6,96
Như vậy, dộ lệch giữa bất cứ cặp trung bình nào lớn hơn 6,96 thì sự sai
khác ấy dêii có có ý nghĩa đôi vổi Ị)hư<jiig pháp kieni tra LSD. Biểu thị kết
quá Irên báng 3.36.
Bảng 3.3Ổ. S I S của bốn giống bỏ kiểm tra theo LSD
Giống bò 4 2 3 1

SLS trung binh 23.18 27.66 30.40 32.03

1.2. Kết luân


«

Bằng phương pháp kiểm t ra r‘íi LSD cho thấy SLS giữa giôVíg bò 2 và
4 cũng như SLS giữa giống bò 2, 3 và 1 không có sự sai khác dáng kể. Thê
Iihư ng , SLS giữíi nhóm giông bò 3 và 4 hoặc 1 và 4 có sự sai khác rõ rệt ở
niức ị)<0,01.

105
2. P h ư ơ n g pháp k iểm tra SNK

2.1. Cách tinh toán cụ th ể như sau


vỏi DF = 6, kết quả tính LSSR và LSR được trình bày cụ thê tại báng
3.37.
Bảng 3.37. Giá trị LSSR và LSR
Sổ lượng số trung binh 2 3 4

LSSR 5,24 6,33 7,03


LSR 6.948 8.394 9,322

Đê thực hiện phép kiềm tra, trưóc hết cần xác định giá trị LSI) ó mức
1% tin cậy. ở đây, giá trị chênh lệch lớn nhâ't là 32,03 - 23,18 = 8,85. Như
vậy, giá trị này nhỏ hơn 9,322 sử dụng cho phương pháp kiểm tra cỏ bôn sô'
trung bình giữa các giông bò trên không biêu hiện sự sai khác đáng kê vê
SLS. Do kết quả không có ý nghĩa sai khác này nên không cần thiết thực
hiện các cặp kiểm tra còn lại cho bất kỳ ba- số trung bình nào. Kếl qua đó
được trình bày ỏ bảng 3.38.

Bảng 3.38. Kết quà của phưong pháp kiểm tra SNK (1%)
Giống bò 4 2 3 1

SLS 23.18 27,66 30.40 32,03


trung bình --------------------------------------------------

Bằng phương pháp kiểm tra 1% SNK cho thấy SLS giữa các giống bò 1,
2, 3 và 4 không biểu hiện ý nghĩa của sự sai khác.

2.2. S ử d ạ n g p = 0,05 đ ể so s á n h
Như vậy, rõ ràng có một sự thiếu đồng bộ trong phép so sánh ở đây là ỏ
phép phân tích phưđng sai trưốc đây đă sử dụng p = 0,05 nhưng ở đây lại
dùng p = 0,01 cho việc thực hiện phương pháp kiểm tra SNK. Vì vậy, dẫn
dến sai lệch về kết quả. Giả sử cũng sử dụng p = 0,05 để kiểm tra, liệu kết
quả sẽ ra sao? Hãy xem xét kêt quả kiếm tra vổi niức tin cậy p = 0,05 ở
bảng 3.39.

106
Bắng 3.39. Giá trị LSSR va LSR của 2 3 và 4 số trung binh
Sô' lưọng 2 3 4
sô trung bình

LSSR 3,44 4,34 4,90


LSR 4.588 5,755 6,49

So ĩiáiih các sự chênh lệch vỏị LSR, cụ ihô tíiih nhu sau:

32.03 • 23,18 = 8,85 > 6,497 sai khác có ý nghĩa;


32.03 - 27,66 = 437 < 5,755 sai khác không có ý nghĩa;
30.04 • 23,18 = 7,22 > õ.ĩõõ íiai khác có ý nghĩa;
27,66 - 23,18 = ‘Ị 48 < 4,588 sai khác không có ý nghĩa.
Kêt (]uá dược trình bàv tổ n g hỢ|) ỏ bíing 3.40.

Báng 3.40. Kết quả của phương pháp kiểm tra SNK (5%)
Giống bò 4 2 3 1

SLS
trung binh 23,18 27,66 30,40 32,03

2.3. Kết luận


Bằng phương pháp kiểm tra 1%SNK cho tliấy SLS giữa các giốhg bò 1,
2, 3 và 4 không có ý nghĩa về sự sai khác. Trong ỉúc đó, nếu dùng phép
kiểtn tra SNK nhưng ở mức độ tin cậy là 5% cho thây SLS giữa giôVig bò 2
và bò 4 cũng như SLS giữa nhóm giống bò 2, 3 và 1 không có sự sai khác
dáng kế. 1'hê nhưng, SLS giừa nhổm giồng 1)0 3, 1 và giòng 4 có sự sai kháo
có ý nghĩa rõ rệt p < 0,05.

3. Phương pháp kiểm tra Duncan


Các biíóc tính toán tiến hành ờ phương pháp kiểm tra bằng bội sô”
khoảng chênh lệch của Duncan tương tự ahư phép kiểm tra SNK, vối Dĩ*’ =
6 và SE = 1,326.

3.1. Tính các giá trị LSSR vá LSR

107
Bảng 3.41. Giá trị LSSR và LSR Iheo phuang pháp Duncan
Số lượng sô trung bình 2 3 4

LSSR 5,24 5,51 5,65


LSR 6,948 7,306 7,492

3.2. So sánh các độ lệch giừa các cặp trung bỉnh với LSR
32.03 • 23,18 = 8,85 > 7,492: sai khác có ý nghĩa;
32.03 - 27,66 = 4,37 < 7,306: sai khác không có ý ỉiplìĩa;
30.04 • 23,18 = 6,86 < 7,306: sai khác không có ý Iighìa.

Kêt quả trình bày cụ thê ở bảng 3.42


Bảng 3.42. Giả Irị LSSR và LSR theo phương pháp Duncan (1%)
Giống bò 4 2 3 1

SLS trung binh 23,18 27,66 30.40 32,03

3.3. Kết luận


Bằng phướng pháp kiểm tra 1% Duncan cho thấy SLS giữa các giống
bò 1, 2 và 3 củng như giữa các giông bò 2, 3 và 4 không có ý nghía vế sự sai
khác.

4. Phương pháp kiểm tra Bonferroni

4.1. Cách tinh


Phương pháp kiểm tra bàng bội sô”so sánh khoảng chênh lệch các sô
Irung bình của Bonĩerroni dược tính theo công thức sau:
Boníbrroni 1% LSD = 5,3982 X/ 2 X7,032/1
= 10,122
= 0,01/6
= 0,00167
5,3982
I*=(),(M)1(!7 ■"

Độ chênh lệch lốn nhất giữa các sô* trung bình là 32,03 - 23,18 = 8,85.
Như vậy, với phương pháp kiểm tra Boníerroni 1% LSD thì độ lệch lỏn nhất
(8,85) < 10,122. Kết quả được trình bày cụ thể ở bảng 3.43.

108
Bảng 3.43. Giá trị LSSR và LSR theo phương ptiáp Boníerroni (1%)
Giống bò 4 2 3 1

SLS trung bình 23.18 27,66 30.40 32,03

4.2. K ết lu â n «

liiiiig p h iíc ỉn g p h á p k ic in t i a i?(iiif'orroni 1 ' m i L S I) c h o t h ấ y g iữ a các


g iỏ n g 1)) 1, 2. 3 v à 4 k h ô iig có ý n g h ĩ a sai k h á c vổ S L S .

c. PHƯƠNG PH Á P KIỂM TRA BẲNG s o s á n h t ư ơ n g


PHẢN

I. KHI NÀO NÊN DÙNG PHƯƠNG PHÁP KIỂM tra BẰNG so


SẢNH TƯƠNG PHẢN?

KI i các mầu của nhâiì tô thí nghiệm có mang dộc tính tự nhiên trong
sự ph<â I nhóm hoặc có sự sấp xếp theo một trật tự nhất định về liều lượng
như th nghiệm về liều dùng của các loại thuốc, việc nghiên cứu về sự sai
kiiác gùa các sô trung bình bằng cát; |)hươiig pháp kiểm tí a so sánh như
ijSf) ii(ặc SNK nêu trên là không Ị)h iú nhữiig ị)hương pháp tô*t nhỉVt. Trong
n h ũ ìig Li ưòng hỢp ấv, cấu trúc cúa các nhân tó thí nghiệm sẽ đòi hỏi sự so
sánh r:êng về mức độ cần thiết phái đưỢc XOIII xél ỏ giữa các giá trị trung
bìnli. Mũíng phương pháp kiếm tra rièng biộl dó là phương pháp kiếm tra
bằng S( sánh tương phản. Gia sử, tại inột thí nghiệm ta có:
Miu sỏ 1: với tần suất quan sát H| và gia Irị truiig bình X|,
M a u s ố 2 : v ớ i l ầ i i s u ấ t q u a n ;sál ii,; và g i á trị irung bình x^,

Mui sô k: vỏi tần su ất quan s;'it I1|^và giá tiị Iriiiig bình X|(,
Nìiư vậy, giá trị X|, X2 , X|, tính dược của các mẫu 1,2, k là Pị, ụ,.
'J|, cia quần thể và phướng sai chung 0 - tính toán bỏi gộp các phưđng sai
niẫu s- (sai sô'bình phương trung binh: EMS).

II. TH Dự• MINH HỌA


*

C( thê sử dụng lại sô’liệu thi dụ 3.10 của một thí nghiệm “SLS bò khi

109
ăn bôn loại thức ãn khác nh au” dã đưỢc nêu ở trên dê áp dụng ph âii tích
cho các phương pháp kiểm tra so sánh bằng tương phản.

1. P h ư ơ n g p h á p tín h

1.1. Kết quả của thi nghiệm


Kết quả của thí nghiệm và các bưóc phân tích tính toán dvídc ihê hiện
qua bảng 3.44.
Bàng 3.44. Tóm tắt sô' liệu vá giá trị trung binh
Mẫu TA, TA; TAj TA,

SLS 10 11 9 6
10 14 10 5
13 14 11 7

X 11 13 10 6

1.2. Các bước tinh toán cụ# th ể


Các bước tính cụ thế làm tướng tự như đã trình bày tại các phần trước
đây, kết quả phản tích phướng sai được trình bày tại bảng 3.4Õ.
Bâng 3.45. Anova vé SLS do ăn bổn loại TA khác nhau
N g u ^ biến DF ss MS Fp

G iC tìcácm ẫu 3 78 26 13 0 .0 0 K P < 0 .0 0 5
Trong các mẳu 8 16 2
Tổng 11 94

2. P h â n c h i a k ế t q u ả ra b a k h ả n ă n g đ ể s o s á n h

Sử dụng lại thí dụ về sử dụng bốn loại thuốc thuộc hai nhóm kháng
sinh (mẫu 1 và 2) và sunía (mẫu 3 và 4) để so sánh theo ba khả năng cụ thê
sau đây. Giả thuyết rằng, số liệu trên đây thu được từ kết quả một thí
nghiệm với bốn loại thuốc khác nhau, trong đó loại thuổc 1 và 2 là kháng
sinh và loại thuốc 3 và 4 là thuộc nhóm thuốc sunfa. Tại thí nghiệm này,
đòi hỏi phải tiến hành ba loại so sánh khác nhau về loại thuốc 1 và 2 thuộc
vào nhóm thứ nhất, loại thuốc 3 và 4 là một nhóm khác và phải so sánh
được hai nhóm thuốc kháng sinh và sunfa có sự sai khác không? Cụ thể ba
loai so sánh đó là;

110
2.1. So sánh giùa hai nhóm kháng sinh và sunfa
Đê llìực hiện việc so sán h giùa hai nhóni niẫu nảy, trưỏc hết phải gộp
s ố liộu của h a i m ẫ u đ ầ u t h à n h một nlìóin va sỏ liộu ha i m ẫ u s a u t h à n h một
nhom khác và như vậy mỗi nhóm có sáu sc/ liệu quan sát. Tại dây, phân
tích phương sai sè thực hiện theo niò hình thí nghiệm có hai nhân tô đó là
hai nhctn mẫu. Những giá trị truiìg bình và kết quá so sánh dược trình bày
tại báníĩ 3.46.
Bàng 3.46. Giả trị trung bình va kết quả so sánh giữa hai nhóm
Mẩu số 1 2 3 4 X JÓ,KJ

Trung bình mẫu JJ______ 13 10______ 6


Trung bình nhóm 12 8
Trung binh tổng 10

('á ‘ bước cơ bán đê xây dựng báĩig anova tính theo mô hình hai nhóm
niẫu: teng bình phương giữa các nhóm mẫu là:
ss„,„.. ........ . =6 (12'^+ 8'-')- 12x10'^
= 48
Vó; DF = 1, như vậy trung bình bình phương cũng chính là giá trị tống
bình phương các trung bình = 48. Giá trị F dược tính bằng cách chia bình
phươnị. trung bình giữa các nhóm mẫu cho bình phương trung bình trong
các nhciii mầu (sai sô*) được xác định lừ báng anova.

= 48/2
= 24
G ii th u yết đế kiểm tra sự s.ni khác giữa hai sô" trung bình của nhóm
thuốc klìánK sinh và sunfa (H„) liệu chúng có tương tự giông nhau không;

2~ ’ 2 '
Tù công thức đó, có thể chuyển hoá chúng như sau:
Hu: PI+ ụ. - P:, - ụ, = 0
Biìu thức P|+ ]J2 * p.t • P| lồ một thí dụ vê sự so sánh tưđng phản các
giá trị Irung bình troiig một quần tliể. Nó là inột kêt hỢp tỷ lệ thuận về
những ?iá trị trung bình và các hệ số đứng trước các giá trị Pi đó (1, 1 - 1, -
1). Nlìi vậy, tưđng phản trèn sẽ là:

111
Pl \h P:! Pl
+1 +1 -1 -1
a._, a:, a.
Định nghĩa: sự kết hỢp tuyến tính của các sô' trung bình Sa,ụ, là một
tướng phản nếu Eai = 0.
Tương phản trên là: aiHi + a.,ụ, + íiiP , + aiP,;
có nghĩa là: (+l)pi + (+l)ụọ + (-l)ụ.i + (-l)Pi;
2a. = (+l) + (+l) + (-l) + (-l) = 0
Như vậy, P| + - P;ị - ỊJ| là một tưđng phản, cần lưu ý rầng, clỏ có niột
tương phản thì điều kiện bắt buộc là Sa, = 0.
Một số cấu trúc khác có thề đưỢc tạo thành vê sự so sánh iương pháii
trong nhóm bốn giá trị trung bình trên là:
+ p,+|j.,+Mì-3ụi, các hệ sô’ tương ứng: 1, 1, 1, -3,
+ Pị- ụ.„ các hệ sô’ tưđng ứng: 1,-1, 0, 0,
+ 2pi - ụ._. - ụ.i, các hộ số tưđng ứng: 2(1), -1 , -1, 0,
+ 50p|-48p2-P:i-lJi. hệ sô' tương ứng: 50(1), -48(1), -1,-1.
Rõ ràng, mỗi sự kết hợp tỷ lệ thuận của các giá trị trung bình, Ea,ụ, ià
một tương phản nêu 2a, = 0. Tương phản Ea,ụ, được tính toán bỏi ccác tư(Jng
phản tưđng ứng của các trung bình mẫu theo công thức:
Y = 2a, X, là giá trị tính toán của Ea,p,
Giả thuyêt không H„: Sa,li, = 0 sẽ bị hoài nghi nếu giá trị Y = Sa, X,
cách xa 0,00 niột cách thỏa đáng. Tồng của các bình phương tưđiig ứng dôi
vỏi tUdng phản có thê dưỢc tính như sau:
nY^
ss =

trong đó:
- Y = 2a,x,;
- n là tần suâ*t quan sát của mỗi mẫu.
Giả thuyết trên được kiểm tra bởi giá trị tính toán p* biểu thị theo công
thức sau:

112
p

M S sai
, , so

Phần tử sô" của F có Đ¥ ~ 1. Đầy là một kếl quả chung. Giá trị s s đổi
với bíVt cứ tương phản nào đêu có DF = 1. Cần lưu ý rằng, tương phản
ihuòng xuyên sử dụng để so sánh hai nhóm inẫu với nhau, giá trị trung
bình có hệ sô dương được so sánh với n h ữ n g giá trị trung binh có hệ số âm,
Trơ lại với th í nghiệm so sánh hai nhóm thuôc kháng sin h và sunfa mà
c h ú n g t a d ã n h ậ n t h â y r ằ n g t ư ơ n g p h ả n t h í c h hỢp là Ịjj + ụ.> - ụ.ị - ụ ị. Tương
p h á n t!’ỏiì có:

Tương phán X, X Xj
a, (+1) (+1) (-1) (-1)

Như vậy, giá trị Y được tính theo công thức sau:
Y = (+1) X 11 + (+1) X 13 + (-1) X 13 + M ) X 6

=8
Tống các bình phương tương ứng đôi với tương phản là:
nY'^
ss =

3x8“
1- +1“ +(-1)- + (-!)“
= 192/4
= 48
Dẫn dến: F| f, = 48/2
= 24 với DF= 1,8.
Như vậy, giá trị p sẽ nằm trong khoảng: 0,001<p<0,05. Rõ ràng, giá trị
n<ìy giống như giá trị đă tính được ở phần trên đây.
Chú ý ràng, ỏ đây giả thuyêt H„: M|+ p- • Ma ■Pi “ 0 cũng có thể biểu
diễn một cách tương ứng khác: Hy! l/2ụi+ 1 /2 ^ 2 * - l/ 2 p4 = 0 cũng
tướnịỊ ứng với tưdng phản mẫu;
Y = ( l/2 x l l ) + (l/2 x 13)-(1/2 X 1 0 )-(1 /2 x 6 )
= 4
vì a, tưđng ứng ià (+1/2), (+1/2), (-1/2) v<à (-1/2). Từ đó, có thể suy ra
tổng các bình phưđng theo công thức sau;

113
3x4

(1/2)“' +(1/2)“ +(-1/2)- +(-1/2)^


= 48
Mặc dầu, kết quả này hoàn toàn giống kết qu«'ĩ đã tìm dược ỏ trèn, song
trong kiểm tra tương phản thường thường ngưòi ta sử dụng số nguyên mà
không dùng phân số và số thập phân.
Sau khi thực hiện phương pháp kiểm tra so sánh giá trị trung bình
giữa hai nhóm thuốc kháng sinh và sunfa, cần thực hiện phép kiểm tra dê
so sánh sự sai khác trong các nhóm mẫu đó vỏi nhau, có nghĩa là kiêm tra
sự sai khác giữa hai sô' trung bình trong mỗi nhóm: giữa mẩu sô' 1 và 2
cũng như giữa mẫu sô”3 và 4.

2 .2 . So sánh trong nhóm thứ nhất (kháng sinh)


So sánh sự sai khác giữa hai sô’ trung bình của mẫu sô’ 1 và 2. Giá
thuyết không (Hu) đế kiềm tra liệu Pi và P2 có bằng nhau khôiig? Từ kết
quả trên cho ta tính được giá trị Y, s s và F
Y= X 1 - X 2

= 11-13
= -2

ss = nY^

3x(-2)-^

= (3x4)/ 2
= 6

=3
Với DF = 1,8, từ các kết quả đó, ta có thể suy ra khoảng tin cậy p >
0,05

114
ỏ dây, khi tính giá trị F thì ihoo Iv tliuyét phái chia s s cho 1 vì DF của
tư<fng phíin là 1. Như vậy, giá trị p đôi với fíiá trị F này lổn hơn 10%, sự sai
khác giữa <;ác nhóm mẫu này là một đại kíỢiig mà có thế về mặt lý thì lón
hon s o vói cơ hội.

2.3. So sá n h tro n g nhóm th ứ h ai (sunfa)


So s á n h s ự s a i k h á c g i ữ a h a i s ỏ ' t r u n g b ì n h g i ữ a mẫu s ô ' 3 và 4. Tương
lự. gi;i thu yết không (Ho) dế thử liệu p, và P| có bầng nhau không? Từ kết
(Ịuá trên cho ta tính được giá trị Y, s s và F
Y= X , - X,
= 10-6
= 1

I" ?

3x4'^

= (3 X 16)/2
= 24
F = 24/2
= 12 vối DF= 1,8.
Vậy, có thê suy ra giối hạn tin cậy là 0,005<p<0,01. Như vậy, m ột sự
hiên nhiên thuận lợi vỏi hiệu quả trung bình cao hơn cho m ẫu thuốc sô”3.

2 .4 . K ế t lu ậ n

■ (ìiá trị trung bình của hai nhóm mẫu thuốc kháng sin h và thuôc
suiifa khác nhau rõ rệt, có nghĩa là:

Mị ^
■‘2 " 2 ^

• Trong nhóm kháng sin h, giá trị trung bình của inẫu số 1 kh ông sa i
khac so vỏi giá trị trung binh của mẫu sô’ 2 hay nói một cách khác là ụ, = p.>.

115
- Trong nhóm sunfa, giá trị trung bình của niẫu sô' 3 biếu hiện -sụ sai
khác so vỏi giá trị trung bình của mẫu sô”4 hay nói một cách khác là Ịj i ụ |,

Ngoài ra, những sự so sánh khác cũng có thể đưỢc tiến hành theo
phướng pháp trên. Thí dụ, chúng ta muôn so sánh sự sai khác giữa inẫu
thuốc số 1 vói các mẫu thuốic còn lại, giả thuyết không {H„) có thô dược viết
như sau:

Từ công thức đó, chúng ta có thề viết theo các dạng sau;
H„; Pi- l/3ụ, - l/3ụ., - l/3p, = 0,
H„: 3P|- - ụ., - ụ, = 0,
H„: -3ụi+ ụ., + P:, + ụ, = 0.
Giả sử, sử dụng tường phản cuối cùng của giả thuyết trêiì, ta c;ó thô
tính được các giá trị Y, s s và F như sau:
Y = -3x 11 + 13+ 10 + 6
= -4

nY-
ss =

3X ____

(-3)^ + 1^ + 1“ +1-

= (3 X 16)/12
=4
F = 4/2
= 2 với DF = 1,8-
Vậy, mức độ tin cậy ở đầy là p > 0,1-
Tóm lại, có thể có râ”t nhiều cặp so sánh tương phản đưỢc hình thaiih
từ một thí nghiệm có hai hay nhiều nhóm mẫu của các nhân tô thí nghiệm.
Song, cần lưu ý rằng sô' tương phản phải hạn chế dựa theo yêu cầu của thí
nghiệm vể sự cần thiết so sánh giữa các mẫu và cấu trúc của số liệu.

116
D. PHƯƠNG PHÁP KIẾM TRA BÀNG s o sá n h tư ơ n g
PHẢN TRỰC GIAO

I. KF1ÁI N IỆ M

KI i hai tương phản Sa,ụ, và Eb,ụ, là trực giao lẫn nhau nếu Sa,b, = 0.
Một l)ộ tương phán được gọi là trực giao nếu mỗi một cặp tương phản đểu là
irực giao. Một nhóm có nh iều hơii hai tương phán được gọi là trực giao nếu
niồi MìCt oặp tương phản trong nhóm đó thoà mãn các diều kiện trên đây.
DÙIIỊÍ Ị.ii thí dụ trên đê khảo sát các tương phán và liệu chúng có tạo thành
i)ộ trựcgiaơ khôiig? Các bước cụ lliô dược trìiih bày !ihư sau:

1. Lập các tương phản trực giao

B á n g 3.47. C ả c tương p h à n trự c g ia o

Tương p h à n X , X 3 X 4

1. Gỉữa khảng sinh và sunfa +1 +1 -1 -1


2. Giữa các kháng sinh +1 -1 0 0
3. Giữa các sunfa 0 0 + 1 - 1

2. Kiểĩti tra các tương phản


Tiưỏc hết cầiì kiểm tra những tương phản trên (1, 2 và 3) và nếu các
cặp 1 Ví 2. 1 và 3 và 2 và 3 có Sa, = 0, thì chúng là tương phản.
Tv.ưnịỊ phán 1 và 2:
2a,b, = (+1)(+1) 4 (HK-l) 4 (-1)(0) i M)(0) = 0
Tiơng phần 1 và 3:
sa.b. = (+1K+1) + (+1)(0) + (:1)(+1) + (-l)M) = 0
Tvơng phản 2 và 3:
sa.bi = (+1)(0) + (-1K0) + (0)(+l) + (0)(-l) = 0

3 . K ết lu ậ n

T ít cả ba tương phản trên tạo thành một bộ tương phản trực giao.

117
II. NỘI DUNG C ơ BẢN

1. Thí dụ minh họa


Tương phản của một nhóm năm số trung bình được thê hiện như san:
2ụi + 2ụ-, + 2pn - 3p I - 3ụ,-i và
2p, - ụ., ■ ụ,.ị

là trực giao bởi vì 2(2) + 2 (-l) + 2 (-l) - 3 (0) - 3(0) = 0.


Ngoài ra, Pv - Py là trực giao cho cả hai vì vậy ba tưđng phản tạo nên
một bộ tương phản.
Từ những thí dụ trên, các tưđng phản có thê là:
1. Pi+ - Pl
2. ụ, - ụ.>
3. Ịi;( -
Những tướng phản trên hình thành một bộ trực giao. Một iướng ịihíin
ngoài các tương phản đã kiếm tra trên là:
4. 3pi - ụ.^ • ụ;, - ụ ,

Như vậy, tương phản 4 là trực giao vối tương phản 3 nhưng không trực
giao với tương phản 1 hoặc 2 vì khi kiểm tra tương phản 4 với tương phản 1
cho thấy 1(3) + 1(-1) + (-!)(-1) + (-1)(-1) = 4.
Tưđng phản trực giao là sự quan tâm đối với một sô”lý do. Những giả
thuyết tưđng ứng với chúng là tách biệt một cách hiển nhiên, chúng nhấn
mạnh những cầu hỏi tướng đối không liên quan về thí nghiệm. Các hệ sô'
của tưđng phản trực giao sử dụng các thông tin khác nhau từ sô’ liệu và vé
mặt thống kô thì chúng độc lập với nhau.
Nếu có k số trung bình trong một thí nghiệm, 1 bộ trực giao có thê có
tới k-1 tương phản. Nếu nó có k-1 tương phản, giá trị s s sẽ được cộng vào
s s giữa các mẫu với DF = k-1 và chúng ta có thể nhìn thấy phép kiểm tra F
được thay thế bởi một nhóm k-1 so sánh sự quan tâm. Sự phân chia của
tống các bình phừơng giữa các nhóm mẫu vào k-1 thành phần. Trong thí dụ
trên, nếu có k = 4 sô' trung bình như vậy nhóm của ba tưđng phản trực giao
là một bộ trực giao hoàn chỉnh. Những kết quả đó được trình bày d bảng
3.48.

118
Bảng 3.48. Bộ trực giao hoàn chỉnh và phân tích tương phản

X 1 X p X ị X4 Y ss F

Kháng sinh và sunfa 1 1 -1 -1 8 48 24


Giữa các kháng sinh 1 - 1 -2 6 3
Giữa các sunía 1 .1 4 24 12
Giửa các mầu 78

Kết quá phân tích tương plìàn trực giao có thể được trình bày riêng lẻ
trêii báng 3.49.
B ả n g 3.49 Anova v ề tư ơ n g p h ả n trự c g ia o

Tương phản Y ss F

Kháng sinh và sunía 8 48 24


Gỉữa các khảng sinh '2 6 3
Giữa các sunía 4 24, 12
Giữa các mẫu 78

Cấn lưu ý rằng, s s của những tưđng phản này là dẫn suất của những
sô^ liệ u k h ô n g t r ù n g lậ p v à độc lậ p vói n h a u .
Tương phản trực giao vể sự tham gia bơi vì:
- inỗi một cặp tương phản nhâìi mạnh một vấn đề về những trung bình
khỏng liên quan đến những v ắ n dề khác;
- niỗi niột cạp tương phán sử dụng những thông tin từ sô' liệu, về mặt
thông kỏ chúng chúng đểu độc lập với nhau.
Nếu một thí nghiệm có k nhỏm niầu, một bộ trực giao có thể có đến k-1
tương phan. Việc hinh thành một bộ k-1 tường phản trực giao và tương
quan tổng các bình phương có thê đưỢc nhìn thấy bởi vì sự phân chia tống
các bình phương giữa các mẫu vào k-1 với DF = 1 cho mỗi cặp tương phản
và inỗi một cặp tương phán sõ thực hiện một phép kiểm tra giả thuyết hoàn
toàn độc lộ|). Mỗi một cặp tương phán hay giả th u yết là hoàn toàn độc lập
lẫn nhau, sử dụng lại thí dụ trên dể nghiên cứu so sánh tương phản và
tương phản trực giao.

Trưóc hết, lập báng phân tích phương sai (bảng 3.50).

119
Báng 3.50. Anova tổng hạp vé sử dụng bốn loại thuốc
Nguồn biến DF ss MS F p

Giũa các loại thuốc 3 78 26 130,001<p<0,005


Trong các loại thuốc 8 16 2
Tổng 11 94

Giá trị trung bình của các mẫu đó là 11, 13, 10 và 6.


Bảng 3.51. Các tương phản của thi nghiệm có bốn loại thuốc
Tương phản X, Xp X3 X4

1. Giữa kháng sinh và sunía +1 +1 -1 -1


2. Giữa các khảng sinh +1 -1 0 0
3. Giữa các sunía 0 0 +1 -1

Tất cả các tướng phản đều có Sa, = 0. Vì vậy, chúng đêu là các tương
phản. Tất cả các cặp giữa 1, 2 và 3 nhóm mẫu trên dều có 2a,b, = 0 nên
chúng đã tạo thành một bộ trực giao. Sau đây chúng ta đi sâu vào nghiên
•cứu từng tưđng phản và s s của chúng một cách riêng biệt.
Tương phản 1
Y, = 1 X 11 + (+1) X 13 + (-1) X 10 + (-1) X 6
= 8
ss, = n Y V
= 3x(8)^/(l)^ + (l)' + (-l)^ + (-l)-
= 48

Tương phản 2
= 1x11 + ( - l ) x l 3 + (O)xlO + 0 x6

= -2
ss., = 3 X(-2)^/(D- + M)'^
= 6
Tương phản 3
Y3 = 0 x 1 1 + 0 X 13 + 1 X 1 0 + (-1) x 6
=4

120
ìh.ng p h â n tích p h ư ơ n g sai Irêìì (lAv cổ th ê dược v i ế t lạ i c h i t i ế t h ơn
c h o laí cá c á c tương p h ả n đó {bang ;ỉ.r)2).

B ả n g 3.52. Anova c h i tiế t c h o tấ t c ả c á c tư ơ n g p h ả n


N g u ố n b iế n DF ss MS F p

G iữ a c á c m ẫ u 3 78 26 13 0.00KP<0,005

T ư ơ n g p h ả n K -S 1 48 48 24 0.00KP<0.005
T ư ơ n g p h ả n g iừ a 1 và 2 1 6 6 3 p>0,05
T ư ơ n g p h ả n g iữ a 3 v à 4 1 24 24 12 0.005<p<0,01
T ổ n g tư ơ n g p h ả n 3 78 24

T r o n g c á c lo ạ i t h u ố c 8 16 2
Tổng 11 94

ghi chú;

- K là nhóm thuốc kháng sinh;


- s là nhóm thuốc sunía;
- DF là độ tự do;
- s s là t ổ n g c á c b in h p h ư ơ n g ;

- MS là trung bình bình phương;


' F và p như đả nêu trén

2. K ết lu ậ n

- ''(Mvà 0,001<p<0,005 giá thuyêt gồm nhiểu vấn để thử X, = X,


= X li không có lý rõ ràng, hay Iiói một cách khác giữa chúng có sự sai
I

hhàv cnnií hè.


- Tương phản I: p', ,, và 0,00 ]<p<0,005 giá thuyết thử (X|+x .2)/2 =
( X !+ X|)/2 là không đủ lý rõ ràng, hay sự sai khác giữa nhóm 1 và 2 có ý
nghía õ rệt.
- ^ương phản 2 (giữa 1 và 2); I'Y.S và p>0,05 giả thuyết thử XI = Xv là
có đầy đủ lý rõ r<àng hay giả thiết cliấp nhạn được có nghĩa là giữa chúng
khôiigcó sự khác nhau rõ ràng.
- Vương phản 3 (giữa 3 và 1): F | v à 0,001<P<0,005, giả thuyết kiểm
tra X = X là không đủ lý rõ ràng hay nói cách khác có sự sai khác rõ rệt
I

giữa ciúng.

121
III. BỘ KHÒNG TRỰC GIAO CỦA CÁC TƯƠNG PHẢN

Trong một sô’ thí nghiệm, những yêu cầu đặt ra không thê ỉiình thành
bộ trực giao. Kết quả cúa nó là s s của bộ tưđng pluín không cộng vào s s
giữa các mẫu và giả thuyết kiểm tra !à không dộc lập với nhau.
Giả sử ở thí dụ trên, mẫu thuôc số 1 là inẫu thuôc đả được chuắii và ba
mẫu thuốc còn lại l«ì ba mẫu thuốc mối cần phải được kiểm tra. Một bộ trực
giao hoàn chỉnh có thể gồm sự so sánh giữa mẫu thuôc chuẩn và số mẫu
còn lại và bất kì hai trực giao tương phản nào trong số ba thuốc mới dó.
Vậy, phép kiểm tra so sánh giữa mỗi một thũốc mới vối thuốc chuẩn có thoá
inãn điều kiện không? Vấn để này được trình bày trên bảng 3.53,
Sáng 3.53. Tương phàn và anova của chúng
Tương phản X1 X2 X3 X4 Y ss F

1 +1 -1 0 0 -2 6 3
2 +1 0 -1 0 1 1.5 <1
3 + 1 0 0 -1 5 37,5 18,75
45

ghi chú
- 2a,b, = 1 giữa tương phàn 1 và 2;
- saí), = 1 giữa tương phàn 1 và 3;
- za,b, = 1 giữa tương phàn 2 và 3.

Nếu Sa, = 0 cho mỗi tương phản 1, 2, 3 thì tất cả chúng dều là tương
phản. Tất cả chúng không tạo thành một bộ trực giao. Cụ thế từng tương
phản như sau:
Tương phản 1
Y, = 1 X 11 + (-1) X 13 + Ox 10 + 0 x 6
= -2
s s , = 3 X(-2)-/2
=6
Tương phản 2
Y., = 1 X 11 + 0 X 13 + (-1) X 10 + 0 X 6
=1
s s . = 3 X{l)-/2 = 3/2
= 1.5

122
Tương phàn 3

Y;, = 1 X 11 + 0 X 1 3 + O x 1 0 + (-1) x 6

= 5

SS;, = 3 X(5)-/2
= 37,5
N h ư v ậ y , t ô n g c ú a t ô n g bìnli p h ư ơ n g oác tư ơ n g p h á n d ư ợ c t í n h t h e o
công thức sau; = SS| + s s , + SSị = 6 + 1.5 + 37,5 = 4Õ. Giá trị này
k h ô n g t r ù n g với g iá tr ị s s g iữ a các m ầ u n h ư dã Ị)h ân tíc h t r ê n d â y (78).
Luii ý rằng, ỏ dây s s các tương |)h;in kliỏng cộng vào s s giữa các niau, vì
v ậ y cà n h ó m là k h ô n g t r ự c giao. Đ ây clìínli là m ột t í n h c h ấ t m à rõ r à n g
(lược k h á m p liá r a t ừ c á c h ệ sô. Vẽ m ứ c cỉộ tr ự c g iá c t h ì rõ r à n g b ộ so s á n h
tiííín g p h á n n à y là k h ô n g t r ự c giaơ bời vì niỗi niộl p liư ơ n g p h á p so s á n h b a o
hàni so sánh sô trung bìiìh của mầu sô 1 với sô trung bình của một mẫu
khác thì độ lốn của mẫu sô 1 đưỢc sử dụng cho mỗi một lần so sánh.

V I. T H Í D ự M IN H H ỌA

Thi dụ 3.13. Trong chàn nuòi lợn, thức ăn làm ảnh hưởng râ”t lớn dến
gía thành, chiếm khoảng 70%. Đỏ nâng cao hiệu quá kinh tê trong chăn
nuôi Idn làm sao lợn có tô"c độ lãng trọng nhanh và lượng thức ăn tôn ít,
N òng trường Thành Tô đã nghiên cửu vỏi năm kháu phần (KP) ăn như sau:

- khẩu phần cơ bán (A);


- khấu phần cd bán + aureoinycÌỊi với tỷ 1(’ 15 g/tiVn (B);
- khẩu phần cơ bản + vitamin B,_, (C);
- k h ẩ u p h ầ n cơ b ả n + s tr c p to iiìy c in với tý lệ 15 g/t<â’n (D);

- k h â u p h ầ n cơ b ả n + s tre p to iiiy c iii vỏi tý lệ 15 g/tâ’n + v i t a i n i n B]., (E ).

M ỗi k h ấ u p h ầ n ă n đ ư ợ c b ố tr í t h í n g h iệ n i vỏi m ư ờ i lợn la i b a m á u
LW{LRxMC). Hãy so sánh ảnh hưởng của cíác loại khẩu phần ăn trên dến
tô'c độ tăiig trọng của đàn lợn thí nghiệm. Tốc độ lăng trọng/tháng của đàn
lợn Lhí nghiệm (TN) được lính bằng lOOg/tháng, kết quả đưỢc trình bày ớ
h a n g 3 .5 4 .

123
Bầng 3.54. Tâng trọng (lOOg/tháng) cùa lợn lai ba mảu với năm khẩu phấn

Khẩu phẩn A B c D E

165 168 185 164 201


156 180 195 156 189
159 180 186 189 173
167 166 201 138 193
170 170 165 153 164
146 161 175 190 160
130 171 •187 160 200
151 169 177 172 142
164 179 166 142 184
158 191 165 155 149

V 1566 1735 1802 1619 1755


X 156,6 173,5 180.2 161,9 175.5

Từ kết quá thu được của ih í nghiệm này, ta có thể th iết lập các phép
trực giao so sánh có thế có ở thí nghiệm trên và trình bày ỏ bíing 3.55.

Bảng 3.55, Các phép so sánh trực giao của thí nghiệm
Tương phản A B c D E Nội dung so sánh của thí nghiệm

1 4 -1 -1 -1 -1 Giừa A vả các KPTN


2 0 1 -1 1 -1 KPTN có và không cỏ B ,2
3 0 1 0 -1 0 ■Aur. và stre. khòng có
4 0 0 1 0 -1 Aur. và stre. có 6,2

ghi chú:
- A, B, c. D và E là nâm khẩu phần ân;
- KP lả khẩu phẩn ăn;
-A ià kháu phẩn cơ bản;
- KPTN là khẩu phẩn thí nghiêm;
- Aur là aureomycin;
- strep là streptomycin.

Kiểm tra những tương phản trên: tất cả các Sa, = 0, vì vậy tất cả chúng
đểu là tương phản. Kiểm tra các tương phản: 1 và 2, 1 và 3, 1 và 4, 2 và 3, 2
và 4, 3 và 4 về Ea.b, = ? giữa các tương phản đó, Kết quả cụ thể của mỗi một
tương phản được tính như sau:

124
Tương phán 1 và 2
Ea.b. = (4)(0) + (-1)(1) + (•1K-1)'+ (-1K1) + {-1){-1)

= 0

Tưưng phản ỉ và 3
2a.b, = ( 4 ) ( 0 ) + ( - l ) ( + l ) + ( - l ) ( 0 ) + ( - l ) ( - l ) + ( - l ) ( 0 )

= 0

TươììíỊ phán ì và 4
2a,b, = (4)(0)+ (-l)(0)+ (-l)(+ l)+ (-])(0)+ (-l)(-l)

= 0

Tương phán 2 và 3
sa.b, = (0)(0)+(+l)(+l)+(-l)(0)+(+l)(-l)+(-l)(0)
= 0

Tương phản 2 và 4
2a,b, = (0)(0)+(+l)(0)+(-l){+l)+(+l)(0)+(-l)(-l)
= 0

Tương phản 3 và 4
za.b. = (0)(0)+(+l)(0)+(0)(+l)+(-l)(0)+(0)M)
= 0

Vì vậy, tâ*t cả các tương phán trên tạo thành một bộ trực giao. Từ đó,
tông hđp trên bảiig phân tích phưdng sai (bảng 3.56).

Bảng 3.56. Anova tổng hợp vế nãm khẩu phẩn

Nguón biến DF ss MS F p

Giữa các khẩu phần 4 3906,52 976,63 4,31 p»^0,5%


Sai số 45 10207,90 226,84
Tổng 49 14114,42

s s đôì vỏi những tương phán đó có thế dược tính tương tự như trước
đáy, bởi vì chúng đóng góp sự phán ly trực giao. Kết quả đó đưỢc trình bày
trên bảng phân tích phướng sai dã có sự biến đối như sau (bảng 3.57).

125
Bẩng 3.57, anova tổng hợp có phân ly trực giao
Nguổn biến DF ss MS F

KP CB và KPTN 1 2093.2 2093,2 9.23 p<0.005


Có và không B ,2 1 1030.2 1030,3 454 p<0.05
Aur và strep 1 672.8 672,8 297 p<0,10
Aur và strep cB ,2 1 110.5 110,5 P<1

Tổng giữa các KP 4 3 9 0 6 ,5 9 7 6 ,6 3

Sai số 45 1 0 2 0 7 ,9 2 2 6 ,8 4

Tổng 49 1 4 1 1 4 .4

ghi chú
KPCB là khầu phần cơ bản;
KPTN là khầu phần thí nghiệm;
k lả không:
c là có;
Aur là aureomycin;
strep là streptomycin.

V. K HI N À O N Ê N D Ù N G P H Ư Ơ N G P H Á P K IỂM tra tương ph ản

T R ự♦ C G IAO

Từ những phương pháp kiểm tra vừa nghiên cứu trên dây, rõ ràng khi
muôn so sánh các số trung bình của các nhóm mẫu cần phải thực hiện các
phương pháp kiểm tra. Song, phương pháp kiểm tra áp dụng cần phải
chính xác thì mới có ý nghĩa. Nên nhớ rằng không có bất cứ một phưđng
pháp nào là hỢp lý hoàn toàn và đúng tuyệt đối cho mọi thí nghiệm. Song,
phương pháp ứng dụng đó cần phải được chấp thuận và đầy đủ lý luận clê
áp dụng.
Nêu một bộ các tương phản trực giao đă đưỢc đặt ra bởi dặc trưng của
thí nghiệm và sẽ được trả lời những yêu cầu đó thì sau khi đá có kết quả,
chúng ta cần đưa ra những tương phản đế được kiếm tra mà không cần dưa
ra kếl quả của phép thử F.
Nếu những câu hỏi ngưòi ta đưa ra đòi hỏi thiết lập một bộ các tưđng
phản không trực giao và sau đó cần phải kiêm tra chúng.
Nếu dặc trưng của thí nghiệm không yêu cầu bất cứ một tương phan
nào thì phương pháp so sánh bội số như LSD và SNK nên được áp dụng.

126
Trong lĩnh vực sinh học cũng Iihií tioiig l ìn h vựo nghiên cứu di truyền
giông, một sô thí nghiệm không dõi h()i so s á n h các nhân ló với nhau, mà
lìịíuời ta muôn dùng kêt quá của tỉií nghiộiii (lè kioin nghiệm một nguyên lý
h;iy lììột quv lihẠt sinh học thì chi C'ó Ị)hư()ng Ị)h;'iỊ) kiểm tra sự phù hỢp giữa
tầii suất thực tiễn và lý thuyêt Iiiổi thoii inâii yêu cầu dó. Phưđng pháp
kiổni tra sự phù hđp giữa tần siiấi thực tiền và lý thuyết sô được trình b<ày
d chươiiẾĩ IV.

127
CHƯƠNG IV

KIỂM TRA Sự PHÙ HỢP GIỮA


THỰC T Ế VÀ LÝ THUYẾT

Trong những phần trên của cuốn sách; một sô' phương pháp kiểm tra
thông kê sinh học cđ bản như xác định mức độ tin cậy cùa sò triing bình và
sự sai khác giữa các số trung bình mẫu với nhau, các phưđng pháp kiểm tra
t và bội số so sánh đã được giới thiệu một cách chi tiết. Song, những thí
nghiệm trong nghiên cứu sinh học rất đa dạng, đặc biệt trong di truyền và
chọn giông, những phướng pháp kiểm tra dó không thê ứng dụng được
trong lĩnh vực này. Thí dụ, nghiên cứu tỷ lệ sinh con trai hay COII gái, tỷ lộ
đực cái trong gia súc, nghiên cứu tỷ lệ đóng góp nguồn vật châ’t di truyền
của từng thành phần vào các tố hỢp lai, nghiên cứu tỷ lệ của những cặp
tính trạng trên các thế hệ lai đời 1, 2 hay 3, v.v, các phương pháp trên đây
không thế giải quyết được,
Những thí nghiệm mang tính châ"t nghiên cứu so sánh tý lộ X í i y ra
trong thực tê so vói tỷ lệ lý thuyết của một số quy luật sinh học rất phố biên
trong nghiên cứu công nghệ sinh học vừa nêu trên đòi hỏi phải có một
phương pháp thích hdp đế kiểm tra. Với những loại mô hình nghiên cứu
chuyên sâu vể những lĩnh vực ấy, bộ sô”liệu thu được từ các mô hình thí
nghiệm ấy có những đặc điểm khác nhau so với các bộ số liệu chúng ta đã
nghiên cứu trước. Đặc biệt sự khác biệt về tính chất và sự phân bố chuẩn,
nên các phương pháp kiếm tra đã trình bày trên như phương pháp kiểin tra
độ tin cậy và so sánh các số trung bình mẫu không đáp ứng cho việc kiểm
tra trong những mô hình thí nghiệm này. Do đặc điểm, tính chất khác
nhau nên sự phân bô”của bộ số liệu này không tuân thủ theo sự phân bô’
chuẩn, dòi hỏi phải có một phưđng pháp kiểm tra thích hỢp.
Phưđng pháp kiểm tra các thí nghiệm nhằm so sánh sự phù hợp giữa
tần suất thí nghiệm thực tế và lý thuyết của một quy luật sinh học là một
phương pháp hết sức cần thiết và quan trọng phục vụ đắc lực cho lĩnh vực
nghiên cứu sinh học cũng như di truyền và chọn giống. Vì vậy, chương IV

128
sẽ trình bày những phương pháp kiếrn tra thông ké sinh học riêng biệt đó.
Có rất nhiều phương pháp kiếm tra so sánh sự phù hỢp giữa tần suất
thi nghiệm thực tê và lý thuyết của một quy luật sinh học. Chương này giói
thiệu hai trong sô các phương pháp kiểm tra thống kê sinh học cơ bản và
thòng ciụng nhát áp dụng cho các tlií nghiệm nghiôn cứu sinh học vể sự phù
hợp giữa tần suất thực tế và lý thuyôL. Hai phương pháp đó là:
- phướng pháp kiểm tra “khi binh phương”, được ký hiệu bằng (x*);
- phương pháp kiểm tra G.
Những phương pháp kiểm tra thống kê sinh học và G đưỢc áp dụng
rộng rãi nhằm phục vụ cho phân tích, kiểm tra, xác định sự phù hợp giữa
tầu suất thực tiễn và lý thuyết. Trong lĩnh vực di truyền học và tạo giông
vật nuôi hay cây trồng, nhiêu thí nghiệm cần thiết phải được khảo sát sự
phù hợp giữa tần suất lý thuyết và thực tế thì những phương pháp kiểm tra
X"và G này thỏa mân đưỢc các yêu cầu đó.
Mục đích của những phương pháp kiểm tra và G này là làm căn cứ
khoa học để kiểm tra những kết quả thực tê của các thí nghiệm chúng ta
dang nghiên cứu liệu có tuán thủ theo các nguyên lý của các quy luật hay
những định luật trong sinh học không? Nếu kết quả kiểm tra cho thấy sự
phù hợp của tần suâ”t thực tiễn trong những thí nghiệm và lý thuyết thì sự
phù hợp đó ở mức độ nào?
Đê kiếm tra được sự phù hợp đó, phương pháp kiểm tra và G là hai
phương pháp kiếm tra thích hợp, thuận tiện, dễ làm và thông dụng nhất.
Vì vậy, trong phần này hai phương pháp kiểm tra x‘^và G sẽ được trình bày
một cách chi tiết về đặc điểm, nội dung và phương pháp phân tích tính toán
kiểm tra để bạn đọc có thể áp dụng nó một cách dễ dàng trong nghiên cứu
của nùnh.

A. PHƯƠNG PH Á P KIỂM TRA x'

I. Đ Ặ C Đ lỂ M , M ỤC Đ ÍC H VÀ NỘ I D U N G

Một trong những phương pháp phân tích kiểm tra thốhg kê sinh học
về sự phù hợp giữa tần suất thực tiễn thu được trong các thí nghiệiĩi và tần
suất lý thuyết thu được của các quy luật sinh học, di truyền học và hệ thống
lai tạo được áp dụng nhiều trong sinh học đặc biệt trong công tác di truyền

129
giống là phương pháp kiểm tra “khi bình phương” và dược ký liiệu bằng
ix^). Giả thuyết để thực hiện phương pháp kiểin tra "khi bình |jluíciiig" là
mẫu thí nghiệm phải được lấy một cách hoàn toàn ngầu nhiên từ quần thê
hoặc số liệu quan sát của thí nghiệm là sô liệu thu được thực tế iroiig các
thí nghiệm chứ không phải bắt nguồn từ bất cứ dẫn suất nào của các phép
tính toán. Đồng thòi, số liệu đó mang tính chất dộc lập. Liíii ý, sụ phán bò
của phương pháp kiểm tra X"là không đôi xứng.
Mục đích áp dụng phương pháp kiêm tra y- nhằm kiêm tra mức dộ
đồng nhâ"t, ngẫu nhiên, độc lập và quan trọiig nhâ"t ỉà sự phù hỢị) giữa tầỉi
suất thực tiễn thu được từ thí nghiệm so với tần suất lý thuyết tínli được từ
các quy luật sinh học. Thí dụ, kiểm tra tỷ lệ giữa con trai và COII gái lại niộl
cơ sở nào đó có đúng là 50% không? Hoặc kiểm tra sự phân tính kiêu hình
có phù hỢp với một tỷ lệ lý thuyết nhât định của một tính trạng Iiào đó ơ
thê hệ lai thứ hai (F2 ) có tuân theo tỷ lệ 3:1 hoặc hai tính trạng độc lập
nhau ỏ thê hệ lai thứ hai (P^) liệu có đúng với tỷ lệ 9:3:3:1 khôiig vì đó là
định luật phân tính, một trong những quy luật cơ bản nhất của di truyền
thường gặp trong công tác tạo giông vật nuôi hay cây trồng.
Tóm lại, phương pháp kiểm tra X" là một trong những phưcỉng pháp
kiểm tra thống kê sinh học quan trọng, đóng góp rất nhiều cho lĩnh vực
nghiên cứu di truyền học, về phân tích kiểm tra mức độ đồng nhất, ngẫu
nhiên, độc lập và quan trọng trong việc kiểm tra sự phù hợp giữa tần suất
thực tiễn của bộ sô* liệu thu được so với tần suâ”t lý thuyết clược xác định
theo các quy luật sinh học. Muốn thực hiện phương pháp kiếm tra thống kê
sinh học tnang lại kết quả chuẩn xác, cần phải tiến hành nghiên cứu
khảo sát một cách kỷ lưỡng những khái niệm, nội dung cơ bản sau;

1. Tần suất lý thuyết


Tồn su ất ỉý th u yết là giá trị tính toán được dựa theo một (Ịuy lUíật lý
thuyết nào đó mà quy luật đó đă được khẳng định thành một quy luật sinh
học, một định luật như tỷ lệ đực và cái là 50:50% hay sự phâii ly độc lập
của hai cặp tính trạng ở thế hệ lai thứ hai (Ka) là 9:3:3:1. Tần suất lý thuyết
đưỢc xác định bằng khả năng trong lý thuyết xảy ra nhân với dung lượng
mẫu lý thuyết.

2. Tần suất thực tiễn


Tần suất thực tiễn là sô' liệu thực thu được trong thực tế, có thể rút ra
từ một quần thể hay thu được từ một thí nghiệm. Tần suất thực tiễn được
xác định bằng kết quả thu được trong thực tê của thí nghiệm; thí dụ, tần

130
suất thực; tiễn sô bé nam trong tổng 1000 bé sinh ra tại quận Ba Đình,
thành phô Hà Nội trong tháng õ năm 2001 là õí)l bé. Từ tần suâ't thực tiễn
dó, suy ra tý lệ thực tiễn giữa con trai và con gái của bộ số liệu trên ià

3. T ín h g iá tr ị

Giá trị y-dược tính theo công thức sau:

trong đó:
- £ là tông cộng tâ*t cả các giá trị, tỷ lệ;
- t là tầii suất thực tiễn thu được từ niột quần thế hay của một thí
nghiệm;
- 1 là tần suất lý thuyết được tính theo một quy luật sinh học hay một
định luật nào đó.

4. Tra cứu xác định giá trị tại bảng


Giá trị được xác định tại bảng phân bố X' với các độ tự do tương ứng
của các mức độ xác suất tương ứng. Trong các thí nghiệm sinh học, ba mức
độ xác suất thưòng được sử dụng là: p=0,05; P=0,01 và p=0,001.

5. So sánh giá trị tính đưỢc của thi nghiệm


v ớ i X* tr a c ứ u c ủ a b ả n g

Khi so sánh giá trị tính được từ thí nghiệm và giá trị tra cứu từ
bảiig cho sẫn, có thể rút ra kết luận, nếu:
• tính được từ thí nghiệm (x'tn) cứu đưỢc của bảng ỏ một
niửc dộ tin cậy nhát định, thí dụ ở mức p=0,05 tức là p (x\n) ^ 0.05 thì kết
luận lằng tần suất lý thuyết và thực tế phù hỢp nhau với độ tin cậy 95%.
• X' tính đưỢc từ th í nghiệm (x \n ) > X" tra cứu tại bảng ồ mức tin cậy
p=0,0õ tức là p (x^tn) 0*05 thì kết luận tầìì suất lý thuyết và thực tế không
phù hỢp nhau vối độ tin cậy 95%.
Tóm lại, thực hiện phưđng pháp kiểm tra thống kê sinh học là kiểm
tra giá thuyết không (H,j) “có sự phù hợp giữa tần suất thực tế và lý thuyết”
liệu giá thuyết không có được chấp nhận hay không. Nếu:

131
1. Giả thuyết không (Ho) được châ'p thuận thì có sự phù hỢp giQa tần
suất thực tiễn với lý thuyết.
2. Giả thuyết không (H(,) không được chấp thuận thì có sự khác nhau
giữa hai giá trị lý thuyết và thực tê và rút ra kết luận tần suíVt thực tê
không phù hđp với lý thuyết.
- Tương tự, cũng tính và biện luận cho các mức độ tin cậy khác nhau
như p= 0,01 và p= 0,001.

II. S Ử D Ụ N G P H Ư Ơ N G P H Á P K IỂ M t r a f KHI NÀO?

Nhiều thí nghiệm đòi hỏi phải khảo sát, kiểm tra so sánh giữa các tần
suất lý thuyết vối các tần suâ*t thu được trong thực tế. Mục đích sử dụng
phưđng pháp này là để khẳng định những giông vật nuôi hay cây trồng tại
một địa điểm nhất định nào đó của một thí nghiệm vê một số cặp tính
trạng nào đó có tuân thủ theo những nguyên lý lý thuyết hay những định
luật sinh học nào đó không và nếu có thì ở inức dộ tin cậy nào. Vì vậy,
phưđng pháp kiềm tra "khi binh phương" được áp dụng khi:

1. Khảo sát một thí nghiệm dựa theo quy luật sinh học
Một trong những quy luật sinh học mà mọi ngưòi thường gặp trong
cuộc sông của con người là tỷ lệ sinh con trai và con gái cũng như tỷ lệ giữa
đực và cái của gia súc là 50:50%. Vì vậy, có thề’ dùng phưdng pháp kiểm tra
này để kiểm tra tỷ lệ giữa đực và cái của một quần thề hay một thí
nghiệm của một giốhg gia súc, gia cầm nào đó liệu chúng có tuân thủ theo
quy luật sinh học tỷ lệ giữa đực và cái 50:50% hay không? Kiểm tra loại thí
nghiệm này thì duy nhâ't là sử dụng phương'pháp kiểm tra X‘-

2. Khảo sát một thí nghiêm dựa theo định luật di truyền học
ứng dụng các định luật đồng tính và phân tính của di truyền học
Mendel rút ra từ nghiên cứu trên cây đậu Hà Lan vào những thí nghiệm
sinh học là những thí dụ điển hình để minh họa việc sử dụng phương pháp
kiểm tra thốhg kê sinh học nhằm kiểm tra sự phù hợp giữa tỷ lệ thực
tiễn của những thí nghiệm so vói tỷ lệ lý thuyết của các định luật di truyền
đó. Thí dụ, kiểm tra khảo sát sự đồng nhất ỏ thế hệ lai thứ nhât (F|) hoặc
tỷ lệ phân ly độc lập ỏ thế hệ lai thứ hai (Pa) đối vỏi một sô' cặp tính trạng
nào đó dựa theo các định luật di truyền đã nêu trên. Hay là khảo sát kiểm
tra tỷ lệ phân ly độc lập ỏ thế hệ lai F, đôì với hai cặp tính trạng nào đó của

132
một giông gia súc hay cây trồng có tuân th<‘0 lý lệ 9:3:3; 1 không?

3. Kicm tra một thí nghiêm dựa theo khả năng


hoặc bản chất sinh học
"rrong lĩnh lực sinh học, khá nàng ho.ậc bán chất sinh học của một sinh
vật nào dỏ thưòng là cô" định. Troiig thực tế, eó thô sử dụng phương pháp
kiểm tra thông kô sinh học y - đê kiếm tra Iiiột khá năng hoặc một đặc điểm
bán chất sinh học của một cđ thô sinh vật nào dó là tốt nhâ”t. Thí dụ, kiểm
tra sự đồng đều về thòi gian mà một giông gia súc hay cây trồng bị nhiễm
một Ccăn bệnh, hay là sự đồng đêu trẻ om sinh la trong một khoảng thòi
gian nhỉít dịnh của một ngày.

III. C Á C P H Ư Ơ N G P H Á P K IỂ M T R A f

Đê kiểm tra được những kết quá các thí nghiệm sinh học đang được
nghiêỉi cứu trong thực tê có tuân theo các quy luật hoặc định luật sinh học
như các quy luật di truyền học, khả nàng mẫn cảin bệnh hay một đặc điểm
sinh học, thì phương pháp kiểm tra thống kê sinh học là một trong
những phương pháp hđp lý và hiệu quả nhất. Phưđng pháp kiểm tra x’
đưỢc áp dụng râ't rộng rãi và linh hoạt đổì vổi các thí nghiệm nghiên cứu về
lĩiih vực di truyền học và nó phụ thuộc nhiều vào sô'yếu tố thí nghiệm.
Đề giúp cho bạn đọc áp dụng, thực hiện được phưđng pháp kiểm tra
thông kê sinh học X“' niột cách hợp lý và thuận tiện, chúng tôi sẽ trình bày
cụ thề phưđng pháp kiểm tra X' l iêng biệt theo từng kiểu câ'u trúc và yêu
cầu của mỗi loại thí nghiệm. Phướng pháp kiổin tra được phân loại ra
theo sô yếu tô thí nghiệm;
- thí nghiệm chỉ có một yếu tô’;
- thí nghiệm có hai yếu tô’ dược phân ra hai hưóng khác nhau.

1. Thi nghiệm chỉ có một yếu tố


Phương pháp kiểm tra thống kè sinh học x’ tlược áp dụng một cách
rộng rãi trong các thí nghiệm, đặc biệt trong, các dạng sau:
- kiểm tra các thí nghiệm dựa vào định luật di ti’uyển học;
- kiểm tra các thí nghiệm dựa vào phân bố tần suất theo thời gian.

1 33
1.1. Dạng 1. Kiểm tra thi nghiệm dựa theo định luật
di truyền học
a. Kiểm tra th í nghiệm dựa theo định luật đồng tính của F ị
Định luật đồng tính của thê hệ lai thứ nhâ”t (F|) là một trong những
định luật di truyền cđ bản nhất, là nền móng của lĩnh vực di truyền học
được Mendel phát hiện ra từ thế kỷ thứ XIX do quá trình thực hiện phép
lai các cặp bô" mẹ thuần chủng có một cặp tính trạng đổi nhau dã thu được
tất cả các cá thể lai ở đời thứ nhâ't đểu đồng tính (tính đồng loạt giông Iihau
hoàn toàn) hoặc của bô”hoặc của mẹ. Thí dụ sau dây sẽ minh hoạ phương
pháp kiểm tra thống kê sinh học X' về định luật đó.
Thí dụ 4.1. Tại một thí nghiệm “lai giữa lợn Pietrain (niàu đen) với
lợn Đại Bạch (màu trắng) tổ chức tại Đông Anh, Hà Nội, thu được ỏ đòi con
100 000 con, trong sô" đó có 20 con màu trắng và 99980 con niàu đen”. Hãy
kiểm tra xem liệu tính trạng màu sắc của hai giôVig lợn dó có tuân theo
định luật đồng tính ở con lai F, không?
Cách giải bài toán
Như ta đã biết, màu đen của lợn biểu thị tính trội, màu trắng là lặn,
hai giông Pi và ĐB đều là thuần chủng và gen biểu thị màu sắc là đơn gen.
Giả thuyết không (Ho); tỷ lệ lợn màu đen ở đời thứ nhất là 100%
Giả thuyết kháng không (Hj): tỷ lệ Iđn màu đen ỏ đòi thứ nhất không
là 100%.
Để tính được x^. trưổc hết hãy xác định tần suất lý thuyết về màu sắc
của mỗi nhóm lợn. Theo tỷ lệ lý thuyết, tính tần suất lý thuyết như sau:
- sô lợn màu đen là 100/100 X 100 000 = 100 000;
- sô lợn màu trắng là 0/100 X 100 000 = p
Vậy, giá trị thí nghiệm được tính theo công thức sau:
2 _ (99980 -100000) 2 (20 - 0)
Xt
100000 0,0
= 20Vl00000
= 0,004
Tra cứu tìm giá trị tại bảng phân bô' vối DF = 1, đó chính là giá trị
Xi^lý thuyết và giá trị đó là:

134
Kết luận
S o s á n h s ự s a i k h á c g i ữ a liai giá trị giá Irị tiiự c t i ễ n Xt" là 0 , 0 0 4 n h ỏ
liơii ti a o ử u t ạ i b ả n g XbaiiK" sự .sai kh;'ic tíiữa c h ú n g k h ô n g có ý
Ii g h ì a rõ r ệ t . V ậ y , với bộ sô liệ u vỏ n ià u sắc c ú a lợn ỏ t h ế h ệ lai t h ứ n h â ”t
giũa thực tế và lý thuyết không chênh lệch .nên giá thuyết không (H,)) trên
đây đưỢc châ"p nhận. Điều đó có nghĩa là tv lộ thực tiền rất phù hdp vối tỷ
lộ lý tlìuyêt, gần như 100% lợn con Fj có màu don.
Lưu ý, trong sô 100 000 lợn F| có 20 con l)icu thị màu trắng là nằm
ìigoài quy ỉuật đồng tính của di tiuvêii học. Hiện tượng này có thế giải
thích do có sự không thật thuần nhất, lấn át gen, uội không hoàn toàn hay
dột biên gen gây ra.
b.Kiểm tra th í nghiệm dựa vào định luật phản tinh một cặp tính trạng
ỞF,
t)ịnh luật phân tính của một cặp lính nạng ó ihế hệ lai thứ hai (F.)) là
3:1 cĩuig là một trong những định luật di tiuyen cơ bán nh ất đưỢc M endel
phát liiệii ra từ thế kỷ thứ XIX. Kết quá do thực hiện các cặp lai của bố mẹ
thuáii chủng thu đưỢc ỏ đòi thứ hai của một cã|) tính trạng đổi nhau là tỷ lệ
kiou hình trội so với lặn của tất cả các cá thế lai đòi thứ hai biểu hiện 3:1.
Thí dụ sau dây sẽ minh họa phưđng pháp và kêt quả kiêm tra về sự phù
hợp giữa tý lộ thực tiễn với lý thuyêt.
Thí dụ 4.2. Tại một thí nghiệm "nghiên cứu vê khả năng kháng căn
bệnh A do bản châ't di truyền gáy ra: tổng dàii lợii thí nghiệm có 40 con,
liong dó 26 lợn có khả nâng kháng được bệnh và 14 lợn bị nhiễm”. Hãy
kióni tra bộ số liệu thu được trong thực tê thí Iiglúệni đó có phù .hợp vói tỷ
lệ lý thuyết 3:1 không?
Cách giãi đê kiêm tra định luật phán tính của F.J đốì với một cặp tính
tr ạ n ịĩ

Dô tính cỉược giá trị X". trước hết liãy xác định tần suất lý thuyết của
Iiiỗi Iihóin lỢn. Theo tỷ lệ lý thuyết ;ỉ:l thì tầii suiVt lý thuyết sẽ được tính
Iihư sau;
- sô lợn kháng bệnh là 3/4 X 40 = 3(>;
- sô’lợn bị nhiễm bệnh là 1/4 X 10 = 10
Vậy, giá trị Xt" đưỢc tính theo côiìg thức sau;
_ (26-30)'“ (14-10)-
"^3(
2,13

135
Tra cứu xác định giá trị Xi^ tại b ản g với DF = 1, thu được kết q u ả Xbanị,"
= 3 ,8 4

Nhận xét
So sán h giá trị x^giữa thực tiễn và lý th u yết cho thấy: Xi' (2,13) <
(3,84) cho phép kết luận sự sai khác giữa chúng không có ý nghĩa rỡ rệt.
Vậy, với sô' liệu giữa thực tế và lý thuyết không chênh lệch đáng kê nêai giả
thuyết trên được chấp nhận có nghĩa là tỷ lệ thực tiễn phù hỢp với -.ỷ lệ lý
thuyết, đó là tỷ lệ 3:1.
Cần lưu ý rằng, với số liệu trên có thể áp dụng phép thử nhị th '£c như
đã trình bày ở phần trên. Theo giả thuyết không (Ho) thì p = 3/4 = 0,75. Giả
sử, ngưòi có khả năng kháng bệnh là thuộc nhân tố may mắn thàr.h công
thì Pmaymản = 26/40 = 0,65. Như vậy, giá trị Z‘được tính theo công thử( S;au:

2 _ ^may mán "Plý thuyết


pq/n
0,65-0,75
(0,75x0,25)/40
= -1,46
Rõ ràng, kết quả của hai phương pháp kiểm tra trên đây hoàn toàn
giốhg nhau. Cụ thể:
Z2 = (-1,46)'^
= 2 ,1 3

Kết luận
Giá trị kiểm tra tính toán theo nhị thức này hoàn toàn phù hcp hoặc
bằng giá trị tính theo phương pháp kiểm tra = 2,13.
c. Kiểm tra th í nghiệm theo định lu ật phân ly độc lập của hai cáp tính
trạng ở F.2
Định luật phần ly độc lập của hai cặp tính trạng ở thế hệ thứ hai (Pa)
là 9:3:3:1 cũng là một trong những định luật di truyền cơ bản được Mendel
xây dựng từ thế kỷ thứ XIX. Kết qủả thu được do thực hiện phép lai của bố
mẹ thuần chủng thu được ỏ đòi lai thứ hai của hai cặp tính trạng đcì nhau
lặ tỷ lệ kiểu hình của tất cả các cá thể lai đòi thứ hai biểu hiện tỷ lệ ):3:3;1.
L}Ịu ý, hai cặp tính trạng này phải độc lập với nhau, trội hoàn toàn, không
xảy ra đột biến và không có liên kết gen vôi nhau. Nếu tách riêng tùng cặp

136
tínli trạng thì cả hai tính trạng dó dồu biổu thị tv lệ 3:1 ỏ đời lai thứ hai
này. Thí dụ sau đây sẽ minh họa phưđng pháp kiôni tra thông kê sinh học
X' vồ Hự phù hđp giữa tỷ lệ thực tiễn !ighiôn cứu so với lý th u yết của định
luật.
Thí dụ 4.3. Một trong sỏ n h ữ n g thí nghiệm nghiên cứu về quy luật di
truyền thực hiện trên cây đậu Hà l.an với kết quá sô’ hạt đậu đã thu được ỏ
thê hệ lai thứ hai khi nghiên cứu hai 0<ậỊ) tính Irạng, gồm bô"n loại hình vè
độ nhẫn và màu sắc hạt khác nhau đưỢc trình bày tại bảng 4.1. Dựa theo
dịnh luật di truyền học “phân ly dộc lập của hai tính trạng ỏ thê hệ lai thứ
hai oủa Mendel”, hãy phân tích kiêin tra bộ số liệu trên liệu thu được liệu
tỷ lệ thực tiễn thí nghiệm đó có tuân theo lý thuyết phân ly độc lập ở thê hệ
lai thứ hai theo tỷ lệ 9:3:3:1 không?

Bảng 4.1. Hình dạng và màu sắc của hạt đậu Hà Lan
Loai hình S ố hat thu đươc

Trơn và Vàng(T và V) 315


Nhăn và Vàng (N và V) 101
Trơn và Xanh(T và X) 108
Nhãn và Xanh (N và X) 32

Các bước tính toán cụ th ế


Giả thuyết không (Ho); Sô liệu hạt đậu thu được trong thực tê của bôVi
loại hình trên tuân theo quy luật 9:3:3:1, có nghla là chúng biểu hiện theo
đúng tỷ lệ 9/16, 3/16, 3/16 và 1/16 tương ứng vổi các loại hình trên.
Giả thuyết kháng không (H,): Số liệu thực tế thu được không tuân thủ
theo tỷ lệ lý thuyết trên. Các bước phân tích, tính toán được tiến hành cụ
thể như sau:
Xác định tần suât mong dời
Giá trị tần suâ't m ong đợi (K) clnỢc xác định tlieo cônh thức sau đây:
E = np

trong dó:
- 11 là tống sô hạt thu được;
- p là tỷ lệ của từng loại hạt phân theo, hình dạng vể độ nhẵn và màu
sắc hạt đã thu được.
Tần suâ"t mong đợi vê tỷ lộ thuộc hai cặp tính trạng màu và dạng hạt
đưỢc trình bày ỏ bảng 4.2.

137
B á n g 4.2. T ầ n s u ấ t m o n g đ ợ i v é tỷ lệ m à u v à d ạ n g h ạ t

Loại hinh T vả V N và V T và X N và X

Số hạt E 9/16(556) 9/16(556) 9/16(556) 9/16(556)


= 312.8 = 104,2 = 104,2 = 34,8

ghi chú:
♦ S ố h ạ t E là s ố h ạ t m o n g đ ợ i đ ư ợ c tín h t h e o lý t h u y ế t
nên còn gọi số hạt lý thuyết:
- T là biểu thị dạng hạt trơn;
- N là biểu thị dạng hạt nhàn:
- V ià b iể u th ị m à u v à n g c ủ a h ạ t;

- X là b iể u th ị m à u x a n h c ủ a h ạ t.

Lập bảng tần suất lỷ thuyết (l) và thực tế(t)y độ lệch giữa chúng

Báng 4.3. T ầ n s u ấ t lý t h u y ế t , th ự c t ế v à đ ộ lệ c h g iữ a c h ú n g

Loại hinh T và V N và V TvàX N v àX V

Số hạt t 315 101 108 32 556

S ố hạt 1 312,8 104.2 104,2 34.8 556

Hiệu (t-ỉ) 2,2 *3,2 3.8 ■2.8 0

ghi chủ:
- 1là tần suất iỷ thuyết;
- 1 lả tần suất thực tiễn;
- t-l là độ lệch giữa tấn suất thực tiền và lý thuyết

Tính giá trị


, ^ 2.2^ -3.2^ 33^ -2 ,8 -
312,8 ^ 104,2^ 104,2 ^ ' 3 4 /
= 0,477
Tính độ tự do (DF)
DF = n - 1
= 4 -1
=3
Tra cứu tại bảng ^ và so sánh với ^ thực tiễn
Vối DF = 3, mức tin cậy p = 0,05 thì Xb,inti' =
Như vậy, giá trị thực tiễn (0,477) nhỏ hơn giá trị tra cứu tại bảng

138
Ximii-" v ậ y t ầ n s u â t c ủ a bộ sỏ liộ u tliu <lu(.ic t r o n g t h ự c t ế r â t k h ô n g s a i
khác so với sô' liệu tính toán lý thuyết nôii f?ia thuyết không (H,|) đưỢc chấp
thuận, có nghĩa là không có sự Sfú khác giữa lầỉi suất lý thuyết và thực
liỗn.
Xác định giá trị p
p=
Kết luận
Vổi bộ sô’ liệu về hình dạng dộ nhăn và niàu sắc của hạt đậu Hà Lan
thu dược troiìg thí nghiệm đó của Mendel, p = Pr(xi)ị.=:Ị^>0,477), nên giả
thuyêt không ỏ trên được chấp nhận. Có thể nói inột cách khác, số liệu thu
dưực từ thí nghiệm của bôn loại hạt đậu về ỉììiìh dạng và màu sắc ỏ trên
hoàn toàn tuân theo định luật phán ly độc lập di truyền là 9:3:3:1.
1.2. Dane 2. Kiểm tra sự phán bố tần suất theo thời gian
a. Đặc điểm chung
Dạng thí nghiệm nghiên cứu về sự đồng nhất trong phân bô' tần suất
tlìoo đơn vị thòi gian của một yếu tô nào đó cũng phố biến trong lĩnh vực
sinh học và trong cuộc sống. Vì vậy, phương pháp phân tích kiếm tra thôVig
kê sinh học về mức độ đồng nhâ*t của các thí nghiệm được trình bày nhằm
giúp bạn đọc áp dụng đê kiểm tra các thí nghiệm loại hình đó của mình.
Thí dụ sau đây sẽ minh họa phương pháp kiểni tra dó.
b. Thi dụ và phân tích tính toán cụ thê
Thí dụ 4.4. Sô" liệu 32 224 trẻ em sinh ra ở ihành phô" Hà Nội trong
ngày 1/6/2001 và được trình bày trên báng 4.4 với khoảng cách thời gian ba
giò. Hãy xác định tần suất trẻ em sinh ra có phân bô* đểu theo các khoảng
thòi gian trong ngày không?
Bảng 4.4. S ố trẻ sinh ngày 1/6/2001 tại thành phố Hà Nội
Sinh ra trong thòi gian (giờ) rắn suât quan sát T ỳlệ(% )

T ừ 0 ,0 0 đ ế n 3 ,0 0 4064 1 2 ,6
0 3 ,0 1 • 0 6 , 0 0 4267 1 4 ,4

0 6 01 - 0 9 0 0 4488 139

0 9 ,0 1 - 1 2 ,0 0 43 5 1 136

1 2 0 1 - 1 6 00 3262 1 0 .1
1 5 .0 1 - 1 8 ,0 0 3630 1 1 .3

1 8 ,0 1 -2 1 ,0 0 •3577 11.1
2 1 ,0 1 -2 4 ,0 0 4225 1 3 .1

Tổng 32224 10 0 ,0

139
Giả thuyết không (Ho): sô' lượng trẻ em sinh ra bàng nhan trong tám
khoảng cách thòi gian tương ứng trong ngày (mỗi khoảng thời giani là 3
giờ).
Giả thuyết kháng không (H|): chúng không sinh ra đều nhau trong
táin khoảng cách thòi gian tương ứng trên. Các bước phân tích và tíinh cụ
thể như sau:
Xác định tần suất mong đợi
Tần suất mong đới (E) được xác định theo công thức sau:
E = np
trong đó:
- n là tổng số trẻ em sinh ra trong ngày;
- p là tỷ lệ trẻ em sinh ra trong mỗi khoảng cách thời gian thu được.
Vậy, tần suất mong đợi sẽ được xác định theo công thức sau:
E = 32224 X 1/8
= 4028,0
Lập bảng tần suất lý thuyết và thực tiễn
Bảng 4.5. Tần suất thực tiễn và độ lệch glCtì thực tiễn và lý thuyết
Sinh trong thời gian (gid) Tẩn suất t (t-lf (t-l)'/l

TỪO.OO đến 3,00 4064 1296 0,32


03.01 - 06.00 4267 57121 14.18
06.01 - 09 00 4488 211600 5253
09 01 - 1 2 00 4351 104329 25.90
12.01 -1 5 ,0 0 3262 586756 145,67
15.01 -1 8 ,0 0 3630 158404 39,33
1 8 ,0 1 -2 1 ,0 0 3577 203401 50,50
21 01 - 2 4 00 4225 38809 9,63

Tổng 32224 338,06

Tính giá trị ^ th í nghiệm: xi^ ~ 338,06


Tính độ tự do (DF)
DF = 8 -1
=7
Tra bảng và so sánh giữa hai giá trị

140
M.O"
' {.'i^H.oe) lớn hơnXbiinK" ( H . o ? ) liên sự sai k h á c g i ữ a c h ú n g có ý n g h ĩ a
I'ât rù rệt .
Kết luận
vỏi sô’ lượiig tre em sinh ra giữa thực lố so với tỷ lệ lý thuyết quá
chứnli lệch nên giá thuyết không ở trên khóng được châ"p nhận. Nói một
cách khác, sô liệu thu được từ thực tế không tuân theo lý thuyết có nghĩa là
trẻ em sinh ra không đồng đều trong tám khoáng thòi gian trong ngày.

2. Thí nghiệm có hai yếu tố


Thí nghiệm có hai vếu tô’ nghiên cứu vê sự phù hợp giữa các tỷ lệ thực
tiễn và lý thuyết khá phổ biến trong lĩtih vực sinh học, Có râ"t nhiều phương
plìáp kiểm tra thôVig kê sinh học c h o các trường hỢp khác nhau, ở đây trình
bày phương pháp kiếm tra cho tiưòng hợp chung ỉihât của mô hình thí
nghiệm này.

2.1. T rư ờn g hỢp ch u n g
Thi dụ 4.5. Kết quả của mộl thí nghiệm dùng ba loại huyết thanh
kháng vi trùng uô"n ván của bò, ngựa và cừu. Với 498 người được đưa vào
thí nghiệm hoàn toàn ngẫu nhiên và thu được kết quả như ở bảng 4.6. Hây
sử dụng phương pháp kiểm tra thống kê sinh học X" để xét xem liệu các
ph;in ứng giữa các loại huyết thanh trên có khác nhau không?.
B ả n g 4.6. Kết quả phản ứ n g của ba loại huyết thanh

Huyết thanh S ố ngưài Số nguời có phản ứng Tỷ lệ phản ứng (%)

Bò 205 25 1 2 ,2
Ngưa 148 42 2 8 ,4

CỪU 145 17 1 1 .7

Giá thuyết không (Ho); khả năng phản ứng của ba loại huyêt thanh
như nhau.
Ciiá thuyết kháng không (H|): kh;i Iiăng Ị)hản ứng của ba loại huyêt
thanh khác nhau.
Đầu tiên, lập bảng phân chia theo hai chiều: một chiều mô tả phản
ứng có hoặc không và chiều kia niô tả các loại huyết thanh sử dụng: bò,
ngựa và cừu (bảng 4.7).

141
Bầng 4.7. Tổng họp giCfâ phản ứng với loại huyết thanh
Phàn ứng C6 Không X

Huyết thanh Bò 25 180 205


Ngira 42 106 148
CiAi 17 128 145

I 84 414 498

Giả thuyết nêu lên rằng khả náng một ngưòi ỏ trong cột dọc sô 1 của
bảng không bị ảnh hưỏng bỏi bâ't cứ hàng nào. Như vậy có nghĩa là giữa cột
và hàng là hoàn toàn độc lập với nhau. Do chúng độc lập với nhau nê!i có
thề áp dụng với quy tắc tích để tính các khả năng của chúng như sau:
- khả năng (Pr) của người trong hàng 1 sẽ được tính = 205/498;
- khả năng của người trong hàng 2 sẽ được tính = 148/498;
- khả năng của người trong hàng 3 sẽ được tính = 145/498;
- khả năng của ngưòi trong cột 1 sẽ được tính = 84/498;
- khả năng của ngưòi trong cột 2 sẽ được tính = 414/498.
Nếu Ho là thực, có nghĩa Ho được chấp thuận thì:
- Pr của ngưòi trong cột sô' 1 và hàng thứ nhất sẽ được tính bằng công
thức sau:
Pr = 205/498 X84/498
T ần su ấ t m ong đợi của ngưòi trong cột số 1 và hàn g thứ nhất sẽ được
tính bằng công thức sau:
^ _ 205 , 84
E --------------- X X 498
498 498
_ 205x84
498
= 34,6
Tần suầ"t mong đợi tổng thể sẽ được tính bằng công thức:
„ _ Tổng của hàng X Tổng của cột
“ ~ ------- ;------------- :— 7---------
Tông của các tông
Tương tự, tính kết quả của các giá trị lý thuyết của các hàng và các cột
được trình bày ồ bảng 4.8.

142
Bảng 4.8. Kết quà vế các giá tri lý thuyết hnng vá cột
Phàn ứng Có Không ỵ

H u y ế t th a n h Bò 3 4 .6 1 7 0 ,4 2 0 5 ,0

N gưa 2 5 ,0 1 2 3 ,0 1 4 8 ,0

Cừu 2 4 .5 1 2 0 ,5 1 4 5 ,0

1 84 ,1 4 1 3 .9 4 9 8 ,0

Nếu làm tròn số (không lấy số thập phân vì cơ thề sinh vật không thể
là sô’ t h ậ p Ị)h â n ) t h ì k ế t q u ả ớ b ả n g giá trị nioiig dỢi ỏ đ â y giôVig n h ư g iá t r ị
thu đưỢc trong thực tế.
Giá trị X" chính là một trong những sô do mức phán tán giữa tần suất
thực tiễn và tần suất lý thuyết (hay oòn gọi là laii suất mong đợi) khi giả
thiêt không đưỢc công nhận là thực.
. ỵ - y (2 5 -3 4, 6) ^ (42^25.0)^ (17-24.5)- (1 80- 170 ,4) ^
34,6 2 d ,(ỉ +

( 1 0 6 - 1 2 3 , 0 ) ( 1 2 8 -120,0) -
123.0 120,5

= 19,92
Xác định DF bằng cách lấy sô hàng (r) -1 nhân với số cột (c) - 1. Vậy,
gicá trị được xác định theo cônh thức: DF = (r • l)(c - 1). Tại thí nghiệm này
dộ tự do df=(3-l)(2-l) = 2
Tra cứu xác định giá trị X' bầng với DF = 2. Vói mức độ tin cậy
Í‘= 0 , 1 % thì X h :m g ' =13,82. Vậy, X,' > Xì,..iik' nên giá thuyết trên không được
chấp nhận (P<0,001), có nghla giữa số liệu lý ihuyốt và sô'liệu thực tế hoàn
toàn khác nhau hay sô liệu thực tê không tuân theo quy luật của lý thuyết.
H uyết thanh ngựe'\ có thể dùng dể sáìi xuất (tưực mức dộ kháng thể có lợi.
2.2. T rư ờng hơp bô sô liêu quá nhỏ
a. Khái niệm
Điều kiện đế những bộ sô’ liệu dược coi là quá nhỏ nếu chúng có đầy đủ
hai đặc điểm cơ bản sau:
- chỉ có một giá trị mong đợi nhỏ hơn 5;
- không có giá trị mong đợi nào nhổ hơn 1.
Nguyên nhân của phương pháp kiêm tra X" không được phép dùng cho
các bộ số liệu quá nhỏ là vì giá trị 7 ,- chỉ tuân theo sự phân bô" một cách

143
tương đôi do quá trình thực hiện bình phương giá trị X" nếu giả thuyết của
phưdng pháp kiểm tra là thực. Do sự tương đôì đó dẫn đến có thê làm oho
không thoả mãn vối những giá trị mong đợi là quá nhỏ bé. Hãy xét thí dụ
sau để làm rõ vâVi để đó.
Thí dụ 4.6. Hãy kiếm tra mức độ đồng đểu về ảnh hưởng của h ai 3êu
tố: tắm nắng và không tắm nắng đôì vói tổng sô' 30 rắn hổ chúa có chửa
hoặc không có chửa của một thí nghiệm đưỢc tồ chức tại Trung tâm y tế
q u ố c t ê ( r ắ n được c h ọ n v à o t h í n g h i ệ m h o à n t o à n n g ẫ u n h i ê n ) . K ô t q u ả đ ó
được trình bày ở bảng phân tích tồng hợp phức cách hai chiều: một chiều là
ảnh hưởng của tắm nắng: có và không tắm nắng và chiều kia là những con
rắn có chửa và không có chửa (bảng 4.9).
Bảng 4.9. Tổng hớp giữa rẳn tắm nắng và chửa
Tắm nắng Có Không 1

Rắn có chửa 11 5 16
Rắn không có chửa 4 10 14

I 15 15 30

Tại thí nghiệm này, hai yếu tô" rắn có chửa hoặc không chửa và rắn có
tắm nắng hoặc không tắm nắng hoàn toàn độc lập nhau.
Giả thuyết không (Ho): khả năng ảnh hưởng của tắm nắng và không
tắm nắng đôi vối rắn hố chúa có chửa và không chửa đểu bằng nhau.
Giả t h u y ế t k h á n g k h ô n g (H ị): g i ữ a c h ú n g có s ự khác nhau.

Các bước tính toán tường tự giống như đã trình bày ỏ thí dụ 4.5 trên
đây. Kết quả thu được sau khi tính toán là Xt" = 4,82.
Tra bảng X* vói DF = 1 và mức độ tin cậy 0,1% là 13,82. Vậy, X,- > XhnniT
nên giả thuyết trên không đươc châ"p nhận (0,02<p<0,03), có nghĩa những
con rắn có chửa thưòng tắm nắng nhiều hđn những con rắn không chửa.
Nhưng do số liệu quá nhỏ nên các kết quả ỏ đây cùng chỉ có thể rút ra
kết luận tạm thời chứ không chắc chắn vì chi’ cần một con rắn chuyển từ
nhóm tắm nắng sang nhóm không tắm nắng thì kết quả Xt^ sẽ bị thay đổi
ngay và giá trị mới sẽ là = 3,45. Như vậy, với giá trị vừa mối tìm đưỢc Xi"
= 3,45 này thì các nhân tô”trên không biểu thị sự sai khác rõ rệt, có nghĩa
là giả thuyết giữa chúng không có sự khác nhau được chấp nhận.
b. Kết luận
Như vậy, trong những trưòng hợp mà bộ sô' liệu quá nhỏ, bắt buộc phải

144
sử dụng hệ sô điều chỉnh thì kết quả mỏi dưỢc tin cậy. Hệ sô" điểu chỉnh
thírh hỢp nhất cho bộ sô"liệu quá nhỏ thưòng dược dũng là hệ sô điều chỉnh
Yate.

2.3. H ệ sô 'đ iều c h ỉn h Yate


a. Hệ RÔ điều chỉnh Yate là gì?
Khi có hai nhân tô’ thí nghiệm trong một sự phân bô mà độ tự do chỉ
b ằ n g 1 t h ì g iá t r ị t h u đ ư ợ c c ủ a p h é p k iê m t r a sẽ rã't lớ n n ê n t a c ầ n á p d ụ n g
hệ sô điều chỉnh Yate. Hệ sô điều chỉnh Yáte là inột hệ sô" điểu chỉnh làm
c h o s ự b iế n đ ổ i c ủ a bộ sô' li ệ u t r ỏ t h à n h liê n t ụ c c h ứ k h ô n g b ị n g ắ t q u ã n g đ ể
áp dụng cho tính toán đôì vối một thí nghiệm có dạng 2 x 2 (biểu diễn
theo hai chiều nià mỗi chiều chỉ có một nhân tố riêng biệt). Hệ số điều
chỉnh Yate được tiến hành thực hiện theo từng bưóc cụ thể như sau: ở tử sô",
lâV giá trị tuyệt đốì của độ lệch giữa tần suất thực tiễn và lý thuyết (t - 1)
trừ đi 0,5 trưốc khi thực hiện phép bình phương. Như vậy, công thức tính
hệ sò •/- có áp dụng hệ sô"điều chỉnh Yate có sự thay đổi.
Công thức tính X‘ ■có áp dụng hệ số điều chỉnh Yate:

trong đó:
- 1 là tần suâ't quan sát thực tiễn;
- I là tần suâ't lý thuyết;

- I I là giá trị tu yệt đối;

• 1/2 là hằng số.


Thí dụ 4.7. Kiểm tra tỷ lệ tròng : mái của 16 chim cút được lấy ra một
cách ngẫu nhiên từ một quần thể chim cút nuôi tại Trung tâm nghiên cứu
gia cầm Thuỵ Phương. Trong số đó, có 12 chim trống và 4 chim mái. Hỏi
quản thể chim cút đó có tuân theo quy luật sinh học lý thuyết trống ; mái tỷ
lệ 1:1 không?
b. Cách g iả i bài toán
Từ bộ sô liệu trên ta có:
Giả thuyết không (Hjj) là tỷ lệ giữa trống và mái bằng nhau.

145
Giả thuyêt kháng không (Hi) là tỷ lệ giữa trông và mái không hằng
nhau.

Để kiểm tra sự đồng nhâ’t của tính biệt trông và mái dàn clniii CÚI thí
nghiệm được rút ra từ một quần thế chim cút, ta có thể tiên hành BO sánh
theo hai cách tính: có và không sử dụng hệ sô diều chỉnh Yatc dê chứng
minh nên dùng hay không nên dùng hệ số điểu chỉnh Yate.
c. Không dùng hệ s ố điều chinh Yate

X J

y-
, _= -------------------
(12-8)'“^ + (4-8)-
8 8
= 4,0

Vói DF = 1 và p = 0,05 thì có sự sai khác vì Xi" (4,0)> X|- (3.84), có nghĩa
là t ỷ lệ t r ô n g m á i c ủ a m ẫ u t h í n g h i ệ m đư ợ c r ú t r a t ừ d à n c h im c ú t k h ô n g
p h ù hỢp q u y l u ậ t s i n h h ọ c lý t h u y ế t .

d. Có dùng hệ s ố điều chỉnh Yate


11-0,5)^
r L J -

^ (112-81-0,5)- (14-81 •0.5)-


8 ^ '8
= 3,062
Với DF = 1 và p = 0,05 thì kết quả ở thí nghiệm có dùng hệ sô điều
chỉnh Yate không biểu thị sự sai khác rõ rệt vì Xt' (3,062) < 7j- (3,84), có
nghĩa là tỷ lệ chim cút trôVig và mái phù hợp với quy luật lý thuvót sinh học
theo tỷ lệ 1:1.
Như giả thuyết đã nêu trên đây là chim cút trông và niái dểu phân tán
ngẫu nhiên trong quần thể. Song, cần lưu ý rằng ở một sô' trường hỢp tỷ lệ
trống mái không tuân thủ theo 1:1 nên đã gây nên sai lệch. Lưu ý, hệ số
điều chỉnh Yate có thể dùng để tính toán trong các trường hợp bộ sô liệu
quá nhỏ cho các báo cáo để kết quả thu được chính xác. Song, ỏ nước ta do
phương pháp sử dụng hệ sô"điều chỉnh Yate không được phổ biến rộng rãi,
và nó không thuận tiện trong khi tính toán củng như lúc trình bày nên
trong thực tiễn nưóc ta ít dùng đến nó.

146
B . P H Ư Ơ N G P H Á P K IỂ M T R A G

I. Đ Ặ C Đ IỂ M C H U N G

Phương pháp kiểm tra thôVig kê sinh học G cũng là một trong những
phiíơng pháp kiếm tra mức độ phù hỢỊ) giữa tan su.it thực tiễn và tần suất
lý thuyết tô’t nhât. Phương pháp kiêm tra G có đặc tính, nội dung và
phương pháp phân tích, tính toán tương tự giông như phương pháp kiểm
tra x~. Song, phương pháp kiểm tra G có một sô ưu điểm tốt hơn so với
phương pháp kiểm tra đó là: dễ làm và đơn giản hơn, đặc biệt dễ sử
dụng cho máy tính cầm tay.
Theo các nhà toán học phân tích thì vê' mặt lý thuyết tnà nói phương
pháp kiểm tra G có nhiều thuận tiện và hiện đại hơn trong việc áp dụng.
Công thức tính của phương pháp kiểm tra G như sau:

G = 2 X I t In

ti o iig dỏ:

- t là tần suâ*t thực tiễn;


- 1 là tần su ấ t lý thuyết;

- In là hàm sô'logarit tự nhiên.

II. CÁC P H Ư Ơ N G P H Á P K IỂM TRA G

Phương pháp kiểm tra thống kê sinh học G là một trong hai phương
pháp dưỢc dùng phổ biến nhất tì‘OMg việ(í plìâiì tíòlì kiểm tra sự phù hỢp
g iữ a lỷ lệ t h ự c t i ễ n t h í n g h i ệ m với lý th u y ế t được t í n h t ừ c á c q u y l u ậ t s i n h
học. Có nhiều phương pháp khác nhau, tuỳ thuộc vào sô' yếu tô”thí nghiệm,
loại niô hình thí nghiệm, vv để phân tích kiểm tra sự phù hỢp đó. Song, có
thê nêu lên đây mâV phương pháp cơ bản và thông dụng nhất:
- phương pháp áp dụng cho tần suât thí nghiệm có một yếu tô;
- phương pháp áp dụng cho tần suâ't thí nghiệm dạng 2x2;
- phương pháp áp dụng cho tần suất thí nghiệm dạng hàng Xcột.

147
1. Áp dụng cho tần suâ't thí nghiệm có một yếu tô'
1.1. Vài n ét 8tí hộ v ề p h ư ơ n g p h á p k iêm tr a G
Trong lĩnh vực sinh học nói chung, thí nghiệm chỉ có một yèu tố dể so
sánh sự sai khác nhau giữa tỷ lệ thực tiễn so với lý thuyết của một quy lu<ậ(
s i n h h ọ c t h ư ò n g được s ử d ụ n g n h i ề u , n h á t là t r o n g l ĩ n h vực d i t r u y ề n h ọ c
và chọn giốhg. Ngoài ra, một số thí nghiệm muôn kiếm t r a Iiiứcđộ(lồng
nhất của một quần thể, sự phân ly một số tính trạng trong c<ác lô hỢỉ) lai, sự
phân bô" đồng đều trên một đdn vị thòi gian, v.v cũng cần dùng phương
pháp kiểm tra thốhg kê sinh học G. Mục đích, đặc điểm, nội dunfĩ và
phương pháp phần tích kiểm tra sẽ đưỢc minh họa trong thí dụ sau dây.
Thí dụ 4.8. Trong một hỗn hỢp bốn giống gà mới IIƠ và số lượiig các
giôVig gà đó đểu bằng nhau, người ta nhặt ra một cách hoàii loàn ngẫu
nhiên 75 con thì thấy trong sô* đó có 24RR, 32LP, lOTH và 9Ỉ)T. Hỏi sự
phân tán của đàn gà con có đồng đều không? Tại bảng 4.lơ, trình bày sô
liệu về tần suất thực tiễn của thí nghiệm và giá trị lý thuyết.
Bảng 4.10. Tấn suất thực tiễn và lý thuyết của cảc giống gà
Giống gà RR LP TH ĐT

Tần suất thực tiễn (t): 24 32 10 9


Tần suất lý thuyết (I): 18,75 18,75 18,75 18.75

ghi chú:
- RR là giống gà Rốt RI;
- LP là giống gà Lirang Phưạig;
- TH là giống gà Tam Hoàng:
- ĐT là giống gà Đông Tào.

1.2. Các bước tiến hành


a. Tim tổng của các tích t với logarit (t/l)
I t In (ưl) = 24ln(24/18,75) + 321n(32/18,75)
+101n(10/18,75) + 91n(9/18,75)
= 5,925 + 17,105 + (-6,286) + (-6,606)
= 10.138
b. Tính G theo công thức sau:
G = 2 x lt In (ưi)
= 2 X 10,138
= 20,276

148
c. Tính hệ sỗ điều chỉnh Williarn (CFịị):
Hộ sô'điểu chỉnh William được xác (lịnh theo cònfí tliức sau;

('iv = 1 + ^
BnDỈ-'
trong dó:
- C h \ là h ệ sô^ diề u c h ỉ n h c ủ a VVilliani;

* a là sô nhóm mẫu hay tần xuâl lớp:


' n là tống dung lượng mẫu;
- DF là độ tự do và được tính = a - 1.
Hộ số hiệu chỉnh CF^ là:

cF vv = 1 +
6x75x3
= 1 + (15/1350)
= 1,0111
d. Tinh giá trị G đã được hiệu chính theo hệ sô'William (G J
G |uéu chinh w ~ G / C I * „

= 20,276/1,0111
= 20,053
e. Kết luận
S o s á n h g iá trị G,„ệu chinh w với X" sử d ụ n g D F = 3. G iá trị Gh.ệu chính w
(20,053) tưổng đương vổi giá trị %- (19,98). Như vậy, với thí nghiệm chỉ có
niột độ tự do thì phướng pháp kiểm Ira G không khác so vói phương pháp
kiồin tia X'-

2. Áp dụng cho tần suất thi nghiệm dạng 2x2


2 .1 . Khái niệm
Trong trường hỢp thí nghiệm có dạng 2x2 thì không cần thiết phân
biệt giữa giá trị thực tiễn và lý thuyết. Có thề ký hiệu tần suât quan sát
h a y t h ự c t i ễ n là f. I^ấy t ầ n s u ấ t q u a n s á t n h â n vói (x) l o g a r i t t ự n h i ê n c ủ a
chính nó rồi cộng các các tích CÌQ lại vâi Iihau. Cách tính này râ*t dễ trong
việc sử dụng máy tính cầm tay. Thí dụ 4.9 sau đây sẽ minh họa cụ thể.

149
2 .2 . Thi du và các bước tinh chinh
é

Thí dụ 4.9. Mức độ nhiễm bệnh của đàn ỈỢn nhập nội tại hai cd sỏ
chăn nuôi Iđn ỏ Việt Nam thu được như sau: Trại A không bị nhiỗin 86 con,
bị nhiễm 15 con và trại B tưdng ứng 32 và 12 con. Hỏi sự khác nhau vê mức
độ nhiễm bệnh giữa hai trại có ý nghĩa không?
Để xác định được sự nhiễm bệnh của lớn trên hai cơ sở chãii nuôi ỏ
n ư ố c t a có k h á c n h a u h a y k h ô n g , c ầ n x á c đ ị n h đưỢc t ầ n s u â ”t q u a n s á t v à
tổng của các yếu tố. Kết quả cụ thể được trình bày ở bảng 4.11.
Báng 4.11. Tẩn suất và tổng thực tế các yểu tố
Không bị nhiễm BỊ nhiễm Tổng

Trại A a b a+b
86 15 101
Trại B c d c+d
32 12 44
Tổng a+c .b^-d a+b+c+d
118 27 145

ghi chủ:
- a, b. c và d là các tần suất quan sát tưong ứng của mỗi yếu tố của mô hình;
- 86,15. 32.12 là tẳn suất cụ thể của thi nghiêm đối với các yếu tố tương ứng:
- a+b và c+d tổng đàn lợn của các trại A và B tưong ứttg;
- a+c và b+d là tổng sỏ’ lợn bị nhiễm và không bị nhiễm bệnh của cà hai trại.

a. Tính Z fln fch o tất cả từng tần suất thực tiễn


I(f InO = 861n86 + 151nl5 + 321n32 + 12lnl2
= 564,417
b. Tính ln ỉjc h o tổng tấ t cả các tần suất thực tiễn
= 145 lnl45
= 721,626
c. Tính ỵ fln fc h o tấ t cả tổng hàng và cột: f là tần suất của hàng và cột
I (f Iní) =1011nl01 + 44ln44 + lis in l 18 + 271n27
= 1284,560
d. Cộng các kết quả Z(f InO tổng của từng tần suất thực tiễn và
lnLf tổng tầ”t cả tần xuất rồi trừ đ i kết quả của S(flnO của tống tần suất
hàng và cột.
564,417 + 721,626 - 1284,560 = 1,483

150
e. Tính giá trị G theo công thức aciu:
G = 2 X [I(f ..... . + (innXO,,„,. - ^(nnOh.„,H..>t]
= 2x1,483
= 2,966
g. Tính CF„ theo công thức sau:

t h w-- 1+
1 — ■ llKii/íí + í') +---- -------
+ d) • _i
1]
. 6n
= 1 + ((145/101) + ( 1 4 5 / 4 4) -1ỊÍ145 / 1 18
" 6 xT 4 õ

= 1 + (20,891/870)

= 1,024
h. Tính , 7,,,,/, bằng cách chia G cho CF(V
^*hiẹu i-hinh w ” G /C P ^ .

= 2,966/1,024
= 2,896
So sánh với / sử dụng giá trị DF = (r-ỉ)(c-l)=I
i. Kết luận
■ Giá trị G tính đưỢc (2,896) < X" (3,84) ớ mức tin cậy p=0,05 nên sự
khác nhau về mức dộ nhiễm bệnh giữa hai trại lợn không có ý nghĩa rõ rệt.
- So sánh giá trị Ghiệudtinh wvới 7,“ sử dụng hộ sô’hiệu chỉnh Yate thì giá
Í^hiíii .hinh w này (2,896) lớn hdn giá trị X' sử dụng hệ sô' hiệu chỉnh Yate
(2,;ỉ55).

3. Áp d ụ n g c h o tầ n s u ấ t th í n g h iệ m d ạ n g h à n g X c ộ t

3.1. K h á i n iệm và cá ch tinh


Trong trường hỢp th í nghiệm có dạng hàng X cột (r x c ), các bước tính
của phướng pháp phân tích kiểm tra thống kê sinh học giôứĩg như dạn g 2 X
2 đã nêu trên đây, có nghĩa cũng không cần thiết phân biệt giữa tần suất
thực tiễn và lý thuyết. Có thế ký hiệu, tần suất quan sát hay thực tiễn là f
rồ i l ấ y t ầ n s u â ”t q u a n s á t n h â n với l o g a r it t ự n h iê n c ủ a c h í n h n ó v à s a u đ ó
cộng các các tích đó lại vối nhau.
3.2. So s á n h vớỉ d ạ n g th i nghiệm kiểu 2 x 2
Thí nghiệm có dạng hàng X cột hầu hết giôVig thí nghiệm có dạng 2x2,

151
song cũng có những điểm cd bản khác nhau sau đây;
a. Độ tự do khác nhau
Phưdng pháp tính độ tự do giốhg như nhau, song ỏ đây hàng vá cột có
thể khác vôi trị sô" 2 ở mô hình thí nghiệm dạng 2 X 2. Vì vậy, độ tự do d mô
hình thí nghiệm hàng X cột được tính theo công thức sau:
DF = (r-l)(c-l)
trong đó:
- r là tổng sô”hàng được bô”trí trong các thí nghiệm;
- c là tổng số cột được bố trí trong thí nghiệm.
Vì vậy, độ tự do trong mô hình thí nghiệm hàng Xcột có thô > 1. Thực
chất, mô hình thí nghiệm dạng 2x2 là một dạng đặc biệt trong các dạng của
t h í n g h i ệ m h à n g X cọt.

b. Không cần thiết áp dụng hệ sô'điều chỉnh cho một s ố trường hợp
Cũng có thể do r > 2 và c > 2 nên DF > 1. Vì vậy, giá trị G, có thề lỏn
hđn G| rất rõ ràng mà không cần áp dụng hệ số điều chỉnh.
Do chỉ có một số điểm khác nhau vừa nêu trên so với thí nghiệm dạng
2x2, còn phương pháp và các bưốc tính toán hoàn toàn giống nhau nên
không trình bày cụ thể phướng pháp phân tích kiểm tra mô hình thí
nghiệm dạng hàng Xcột.

c. MỘT SỐ ĐẶC ĐIỂM CỦA PHƯƠNG PH Á P KIỂM t r a

Để kiềm tra mức độ đồng nhất, mức độ ngẫu nhiên, sự phù hỢp giữa
t ầ n s u ấ t t h ự c t i ễ n v à lý t h u y ế t , s ự p h ù h ợ p c ủ a m ộ t q u y l u ậ t s i n h h ọ c , V .V .,

cần phải áp dụng phưdng pháp kiểm tra sự phù hỢp và G này. Đê thề
hiện rõ ràng hơn về các đặc trưng của phưđng pháp kiểm tra này và ứng
dụng-cụ thể của mỗi phướng pháp áp dụng vào các mô hình thí nghiệm khi:
1. Kiểm tra so sánh mức độ đồng nhâ”t giữa tần suâ*t thực tế và lý
thuyết nếu giả thuyết không (Ho) đã được chấp nhận. Chú ý rằng, khi tính
tầ n su ấ t lý th u yết là phải dựa trên mô hìn h toán học thích hỢp vối quy lu ậ t
sin h học đang đừđc n gh iên cứu. c ả h ai phương pháp X' và G đều áp dụng
được nhưng ỏ phưdng pháp G không cần thực hiện phép tính ở giai đoạn
trung gian khi xác định tần suất lý thuyết. Các phương pháp này (lùng

152
niiiéu trong di truyền học và tạo giống vạt nuòi dô khẳng định sự đóng góp
c ủ a m ỗ i t h à n h v iê n n h ằ m x á c d ịn ti giá Irị g iô n g cỉự đ o á n c ủ a c á c n h ó m
g iô n g h a y tố’ hỢp lai.

2. Do kết quá loại thí nghiÌMii này (iược biêu thị theo đơn vị số lưỢng
Iién c á c sô liệ u p h ả i đ ư ợ c đ ư a v ào ihoo các n h ó m Iihỏ n à o đ ó n h ư n g k h o ả n g
c á c h n h ó m p h ả i b ả o đ ả m rõ r à n g và b ắ t buộ c p h ả i m a n g t í n h liê n tụ c ,
không n g ắt quãng.

3. Mẫu thí nghiệm phải được lâV một cách hoàn toàn ngẫu nhiên và
các sò liệu phải độc lập vổi nhau, kliỏiig có bâ’l cứ niột sự ràng buộc nào.
4. Kích câ inẫu thí nghiệm phái đủ lỏn, vỏi tần suất thực tiễn của tổng
dung lượng mẫu là n và tần suât lý ihuyêt phái >5. Cũng có thế có trưòng
hợp tần suất lý thuyết < 5 nhưng số tần suất đó không vượt quá 1/5 tổng số
của tần suâ”t lý thuyết và không có bất cứ một tần suâ"t lý thuyết nào < 1.
5. Tất cả các tần suất thực tiền phái là sô liệu thực tê thu được từ thí
nghiệm chứ không phải là sô" liệu tíiih toán hoặc dẫn xuâ”t từ bất kỳ một
phép tính nào của những sô"liệu quan sát.
6. Chỉ được áp dụng hệ số điểu chỉnh Yate khi có DF = 1 ỏ phương
pháp kiểm tra Cùng tương lự, chỉ dưỢc áp dụng hệ sô' điều chỉnh
William trong phướng pháp kiểiii tra dơn cách và mô hình thí nghiệm dạng
2 X 2 ở G |„ ị,„ ,.ị„ „h w Trong trường hỢp mô hình thí ĩighiệm có dạng hàng X cột
(r X c) mà có DF > 1 thì không đưỢc sử dụng hệ số điều chỉnh W illiam .
Nhìn chung, hai phương pháp kiểm tra thống kê sinh học và G
tư ơ n g tự n h ư n h a u v à đ ểu được á p d ụ n g rộ n g ră i tr o n g lĩn h vực di tr u y ề n
và chọn giống. Song, giá trị các kết quả thu dược từ phưđng pháp kiểm tra
G thư ờng biến động nhiều hơn so với phưđng pháp X" nên giả th u yết không
(H„) dỗ bị không chấp thuận hơii so vứi X'- Thực tế, phương pháp kiểm tra
•/- đang đưỢc dùng khá phô’ biến song phưcíng pháp kiểm tra G đang có xu
h ư ớ n g p h ấ it t r i ề n m ạ n h h ơ n vì nó l ấ t lin h d ộ n g t r o n g v iệ c s ử d ụ n g v à đưỢc
dễ dàng tính toán hdn khi sử dụng niáy tính cầm tay.
Một số thí nghiệm nghiên cứu tt ong lĩnh vực sinh học được các nhà
khoa học sử dụng nhiều các phương pháị) kiểm tra và G này là:
-so sánh sự sai khác giữa só liệu thí nghiệm thực tiễn và sô" liệu lý
th uyếl;
■nguyêỉi nhân gầy nên mối tương quan giữa các sô liệu;
- kiểm tra sự phù hỢp giữa tỷ lệ tần suất thực tế và lý thuyết,

153
- dạng thí nghiệm 2x2 và hàng X cột (r X c),
- khảo nghiệm các thí nghiệm dựa theo những quy luật, định !ý, dịnh
l u ậ t , v .v đ ặ c b i ệ t t r o n g c á c q u y l u ậ t v à đ ị n h l u ậ t d i t r u y ề n c h o c á c g iô n g v ậ t
nuôi, cây trồng, một thế hệ trong công tác giồng, ... tại một địa diểm nào dó.
Tóm lại, phưdng pháp kiểm tra thông kê sinh học x' và G cung cấp một
phưđng pháp đánh giá giả thuyết về một quần thể nhất định có dạng phân
bô' r i ê n g b i ệ t c ủ a nó. H a i p h ư ơ n g p h á p k i ể m t r a n à y d ù n g n h i ề u t r o n g v iệ c
phân tích đánh giá và so sánh tần suất thực tế của thí nghiệm với tần suất
lý t h u y ế t t h e o c á c q u y l u ậ t s i n h h ọ c n h ấ t đ ịn h . H a i p h ư ơ n g p h á p n à y đ ư ợ c
s ử d ụ n g r ấ t n h i ề u t r o n g l ì n h v ự c n g h i ê n c ứ u d i t r u y ề n h ọ c và c h ọ n g i ố n g
v ậ t n u ô i c â y t r ồ n g n h ằ m k h ẳ n g đ ị n h n h ữ n g t í n h t r ạ n g k i n h tô q u a n t r ọ n g
c ủ a câ"c g i ô n g v ậ t n u ô i v à c â y t r ồ n g liệ u c h ú n g có t u â n t h e o c á c q u y l u ậ t d i
t r u y ề n h ọ c c ủ a n ó h a y k h ô n g đ ê đ ị n h h ư ớ n g tạ o v à c h ọ n g iô n g đ ạ t h i ệ u s u ấ t
c ao .

Đ ế n đ ây , q u a các p h ư d n g p h á p k iể m tr a đ ã n ê u tr ê n cho p h é p c h ú n g ta
cỏ thể khẳng định được rằng hầu hết giá trị trung bình của kết quả cáo thí
nghiệm đã có các phương pháp kiểm tra thích hợp và dã được đánh giá một
c á c h t h o ả đ á n g . T h ế n h ư n g , t r o n g m ộ t sô" t h í n g h i ệ m d o có q u á n h i ề u n h ó m
hoặc nhiều nhân tô”thí nghiệm nhưng niục tiêu của thí nghiệm chỉ yêu cầu
so sánh sự sai khác tổng thể thì không nên áp dụng các phương pháp kiểm
tra trên vì tôVì quá nhiều thòi gian và không kinh tế. Những bộ sô liệu iYy
nếu chỉ yêu cầu so sánh sự sai khác tổng thế của các yếu tô" chung Ihì sử
dụng các phương pháp kiếm tra trên đây là không cần thiết, mất nhiều thòi
gian, thậm chí có những trường hỢp kết quả dễ bị người khác hiểu sai lệch
đi. Để thoả mãn cho việc thực hiện các phương pháp kiểm tra những bộ số
liệu này, một phương pháp phân tích kiểm tra thích hỢp được sử dụng, (tó
là phưđng pháp phân tích phương sai.

154
CHƯƠNG V

PHƯƠNG PHÁP PHÂN TÍCH PHƯƠNG SAI

A. ĐẶC ĐIỂM CHƯNG

I. K H Á I N IỆ M V Ể P H Â N TÍC H PH Ư Ơ NG SAI

Phương sai là tổng các bỉnh phương sai lệch, hay là tống các bình
phương của độ lệch chuẩn. Phân tích phương sai là phương pháp tách
phưđng sai tổng hay còn gọi phương sai chung thàph các'phương sai thành
phần. Trong các thí nghiệm, khi muôn so sánh giá trị trung bình từ ba mẫu
tiở lên thì phương pháp phân tích phiídng s.ai là phưđng pháp kiểm tra
Ihông kê thường được sử dụng nhiều nhâ’t vì thuận tiện, dễ làm và nhanh
nhất. Phân tích phương sai thực chất là một phương pháp phân tích kiểm
tra thông kê sinh học nhàm so sánh sự sai khác giữa các số trung bình mẫu
hay các yếu tô’ thí nghiệm. Phâii tích phương sai bao gồm ba nội dung
chính, đó là:
- xác định phưđng sai giữa các niẫu;
- phương sai trong các niẫu;
- so sánh sự sai khác giữa các phương sai thành phần đó.
Nội dung chính của phân tích phướng sai là phân tách tổng tất cả các
b i ế n đ ổ i h a y b i ế n đ ổ i c h u n g t h à n h các b i ế n đồi t h à n h p h ầ n cd b ả n n h ư g i ữ a
các mẫu và trong nội bộ các mẫu t ừ inột bộ số liệu thí nghiệm đã thu được
và sau đó so sánh sự sai khác giữa các biến đổi thành phần đó với nhau.
Hiểu một cách rộng hớn là kỹ thuật phân tích phương sai tổng cộng của tât
c;i I'ác sự biến đổi của một bộ sô”liệu thành các phương sai thành phần tạo
nên nó như nhân tô’ thí nghiệm, niỏi trường, sai sô và cuôì cùng so sánh sự
s a i k h á c g i ữ a c á c p h ư d n g s a i t h à n h Ị)h ầ n với p h ư ơ n g s a i s a i s ố n h ằ m x á c

155
định mức độ sai khác của các yếu tố thí nghiệm.
Sự biến đối do các nhân tô' làm ảnh hưỏng đến kết quá thí nghiệm
được gọi là sự biến đổi của các nhân tô thí nghiệm hay CÒII ciưọc gọi là
phương sai giữa các nhân tô th í nghiệm. Sự biến đối gây ra b(ji sự khác
n h a u g i ữ a c á c đ ơ n vị t h í n g h i ệ m h a y c á c t h à n h p h ầ n t r o n g t h í n g h iộ iii (iược
gọi là s ự b i ế n đối t r o n g c á c m ẫ u d o m ô i t r ư ò n g g â y r a h a y c ò n đưỢc gọi là
phương sai sai sô. Sự biến đối ngẫu nhiên không mong chđ của sô' liệu đóng
g ó p v à o s ự b i ế n đổi c ủ a s a i sô.

Phân tích phương sai còn có thể được hiểu theo một cảcli dđii giản
hơn, đó ià một phưđng pháp tính toán các thông sô thông kô dơn gian, thièt
lập bảng phân tích phương sai (anova) và căn cứ vào sự biến đổi của mỗi
thành phần nhân tô"đề chia phương sai chung hay phưđng sai tòng ihành
các phương sai thành phần. Đồng thòi, kiêm tra dược niứo độ sai khác có ý
nghĩa trong thôVig kê sinh học giữa các phương sai đó dựa vào phán bô K,
mà giá trị F được xác định bằng tỷ lệ giữa các phương sai thành phần và
phưong sai sai sô*.

II. G IẢ T H U Y Ế T Đ Ể S Ử D Ự N G A N O V A

Phân tích phương sai là một thuật ngữ thống kê sinh học biêu thị các
bưôc phân tích của phương sai (anova) được sử dụng để giải quyết hai vâ'n
đề chính, đó là:
1. Khám phá sự tồn tại của mối tương quan cố dịnh giữa các tham số
thông kê và hằng số. Có nghĩa là nếu m, là nhân tố cố định và chúng ta
muốn biết liệu m, = m, không và chính nó sẽ biểu thị có mối quan hệ giữa
chúng vối nhau hay không.
2. Khám phá sự tồn tại của các thành phần phưđng sai. Điều này nói
lên phương sai của X (Sj,^) = s^. Để áp dụng được phương pháp phân tích
phướng sai cần phải tìm xem liệu s- có chung cho tât cả niọi giá trị của X
hay không? Mô hình chung có thể được trình bày hhư sau:
- Xjj biểu thị cho mỗi sô'liệu quan sát với i và j = 1, 2,... e;
- i biểu thị cho hàng (r) thứ i“’, vối i = 1, 2,... r;
- j biểu thị cho cột (c) thứ j‘*’, với j = 1, 2,... c.
Những biểu thị đó có thể được mô tả theo sd đồ 5.1.

156
Sơ đồ 5.1. Mò hình bộ tạo sò liệu cho anova

tro n g đ ó :

- ỉả một biến số ngẫu nhiên nó được phân bổ theo giá trị trung bình M,, là một hằng s ố cố
định hay còn gọi lả tham sổ. Có nghĩa !à; E (X.J) = M., và E = M,,- M,, cho tất cả mọj giả trị i
và j.
• M ỗ i m ộ t g iá tr ị c ù a M,| là m ộ t k ý h iệ u c ò n g c h o tấ t c ả c á c g ỉá t r ị t r u n g b in h tư ơ n g ứ n g =
m .. + { m ,. - m .. ) + ( m .j - m . .) + o. K h i đ iế u k iệ n n à y đ ư ợ c th o ả m â n th ì m ,. - m .. là m ộ t s ố

đ o c ủ a s ự k h á c n h a u t r u n g b ìn h giữ a c á c ả n h h ư ơ n g tư ơ n g ứ n g đ ổ i v ô i n h ả n t ố b iể u th ị

t h e o h à n g , v à m .j - m .. tư ơ n g ứ n g đ ổ i với n h ả n t ố b iể u th i t h e o c ộ t.

- B iế n s ố n g ẫ u n h iê n là m ộ t b iế n s ô đ ổ n g n h ấ t c ó n g h ĩa !ả n ó c ó c ù n g m ộ t b iế n s ố đ ộ c ỉậ p

v à k h ô n g p h ụ t h u ộ c lẳ n n h a u . Đ iề u đ ó n ó i lẻ n rằ n g c h ú n g c ó th ể c ó n h ũ n g k ỳ v ọ n g k h á c

n h a u n h ư n g c ó c h u n g m ộ t p h ư ơ n g sai E { X - = s^.

- X ỉà tổng thể hay là tổng của tất cả các tổng hoãc tổng của tất cả các s ố liệu quan sát và
được tính theo công thức sau:
X = x, + ... + X,
= X , + X 2 + ... + X e

III. V A I T R Ò V À C H Ứ C N Ă N G CỦA ANOVA


X'

Như đã trình bày trước, phân tích phương sai là tách phương sai tổng
ih àn h các phương sai thàtìh Ịilìầiì và kiểm tra gai khác giữa các thàn h
phần phưđng sai ấy và đó chínli là 2 vai trò và chửc năng của anova:
• phân loại và tính toán các phương sai thành phần;
• kiểm tra sự sai khác giữa các phương sai thành phần vối phương sai
■sai sô’ đ ư ợ c p h â n b ố đ ộ c l ậ p , c h u â n vổi I r u n g b ìn h = 0 v à p h ư ơ n g s a i = 1;
hay được biêu thị một cách ngắn gọn là:
N (0, 1);
IE(e,) = 0;
m ef= l.

157
IV . Ẳ N H H Ư Ở N G C Ủ A sự THỪA N H Ậ N ANOVA

Sự thừa nhận trên đã tạo nên ở phướng pháp phân tích phương sai
là các nhân tô"thí nghiệm và môi trường đều là các nhân tô^nian^ tính cộng
gộp. Vì vậy, nó đã biểu hiện những sai sót trong sự phản bô' một cách dộc
lập bơi vì phân bô"chuẩn bao giò cũng c6 chung một phương sai. Trong thực
tế , c h ú n g t a có t h ể t i n r ằ n g n h ữ n g t h ừ a . n h ậ n t r ê n được n ắ m c h ắ c v à
t h ư ờ n g có m ộ t lý d o t h í c h hỢp đ ể g i ả i t h í c h c h o m ộ t sô" t r ư ờ n g hỢp k h ô n g
hợp lệ.
Như một quy tắc về sự sai sót của một sự thừa nhận với ánh hưởng
cả hai phương pháp kiếm tra F và t vê mức độ có ý nghĩa và độ nhạy cảm.
Khi một thí nghiệm ngưòi ta nghĩ rằng người ta chỉ muốn kiểm tra ỏ mức ý
nghĩa 95% thì trên thực tê đã kiểm tra ở mức độ cao hơn nó, thí dụ 96% hay
98%. Thường thưòng, độ sai khác thực có khả năng lớn hơn so vói bảng qui
định, có nghĩa rằng có quá nhiều kết quả sai khác có ý nghĩa thu được cũng
có rất nhiều sự mất đi của độ chính xác vì vậy phân tích phương sai (phép
kiểm tra F) có thê được xây dựng nếu các mô hình toán học đúng đã dược
thiết kế thích hỢp. Có một sự mất mát về độ chính xác tưđng ứng trong quá
trình tính toán đối vổi các nhân tô' thí nghiệm là nếu những niô hình toán
học không được xác định một cách chính xác.
Sự trỏ ngại lổn nhất trong quá trình phần tích phương sai xuâ"t hiện
khi phương sai sai sô' không phải là một hằng số đô'i vối tất cả các số liệu
quan sát. Sở dĩ có những trưòng hợp trở ngại xảy ra là do các mô hình loán
học không phù hdp với sô" liệu kết quả thu được của thí nghiệm. Trong
trưòng hợp ấy, bộ sô' liệu đó cần phải được chuyển dạng cho phù hợp với
phân bô"chuẩn trước khi thực hiện các bưóc tính toán, phân tích phướng sai
để thu được kết quả thích hđp hớn. Cách chuyển dạng số liệu để phù hợp
với phương pháp phân tích phương sai đã được trình bày trong chương 1.
Tóm lại, sự thừa nhận về sai sô"là hoàn toàn độc lập từ sô’liệu quan
sát này đến số liệu quan sát khác là rất rõ ràng. Để thực hiện phép phân
tích phương sai có kết quả đúng đòi hỏi phải có ba điều kiện:
- tất cả các mẫu lấy từ các quần thể đều phải tuân theo phân bô'chuẩn;
- các phương sai của các mẫu đó phải bằng nhau, có nghĩa là S^I = S"2 =
^ ;Ị ^ n>•
- các sô' liệu quan sát phải được lấy ra một cách ngẫu nhiên và biển thị
đặc trưng cho mẫu đó.

158
V. CÁC T H À N H P H Ẩ N P H Ư Ơ N G SAI

P h ư ơ n g p h á p p h â n tíc h phươiìj 4 sai do tiê n sỹ R.A. p^issher đ ư a r a t ừ


n;uiì 1925. Từ dó đến nay, phưdỉìg Ị)haỊ) Ị)hân tích phương sai dược sử d ụ n g
một cách rộng răi để kiểm tra niức dộ íiii cáy hoạc sự sai khác có ý nghĩa vể
L hông k ê s i n h h ọc g iữ a các n h â n tô th í ngỉìiộni t r o n g m ọi l ì n h vực. F"issher
c ù n g d à n ê u r a c á c h s ử d ụ n g p h ù íin g ị)hấỊ) Ị)hân lí(‘h p h ư ơ n g s a i đôì với c á c
thí nghiệm có 1, 2 hay nhiều yôu tố. Tíá cá các Ị)hương sai của các nhân tô^
d ó gọi là p h ư ơ n g s a i t h à n h p h ầ n và các p h ư ơ n g sai t h à n h p h ầ n đ ó đ ó n g g óp
ih à n h t ổ n g p h ư ơ n g s a i h a y p h ư ơ n g sai c h u n g . C á c h t í n h t o á n n h ữ n g
J)liương sai thành phần và phương sai chung sõ (ỉược trình bày một cách cụ
thê trong các phần tiếp theo.
1. Giả định
M ặ c d ầ u , g iả đ ị n h ỏ m ỗ i m ột tr ư ò n g hỢỊ) d ể u đượ c d ự a t h e o n h ữ n g
p h ư ơ n g t r ì n h cơ b ả n g iô n g n h a u , so ng cơ b ả n m à nói, c h ú n g c ủ n g có n h ữ n g
d i ế m k h á c n h a u . T h í d ụ , bô^ t r í m ộ t th í n g h iệ m h o à n t o à n n g ẫ u n h i ê n g ồ m
c á c n h â n t ố t h í n g h i ệ m A j, A.., th e o các l á n lặ p lại B j, cùng
Víii một lượng n sô quan sát đôi với các nhán tô và các lần lặp lại thí n g h iệm
t r ẽ n . G i ả sử , c ầ n p h ả i x á c đ ị n h giá trị là b iế u h i ệ n c ủ a sô> liệ u q u a n s á t
t h ứ k ở n h ó m m ẫ u t h ứ j v à y ẽ u tô ih í n g h iệ m t h ứ i. B ằ n g n h ữ n g n h â n tô'
t i ê n , có t h ể l ậ p đ ư ợ c m ộ t m ô h ì n h to á n học đ ể t h ự c h i ệ n p h é p p h â n tíc h
Ị)hương sai:
y,jk + + afị, +e„;,
t r o n g đó:

- là mẫu quan sát thứ k thuộc yêu tố thứ i‘'', yếu tố thứ j‘^, tương tác
g i ữ a c h ú n g t h ứ ij"’;

- \1 là giá trị trung bình tổng thể của quần thê hay mẫu thí nghiệm;
- a, là yếu tố thí nghiệm afỊ,| với i = 1, 2, n,;
- [i, là yếu tô' thí nghiệm ap,| vói j = 1 , 2 , n,:
- a(ỉ,j là tương tác giữa hai yếu tô ihí nghiệm a(5,| vói ij=l, 2,..., n,,s
- e,,;. là sai sô"ngẫu nhiên.
M u ô n có k ế t q u ả c h í n h x á c k h i sử cỉụng côn g t h ứ c t r ê n , h a i g iả t h u y ê t
sau đây can phải được chấp nhận:
- e,,!, tuân theo qui tắc phân bô'chuẩn và hoàn toàn độc lập vói nhau,
với giá trị t r u n g bìn h (^) = 0 và phương sai sai sỏ (s",.) = 1, và

159
• a„ p,, ap,j và Mlà những tham sô quần thế được giữ nguyên cò clịiih lừ
mẫu này qua mẫu khác. Vấn đề ơ đây là phải tính dưỢc a„ p,, ufỊ„ v<à ụ và
sau đó phải kiểm tra được giả thuyết không (Ho) cho mỗi một nhóm tham số
của a, a„, đêu phải bằng 0.
Phương pháp phân tích phương sai sẽ cung cấp một giải pháp đế’ giải
quyết những vân để vừa nêu ỏ hai giả thuyết trên đây. Có thô khẳng định
rằng;
- a„ Pj, aPi, và ej,ij là những biến số ngẫu nhiên phân bô một cách độc
lập và chuẩn vỏi trung bình = 0.
• Các tham sô thông kê cơ bản ỏ trong trưòng hỢp này là phương sai
của a„ p,, ap,j và e„|< mà chúng được biểu thị bởi a / , ơ|,-, ơ,.'- và trung
bình quần thể ụ. ở đây, vấn để là phải tính toán đưỢc ơ„-, Ơ|Ị-, ơa|(- và ơ,,-
không phải tuân thủ theo một yêu cầu nào của sự phân bố. Nếu thí nghiệm
có các nhân tô cô”định thì phải sử dụng mô hình các nhân tô”cô’ dịnh, nếu
các nhân tô”là ngẫu nhiền thì sử dụng inô hình các nhân t ố ngẫu nhiên và
nếu một số nhân tô cô định và một số nhân tô* khác ngẫu nhiên thì sử dụng
mô hình hỗn hỢp hay kết hđp vừa cô* định vừa ngẫu nhiên.
Giá trị trung bình của các trung bình bình phưđng dưới những giả
thuyết này có thể được biểu diễn bằng giá trị trung bình của lổng trung
bình bình phương.

2. P h ư ơ n g p h á p x á c d ịn h c á c p h ư ơ n g s a i t h à n h p h ầ n

Các phương sai thành phần có thể được tính theo nhiều cách khác
nhau, song có hai cách chính: tính theo từng nhóm mẩu riêng biệt và tính
theo công thức tổng thể. Cách tính của mỗi cách cụ thế như sau:
2 .1 . Tinh theo từng mẫu riêng biệt
Giả sử ỏ niột thí nghiệm có k mầu, các bước tính toán trong phân tích
phương sai có thể tuân theo sd đồ 5.2.
Sơ đô 5.2. Mô hình chung của anova

Mẳu sổ 1 Mẫu sô' 2 Mâu s ố .. Mẫu s ố k

Tẩn suất Hi ri2 n.


Trung bình X1 XX2/ri2= X 2
ss I (X -x ,) ^ I(X -
DF nr1 ri2*2 Hk -1

160
ghi chú;
- X , là t r u n g b in h m ẫ u ;

- s s là tổng các bình phương:


- DF là độ tự do

Công thức tính các tham s ố thông ké


Tổng tần suất bộ sô’liệu (N):
N = n, + Iiọ + ... + n|i
Trung bình tổng thể (X)

+ n.2 + ... + n|^


Tổng bình phương tổng thể (TSS)
TSS = Z(X,- X)'- (toàn bộ các số liệu)
vói DF = N-1
Tồng bình phương giữa các mẫu (TrSS)
TrSS = ni(^i-ậ)^ + n.^í XV- X)^ + ... + ri|(( Xk- XY
với D F = k -l

Tổng bình phương trong các mẫu (ESS)


ESS = SS| + ss., + ... + SS|(
vối DF = DF|+ DPi + ... + DF|t
= ( n , - l ) + ( n .r l) + ... + (tiu -l).

2 .2 . Tinh theo công thức tổng thê’


Tổng bình phương tổng thể(TSS)
Sử dụng toàn bộ các sô liệu quan sát để tính TSS
TSS = IX'- N^‘'^
DF = N-1
Tổng binh phương giữa các mẫu (TrSS)
T rS S = 11] X i' + n2 X /+ . ..+ r»k X N X^
DF = k-l
Tổng binh phương trong các mẫu (ESS)
ESS = TSS - TrSS
DF = DF,+ DF, + ... + DFk

161
= (n,-l) + (1 1 2 -I) + ... + (iik-l)
Kiểm tra bằng giá trị F:
Giả thuyết không (Ho): ỊJ| = ịÌ2 = |J,J = ... = P|(, giá trị F được tính theo
công thức:
Phưongsaigiưacácmẫu(sb)
b—
Phưong sai trong các mẫu (s^)
= s V s\.
Độ tự do (DF) đxiỢc tính theo công thức:
DF = [(k-l).(n,-l) + (n-rl) + ... + (n,-l)]

B. CÁC PHƯƠNG PH Á P PHÂN TÍCH PHƯƠNG SAI

Phương pháp phân tích phương sai (a n o va ) phụ thuộc vào các
đặc điểm cơ bản của từng yếu tô"thí nghiệm như số yếu tô”, tính chát và ìoại
hình thí nghiệm. Ngoài ra, một sô' thí nghiệm có các nhân tô' được phân
chia th eo hệ huyết thốhg thì phương pháp phân tích đó được gọi là phân
tứ h phương sai theo dòng họ và thứ bậc. Phương pháp phân tícli I)hương
sai được chia thành bốn nhóm chính theo các đặc điểm của các yếu tô' như
sau:
1. Anova với số yếu tố thí nghiệm khác nhau.
2. Anova với tính chất và điều kiện của các yếu tô”.
3. Anova với các yếu tô' thí nghiệm lồng vào nhau.
4. Anova vối các yếu tô' thí nghiệm sắp xếp theo hệ phả.
Trưốc khi tiến hành phương pháp phân tích phưđng sai cần phải chú ý
đến các đặc điểm trên của các nhân tô' cùng ảnh hưởng đến kết quả thí
nghiệm đê ứng dụng phương pháp phân tích phương sai thích hđp theo mô
hình một hay nhiều yếu tố, mỗi yếu tố mang tính chất ngẫu nhiên hay cố
định, các nhân tố lồng vào nhau hay chúng được sắp xếp theo hệ phả,

I. A N O V A V Ớ I S Ố Y Ể U T Ố T H Í N G H IỆ M KHÁC N H A U

Do phướng pháp phân tích phướng sai phụ thuộc vào các đặc điếm cơ

162
bản của từng yếu tố thí nghiệm, mà số yếu tố thí nghiệm là một trong bốn
đặc điểm â'y. Vì vậy, trong phưdng pháp phân tích phưđng sai dựa theo số
yếu tô' thí nghiệm được chia thành ba nhóm chính sau:
1. Anova vối một yếu tô' thí nghiệm;
2. Anova với hai yếu tố thí nghiệm;
3. Anova vói ba yếu tố thí nghiệm.

1. Với một yếu tô* thí nghiệm


Những thí nghiệm chỉ có một yêu tô thì khi phân tích phương sai phải
tuân thủ giả thuyết không (Ho) là:
Ho: ụ , = P 2 = P3 = - = Pk

Giả thuyết kháng không (H)) là:


H p Pi ^ Ps > ••• * Pk

ỊJ|, ụ.„ Pk là những tham sô”thông kê trung bình của quần thể
mà ở đó k mẫu được lấy hoàn toàn ngẫu nhiên và có cùng cơ hội như nhau.
Trong những thí nghiệm chỉ có một yếu tô thì có thể xảy ra hai khả năng:
các nhóm mẫu thí nghiệm có lặp lại và không lặp lại. Phương pháp phân
tích phương sai của chúng cũng có những khác nhau rõ rệt. Vì vậy, chúng
ta chia chúng ra hai trường hỢp lặp lại và không lặp lại để dễ dàng hiểu và
ứng dụng.
1.1. Trường hợp các nhóm mẫu thi nghiêm không lặp lại
Các bưốc tiến hành phân tích phướng sai áp dụng cho trưòng hđp thí
nghiệm chỉ có một yếu tô' mà các nhóm mẩu của yếu tố thí nghiệm đó không
lặp lại được tiến hành phân tích theo từng bước cụ thể sau đây:
o. Tinh phương sai giữa các nhóm mầu
Phương sai giữa các nhóm mẫu biểu thị sự đóng góp của cả hai hay
nhiều nhóm mẫu khi có sô" liệu quan sát và cỏ cơ hội khác nhau gây nên
mức độ biến đối giữa các nhóm mẫu. Trong thí nghiệm, số liệu quan sát ỏ
mỗi nhóm mẫu thí nghiệm có thể khác nhau. Hơn nữa, do sự khác nhau về
cơ hội, mỗi một cá thể ỏ trong một nhóm cùng nhận một cách chính xác
điểu kiện chung của cùng một nhân tố thí nghiệm. Từ bộ số liệu đó có thể :
• tính được giá trị trung bình của mỗi nhóm mẫu: X 1, X2, ••••, X
- tính giá trị trung bình tổng thể ( X), tức là trung bình của tát cả các
trung bình hoặc trung bình của tất cả số liệu quan sát, X = (Xi + X2 +....... +
xj/n;

163
- tính hệ diều chỉnh (CF);
SỐ

- tính độ lệch giữa giá trị trung bình với từng giá trị quan sál;
- tính bình phương độ lệch đó có nghĩa là tính tổng bình phương giữa
các nhóm mẫu;
- tính trung bình tổng các bình phương bằng cách chia các tông bình
phương cho các độ tự do tương ứng. Độ tự do (DF) đựơc tính bầiig sô' nhóm
mẫu (n) -1. Vậy, DF = n - 1.
b. Tinh phương sai trong các nhóm mẫu
Phương sai trong các nhóm mẫu do nguyên nhân cơ hội lấy mẫu gây
ra. Cách tính toán các bước cơ bản như sau ;
- tính giá trị trung bình của mỗi nhóm mẫu;
- tính độ lệch giữa trung bình nhóm mẫu và mỗi sô liệu quan sát, tức
là hiệu giữa trung bình nhóm mẫu và mỗi sô"liệu quan sát của nhóm mẫu;
- tính bình phưđng những độ lệch đó, có nghĩa là tính Lông bình
phương trong các nhóm mẫu;
• tính trung bình tổng các bình phưđng bằng cách chia tông các bình
phương đó cho các độ tự do tương ứng. Độ tự do được tính bằng hiệu giữa
tổng số sô"quan sát và sô nhóm mẫu.
c. Tính giá trị F
Giá trị F đước tính theo công thức sau:
p _ Phưđng sai giữa các nhóm mẫu
Phưđng sai trong các nhóm mẫu
d. Kết luận
So sánh giá trị F tính được của thí nghiệm với giá trị F tra cứu của
bảng (bảng phân bố F). Nếu giá trị F tính đưỢc từ thí nghiệm lỏn hơn so vói
giá trị F tra cứu của bảng thì sự sai khác giữa các giá trị trung bình nhóm
mẫu có ý nghĩa, nghĩa là trung bình các nhóm mẫu đó khác nhau rõ rệt.
Mức độ sai khác thể hiện ở giá trị p.
Từ những kết quả trên, có thể tổng hđp xây dựng bảng phân tích
phưđng sai (anova). Tổng hỢp bảng anova được trình bày ở sơ đồ 5.3.
So dố 5.3. Mô hình chung của anova cho thí nghiêm một yếu tố
Nguồn biến DF ss MS F

Giữa các mẫu c-1 SS b SSb/ c-1 MSSb/MSS,


Trong các mẫu n-c SSvv .SSw/n-c
Tổng n-1 TSS

164
ghi chú:
- DF là độ lựdo:
- ss là tổng các bint) phương:
- MS là trung binh tống các binh phương;
- B v à w là g iữ a v a tr o n g c á c n h ó m m ẫ u ;

- F tà giá tn phép kiểm tra;


- c là số cột (sỏ nhóm mẫu);
- n là số số liệu quan sát hay dung lượng mẫu.

Sự biến đối trong các nhóm inẫu có nghĩa là sự biến đối của các giá trị
quan sát trong nhóm mẫu từ mỗi giá trị quan sát dối với giá trị trung bình
nhóm mẫu về mức độ ảnh hưỏng cúa cơ hội vì chính nó gây nên sựkhác
n h a u l ừ g iá tr ị q u a n s á t n à y đ ế n giá trị q u a n s á t k h á c .

e. Tìm giá trị trung binh bình phương mong đợi


Từ kết quả trên, có thê biểu thị chúng như sau: ụ, = ụ+ X, với Zxi = 0.
Như vậy, X, = ụ + T, + Cị.
Giá thuyết không (Ho): Pi = u_, = ... = Pii- Do giá trị p là giá trị chung
của quẩn thê nên có thề viết được (H„): Tị = Tv = ... = Tk hoặc là (Ho): T, = 0
cho tất cả các ivói i = 1, 2, ... = k.
Diều quantrọng ỏ đây là phái xác định được giá trị trung bình binh
phương mong đợi (EMS). Giá trị này của sai sô được gọi là trung bình binh
phương trong các nhóm mẫu hay trung binh bình phương sai số. EMS = ơ,^.^

E M S g iữ a các in ẫ u = ơ,.- + —^ z
k -1
t r o n g đó:

- n là d u n g lượng của mỗi n h ó m m ẫ u ;


- k là sô nhóm mẫu.
'l'ừ dó, giá ti ị F dưỢc tính theo cồng lliửc sau;
_2 V 2
Như vây, F = -— —ỉ-------
o'Ì
Nếu ^T|I = 0 thì F = 1,0.
g. Các mô hình thí nghiệm khác nhau
Các mô hình thí nghiệm khác nhau thì phương pháp phân tích phương
sai của chúng củng khác nhau. Những thí dụ sau đây sẽ minh họa phương
pháp phân tích phương sai một cách chi tiết khi áp dụng cho từng loại mô

165
hình thí nghiệm. Phương pháp phân tích phưdng sai riêng biệt theo từng
mô hình thí nghiệm khác nhau được trình bày cụ thể như sau:
Mô hình 1. So sánh số trung bình giữa các nhóm
khi tần suất bằng nhau
Trong lĩnh vực sinh học và nông nghiệp hầu hết các thí nghiệm đơn
giản chỉ có một yếu tô"thì tần suất của các nhóm mẫu thí nghiệm đều bằng
nhau. Do tần xuâ't các nhóm mẫu bằng nhau nên phương pháp phân tích
phương sai của chúng tương đôl đơn giản. Các thí dụ sau đây sẽ niô tả cụ
thể phương pháp phân tích phưđng sai cho thí nghiệm có một yếu tố mà tần
suất của các nhóm mẫu trong yếu tô' đó bằng nhau.
Thí dụ 5.1. So sánh khốỉ lưỢng (kg) lúc sáu tháng tuổi của bôVi giông
lỢn ngoại được vỗ béo tại Xí nghiệp chăn nuôi và thức ăn gia súc An Khánh
năm 2000, kết quả được trình bày ỏ bảng 5.1.
Bảng 5.1. Khối lượng (kg) ỉúc sáu tháng tuổi của bốn giống lợn
Giống lợn Ba máu DYL D L Y

Khối lượng 78 82 78 81 79 78 77 84
88 81 78 81 73 80 68 80
87 80 85 82 79 78 75 75
88 80 81 76 75 83 70 76
83 89 78 74 77 84 74 75

ghi chú
Ba máu DLY là tổ hợp lai ba máu giữa Duroc, Landrace và Yorkshire;
0 là giổng lợn Duroc;
L là giống lạn Landrace;
Y là gi&ìg lợn Yori<shire;
78. 82,... 75 là khổi ludng của mỗi cá thể trong các giống lợn đó.

1) Phân tách các thành phẩn phương sai từ phương sai chung
Như các phần trên đây đã trinh bày cụ thế từng bước tính toán của
phưđng pháp phân tích phướng sai. Điểm quan trọng ỏ đây là phải xác định
được giá trị tổng các bình phương tổng thể và các thành phần của chúng:
= ss fÕâacácmẫu cácmảu
trong đó:
- SStíng là tổng của tất cả các bình phương;
• SSgiag là tổng các bình phương gữa các mẫu và biến đổi gây ra
biểu thị cho sự biến đổi giữa các mẫu gây ra;

166
• .n.',u !à
!à tổng
t ổ n g các bỉnh
b ỉn h phu(ing
p h u (in g tron;
tr o n g các m ẫ u v à b iế n đ ổ i g â y r a
(lo ảnh hưởng ngẫu nhiên trong mỗi mầu.
Nhu vậy, nhiệm vụ của phướng pháp phâii tích phương sai là tính
dưỢc từng phưđng sai thành plìầii và xác dịnh mức độ tin cậy giữa các
thành phần dó vối phương sai trong các mẫu.
2) Các bước tính toán để xây dựng anova
Chuyên sô’ liệu thu đưỢc của thí nghiệm trên vào bảng 5.1. Bước làm
Iiày có nghĩa là đưa toàn bộ sô’liệu của bôn giống Iđn (ba máu DYL, D, Y, L)
biểu thị trên bôn cột khác nhau, mỗi cột biểu thị một giốhg lớn. Tiếp đó,
tính giá trị trung bình, độ lệch chuẩn, dung liíỢng mẫu và tổng của từng
ináu và trình bày chúng ở bảng Õ.2.
B á n g 5.2. C á c tham s ố c ơ b à n đ ể thực hiện p h é p anova
Ba máu DYL D L Y Xtổngthể

n 10 10 10 10 40
X = 83,6 79,4 78.6 75.4
s = 4,03 3,20 3,31 4.53
s' = 16,24 10,24 10,96 20,52
IX 836 794 786 754 3170
IX ^ — 70036 63136 61878 57036 252020

ghi chú:
n là lẩn suất mẫu;
X là trung binh mẫu:
s là độ lệch chuẩn;
là phương sai mẫu:
£X là tổng của mỗi mẫu;
ỵx^ là binh phưtíng của mỗi tổng.

Kiểm tra liệu các phương sai mẩu cố tương tự giông nhau hay không
và gọi đó là kiểm tra sự đồng đều của phương sai. Cách kiểm tra sự đồng
nhâ\ của các nhóm mẫu được thông qua giá trị Giá trị Peụcdạị là tỷ lệ
giữa phương sai lớn nhâ*t và phương sai nhỏ nhíVi của các nhóm mẫu thí
nghiệm, Nếu
- biểu thị sự sai khác rõ rệt thì không cần kiểm tra những cặp mẫu
còn lại;
• biêu thị sự sai khác không rõ rẹt thì cần phải kiểm tra những cặp
mẩu còn lai.

167
N h ư v ậ y , g iá t r ị Feụcđại c ủ a t h í n g h iệ m t r ê n đưỢc t í n h th e o c ô n g th ứ c :

Peụcdại = 20,52/10,24
= 2,00
DF = 9 cho mỗi mẫu.
Như vậy, giá trị F tính được của thí nghiệm (2,00) nhỏ hđn F tra cứu
từ bảng (6,31) với độ tự do a = 4 • 1 = 3 và n = 10 - 1 = 9. Từ đó, có thế rút ra
kết luận các phương sai trên đồng nhất và vì vậy tiếp tục thực hiện các
phép phân tích phương sai.
Tinh hệ số điều chỉnh (CF)
CF =
= 3170^/40
= 251222,5
Tổng bình phương tổng thể (TSS)
TSS = IX.2. CF
= 252020 - 251222,5
= 797,5
Tổng bỉnh phương giữa các mẫu (SSpaacácmiu)
(S X 3 f
o^giửacácmỉu------
rtỊ n2 H3
= [6988962/10+6304362/10+617796^/10+5685162/10] - 251222,5
= 341,9
Tính tổng bình phương trong các mẫu (SS,rongcácmẳu)
mẫu mẫu
= 797,5 - 341,9
= 455,6
Tại mỗi thí nghiệm, có thể kiểm tra giá trị SSt„ng cácmhubằng cách tính
từng giá trị trong mỗi mẫu thí nghiệm rồi cộng các kết quả lại vái nhau.
Phương pháp này đđn giản và dễ làm bằng máy tính cầm tay. Cụ thể tính
toán như sau:

(Ịx .r
S S tr o n g m ỉu I " •

168
- -nn.K- «9889«
10

= 146,4

o q — \'Y
•^•^u-onsr mâu 1:!
n.;

= 6 ^ 10 0 .
10
= 56.4

ss....„„,,.„
•^•^irong = IX,=
mau ỉ ~ í '. ■

= 61878- ỉiạ *’®


10
= 98,4

QQ — V Y - ^
^^tronịrmảu í “ ■

= 57006-“ ^ ’«
10
= 154,4
s s , = 146,4 + 56,4 + 98,4 + 154,4
= 455,6
Kiểm tra sự độc lập của của các giá trị s s
SSiéng thẽ ‘ ii‘ ciic máu

= 341,9 + 455,6
= 797,5
Xác định DF cho mỗi tổng bình phương
-Đốìvới TSSđf=(n,- 1)
= 40-1

= 39
- Đối với SSpfl,eácn.Ẩu.df = (a - 1)
= 4-1
= 3

169
- Đối vđi SS,„„ge.,rmẰu.df = (n, - a)
= (40 - 4)
= 36
X á c đ ịn h p h ư ơ n g s a i t h à n h p h ầ n b ằ n g cá ch c h ia s s c h o D F tư ơ n g ứ n g

các m ẫu ^ ^ g i ử a các giữa câc mảu

= 341,9/3
= 113,97
02
trongcácmầu — ‘^‘^
qq /D F
trongcácmíìu^^^ ỉrongrácmẫu
= 455,6/36
= 12,66
Tính giá trị F cho các biến số theo công thức sau:
_ _ Phưỏng sai giừa các mẫu
r —
Phương sai trong các mẫu
= 113,97/12,66
= 9,002
Nếu phưđng sai trong các mẫu (phương sai sai số) lỏn hơn phương sai
giữa các mẫu thì không cần phải tính giá trị F và có thế khẳng định là
không có ý nghĩa về sự sai khác giữa các mẫu.
Tổng hỢp các kết quả tính được của các tham số thống kê trên ỏ bảng
5.3
Bổng 5.3. Anova về khối lượng lợn lủc sáu tháng tuổi
Nguồn biến DF ss MS F

Giữa các mẫu 3 341,9 113.97 9.002**


Trong các mẳu 36 455,6 12,66
Tổng 39 797,5

3) Nhận xét
■ Căn cứ vào bảng phân bố F biểu thị theo một phía hay một đuôi, giá
trị F tính được giữa các mẫu là 9,002 với DF = 3 và 36 lớn hơn giá trị F
bảng p < 0,05 (2,88) nên ảnh hưởng rõ rệt đến khôi lượng lợn lúc sáu tháng
tuổi.
4) ứng dụng phương pháp phân tích kiểm tra Tukey
- Do sự khác nhau giữa các các số trung bình mẫu có ý nghĩa nên cần

170
làm phép so sán h giữa các cặp sô trun^" bình và có thê ứng dụng phép kiểm
tra T u k e y cho th í nghiệm này. Phương pháp kiểm tra T u k e y được trìn h bày
cụ thê dưới đây.
Phương pháp phân tích kiếm tra Tukey là một phương pháp nhạy cảm
dùng cho phân tích phương sai khi thí nghiệm chỉ có một hay nhiều yếu tô,
nhưng trong mỗi yếu tố có từ hai nhóm mẫu trỏ lên và tần suâ^t của các
nhóm mẫu cũng như kích thước các nhóm mẫu phải bằng nhau. Đặc biệt,
phương pháp phân tích kiểm tra Tukey sử dụng rất hiệu quả đôi vối những
thí nghiệm có rất nhiều nhóm mẫu. Công thức tính của phương pháp phân
tích kiêm tra Tukey đưỢc trình bày như sau:
, V / ^ h ư đ n g sai t r o n g các mẫu

trong đó:
- T là giá trị kiểm tra Tukey;
- q là giá trị lấy từ bảng phân bốTukey;
- n là dung lượng mỗi mẫu.
Tại thí dụ trên, a là 80"mẫu (8) và DF là 8 vậ 32 dẫn đến giá trị q = 3,82.
T = 3,82 yỊŨ^ẽĩìÕ
= 4,30
Lấy lại thí dụ 5.1 đã nêu trên đây vế “khôi lượng lợn nuôi vỗ béo lúc
đạt sáu tháng tuổi của bốn giống D, L, Y và ba máu DLY” để nghiên cứu
việc ứng dụng phương pháp kiểm tra Tukey.
Lập bảng 5.4 để biểu thị sự chênh lệch giữa tâ’t cả các cặp sô" trung
bình mẫu đế áp dụng phương pháp kiểm tra Tukey đôi vối phép anova khi
thí nghiệm chỉ có một biến số.
Bẩng 5.4. Sự chénh lệch giữa càc cặp sỏ' trung bình mẫu

Mẩu 2 3 4

Mấu 1 X X. X ,- X j X ,- X4
X , = 83.6 4.2 5,0 8.2
Màu 2 X?- X j X 2- X 4
X j= 7 9 ,4 0.8 4.0
Mẫu 3 X j- X 4
X 3 =78.6 3.2
Mẩu 4
x ,= 7 5 .4

171
5 ) K ế t lu ậ n

Như vậy, trong thr nghiệm này có đến hai cặp sô' trung bình (giữa 1 và
3 và 1 và 4) trong tổng sô* sáu cặp sô”trung bình của các nhóm niẫu được
thiết lập có độ lệch lốn hơn giá trị T (giá trị T = 4,30), nên sự sai khác của
hai cặp giữa các số trung bình mẫu ấy về mặt thống kê có ý nghĩa rõ rệt ở
mức p = 0,05.
Mô hình 2. So sánh các trung binh mẫu
khỉ tần suất của mẫu khác nhau
Trong lĩnh vực sinh học và nông nghiệp có nhiều thí nghiệm chỉ tổ
chức nghiên cứu một yếu tô" mà tần suất của các nhóm mẫu của yêu tô đó
không bằng nhau. Khi tần suâ't các nhóm mẫu không bằng nhau thì
phương pháp phân tích phưđng sai của chúng cũng phải khác nhau. Các thí
dụ sau đây sẽ mô tả cụ thể phương pháp phân tích phương sai cho thí
nghiệm có một yếu tố mà tần suất của các nhóm mẫu trong yếu tô' đó không
bằng nhau.
Thí dụ 5.2. Hãy so sánh sản lượng sữa (SLS) thu được hằng ngày
(kg/ngày) của 20 con bò sữa được nuôi trong bốh hộ gia đình 1, 2, 3 và 4 tại
thành phô" Hồ Chí Minh, kết quả cụ thể trình bày ở bảng 5.5.
Bảng 5.5. SLS hằng ngày của 20 con bò sũa trong bốn hộ (kg/ngày)
Hộ gia đinh số 1 2 3 4 IX

SLS (kg/ngày) 18 18 12 20
12 16 9 23
16 17 10 19
12 23 14 18
17 21 .10
15

I 90 96 55 80 320
X 15 19 11 ‘ 20
ss. 32 34 16 14
n, 6 5 5 4

1) Tính toán các tham số thống kê đê xây dựng anova


X = 320/20
= 16

172
C F = 20 X !()-
= 5120

TSS = (18- + 12- + ...+ 18'-) - 5120


= 3:56
TrSS = (6x15- +5x19- +5x11-+4x20-) - 5120
= 210
ESS = TSS • TrSS = 336 • 240
= 96

Báng 5.6. Anova về SLS sử dụng nguốn các nhóm mẫu


Nguồn biến DF ss MS F

Giữa các hộ 3 240 80 13.33


T ro n g c á c h ộ 16 96 6

Tổng__________ 19 336____________________

Lưu ý, trong bảng phân tích phương sai này do ý nghĩa của hàng
“trong các hộ” chính là giữa các bò trong các nhóm mẫu và còn được gọi là
sai số. Thường thưòng, trong bảng phân tích phương sai, ngưòi ta dùng
cụm từ “sai sôi” thay cho cụm từ “trong các nhóm mẫu”. Vì vậy, có thế
chuyển bảng phân tích phưđng sai có nguồn trong các hộ thành bảng phần
tích phương sai nguồn sai sô”như sau:
Bàng 5.7. Anova vé SLS khi sử dụng nguồn sai số
Nguổn biến DF ss MS F

Giữa các hộ 3 240 80 13,33


Sal sô' 16 96 6
Tổng 19 336

Như vậy, giá trị trung bình bình phương sai số (EMS) ỏ thí dụ này
là 6,0. Có thế hiểu rằng đó là giá trị tính được tô"t nhâ*t của phương sai
quần thể (a^). Khái niệm “sai sổ” ở đây có thể rất dễ bị hiểu nhầm về ý
nghĩa. Tốt hơn hết là hăy hiểu nó như là “trung bình bình phương trong
các hộ” hay “sự biến động tự nhiên cửa các con bò sữa trong các
hộ”.
Tra cứu tại bảng F vối thu được giá trị 9,01 ở mức p = 0,001.
So sánh giá trị này vói F tính được từ thí nghiệm (13,33) thì:

173
Giả thuyết không (Ho): Pi = P2 “ p I“ Pi
Giả thuyết kháng không (Hj): Pi 7; Pa ^ Pi
Giá trị p tương ứng với Pavi. 1« là:
Khi p = 0,05 thì F = 3,24
0,025 4,08
0,01 5,29
0,005 6,30
0,001 9,01
2) Kết luận
F{13,33) tính được của thí nghiệm lón hơn F(9,01) tra cứu tại bảng ỏ
mức p<0,001. Sự sai khác giữa các hộ vê SLS rất có ý nghĩa. Vậy, SLS thu
được giữa các hộ gia đình khác nhau rất rõ rệt (P<0,001).
Mô hình 3. Trường hợp chỉ có một số liệu
quan sát duy nhất ò mỗi mẫu
Trong trường hỢp các thí nghiệm nghiên cứu chỉ có một yếu tố mà mỗi
mẫu thí nghiệm chỉ có duy nhất một số liệu quan sát thì không có phưđng
Sầi trong các nhóm mẫu. Khi phân tích bộ số ìiệu loại mô hình thí nghiệm
này phải chấp nhận giả thuyết “không có tưđng tác” hoặc có tương tác
nhưng quá nhỏ và không đáng kể. Trong trường hỢp này, giá trị của
phương sai tương tác được cộng vào trong giá trị phưong sai sai số.
Thí dụ 5.3. LưỢng thức ăn tinh (kg) cho ăn hằng ngày của ba giống bò
sữa Holstein - Prisian (HF), Jersey và con lai của chúng được minh họa ở
bảng 5.8.
Bảng 5.8. Luọng thức ăn tinh cho ân của ba g iố ig bò sữa
Thứt ân tinh 1 2 3 4

Giống bò HF 16 16 15 23 17,50
Jersey 12 10 14 13 12,25
Con lai 11 14 16 18 14,75

13.00 13.33 15,00 18.00 14,83

1) Tính các tham số thống kê để xây dựng anova


CF= 12 X 14,83^
= 2640,33

174
TSS= lx(16^+ ]‘2-+ 1-+ ... + 18") - CF
= 131,667
= 4 ( 1 7 , 5 0 '+ 12,25'-+ 4 ,7 5 -) - C F

= 5 5 ,1 6 7

SSih,,..,n = 3 (13,00-+ 3,33-+ 5,00-+ 8,00“') - CF


= 46 ,9 7 4

s s , = T S S - s s , , „ „ - S S o„,

= 29,526

Bảng 5.9. Anova về S L S có tương tác giữa g iố n g v à TA


Nguồn biến DF ss MS F

Giữa các giống 2 55.167 27,584 5.605


Giữa các thức ân 3 46,974 15.658 3,182
Tương tác 6 29.526 4.921
Sai số 0 0
Tổng 11 131.667

Do nguyên nhân không tính phương sai trong các nhóm mẫu (phương
riai sai sỗ) vi giả thuyết phải được công nhận là không có tương tác, thực
chất là có thể có nhưng nếu có thì nó cũng vô cùng nhỏ và nó đã đưỢc gộp
vào phương sai sai sô. Vì vậy, bảng phân tích phương sai được thiết lập lại
ỏ bảng Õ.IO.
Báng 5.10. Anova vé SLS không có lương tác giữa giống và TA
Nguồn biến DF ss MS F

Giữa các giống 2 55.167 27,584 5.605


Giữa các thức ăn 3 46,974 1 5 ,6 5 8 3.182
Sai số 6 29,526 4,921
Tổng 11 131,667

2) Kết luận
Tóm lại, những thí nghiệm nghiên cứu gồm có hai yếu tố thì ít nhất
phải có hai sô”liệu quan sát trong mỗi yếu tô"là điểu kiện bắt buộc.

1,2. Trường hợp các nhóm mẫu thi nghiệm được lặp lại
Trong trưòng hỢp tổ chức các thí nghiệm có cùng nhân tố thí nghiệm

1 75
mà nhân tô"đó đưỢc lặp lại một sô" lần nhất định thì mô hình thí nghiệm đó
phải được phân tích phương sai theo mô hình nhóm mẫu thí nghiệm đưỢc
lặp lại. Giả sử ở một thí nghiệm có bôVi nhóm mẫu của một nhân tô thí
nghiệm (tj, tv, tg, í^) và mỗi nhóm của nhân tô"đó được lặp lại nám lần thì đê
thực hiện phép phân tích phương sai, mô hình thí nghiệm và các bước tính
toán cụ thể được trình bày ở sơ đồ 5.4.
Sơ đồ 5.4. Mô hình thí nghiệm với bốn yếu tố và nàm lặp lại

Lần lãp lại


thứ 1 t, ta t4 t.
2 t, t, t.
3 tí .t, t, t.
4 t4 t, t,
5 t,

ghi chú:
- 1,, t2, ..u là các yếu tố thí nghiệm 1. 2. 3, và 4;
- lần lặp thứ 1. 2, 3, 4. và 5 thể hiện trên các hàng.

a. Mô hình toán học được ứng dụng cho loại mô hinh thí nghiệm này
Y = ụ + t, + e, *
hoặc Yị, = p + a, + 6ij
trong đó:
- Yy là giá trị quan sát thứ của nhóm mẫu thứ i*'’;
- ụ là trung bình tổng thể;
- ttị là ảnh hưỏng do các nhóm mẫu của nhân tố thí nghiệm gây nên;
• 01, là sai aố ngẫu nhiên.

Sđ đó 5.5. Mô hình thí nghiệm với bón yếu tố và nàm lặp lại

Nhóm mẫu 1 2 3 4

Lấn lắp lại thứ


1 Y„ Y„ Yj, Y„
2 Y« Y„ Y„ Y 42
3 Y„ Y ,, Y» Y 43
4 Yu Y„ Y,4 Y«
5 Yn Y j5 Y» Y«

176
6. Tính các tham sô thông kê để xảy dựng anova
Tính hệ sô điều chinh (CF)

CF
n

t r o n g dó:

•X là g iá trị tổng thể của tất cả các tống;


• n là t ẩ n sô" t ổ n g t h ể .

Tống binh phương tổng thể (TSS)^*‘


TSS = (y,,^ + + ... +y,,^)-CF
Tống binh phương giữa các mẫu (TrSS)
TrSS = (t," + t,- + t;r + t,- )/r ■CF
t r o n g đó:

- r là lần lặp lại;


- 1, là bình phương các tổng của các mẫu
hay các yếu tô' thí nghiệm tương ứng.
Tổng binh phương sai sô'(ESS)'"'
ESS = TSS - TrSS
Bàng 5.11. Anova tổng hợp vâi bốn nhóm mẫu và nãm lẩn lãp lại
Nguổn biến DF ss MSS F

Giữa các mẳu 4-1 TrSS TrSS/3 = s,' S.VS,*


Trong các mẫu 20-4 ESS ESS/16 =s,^
Tổng 20-1 TSS

Mô hình thí nghiệm chỉ có một yếu tố và có sự lặp lại của các nhóm
mẫu cùng được sử dụng khá phổ biến trong nghiên cứu sinh học nói chung
vì nó dễ làm, kinh tế, có độ chính xác cao; đặc biệt, đối vói lĩnh vực trong
nghiên cứu thức ăn cho gia súc vì nỏ đơn giản và rẻ tiền. Thí dụ 5.4 sẽ minh
hoạ nội dung đó.
Thí dụ 5.4. Sản lượng sữa hằng ngày (SLS) của đàn bò hạt nhân được

Còn gọi là tố n g t ấ t cả các b ìn h phương (TSS)

Còn gọi là tô n g b ìn h phương trong các nhóm mẫu (ESS)

1 77
tổ chức nuôi thí nghiệm với bôVí khẩu phần ăn khác nhau (KPA, KPB, Kl*c
và KPD) và được lặp lại năm lần tại Trung tâm nghiên cứu bò và đồng cỏ
Ba Vì. Hãy phân tích vối kết quả thu thập được trình bày ở bảng 5.12, liệu
chúng có biểu hiện sai khác rõ rệt không?
Báng 5.12. SLS của đàn bò với bốn loại TA và năm lẩn lăp

Mẩu (KP) A B c D

Lần lâp lại X, X2 X3 X4


1 8 12 18 13
2 10 11 12 9
3 12 9 16 12
4 8 14 € 16
5 7 4 8 15

I 45 50 60 65
X. 9 10 12 13

c. Các bước tính toán để xây dựng anova


Tính trung binh tổng thể ( X)
X = ( 9 + 1 0 + 12+13)/4
= 11
Tính phương sai giữa các nhóm mẫu
(x,- x)^ = (9- 1 1 )^

=4
(X 2- x)=^=(10- 11)2
= 1

(X3- x)2 = (12- 11)2


= 1

(X 4- x)2 = (13- 11)^


=4
Đưa tất cả các kết quả tính toán được ỏ trên biểu thị trong bảng
phương sai giữa các nhóm mẫu (bảng 5.13).

178
Báng 5.13. Phương sai giữa các nhóm mẵu

X; X-J X-4

í.
4

I, 20 20

Tông bình phương giữa các mẫu (các yếu tô thí nghiệm) (TrSS)
TrSS = 20 + 5+5 +20
= 50

Trung binh tổng binh phương của các yếu tô' thí nghiệm (MSS)
MSS = 50/(4 - 1 )
= 16,7
Tính phương sai trong các nhóm mẫu ,
Nhóm mẫu thứ nhát:
(X„- x,)- = {8-9)^'
=1
(X,, - X ,)■- = (10 - 9)^
=1
(X ,|- X,)- = (12-9V-

=9
(X,„ - X = (8 - 9 f

=1
(X 5, - X ,)' = (7 - 9)-^

=4 .
Tương tự, tính cho các nhóm mẫu thứ 2, 3 và 4 và những kết quả của
chúng được biểu thị trên bảng 5.14.

179
Báng 5.14. Phương sai trong các nhóm mẫu

Nhóm mẫu X, Xj Xj X4

1 4 36 0
1 1 0 16
9 1 16 1
1 16 36 9
4 36 16 4

I 16 58 104 30

Tổng bình phương trong các mẫu (ESS)


ESS = 16 + 58 + 104 + 30
= 208
Trung bình bình phường trong các mẫu (EMS)
EMS =208/(20-4)
= 13

Kiểm tra lại giá trị tổng của tổng các bình phương
Nhóm mẫu thứ nhất:
( X „ - x)2 = ( 8 - l l ) 2
=9
(X2 ,- x)2 = (10- 11)^
=1
(X3,- x)2 = (12 - 1 1 )'^
=1 .

=9
(X5,- x)2 = (7-11)^
= 16
Tính tương tự như trên cho các nhóm mẫu thứ 2, 3 và 4 và kết quả
được biểu thị trên bảng 5.15.

180
Bảng 5.15. Kiểm tra giá trị lổng của tổng các binh phưdng
N hóm m ẫu Xi X, X3 X,

9 1 49 4

1 0 1 4

1 4 25 1
9 9 25 25

16 49 9 16

V 36 63 109 50

TSS = 36 + 63 +109 +50


= 258
Như vậy, giá trị này đúng bơi vì hoàn toàn trùng vối kết quả đã tính
trê n đáy:

TSS = TrSS + ESS


= 50 + 208
= 258
d. Thực hiện phép kiểm tra F bằng cách tính giá trị F
đế so với giá trị F của bảng F
p _ Phưdng sai giữa các mẫu
Phưđng ẩai trong các mẫu
= 16,7/13
= 1,285
Kết luận
Như vậy, giá trị F tính toán được của thí nghiệm nhỏ hơn F tra cứu
của bảng phân bô'chuẩn F vói độ tự do = 3 và 16 ỏ mức độ tin cậy 5% biểu
hiện sự sai khác không rõ rệt. Vậy, có thể rút ra kết luận các nhóm mẫu thí
nghiệm thức ăn trên được lấy ra từ một quần thể đồng nhất. Hay nói một
cách khác, giữa bốn loại thức ăn nêu trên không gây ảnh hưỏng rõ rệt đến
sản lượng sữa của đàn bò. Từ đó, tính các tổng bình phưđng theo các công
thức dã cho như sau:
Hệ số điều chỉnh (CF)
CF = X^/n
= 220^/20
= 2420

181
Tổng binh phương tổng íAề’(TSS)
TSS = 2678 - 2420
= 258
Tổng các binh phương nhân tố thi nghiệm (TrSS)
TrSS = (t,2 + t./+ v'+ t,")/5 - CF
= 2470 - 2420
= 50
Tổng binh phương sai sô'(ESS)
ESS = 258 - 50
= 208
Tính giá trị F để so sánh với F tra cứu tại bảng
TrSS/(t-l)
F =
ESS/(n-t)
50/3
208/16
= 16,7/13
= 1,285
e. Kết luận
Kết quả tương tự như cách tính trên, nghĩa là sự sai khác về sản lưỢng
sữa của bốh loại thức ăn không rõ ràng hay không có ý nghĩa rõ rệt.

2. Với hai yếu tố thí nghiệm

2 .1 . Sơ đổ vá mô hình thí nghiệm


Trong lĩmh vực nghiên cứu công nghệ sinh học nói chung, hầu hết các
thí nghiệm đều sử dụng hai yếu tô" thí nghiệm. Trưòng hợp thí nghiệm có
hai yếu tố, cũng có thể phần tích tương tự như trưòng hỢp chỉ có một yếu tố
thí nghiệm mà đưỢc lặp lại nhiều lần. Theo cách bố trí thí nghiệm này
ngưòi ta cũng xếp các nhân tô' thí nghiệm là t và số lần lặp lại là r.
Mô hình toán học chung thưòng được áp dụng cho anova như sau:
Yijk=ụ+ Trj +Pj + Cijk

1 82
tro n g đó:

- là giá trị quan sát thứ k"' ở nhân tô thí nghiệm thứ j"’ và lần thí
nghiệm thứ i’’’;
- ụ là trung bình tổng thể;
- Tr, là ảnh hưởng gây ra bơi các nhân tố thí nghiệm, vối i = 1, 2, n;
- Pi là ảnh hưởng gây ra bởi các nhóm mẫu, vỏi j = 1 , 2 , n;
- e,,|, là sai số ngẫu nhiên.
Mỏ hình thí nghiệm có hai yếu tô ứng dụng ihưòng được bô' trí theo sơ
dổ 5 .6.

Sơ dó 5.6. Mô hinh thi nghiệm có hai yếu tỏ’


Lẩn lặp lại cùa thi nghiệm (mẫu)

1 2 3 4

Các yếu tố 1 t, t, t2
2 t. t3 tí t,
3 t3 t, t3
4 t4 t4

a. Tính các tham sô'thống kè đè xây dựng anova


Hệ số điều chỉnh (CF)

CF = - -
rl
trong đó:
- r là số nhóm mẫu hoặc sô lần lặp lại thí nghiệin;
- t là sô’nhân tô"thí nghiệm.
Tổng bình phưdng giữa các mầu (TrSS)
• TrSS = It,7r, - CF
Tông bình phương các lần lặp lại (hoặc các nhóm thí nghiệm) (RSS)
RSS = IR,Vt, - CF
Tổng bình phương tổng thế (TSS)
TSS = (y,,^ + ■CF
- II y ,r - C F

183
Tổng bình phương sai sô* (ESS)
ESS = TSS - TrSS - RSS
Lập bảng phân tích phướng sai tổng hỢp
Bẩng S.16. Anova chung cho thí nghiêm có hai yếu tố
Nguồn biến DF ss MSS F

Giữa nhân tố t-1 TrSS TrSS/t-1=S,* S,’ /S e'


Giữa lần lâp r-1 RSS RSS/r-1=S,^
Sai sô' (t-1)(r-1) ESS ESS/(t-1)(r-1)=SE^
Tổng_____________ft-1 TSS__________________________

Các thí nghiệm có sô" lần lặp lại > 1 , thí dụ có năm lần lặp lại và thí
nghiệm có bốh nhân tô" thí nghiệm sẽ được biểu hiện theo mô hình chung
như sđ đồ 5.7.
So đó 5.7. Mô hình chung của thi nghiệm có hai y ế u tố
Nhân tố 1 2 3 4 V

Lần lặp lại


thứ 1 Y„ Y,, Y 3, Y 4, R,
2 Y22 Y« Y« R,
3 Y„ Y« Y 33 Y«
4 Y,4 Ym Y34 Y« K
5 Y« Y,5 Y 35 Y45 Rs

I t, t3 t4 ts

2 .2 . Những mô hình thỉ nghiệm khác nhau


Phương pháp phân tích phương sai ứng dụng trong các thí nghiệm có
hai yếu tố phụ thuộc nhiều vào số nhóm mẫu của mỗi biến số, số liệu quan
sát của mỗi mẫu và mô hình thí nghiệm sắp xếp theo khôi hoàn toàn ngẫu
nhiên hay ô vuông Latinh. Đồng thời, ỏ phần này sẽ giới thiệu thêm cách sử
dụng của hai phương pháp phân tích kiểm tra Tukey và hồi quy để so sánh
vối anova.
Mô hình 1. Mỗi hiển số chỉ có hai mẫu
Mô hình thí nghiệm có hai yếu tố mà mỗi yếu tô' chỉ có hai nhóm mẫu
cũng được sử dụng phổ biến trong nghiên cứu vì nó đdn giản, dễ làm, kinh
tế, có độ chính xác cao; đặc biệt, đối với lĩnh vực nghiên cứu sự ảnh hưỏng

1 84
của mùa vụ đên các tính trạng khôi lượng và chất lượng gia súc. Thí dụ sau
đây sẽ minh hoạ nội dung đó.
Thí dụ 5.5. Tại một thí nghiệm xác định àiih hưởng inùa vụ đến khối
lưựng gà con mới nở (g) trên hai tính l)iột trông và mái khác nhau được bô”
trí lại Trung tâm nghiên cứu gia cầm Thuỵ Phương trong hai mùa xuân-hè
và thu-đông. Qua kết quả trung bình thu được sau dây (bảng 5.17), hãy
phân tích ảnh hưởng tính biệt trông và mái, và mùa vụ xuân-hè và thu-
đông đến khôi lượng đàn gà con.
Bàng 5.17. Ảnh hưởng mùa vụ đến khối lư ợng gà con mới nỏ
Biến số
tinh biệt Trống Mải

Biến sô' mùa vụ Xuân-Hè 57 53


Thu-Đông 55 51

Đê phần tích và khẳng định sự sai khác giữa các giá trị trung bình của
hai tính biệt và giữa các giá trị trung bình ơ các mùa vụ cỏ thể xây dựng
sáu cặp sô trung bình đế so sánh liên đới cần kiểm tra như sau:
- xu.ân-hè trôVig vối xuần-hè mái;
• xuân-hè trống vối thu-đông trông;
• xuân-hè trống vởi thu-đông mái;
- xuân-hè mái với thu-đông trống:
- xuân-hè mái với thu-đông mái;
• thu-đông trôVig vói thu-đông niái.
Như vậy, nếu dùng phương pháp kiềm tra z hay t thì không thể phát
hiện đượ<c liệu giữa chúng có sự tưđng tác qua ỉại làm ảnh hưởng đến khốỉ
lưỢng của gà hay không nên phải sử dụríg phướng pháp phân tích phương
sai.
Mô hình 2. Mồi biến sốcó trên hai nhóm mẫu
Hầu hết, các thí nghiệm trong công nghệ sinh học nói chung hay trong
nông nghiệp nói riêng thưòng tô’ chức nghiên cứu trên hai nhóm mẫu cho
mỗi biến số. Mục đích sử dụng mô hình thí nghiệmcó trên hainhóm mẫu
của mỗi biến sô”là để so sánh cùng lúc nhiều nhómmẫu khác nhau như các
giớng cây trồng, vật nuôi nhằm tìm xem giống cây trồng hay vật nuôi nào
tốt hơn t rong cùng môi trường đó. Những thí dụ sau đây sẽ minh hoạ đặc
tính chung của mô hình này.

185
Thí dụ 5.6. So sánh ảnh hương mùa vụ hè-thu và đông-xuAn đôi VỚI
bôn giống Iđn ngoại vỗ béo tại Xí nghiệp chăn nuôi và thức ăn gia súc An
Khánh về khôi lượng (kg/con) lúc đạt sáu tháng tuổi. Kết quả thí nghiệm
dược trình bày ở bảng 5.18.
Bàng 5.18. Khối lượng lúc sáu th á n g tuổi c ủ a b ố n g iố n g lợ n t r o n g h a i m ù a v ụ

Giống lợn (biến số B)


Mùa vụ Ba máu DYL D L Y
(biến số A)

78 82 78 81 79 78 77 84
88 81 78 81 73 80 68 80
Hè-Thu 87 80 85 82 79 78 75 75
88 80 81 76 75 83 70 76
83 89 78 74 77 84 74 75

Đông-Xuân 85 87 84 87 91 88 90 86
88 98 88 93 90 92 87 82
86 86 91 87 87 96 85 80
95 89 96 94 84 83 90 81
100 94 86 96 86 85 77 84

1 ) Xác định các phương sai thành phần


Như ỏ các phần trên đã nêu cụ thể từng bưốc tính toán của phép phân
tích phương sai. Điểm quan trọng của phân tích phương sai là pnải xác
định được phương sai tổng thế hay còn gọi là phương sai chung và các
phương sai thành phần của chúng. Công thức tính phương sai chung như
sau:
^^lổng thế cácmáu ^^li-ongcúcItiảu
trong đó:
- SStrong eác inẴu là biến đổi gây ra do ảnh hưởng ngẫu nhiên trcng mỗi
mẫu;
- biểu thị cho sự biến đổi giữa các mẫu gây ra.
Giá trị SSpa, mỉucó thể đưỢc chia ra các thành phần phưđng ssi riêng
biệt như sau:
- ss biểu thị cho sự biến đổi giữa các mẫu gây ra do biển sô"A (S3,v);
- ss biểu thị cho sự biến đổi giữa các mẫu gây ra do biến số B (SSa);
- ss biểu thị cho sự biến đổi giữa các mẫu gây ra do tương tic giữa

186
biến sô' A và biến số B (SS,ưa„g t.i,. hoặc ss,).
Từ dó, phương trình phưđng sai tông trên đây có thế được khai triển
thành từng thành phần riêng như phương trình sau:
thế ~ ( S S ạ + S S ịị + S S |) + SS|,„njj
Như vậy, nhiệm vụ của phương pháp phản tích phưđng sai là phải
tính được từng phương sai thành phần đó và xác định mức độ tin cậy giữa
các thành phần đó với phương sai trong các niẫu (phương sai sai sổ).
2) Chuyển sô liệu trên vào bảng cột X hàng (4x2)
Đầu tiên, phải sắp xếp đưa bốn giống lợn (ba máu DYL, D, Y, L) biểu
thị trên bô"n cột và hai mùa vụ (hè-thu và đông-xuân) lên hai hàng (thí dụ
5.6). Tiếp đó, tính giá trị trung bình, độ lệch chuân, dung lượng mẫu và
tổng của mỗi mẫu, mỗi hàng và mỗi cột rồi trình bày chúng trong bảng
õ. 19.

Bảng 5.19. Tham số thống kê cơ bản của bốn giống lớn ở hai mùa vụ
Giống lờn
Mùa vụ BamáuDYL D L Y Xhang

Hè-Thu
n 10 10 10 10 40
X 83,6 79,4 78.6 75,4
s 4,03 3,20 3,31 4.53
16,24 10,24 10,96 20.52
IX ^ 70036 63136 61878 57036 252020

Đông-Xuân
n 10 10 10 10 40
X 90,8 90,2 88,2 84,2
s 5,47 4.37 4.0S 4.2ê
29,92 19.10 16,40 18,15
IX 908 902 882 842 3534
IX ^ 82716 81532 77940 71060 313248

n 20 20 20 20 80
IX 1744 1696 1668 1596 6704
IX ' 52752 144668 139818 128096 536334

3) Kiểm tra sự đồng nhất củữ phương sai


Giá trị được tính bằng cách lấy phương sai mẫu lỏn nhất.chia

187
cho phưdng sai mẩu nhỏ nhất rồi lấy bình phướng kết quả đó để so sánh với
giá trị F tra cứu tại bảng Pcụedại.
Trong thí dụ này, giá trị ,|ạ i được tính như sau:
= 29,92/10,24
= 2,92
Vối độ tự do tưđng ứng a = 8 và DF = 9, giá trị tra cứu tra cứu
được ỏ bảng là 8,95. Vậy, giá trị Frụe,t,,i thí nghiệm (2,92) < Fi„ing (8,95) ỏ mức
độ tin cậy p=0,05.
Tinh hệ số hiệu chỉnh (CF) theo công thức sau:

nt
= 6704^
80
= 561795,2
Tính tổng bình phương tổng thể (SSị)
SSi = I X , - CF
= 565334-561795,2
= 3538,8
Tính tổng bình phương giừa các mẫu rSSpoa mí>J ■

^ ^ g i ử a niiiu'” _ ^ - L /r
n.2 ĩiịí
= 836'^/10 + 794'^/10 +...+ 842-/10 - 561795,2
= 2264,8
Tinh tổng binh phương của biên SỐA (SSa)

ss - £ 1 CF
lìi hàngl n 2 hàng2
= 3170=^/40 + 3534^/40 - 561795,2
= 1656,2
Tính tổng binh phương của biến SỐB (SSiì):

188
n J cột 1 n ^ cột 4

= [1744^/20+1696-/20+1668-720+1596-/20] - 561795,2
= 574,4
Tổng binh phương tương tác giữa hiến sô'A và B (SSJ
SS| = SSg|,„, ,n,\u - (SS,\ + SS|ị)
= 2264,8 - (1656,2 + 574,4)
= 34,2
Tinh tổng bình phương trong các mẫu „„iJ
niAu SSj ■ m/m

= 3538,8 - 2264,8
= 1274
Tổng bình phương trong các mẫu củng có thề được xác định theo công
thức sau;

......
* ^ ^ T ro n g cúc imiu
n,
Xác định DF cho mỗi phương sai thành phần
Đôi với ss, df= (n, • 1 )
= 80-1
= 79
Đối vối SSpa„™, df = (a - 1)

= 8- 1
=7
ĐỐì v ớ i s s , v d f = (r - 1) ( r là s ô 'h à n g )

= 2- 1
=1
Đốỉ vói SSịỊ df = (c - 1) {c là số cột),
= 4-1
=3

189
Đối với s s , , df = (r - 1) (c - 1)
= 3x1
=3
Đối với df = (n,-rc)
= 80 - (2x4)
= 72
Xác định phương sai thành phần bằng cách chia s s cho DF tương ứng
s^ể„„hể = SS,/DF.
= 3538,8/79
= 44,79
s / = SS,/DF,
= 1656,2/1
= 1656,2
S b^= SSb/DF„
= 574,4/3
= 191,5
S ^ „ „ * e .c ™ S u = SS./DF.
= 34,2/3
= 11.4
s tran g các m àu ~ S S lr o n g c á c m ỉu ^ ^ ^ tr o n g r B C màu

= 1274/72
= 17,69
Tính giá trị F của các yếu tố chính
p (biến SỐA) “ trong các m ỉu

= 1656,2/17,69
= 93,62 .
^ (biên sôB) Irong các màu

= 191,5/17,69
= 93,62

190
(tinUlK t;»<-A * li) tMíUi

= 11,4/17.6ÍJ

= 0.(i4
4) Tông hỢp các kết quả trẽn hảng a n o v a
Bảng 5.20. Anova vế khỏi lượng của bốn giông lon ờ hai mùa vụ
Nguồn biến DF ss MS F

Gíửa các mầu 7 2264.8

Biến số A 1 1656,2 1656.2 93,62**


Bỉến số B 3 574.4 191.5 10.83-*
Tương tác AxB 3 34.2 ‘ 11.4 0,64

Trong các mẫu 72 1274 17,69

5) Nhận xét
■ Hai yếu tô"thí nghiệm giông và mùa vụ đêu biêu thị sự sai khác có ý
nglũa rất rõ rệt (p<0,01). Như vậy, giá thuyết không (Ho) không đưỢc chấp
nhậii có nghĩa là cả hai nhân tố giống và mùa vụ đểu ảnh hưỏng đến khổì
lượng lớn hơi lúc sáu tháng tuổi.
- Phương sai tương tác giữa các biến sô (AxB) nhỏ hơn phương sai
trong các niẫu nên không cần thiết xác định mức độ tin cậy. Thực châ”t,
F=0,64 không cho phép loại bỏ giả thuyêt không. Vì vậy, có thế rút ra kết
luận; không có tương tác giữa hai biến số đó.
ứng dụng của phương pháp phân tích kiểm tra Tukey
Phương pháp kiếm tra Tukey được ứng dụng một cách phổ biến trong
các thí nghiệm khi mỗi biến sô' ró trfn hni nhóm !nễu bơi vì phương pháp
này là một trong những phương pháp cho phép biết mức độ sai khác cụ thê
của mọi cặp sô trung bình của các nhóm mẫu trong biên sô” đó. Phương
pháp kiểm tra Tukey (T) là một phương pháp rất nhạy cảm thưòng dùng
cho phân tích phương sai khi thí nghiệm có hai biên sô và mỗi biến có trên
hai nhóm mầu. cần lưu ý, khi áp (lụng phương pháp phân tích kiêm tra
Tukey phải có điểu kiện bắt buộc là kích thước của các nhóm mẫu phải
bằng nhau. Công thức tính kiểm tra được trình bày như sau:
rp- / \ íỉ^hưởng sai trong các mẫu
^ “ vQ/ \ '
V n

191
trong đó:
- T là phưđng pháp kiểm tra Tukey;
- q là giá trị lấy từ bảng phân bố Tukey (xem phụ lục) xác định th(!0 độ
tự do tương ứng;
- n là dung lượng mỗi mẫu.
Tại thí dụ trên, với số mẫu a là (8 ) và DF là 8 và 72 dẫn đến giá trị q
tra cứu tại bảng Tukey là 4,4. Từ đó, xác định giá trị T như sau:
T = 4,4^17,69/10
= 5,85
Lấy lại thí dụ 5.6 đã trình bày trên đây “ảnh hưởng của giông và mùa
vụ đốì vỏi khôi lượng lợn vỗ béo lúc đạt sáu tháng tuổi” đề nghiên cứu
phương pháp phân tích kiểm tra Tukey.
Lập bảng chênh lệch giữa các sô'trung binh
Bảng chênh lệch giữa các cặp giá trị trung bình mẫu của Tukey đốỉ với
phường pháp phân tích phưđng sai khi có hai biến số có thể biểu thị như
bảng 5.21 sau:
Bảng 5.21. Bảng chênh lệch giữa các số trung bình mẫu "*
Mẫu 2 3 4 5 - 6 7 8

Mẫu 1 X,-Xj X,-Xj X,-X4 X,-Xs X,- X, X X, X r Xe


X =83.6 4.2 5.0 8.2 7.2 6.6 4.6 0.6
Mẫu 2 Xr X3 X X 4 X j- Xs X j- Xe XrX, X 2- X ,
X =79.4 0.8 4.0 11.4 10 8 8.8 4.8
Mẫu 3 X 3- X 4 X j- Xs XrXe X 3- X , X, - x »
X =78.6 3.2 12.2 11.8 9.6 5.6
Mẫu 4 XrXs X r x» X 4* X? X4- X.
X =75.4 15,4 14,8 12.8 8.8
M ẳu5 X 5- X . x$- X , Xs- X ,
x=90,8 0.6 2.6 6.6
Mẫu 6 X r X, Xe- X ,
x=90,2 2,0 6.0
Mẫu 7 X,- X,
x=88.2 4,0
Mẫu 8
x=84.2 *

(1) Còn gọi là độ lệch giữạ các sô' trung bình mẫu.

192
K ế t lu ậ n

Như v«ậy, trong thí nghiệm này có 15 cặp trong tổng sô' 28 cặp sô' trung
bìiih mẫu có độ lệch giữa các sô’ trung binh đó lớn hơn giá trị T (5,85) nên
sự sai khác của 15 cặp giữa các số trung bình m<ầu ấy vê mặt thốhg kê có ý
nghía rõ rệt.
Mô hình 3. Mỗi mẫu thi nghiêm chỉ có mót số liệu quan sát
Trong những thí nghiệm có hai biến sô”mà đ mỗi mẫu của biến sô chỉ
có Iiìột sô liệu quan sát duy nhàt thì trong phép phần tích phương sai
không cho phép tính tông bình phương giữa các mẫu. Do không có tổng
bình phương giữa các mẫu dẫn đến không có tổng bình phương tưđng tác và
nguồn biến này không được nghiên cứu. Vì vậy, đôi vâi mẫu chỉ có một số
liệu quan sát thì bắt buộc phải chấp thuận giả thuyết không có tưđng tác
giữa các biến sô”.
Thí dụ 5.7. Tại một thí nghiệm vỗ béo lợn ở Nông trường Thành Tô,
thành phố Hải Phòng, sử dụng bốn loại thức ăn A, B, c, D cho ba giống Iđn
Landrace (LR), Large White (LW) và Móng Cái (MC). Lúc ỈỢn đạt khối
lưựng 1 0 0 kg/con, giết thịt để đo độ dày md gáy ở thân thịt mổ khảo sát
(cin). Sô' liệu thí nghiệm và kết quả tính toán được trình bày ở bảng 5.22.
Bảng 5.22. Độ dày mỡ gáy thân thịt cùa ba giống lọn ăn bốn loại thức ăn
Thức ăn A B c D X IX IX ^

Giông LR 3,0 2.7 4.5 1.5 2,925 11.7 38,79


LW 3.3 42 6.3 3,7 4375 17,5 81.91
MC 5,2 6,8 9.7 4,7 6,60 264 189,46

X 3,833 4.567 6,833 3.3


IX 11.50 13,70 20,50 9,9
IX ^ 46 93 71,17 154,03 36,03

Và giá trị n, = 12
IX , = 55,6
IX.=^ = 310,16

Như vậy, mỗi giống lợn (thuộc biên số A) tương ứng vỏi mỗi loại thức
ãn (biến sô B) chỉ sử dụng duy nhát một cá thề làm thí nghiệm nên không
đê cập đến tưđng tác trong quá trình thực hiện phân tích phướng sai. Tổng
các bình phường tổng thể cũng như các thành phần được tính theo các công
thức:
thè - SS.,^ + SSị, +

193
T ín h hệ SỐ h iệ u c h in h ( C F )

n,

= 55,6^
12
= 257,613
Tính tổng bỉnh phương tổng thể (SSị)
s s , = IX,^ - CF
= 310,16-257,613
= 52,547
Tinh tổng binh phương của biển sốA (SSf)

n n n
= 11,7-/4 + 17,5-/4 + 26,4-74 - 257,613
= 27,412
Tinh tổng bình phương của biến SỐB (SSii)

nr nr
= 11,5^/3 + 13,7^3 + 20,5‘^/3 + 9,9-/3 - 257,613
= 21,787
Tính tổng binh phương trong các mẫu (SS,f„niỊnu mảJ
= s s , - (SSa + SSb)
= 52,547-(27,412 + 21,787)
= 3,348
Xác định DF cho mối tổng bình phương
ĐỐìvdiSSi,df = (nt-l)
=12-1
= 11

194
Đ ố iv a iS S . . v , d f = ( r - 1 )

= 3-1 (r là sô’ hàng)


=2
Đốì với SSịỊ df = (o-l)
= 4-1 (c là sô’cột)
= 3

Đối vối SS„,,n^„„,„ảu,df = (i-D(c-l)


= (2x3)
=6
Xác định phương sai thành phần bằng cách chia s s cho DF tương ứng
S,^ = SS,/DF,
= 52,547/11
= 4,777 •
s / = S S ,/ D F ,

= 27,412/2
= 13,706
= SS„/DFh
= 21,787/3
= 7,262

S”tconj[cácmàu ~
= 3,348/6
= 0,558
Tính giá trị F của các biến sô
p (biến SÔ'A) ~ S ; \ 11'ong các ninu

= 13,706/0,558
= 24,56
p
* (biếnsõlì) —0|ị/O
c 2/02 ironịỉt‘á<-inùu
= 7,262/0,558
= 13,01
Tổng hỢp trên bảng anova

195
Bắng 5.23. Anova vé dày mõ gáy ba giống tợn ắn bốn loại thức ăn
Nguổn biển DF ss MS F

Biến số A 2 27.412 13.706 24,56‘ *


Biến SỐ B 3 21,787 7.262 1 3 ,0 r*
Trong các mẫu 6 3.348 0,558
Tổng____________________ 11 52.547 4,777

Kết luận
■ Căn cứ vào bảng phân bố F, giá trị F tính được giữa các giông là
24,56 của biến số A vổi DF = 2 và 6 và giá trị F tính được của biến áố B giữa
các loại thức ăn là 9,779 với 3 và 6 độ tự do, chúng đều lốn hơn giá trị F
bảng ở mức p= 0 ,0 1 nên cả hai biến sô”giốhg và thức ăn đều ảnh hưỏng rõ
rệt đến độ dày mô gáy Iđn mổ khảo sát lúc đạt 10 0 kg.
- Do mỗi mẫu chỉ có một sô”liệu quan sát nên không thể ứng dụng phép
kiểm tra Tukey cho thí nghiệm này. Nhưng dựa vào số liệu thô ta thấy thức
ăn c gây nên độ dày tnỏ gáy lón và giống MC củng có độ dày mỡ gáy lớn
hđn hai giông còn lại.
Mổ hình 4. Trường hỢp khối hoàn toàn ngẫu nhiên
1 )Đặc điểm và thí dụ minh họa
Những thí nghiệm có hai biến sô' mà nhân tô' được sắp xếp theo khối
hoàn toàn ngẫu nhiên phân theo hai biến số là loại mô hình thí nghiệm khá
phổ biến trong nghiên cứu sinh học và chăn nuôi.
Thí dụ 5.8. Bốn giống lợn D, L, Y, D(YL) được thí nghiệm sử dụng
năm loại thuốc tẩy giun 1 , 2 , 3, 4, 5. Sau khi uốhg một tuần, ngưòi ta xác
định sô' trứng giun qua các mẫu và kết quả được trình bày trên bảng 5.24.
Hãy phản tích xác định xem liệu có sự sai khác giữa các giông và giữa các
khối không?
Báng 5.24. Số trứng giun và tỷ lệ ỏ bốn giổng lờn uống năm loại thuổc tẩy giun
Khối Yếu tô' chinh Tổng khối

1 D Y L D(YL)
4 23 9 11 I X = 3.959
0,602 1.362 0,954 1,041 4.211

L D(YL) D Y
11 7 9 16 IX = 4.044
1,041 0.845 0,954 1,204 IX ^ = 4,157

196
L Y D(YL) D
14 20 5 7 I X =3.991
1,146 1.301 0.699 0.845 4,209

D D(YL) Y L
15 4 19 8 I X =3,960
1,176 0,602 1.279 0,903 IX ^ = 4,197

D(YL) L Y D
8 6 21 3 I X =3,480
0,903 0.778 1.322 0.477 IX ^ = 3.396

ghi chú:

- những số nguyên là giá trị quan sát khi chưa chuyển dạng sổ liệu;
- những sổ thập phân là giá trị quan sát sau khi số ilệu đã chuyển dạng:
- tổ n g c á c khối như z x và được trinh bảy ò cột CUỐI cù n g c ủ a b ản g sỏ liệu.

2) Nhận xét
- Nãni số liệu quan sát của mỗi giống dược tập hỢp thành bôn mẫu,
như vậy có thê kiểm tra sự khác nhau giữa các số trung bình trong mỗi
nhóm bàng phương pháp phân tích phương sai vối một biến số hoặc phưdng
pháp Kruskal-Wallis. Trong quá trình thực hiện phương pháp kiểm tra này
thì sự sai khác giữa các khối coi như không đáng kể.
• Do số liệu là số đếm được và nó không tuản theo phân bố chuẩn nên
phải làm phép chuyển dạng sô' liệu trước khi phân tích. Bộ sô" liệu này
không có giá trị quan sát nào bằng 0 và dễ nhận ra phương sai lón hđn
trung bình nên phép chuyến dạng sô liệu hữu hiệu nhâ't là sử dụng hàm
togaril.
3) Tính các giá trị tổng của yếu tố chinh
Từ đó suy ra tổng các bình phướng được phân ra như sau:
^ ^ t ổ n g *” ^ ^ n h ả n tô chính ^ ^ k h (V i cảc mầu

Tại đậy, thí nghiệm mà nhân tô"chính được bô”trí theo hàng con các cột
là yêu tô”ngẫu nhiên của khôi nên không cộng các cột lại với nhau mà chỉ
cộng từng nhân tố chính lại với nhau.
Giá trị đó là:
Giông D:
IX, = 4,054
IX,- ==3,597

1 97
Giống L:
IX , = 4,822
= 4,728
Giốhg Y:
1 X3 = 6,468
= 8,381
Giống D(YL):
1 X4 = 4,0.9
ỵ x / = 3,464
n, = 2 0
IX, = 19,43
IX ,-= 20,17
Tính hệ số hiệu chỉnh (CF)

o .- S ệ l

_ 19,434
20
= 18,884
Tổng binh phương tổng thể
TSS = IX ,2 - CF
= 20,17 - 18,884
= 1,286
Tổng binh phương của yếu tô'chính (A-D)

ne ng n]Ị riR
= [4 ,0 542/5 + 4,822% + 6,4682/5 + 4,09/5] - 18,884
= 0,766
Tổng bình phương của khối

^ ..Ẹ íiĩ. , Ẹ a . „
ytc yic

198
= [3,959-/4 + 4,044-/4 + 3,991-/4 + 3,96-/4 + 3,48/4] -18,884
= 0,053
Tổng binh phương trong các mầu
= Tss - (SS^I, + SSịji„-,*,)
= 1.286 - (0,766 + 0,053)
= 0,467
Xác định DF cho mỗi tông binh phương
Đ ố i v ớ i s s , , d f = (n - 1)

= 20-1
= 19
Đốì vói SSvi,.,df = (I1,U - 1)
= 4 .1
=8
Đối với SSkhố., = (Hkhí, - 1)
= 5-1
=4
Đối với = (n„,-l)(nk,úH-l)
=(3x4)
= 12,
Xác định phương sai thành phần bằng cách chia s s cho DF tương ứng
s ,- = S S ,/I)F ,

= l,28(í/i9
= 0,0677
S,.;^ = ss.,yDF„„
= 0,76(5/3
= 0,2553
S^khỏi~ SSkh,v,/Dt|ih,v,
= 0,053/4
= 0,01325

199
02irtm g các m ẫu
^ —*^*^trong
cc /DRtrong lác jnẲu
các m ẫu '

= 0,467/12
= 0,0389
Tinh giá trị F cho từng biến sô'
12(.vtc) ~ rác inìíu

= 0,2553/0,0389
= 6,563
^■1, Ì2(khôì} "'trangcácin«u
= 0,01325/0,0389
= 0,3406
4) Tổng hợp các kết quả trên bảng a n o v a
Bảng 5.25. Anova của yếu tố chinh và khối
Nguồn Biến DF ss MS F

Yếu tố chính 3 0,766 0,2553 6,663**


Giữa các khối 4 0.053 0 01325 0.3406**
Trong các mẫu 12 0,467 0.0389
Tổng 19 1.286 00677

5) Kết luận
■ Căn cứ vào bảng phân bô"F, giá trị F tính được của yếu tô chính (giữa
các giống) là 6,563 vối DF = 3 và 12, lón hđn giá trị F tra cứu tại bảng
(5,9525) với p = 0,01 nên biến số giổng bị ảnh hưởng râ*t rõ rệt bởi thuốc
giun.
- Giá trị F tính được của biến số khối (giữa các loại thuốc) là quá nhỏ vì
vậy không cho phép loại bỏ giả thuyết không (Ho), tức là không có sự sai
khác đáng kể giữa các loại thuốc giun.
- Do ảnh hưỏng của khôi không đáng kể nên tổng bình phương giữa các
khối được cộng vào trong các mẫu (0,053 + 0,467 = 0,52) và độ tự do của các
khôi cũng được cộng vào với độ tự do trong các mẫu (DF = 4 + 12 = 16). Vì
vậy, phưđng sai trong các mẫu sẽ là 0,52/16 = 0,0325 và giá trị Fv„ =
0,2553/0,0325 = 7,855. Rõ ràng, giá trị F tính được sau khi đã cộng yếu tố
khôi vào sai số đã tăng lên rõ rệt.

200
Mô hỉnh 5. sắ p xếp theo ô vuông latinh
1) Đặc đíêm và thi dụ minh họa
Mô hình thí nghiệm ô vuông latinh thưòng dưỢc bô trí đế nghiên cứu
một yếu tô’ chính bị hoà lẫn bỏi những khá năng ánh hưởng hệ thông theo
niột chiều hướng môi trường thông qua tâ't cá các niầu. Những thí dụ cụ thể
như ánh hưởng của phân bón, phưđng pháp quán lý, ... thông qua một môi
triíờng nào dó. Phân tích phương sai ớ thí nghiệm ô vuông latinh cũng cho
phép tách tông bình phương ra các thành phầỉi riêng của nó. Đặc điểm cơ
bán Iihất cúa thí nghiệm ô vuông lalinh là ti ong inỗi hàng cũng như trong
mồi cột đểu phải có đủ các nhân tô.
Thí dụ 5.10. Tỷ lệ đàn trâu bị nhiễm kí sinh trùng đưòng máu thu
được tại bôn huyện A, B, c, D chạy dọc iheo sòng Đáy ỏ bô”n điểm tương ứng
1, 2, 3, 4 thuộc inột tỉnh (biến SỐX) và cách xa quốc lộ theo bốn khoảng cách
khác nhau 1, 2, 3, 4 (biến số Y) dưỢc Irình bày trên bảng 5.29. Hãy phân
tích và kiểm tra liệu có sự sai khác giừa các tần suất tỷ lệ giữa các huyện
tức là do yếu tố quản lý (yếu tố chính) không? và liệu có sự sai khác trong
các diêm thuộc biến sô* Y dọc theo dòng sông và X khoảng cách đến đưòng
quốc lộ không?

Báng 5.26. Tỷ lệ trâu mắc bệnh ki sinh trùng tại bốn huyện

Biến sổ X Biến số Y Tổng hàng


1 2 3 4

Hàng 1 0,32 0,81 0,64 0,57


D A B c I X = 200,76
34,45 64,16 53,13 49.02 1X^=10529,07
2 0,84 0 ,2 7 0,58 0.62
A D r B I X = 199,27
66,42 31,31 49.60 51.94 1X^=10649,86
3 0,63 0 ,6 7 0,79 0,19
c B A D I X =196,05
52,54 54,94 62.73 25,84 1 X ^ = 1 0 3 8 1 ,6 1

4 0.72 0.65 0,24 0,70


B c D A IX = 1 9 7 .9 0

58,05 53.73 29.33 56,79 1X^ = 1 0 3 4 2 .0 7


IX 211,46 2 0 4 ,1 4 1 9 4 ,7 9 1 8 3 ,5 9 IX = 2 0 0 ,7 6
1 1 7 2 8 ,6 7 1 1 0 0 2 ,1 4 1 0 0 7 8 ,2 6 8 9 9 3 ,5 3 In = 16

1 X ^ = 4 1 8 0 2 ,6 1

201
ghl chú:
- nhữhg số in đậm là giá trị quan sát tỷ lệ khi chưa chuyển dang số liệu:
- những sổ in nghiêng là giá trị quan sát sau khi số liệu đã chuyển dạng theo dạng hàm
đối sin;
- tổng các hàng sau khi số liệu đã chuyển dạng như I X và cũng được trinh báy trên
cột cuối cùng của bảng số liệu;
- tổng các cột sau khi số liệu đâ chuyển dạng như I X và cũng được trình bày trên
những hàng cuối cùng của bàng số liệu;
- tổng các tổng thể sau khi sô liệu đâ chuyển dạng như Xn. z x và cũng được trinh
bày trèn góc cuối của bảng số liệu.

2) Nhận xét
■ Tần suất tỷ lệ quan sát của mỗi yếu tô"chính bằng mỗi hàng và mỗi
cột được tập hđp thành một hình vuông lớn có 16 ô vuông nhỏ.
- Do sô liệu trình bày theo đđn vị tỷ lệ và nó không tuân theo phán bô
chuẩn nên phải làm phép chuyển dạng sô'liệu trước khi phân tích và phép
chuyển dạng được sử dụng hỢp lý nhâ't cho bộ sô"liệu nàv là hàm đôi sin.
3) Các bước tinh toán cụ thể để phục vụ cho anova
Tổng của các tống các bình phương
Từ bộ sô liệu đó suy ra tổng các bình phương tổng thế được phân thành
các tổng bình phương thành phần như sau:
= SSyèV, tốchinh SSx + SSy +
Tổng các giá trị của yếu tố chính
Tống của các cột và hàng củng như tổng thế đã đước trình bày tại bảng
trên còn giá trị tổng của mỗi nhản tô"chính được cộng lại với nhau được thể
hiện sau đây:
Yếu tố chính A:
IX = 250,10
IX'^ = 15688,28
Yếu tô*chính B:
IX = 218,06
1X2= 11908,77
Yếu tố chính C:
XX = 204,89
IX^= 10510,48
Yếu tố chính D:

202
vx = 120,93
IX- = 'Mmxm
H ệ Hố h iệ u c h in h ( C F )

CF = -
n,
793,98-
16
= 39400,27
Tổng binh phương tổng thế
ss, = IX,-. CF
= 41802,61 - 39400,27
= 2402,34
Tổng binh phương của yếu tô chinh (A-D)

nj ti2 n;i
= [250,1-/4+218,06-/4+204,09-74+120,93/4] - 39400,27
= 2275,77
'Tổng hinh phương của biến sốx

»1 « 2 n-, 114

= [200,76-/4+199,27-/4+196,05-/4+197,9/41 - 39400,27
= 3,01
'Tổng hình phương của biến sô Y

nỊ n9 n ;ị n ,ị
= [211,46''/4+204,14-74+194,79-74+183,59 /^ 1 - 39400,27
= 108,96
'-Tông bình phương trong các mẫu
s s , = ss, ■(SS.„. + SSx + SSy)

203
= 2402,34 - (2275,776 + 3,01 + 108,96)
= 14,6
Xác định DF cho mỗi tổng binh phương
Đ ố ì v ổ i s s , d f = (n , • 1)

= 16-1
= 15
Đôì với SSy„..df= (riv,,, - 1)
= 4 -1
=3
Đổì với SSx df = (nx - 1)
= 4 -1
=3
Đối với SSy df = (ny • 1)
= 4-1

=3
Đốỉ vỏi SS„^„^eácmẳu,df = (n-l)(n-2)
=(3x2)
=6
Xác định phương sai thành phần bằng cách chia s s cho DF tương ứng
= SS,/DF,
= 2402,34/15
= 160,156
S,.,^ = s s , JDF,„
= 2275,77/3
= 758,59
= SSx/DFx
= 3,01/3
= 1,003
Sy^ = SSy/DFy
= 108,96/3
= 36,32

204
rong rárniỉul <J1( Irontỉ .h inriu

= 14,6/6
= 2,433
Tính giá trị F cho các biến sỏ
F:t,<i(ytc) = phương sai„,/phưưng sai,
= 758,59/2,433
= 311,79
F:,.g(X) = phương saix/ phương sai,
= 1,003/2,433
= 0,412
Pa.eOO = phương saiy/ phương sai,,„„^,Ac mẫu
= 36,32/2,433
= 14,928
4)Tống hỢp các kết quả tinh toán cơ bản vào bảng anova
Báng 5.27. Anova về nhiễm ký sinh trùng của trâu ỏ bốn huyện
Nguốn biến DF ss MS F

Y ế u t ố c h ín h ( q u ả n lý ) 3 2 2 7 5 .7 7 7 5 8 ,5 9 6 ,5 6 3 * *

G iữ a c á c b iế n s ố X 3 3.0 1 1 ,0 0 3 0 ,4 1 2

G iử a c á c b iế n s ố Y 3 1 0 8 ,9 6 3 6 .3 2 1 4 ,9 2 8 *

T ro n g c á c m ẫ u 6 1 4 .6 2 .4 3 3

Tổng 15 2 4 0 2 .3 4 1 6 0 ,1 5 6

5) Kết luận
■ Căn cứ vào bảng phân bô’ F, giá trị F tính tiược của yếu tô’ chính
(phương thức quản lý) là 311,79 vối DF = 3 và 6, lớn hơn giá trị F tra cứu ỏ
bảng (9,7795) ở mức p = 0,01 nên yếu tó quản lý có ảnh hưởng rất rõ rệt bởi
bệnh kí sinh trùng.
- Giá trị F tính được của biến sỏ' X (giữa các khoảng cách đưòng quốc
lộ) là quá nhỏ vì vậy không cho phép loại bỏ giả thuyết không (H„), tức là
không có sự sai khác giữa các khoảng cách đến đưòng quốc lộ.
• Trong lúc đó, giá trị F tính được của biến sô'Y (giữa các điểm khác
nhau chạy dọc theo dòng sông) là 14,928. Vì vậy, củng cho phép loại bỏ giả

205
t h u y ế t k h ô n g , tứ c là có sự s a i k h á c r õ r ệ t g iữ a các đ iể m dọc th e o d ò n g s ô n g .

- Do ảnh hưởng của biến số X không đáng kế nên tổng bình phương
giữa các biến số X được cộng vào tống bình phương trong các mẫu liên giá
trị p’ đã tăng lên rõ rệt.
Phương pháp phán tích phương sai hồi quy
Phân tích phương sai cũng có thế đưỢc ứng dụng trong việc sử dụng
kiểm tra đường hồi quy. Điểm cđ bản của phân tích phương sai trong tuyến
tính hồi quy là xác định tổng bình phương do hồi quy (yếu tố chính) và tống
bình phương trong các mẫu. Các giá trị đó được biến dổi thành biến sô”bằng
cách chia chúng cho độ tự do tưđng ứng của 1 và (n - 2). Phưđng pháp phân
tích kiêm tra đường hồi quy là xác định giá trị F bằng phương sai hồi quy
chia cho phương sai trong các niẫu rồi so sánh với F bảng vỏi DF = 1 và (n-
1). Thí dụ 5.10 sẽ minh họa vân đề đó.
Thí dụ 5.10. Nghiên cứu khảo sát ảnh hưỏng của lượng phân hoá học
khác nhau đối vói năng suất cỏ trồng. Hạt cỏ được gieo đểu trêĩi một diện
tích đâ”t trồng. LâV 10 điểm ngẫu nhiên, mỗi điểm 1 111-, rồi hón với các
lượng phân khác nhau. Sau hai tháng, cỏ được cắt và phđi khô rồi cân. Kêt
quả thu được như sau:
- Biến số x (khốỉ lượng phân) (g/m‘‘^):
25 50 75 100 125 150 175 200 225 250
- Biến SỐY (khối lượngcỏ) (g/m-):
84 80 90 154 148 169 206 244 212 248
Tính tổng bình phương hồi quy, (SSk,u,iuy)
(Tổng các tích)^
SSi,4, ,,uy -
Tổng các binh phưong của X
_ 41837,5^
51562,5
= 33946,694
Tống bình phưđng hồi quy luôn có DF = 1. Vì vậy, phương sai hồi quy
cũng chính là tổng bình phương hồi quy.
Tính phương sai sai sỐ(Sk )

( 3 6 8 3 4 .6 - 1 ™ ? ^ )
8 51562,5
= 3 6 0 ,9 8

206
DF=n-2
= 10-2
=8
T ín h g i á t r ị F

Fị H= p h ư ơ n g s a i hồi (ịuy/|)!iưdng s a i s a i sô

= 33946,694/360,98
= 94,04
Kết luận
Giá trị F tính đưỢc của thí nghiệm là 94,04 với Ỉ)F' = 1 và 8 lốn hơn rất
nhiôu so với giá trị F tra cứu ở bíing (11,26) vỏi núic liii cậy p = 0,01. Từ kết
(lUií đó, có thê rút ra kết luận hồi quy có ý nghĩa rất rõ ràng.
2.3. Thi dụ minh họa về thi nghiêm cô hai yếu tố
Như vậy, chúng ta đã xét các trường lìỢp khác nhau của thí nghiệm có
hai yếu tố và cách sử dụng anova cho môĩ trường hợp riêng của chúng. Sau
đây, chúng tôi sẽ trình bày một thí dụ cụ the đè chứng minh về sự ảnh
hưdng của inỗi nhóm mẫu trong mỗi biến số trong các thí nghiệm có hai yếu
tô".
Thí dụ 5.11. Hây phân tích và so sánh bôn thành phần dinh dưỡng
thức ăn khác nhau đ ba công ty A, B và c. Kết quả thí nghiệm được trình
bày ở báng 5.28.
Bảng 5.28. Bốn thành phần dinh dưỡng thức ăn của ba công ty

C ô n g ty A TPDD, 0 ,8 3 0 ,3 9 0,66
TPDD, 3,15 2 ,4 7 2 ,7 5

T pooi 0,70 1.0? 0,60


TPDo’ 292 1,86 2.90

C ô n g ty B TPDD, 1,90 3 .1 4 2 .7 7

TPDDj 4 ,4 7 3 ,8 9 4 ,1 9

TPDD, 3 ,4 3 1 86 262
TPDD, 3,25 3,55 385

Công ty c TPDD, 1 ,9 5 1 .3 4 3 ,0 6

TPDDj 3 ,6 5 4 ,2 5 3 11

TPDDj 2 ,4 7 2 ,1 8 3 ,1 6

TPDD, 3 ,5 4 3 ,8 3 4 ,5 5

207
1) Các bước tính toán cụ thể phục vụ cho anova
Tính giá trị trung bình theo mỗi thành phần dinh dưỡng thức ăn của
các công ty khác nhau và kết quả được biểu hiện trên bảng 5.29.
B á n g 5.29. G iá t r ị t r u n g b ìn h d in h d ư ỡ n g c ủ a th ứ c ă n v à c ô n g t y
T h à n h p h ầ n d in h d ư õ n g

1 2 3 4

C ô n g ty A 0 ,6 2 7 2 ,7 9 0 0 ,8 6 3 2 ,5 6 0 1 ,7 1 0

C ô n g ty B 2613 4 .1 8 3 2 ,6 3 7 3 ,6 5 0 3 .2 4 6

c ỏ n g ty c 2 .1 1 3 .6 7 0 2603 3 ,9 7 3 3091

X DO 1 ,7 8 6 3 ,5 4 8 2 ,0 3 4 3 ,3 6 1 2 ,6 8 2

Tính tổng các binh phương


CF = Nx^
= 36 X 2,862^
= 258,834
ss,á.„ Ihế = 0,832 + 0,39- + 0,66- + 4,55’ - CF
= 47,391
Với DF = tống số số liệu (n) • 1
= 36-1
= 35

= 3(0,6272 + 2,790^ + 3,973‘^) - CF


= 40,614
Với DF = số nhóm - 1
= 12-1
= 11
SSdd = ed.TSe^^+a,548^+2,034^+3,361‘") - CF
= 21,942
Vói DF = sô"loại dinh dưõng - 1
= 4 -1
=3

208
= 12(1,7l0-+3,246-+3,091 -) ■CF
= 17,111
Với DF = số công ty - 1
= 3-1
=2
s s , = 4 0 ,6 1 4 - 2 1 ,9 4 2 - 17,111

= 1,56
Vơi DF —DF,,(ingly XD
= 2x3
=6
ss,„ ,0 = 47,391 -40,614
= 6,777
Với DF = DF,ổ„^ - DF„, Au
= 3 5 - 11

= 24
2) Tổng hỢp trên bảng anova
Báng 5.30. Anova về dinh duỡng (DD) của bốn TA à ba công ty
Nguồn biến DF ss MS F p

Giữa các dinh dưỡng 3 21,942 7,314 25,84 p<0,001


Giữa các công ty 2 17,111 8556 30.34 p<0,001
Tương tác 6 1,561 0,260 0.92 p>0,1
Sdi số 24 6,777 0,289
Tổnq 35 47.391

3) Kết luận
- F tính được giữa các thành phần dinh dưông (25,84) vối DF = 3, nên
nó lổn hơn giá trị F tra cứu của bảng vói DF = 3 và 24 (7,55) ở mức p=0,001,
chứng tỏ sự sai khác giữa các thức án rất rõ rệt.
- Tương tự, F tính được giữa các công ty (30,34) với DF = 3, như vậy F
tính được giữa các công ty lớn hơn giá trị F của bảng với DF = 2 và 24 (9,34)
ỏ mức p=0,001. Như vậy, sự sai khác giữa các công ty rất rõ rệt.

209
- F tính được giữa các tương tác < 1 dẫn đến môi tương tác giữa chúng
không biểu thị sự sai khác rõ rệt. Có thế sự sai khác giữa các loại dinh
dưởng thức ăn khá bền vững ở trong mọi công ty, nên mô'i tương tác giữa
chúng không biểu thị sự sai khác rõ rệt.
Vì vậy, giữa các thành phần dinh dưỡng của thức ăn cùng Iihií giữa các
công ty biểu thị sự sai khác rất rõ rệt hay sự sai khác giữa chúng có ý nghĩa
rất lớn. Trong lúc đó, môì tương tác giữa chúng không biểu thị sự sai khác
rõ rệt.
Lưu ý
- Loại thí nghiệm này có hai nhân tô (hai biến số) chính, đó là các
thành phần dinh dưõng thức ăn và các công ty.
■Nhân tố chính “thành phần dinh dưỡng thức ăn” được biểu thị theo
cột và nhân tố chính “công ty” được biểu thị theo hàng.
■Tương tác là cách viết ngắn gọn của “tưđng tác giữa các công ty và các
thành phần dinh dưởng thức ăn”

3. Với ba yếu tố thi nghiệm

3.1. Mô hỉnh thỉ nghiêm


Trưòng hỢp thí nghiệm có ba yếu tô' thường được tố chức cho nghiên
cứu các lĩnh vực tương đốì phức tạp nhưng các vấn đề nghiên cứu đòi hỏi có
độ chính xác cao. Mục đích của mô hình thí nghiệm ba yếu tô là muôn cùng
một lúc và cùng một điều kiện xem xét cả ba yếu tô*. Với mục đích của thí
nghiệm ba yếu tố nhằm nghiên cứu so sánh thật chính xác cùng một lúc,
cùng một điều kiện như nhau cho cả ba yếu tố và đặc biệt nghiên cứu mối
tương quan và tương tác giữa chúng. Thí nghiệm ba yếu tô' thường được bố
trí theo kiểu ô vuông la tinh như đã trình bày trên đây. Hay nói một cách
khác, thí nghiệm bô' trí theo kiểu ô vuông latinh được áp dụng để nghiên
cứu các thí nghiệm có từ ba yếu tố trỏ lên. Mô hình ô vuông latinh thường
bô' trí nghiên cứu từ ba đến năm 5fếu tố cho kết quả hữu hiệu nhất. Sau đây
sẽ minh họa nội dung và phương pháp phân tích phường sai.
Thí dụ 5.12. Hãy so sánh sản lượng sữa từng lứa của bốn giống bò sữa
khi chúng đưỢc sử dụng bốn loại thức ăn khác nhau (sơ đồ 5.8).

210
Sơ đố 5.8. Mô hinh ô vuông latinh với bốn yếu tố
Biến số (X) 1 2 3 4 L

Biến số (y ) 1 A y„ Byj. Cyi, Dy.. u


2 Dy,j A yjj Byu Cy.? h
3 Cy,3 DV23 Aysa By43
4 B y ,í Cy24 Dyj4 Ay44 u

Ic c, C3 c.
vàtA.te.tc vàto-

Mồ hình toán học thường được ứng dụng trong anova cho loại thí
nghiệm ô vuông latinh có dạng chung nhất như sau:
Yijui = ụ + Ti + Cj + tk + eyk,

t r o n g đó:

- Y„1,| là số liệu quan sát thứ 1'*’ của nhân tố thí nghiệm thứ k'*' thuộc
cột thứ j"’ và hàng thứ i*’';
- p là tham sô' trung bình quần thể;
- r, là nhản tố thí nghiệm trình bày theo hàng;
- Cj là nhân tô"thí nghiệm trình bày theo cột;
- tị, là nhân tố thí nghiệm chính trình bày ngẫu nhiên theo ô vuông la
tinh;
- eì,ki là sai số ngẫu nhiên.

3.2. Các hước tinh toán thống kề đ ể xây dựng anova


Tính giá trị hiệu chỉnh (CF)

CF =

Chú ý: Sr, = Ic, = Stị, = X


Tổng các bình phương tổng thể
TSS = - CF
Tổng các binh phương của cột
c s s = Ic,'^/r - CF
Tổng các bình phương của hàng

211
RSS = Ir-^/c - CF
Tổng các binh phương của nhân tô'
TrSS = Itk-/r - CF
Tổng các bình phương của sai số
ESS = TSS - RSS - c s s • TrSS
3.3. Tổng hợp hàng anova từ mô hình chung ô vuông latinh
Bâng 5.31. Anova mô hình chung cho ô vuông latinh
Nguồn biến DF ss MSS F

" Giữa các hàng r-1 rSS RSS/r-1 S,^/Se


Giữìa các cột c -1 cSS CSS/c -1 Sc^/SẼ
Giữa các nhân tố t-1 ts s TrSS/t -1 S,^/Se
Sai sô' (r-1)(c-1)(t-1) ESS ESS/(r-1)(c-1)(t-1)
Tổng rct-1 TSS

Thí dụ minh họa


Tốc độ tăng khôi lượng hằng tháng trong thòi gian vỗ béo (kg) của
nhóm lợn lai ba máu tại bô"n trại (bố trí theo cột) của bô"n lợn đực giông (bô’
trí theo hàng) vói bổh khẩu phần ăn A, B, c, D bô"trí ngẫu nhiên. Kết quả
về tăng trọng hằng tháng (kg/tháng) thu được trình bày ở bảng 5.32. Hãy
xét xem mức độ ảnh hưởng của từng nhân lô trên đói với tóc dộ Làng trọng
của đàn lợn.
Bảng 5.32. Tăng trọng/tháng trong thòi gian vỗ béo lợn

Trai 1 Trai 2 Trai 3 Trai 4


Đut số c 0 B A
1' 27.4 28,1 24.9 25.4
Đưc sổ A B D c
2' 25,8 25,9 27.1 25.7
Đuti số D A c B
3' 27,2 25.7 25,3 24.3
Đực SỐ B c A D
4 26.0 25,5 24.1 24,7

Tính các giá trị trung binh


Xhàng 1:26,450 2:26,125 3:25,625 4:25,075
1:26,600 2:26,300 3:25,350 4 :2õ,02õ

212
x,i.„.a„ A: 25,250 B: 25,275 (': 25.975 D:‘26,775
X = 25,81875
Tinh hệ aổđiều chinh (CF) và tống các hình phương (SS)
CF = 16x25.81875-
= 10665,72563
= 4 x ( 2 6 ,4 5 0 - + ... + 25,075'-) - C F

= 10671,0675 - 10665,72563
= 4,33187
s s . , , = 4 x ( 2 6 ,6 0 0 - + ... + 2 5 ,0 2 5 -) - C F

= 10673,4925 • 10665,72563
= 6 ,7 6 6 8 7

= 4 x (2 5 ,2 5 0 -+ ... + 2 6 ,7 7 5 - ) - C F

= 10671,9570 - 10665,72063
= 6,23187
ss„,., = (27,1'^ + 28 ,p +... + 24,7-') - CF
= 10684,95 - 10665,72563
= 19,22437
gỊi ~ T S S - SSịiíinu - SScộ, - SSih,,,. An
= 19,22437-4,33187-6,76687 - 6,23187
= 1,89376
lẠ p bảng phân tích tổng hỢp

Bảng 5.33. Anova về tăng trọng cùa các đực giộng, thửc ặn và trại
Nguổn biến DF ss MS F p

Giữa các đực giống 3 4.33187 1,4441 4.67 >0,05


Giữa các trại 3 6.77687 2.2556 7,16 <0,05
Giữa các thức ăn 3 6.23187 2,0773 6.58 <0 05
Sai số 6 1,89376 03156
Tổng 15 19.22437

Kết luận
Sự sai khác về tôc độ tăng khối iượng hằng tháng của đàn lỢn lai ba

213
máu trong thòi gian nuôi vỗ béo có ý nghĩa rõ rệt với các trại và các thức ăn
song không có ý nghĩa đôi vói các đực giống khác nhau.

II. ANOVA VỚI TÍNH CHẤT VÀ ĐlỂU KIỆN CỦA CÁC YÊU Tố

Trong nghiên cứu sinh học, khi tính châ't và điều kiện của các yếu tô”
thí nghiệm thay đổi thì phường pháp phân tích phưđng sai củng phải thay
đổi. Phường pháp phân tích phương sai phải phù hỢp với tính chất và điều
kiện của yếu tố thi nghiệm thì kết quả của thí nghiệm mỏi chính xác. Thí
dụ, một yếu tố thí nghiệm như các loại thức ăn trong điều kiện của thí
nghiệm này mang tính chất cố định nhưng trong một thí nghiệm khác nó
lại mang tính chất ngâũ nhiên thì phương pháp phân tích phương sai áp
dụng cho hai thí nghiệm đó rõ ràng phải khác nhau. Tính chất và điều kiện
của các yểu tố thí nghiệm khác nhau rất nhiều, nhưng có thế rút ra mấy
loại chính sau
1. Thí nghiệm chỉ có một yếu tố cố định.
2. Thí nghiệm có chỉ một yếu tố ngẫu nhiên.
3. Thí nghiệm có hai yếu tố đểu cố định.
4. Thí nghiệm có hai yếu tố chỉ có một yếu tô"là cố định.
5. Thí nghiệm có hai yêú tõ’đểu là ngẫu nhiên.
Nội dung các phưdng pháp phân tích phương sai khi tính chất và điều
kiện của các yếu tố thí nghiệm khác nhau sẽ được phán tích chi tiết trong
các phần tiếp theo. Trước hết, hãy phân biệt sự khác nhau cơ bản về ngẫu
nhiên và cô" định của các yếu tố thí nghiệm được tạo bởi các tính châ”t và
điểu kiện.
Phẩn hiệt yểu tố cố định vá ngẫu nhiên
Trong các thí nghiệm sinh học, tính chất và điều kiện của các nhân tố
thí nghiệm có thể được thể hiện khác nhau, chúng có thể là nhân tô' cố định
hay ngẫu nhiên. Có những thí nghiệm mà trong thí nghiệm đó mang cả hai
tính chất và điều kiện: vừa có yếu tô"ngẫu nhiên vừa có yếu tô"cố định. Vậy,
cần thiết phải phân biệt rõ tính chất và điểu kiện yếu tô' nào thì được gọi là
ngẫu nhiên và yếu tố nào là cố định; vì giữa chúng có sự khác nhau rất lốn
trong quá trình thực hiện phân tích phương sai, đặc biệt về sô' độ tự do và
giá trị trung bình tổng các binh phương mong đợi hay binh phương sai sổ.
Các yếu tố thí nghiệm có thể cố định hay ngẫu nhiên phụ thuộc vào
tính chất và điều kiện của yếu tô”đó trong mỗi thí nghiêm, nhưng sự phân

214
biệt giữa chúng thật sự không dễ. Có thể phán chia chúng dựa theo các đặc
điếm cơ bản như sau:
• Những yêu tò được gọi là v ố định lá Iihững yêu tò’ mang đặc tính cô
định như giối tính của vật nuôi, loại thuốc sử dụng, loại thức ăn cho gia súc
ăn, v.v. Nó thường biểu thị tính châ’t và điều kiện là cô định được áp dụng
cho mọi thí nghiệm.
' Những yếu tô" được gọi là ngẫu nhiên là những yếu tô" không mang
đặc tính cô' định mà có thế được phân bô' một cách hoàn toàn ngẫu nhiên
như từng con vật nuôi hay từng ngưòi cho từng thí nghiệm. Nó thưòng đại
diện cho inỗi mẫu của một quần thể.
Thí dụ, dùng loại thuốc A áp dụng cho một đàn bê thì thuốíc là nhân tô'
cô" định vì nó luôn luôn có cùng một ảnh hương và ảnh hưởng đó được xác
định bằng hiệu của trung bình đàn bê sử dụng thuốc đó và trung bình quần
thế. a, = |J, - )a. Trong lúc đó, những cá thể bê được sử dụng thuốc đó đưỢc
coi là nhân tô hoàn toàn ngẫu nhiên được lấy ra từ quẩn thể phán bô"chuẩn
VỚI trung bình (.1 + a, và phương sai Ơ-. Như vậy, thuôc là yếu tố cố định và
bê là yếu tô ngẫu nhiên.
Thế nhưng, có rất nhiều trưòng hđp một yếu tố mà trong thí nghiệm
này được coi là yếu tô ngẫu nhiên nhưng trong một thí nghiệm khác lại
được coi là yếu tô' cố định. Vì vậy, yếu tô' được gọi là cố' định hay ngẫu nhiên
củng chi’ là tướng đôì và áp dụng sắp xếp chúng vào ngẫu nhiên hay cô"định
phiii hết sức linh hoạt chứ không cứng nhắc cho mỗi yếu tô" trong mỗi thí
nghiệm.
Tiong phương pháp phân tích phương sai, các bưốc phân tích, tính
toán cơ bản giống nhau duy chỉ có độ tự do và trung bình các binh phương
mong đợi là khác nhau, phụ thuộc vào việc sắp xếp các yếu tô" thí nghiệm
mang tính chất ngẫu nhiên hay cố định. Vì vậy, trong phần này chỉ cần xét
đến hai yếu tô khác nhau cơ bàn ngẩu nhiên và có định trong các mô hình
thí nghiệm khác nhau: thí nghiệm chỉ có một yếu tố, thí nghiệm có hai yếu
tô và thí nghiệm có ba hay nhiều yếu tô.

1, Thí nghiệm chỉ có một yếu tô cố định


1.1. Đặc điểm chung
Những thí nghiệm khảo sát một đặc tính nào đó mà đặc tính đó bị ảnh
hương bơi một và chỉ một nhân tô nào đó mà thôi thì thí nghiệm đó được gọi
là thí nghiệm chỉ có một yếu tố. Như đã nêu ở các phần trên đây, thức ăn có
thề được coi là một yếu tô”cố định trong thí nghiệm khảo sát ảnh hưởng của

215
nó đến sản lượng sừa của đàn bò, tốíc độ táng trọng của dàn gia súc, gia
cầm, chất lượng thịt của vật nuôi, v.v, nhưng chính nó cũng có thể được coi
là yếu tố ngẫu nhiên. Kết quả phân tích phương sai các sô’ liệu giữa chúng
có lúc giông nhau nhưng có lúc hoàn toàn khác nhau khi yếu tô"thí nghiệm
đổi từ ngẫu nhiên sang cố định hay ngược lại. Sự khác nhau đó chính là do
yếu tô" thí nghiệm thay đổi, được xếp vào cố định hay ngẫu nhiên vì giữa
ngẫu nhiên và cô" định thì giá trị DF và giá trị trung bình bình phương
mong dợi sẽ khác nhau.
1.2. Sơ đổ chung
Như đã phân tích trên đây, thức ản có thể được coi là một yếu tố cô'
định trong thí nghiệm nghiên cứu về sự ảnh hưởng của nó đến năng suấl
vật nuôi và chất lượng sản phẩm. Yếu tố này ảnh hưởng đến các tính trạng
của gia súc như: sản ỉượng sữa của đàn bò, tốic độ tăng trọng của đàn gia
súc, gia cầm, chất lượng thịt của vật nuôi, số lợn con sinh ra trong mỗi lứa
đẻ, v.v. Như vậy, trong những thí nghiệm này yếu tô' thức ăn đưỢc coi là
một yếu tô' cố định.
Đổì vói phương pháp phán tích phưđng sai ứng dụng cho các mô hình
thí nghiệm khác nhau khi chỉ có một yếu tô" cố định thì điểm quan trọng
nhâ't là phải xác định được giá trị độ tự do (DF) và trung bình bình phưđng
mong đợi (EMS). Hãy xem sơ đồ chung cho thí nghiệm chỉ có một yếu tố cố
định qua bảng trình bày mẫu về phân tích phương sai (anova) tổng hợp (sơ
đo 5.9)
Sơ đổ 5,9. Mô hình chung thí nghiêm một yếu tố cổ định
Nguổn biến DF MSS

Giữa các mẫu k-1


k -1
Sai số n(k.1)
Tổng nk-1

k-1
Glá trị F =
o*
Vối DF = k-1 và n(k-l) hãy kiểm tra xem Oị = 0 cho tất cả các i không?
Tính ttị và :
- Oị = m ^ là hiệu trung bình giữa mẫu và quần thể. Trong thực tế đó

216
chinh là giá trị tính đưỢc từ mẫu: a, = X, ■ X
- ơ" = P>ỈV1S,„, ở bảng anova.
Như v<ậy, a, là giá trị cô định nôii niò liìiih tlií nghiệm này được gọi là
inô hình yêú tô’cò định.
1.3. Nội dung chinh
Thí dụ 5.13. Hãy so sánh sự iinh hướng của bô"n loại thức ăn khác
nhau TA,, l ’A^, TA;, và TA,| đến sán lượng sữa (SLS) hằng ngày ở đàn bò hạt
nhàn nuòi tại Trung tâm nghiên cứu bò và đồng cỏ Ba Vì được mô tả ở bảng
5.34. Sứ dụng phương pháp phán tích phương sai theo dạng một yếu tô
thức ăn là cố định.
Báng 5.34. S L S đ à n b ò h ạ t n h ã n v ớ i b ố n lo ạ i th ứ c ă n

M ẫu T A 1 2 3 4

10 11 9 6
10 14 10 5
13 14 11 7

M, 11 13 10 6 M = 10
a. +1 +3 0 -4 1«, = 0

Bầng 5,35, Anova về SLS đàn bò với bốn loại thức àn khác nhau

Nguồn biến DF ss MS F p

Giữa các mẫu 3 78 26 13 0,00KP<0.0


Sai số 8 16 2
Tổng 11 94

1.4. Biện luân


Như kêt quả đã trình bày trôn đây: a, tương ứng là: tti = +1, a -2 = +3, a:(
= 0 và a, = -4. Từ đó có thể suy ra mầu sô 3 coi như mẫu đốí chứng thì mẫu
thứ 1 do tác dộng của yếu tô’cô dịnh nên dã gáy nôn một giá trị lớn hơn đôi
chứng là 1, mẫu thứ 2 cũng do yếu tô cô dịnh nén dă gáy nên một giá trị lớn
hơn đổi chứng là 3, và mẫu thứ 4 cùng do yếu tố cố định nên đă gây nên
ảnli hưởng làm cho giá trị đó lớn hơn đôl chứng là 4.

217
2 . T h í n g h i ệ m c h i’ c ỏ m ộ t y ế u t ố n g ẫ u n h i ê n

2.1. Khải niệm và sơ đồ


Trong sinh học và chăn nuôi, có nhiều thí nghiệm mà sự sắp xếp của
các nhóm mẫu hoàn toàn ngẫu nhiên, nên phương pháp phân tích phương
sai của chúng cùng biểu thị những đặc điếm riêng biệt mang tính ngẫu
nhiên. Các thí dụ sau sẽ mô tả cụ thể phưđng pháp phân tích phướng sai
cho loại thí nghiệm này.
Thí dụ 5.14. Trong một thí nghiệm, ngưòi ta muốn so sánh ba ioại
thức ăn (TA) A, B, c áp dụng cho 15 bò cái đang vắt sữa ở tháng thử hai tại
Trung tâm nghiên cứu bò và đồng cỏ BaVì, Viện chăn nuôi. Cách bố trí thí
nghiệm ở đây là hoàn toàn ngẫu nhiên và các bưóc làm như sau: cho 15 bò
vào 15 ô và sau đó cứ mỗi loại thức ăn làm thành 5 phiếu bốc thảm rồi phân
15 phiếu đó cho 15 ô bò đă có sẵn một cách hoàn toàn ngẫu nhiên và theo
dõi sản lượng sữa của chúng. Kết quả bốc thăm bô"trí thí nghiệm được thể
hiện như sơ đồ 5.4 (trang 176) và bảng 5.36; năng suất sữa được trình bày ở
bảng 5.37.
Báng 5.36. Bố tri thí nghiệm ba loại thức ăn cho 15 bò sữa

B A c c Đ
18 12 9 10 21
c B A c A
12 16 16 14 17
A B B A c
18 17 23 12 10

Bảng $.37. SLS của 16 bò sữa vối ba loại thức ăn


Mẳu thí nghiệm A B c
(loại TA)

SLS (kg) 18 18 12
12 16 9
16 17 10
12 23 14
17 21 10

X 15 19 11

Cấc bước tinh toán cơ bản để xây dựng anova


Tính các thông số thống kê cơ bản để xây dựng anova theo các công
thức đã cho:

218
x = 15
C F = 15 X 15"

= 3375
TSS = (18- + 12- + ...+ 10-) - 3375
= 242
T rS S = (5 x 1 5 - + 5 x 1 9 - + 5 x 1 - 3375

= 160
Bàng 5.38. Anova về SLS 15 bò sữa ăn ba loại Ihửc ăn
Nguồn biến DF ss MS F

Giữa các mâu 2 160 80 11.71


Sai sô' 12 82 6,833
Tổng 14 242

Như vậy, 0,005 > p (F2 12>11,71) >0,001 cho nên khả năng để được
châ"p nhận giả thuyết không (Ho): Pi = ụ-) = Pi là vô cùng nhỏ bé. Điều đó có
nghĩa là sự sai khác giữa ba nhóm thức ăn trên là râ"t rõ rệt.
Loại thí nghiệm chỉ có một yêú tô' được bố trí sắp xếp hoàn toàn ngẫu
nhiên được sử dụng nhiều trong nghiên cứu sinh học và nông nghiệp. Trong
phân tích phướng sai dùng cho loại thí nghiệm có một yếu tô' là ngẫu nhiên
thì giá trị mong đợi giữa các mẫu (EMS) = cácmỉu. trong đó,
mỗu là phương sai quần thể của các mẫu đó.
Như đã phân tích ở các phần trên đây, tính châ't và điều kiện của các
yếu tô' thí nghiệm làm cho các yếu tô' đó biến đổi từ ngẫu nhiên sang cố
định hay ngược lại. Vì vậy, khái niệm vể ngẫu nhiẻn hay cố định áp dụng
vào các yếu tô' thí nghiệm phải hết sức linh động. Thí dụ, thức ăn trong thí
dụ trước là một yếu tô' cô' định, nhưng thức ăn củng có thể được coi là một
yếu tô" ngẫu nhiên trong thí nghiệm khảo sát ảnh hưởng của nó đến sản
lưỢng sữa của đàn bò, tốíe độ tăng trọng của đàn gia súc gia cầm, sô”Iđn con
sinh ra trên mỗi ổ, chất lượng thịt của vật nuôi, v.v. Như vậy, trong thí
nghiệm này thức ăn được coi là một yếu tố ngẫu nhiên.
vẫn sơ đồ chung cho thí nghiệm một yếu tô"là ngẫu nhiên thì phường
pháp phân tích phương sai được thực hiện theo cách trình bày ở bảng 5.39.

219
Báng 5.39. Anova của thí nghiêm chì một yếu tố ngẫu nhién
Nguổn biến DF MS

Giữa các mẫu k-1 +


Sai sô' n(k-1)
Tổng nk-1

Giá trị F được tính theo công thức:


__2
nơ“ - , _. +Ơ _2
.T
í ĩ i u a các niãu ‘
F=
ơ ,.

Với DF = k-1 và nk-1, hãy kiểm tra liệu ơ‘Vm<ácmảu có bằng 0 không?
Lưu ý, nếu giá trị ơ^p,-,a tính được mà âm thì nó sẽ được coi như là
dưđng nhưng phải biện luận rõ ràng.
Tóm lại, sự khác nhau cơ bản giữa yếu tố ngẫu nhiên và yếu tố cố định
là yếu tố ngẫu nhiên biểu thị một mẫu trong một quần thề; trong lúc đó yêú
tô* cố định biểu thị cho một tình trạng mà ỏ đó nó là yếu tô’ phụ thuộc (luy
nhâ't vào mức độ của thí nghiệm mà không quan tâm đến mẫu.
2.2. Nội dung chinh
Lấy lại thí dụ 5.13 “sản lượng sữa hằng ngày ở đàn bò hạt nhân nuôi
tại Trung tâm nghiên cứu bò và đồng cỏ Ba Vì khi sử dụng bốn loại thức ăn
khác nhau”. Hăy so sánh sự ảnh hương của bổh loại thức ăn đến sản lượng
sữa của dàn bò và mỗi loại thức ăn sử dụng ba cá thề’ làm thí nghiệm”. Yếu
tô” thức ăn trong thí nghiệm này dược coi như ngẫu nhiên để áp dụng
phương pháp phân tích phướng sai.
LẠp bảng anova tổng hỢp
Báng 5.40. SLS đàn bò hạt nhân với bốn loại thức ăn
Nguổn biên DF ss MS F p

Giữa các mẫu 3 78 26 13 0.00KP<0.005


Sai sổ 8 16 2
Tổng 11 94

Nhận xét
Thí nghiệm chỉ có một nhân tô* thí dụ thức ăn thì dù nhân tô đó là
ngẫu nhiên hay cố định chúng đều có mức độ ảnh hưỏng như nhau vì cùng

220
có chung một bảng anova và cár kối quíí tính giông nhau.

2.3. Tinh phương sai thành phần


a. Mục đích
Mục dích tính phương sai thành phấn là xác định một số thông sô
tliống kê cơ bản được ứng dụng Iihiêu trong di truyền học cũng như trong
công tác lai tạo giôVìg vật nuôi và cây trồng nhu hệ số di truyền, hệ sô* lặp
lại, hộ sô’ tương quan di truyền, các thành phần di truyền cộng gộp, giá trị
giông trong mỗi cá thế lai và các ưu thế lai thành phần.
Phương sai thành phần cùa niô hình thí nghiệm có một yêu tố mà nó là
ngẫu Iihiôn gồm hai thành phần: phương sai sai số và phưđng sai giữa các
niầu.
b. Cách tính
Phương sai sai sô dược kí hiệu là ơ,- và chính là trung bình phưđng
sai sỏ giá trị ơ,- ở thí nghiệm này.
ơ ,- = 2 ,0 0

Phương sai giữa các mẩu .„i„) được tính theo công thức;
nxơ -pto + ơ.- =26

-♦ M.U. = (2 6 - ơ,.-)/n

= {2 6 - 2 ,0 0 )/3

= 8,00
c. Nhận xét
Phương sai của sự phân bô giừa các mẫu thí nghiệm về các loại thức
ăn là 8,00 và phương sai của sự Ịỉlìíin bố các bò thí nghiệm (trong các mẫu)
là 2,00. Mục đích xác định các phương sai thành phần là xác định mức độ
anh hương cụ thê của mỗi một nguồn biến đó.
Thí dụ 5.15. Kết quả của một thí nghiệm “xác định khôi lượng của bê
dực giông hướng sữa nuôi tại Trung tâm tinh viên Moncađa lúc 12 tháng
tuổi (mỗi bê được cân ba lần cho chính xác)”. Hãy xác định các phương sai
thành phần và mức độ lặp lại cúa mỗi sô liệu Irên.
Sau khi tính được các tham sô thôVig kê cđ bản của bộ sô liệu để phục
vụ cho phân tích phướng sai, hãy lập bảng anova:

221
Bắng 5.41. Khói luọng đàn bè đực lúc 12 tháng tuổi
Nguổn biến DF ss MS EMS

Giữa các bê 4 192 48 3cr'gù.c«:bé + o."


Sai số 10 18 1.8 ơ.*
Tổng 14 210

d. Xác định các thành phẩn phương sai


Đế xác định được các phương sai thành phần, chi’ việc giải các phương
trình cụ thề sau:
48 =

1,8 = 0..=^
Suy ra cácbé = (48 - 1,8)/3
= 15,4
e. Kết luận
Phương sai thành phần một lần cân của mỗi bê là tổng của các phưđng
sai thành phần; sai số và giữa các mẫu:
ơ^^Riaacácbê + =15,4 + 1,8
= 17,2

2.4. H ệ SỐ lặ p lạ i

Hệ số lặp lại (R) là tỷ lệ giữa phương sai giữa các mẫu và phương sai
của mỗi một sô' liệu được lặp lại của từng cá thể. Hệ số lặp lại chính là hệ Bố
tương quan trong các lớp. Hệ sô' lặp lại được sử dụng nhiều trong công tác
di truyển và chọn giống, đặc biệt đốì vôi các tính trạng được lặp lại nhiều
lần như sinh sản của Iđn qua các lứa đẻ, sản lượng sữa bò của các chu kì , ...
và khi chúng có hệ số di truyền thấp. Cách tính hệ số lặp lại (R) cụ thể theo
công thức sau:
_2 ^
_ -
°giưa các bê —

®gii?acảcbê
_ 1^
17,2
= 0 ,8 9 5

222
N h ư v ậ y , h ệ s ô "lặ p lạ i c ủ a m ỗ i n iộ l cá ih ổ I i o iig t h í n g h iệ m đ ó là 0 ,8 9 5 .

3. Thí nghiệm có hai yếu tố đều cô định


Các bưốc tiến hành của Ị)hưdng pháp Ịìhân tích phương sai cho thí
nghiộni có hai yêu tô tương tự giông thí Iighiộm có một yếu tô. Điểm khác
nhau cơ bán phụ thuộc vào khi sử dụng các yếu tô thí nghiệm đó nó mang
tính chât và điểu kiện cô" định hay ngẫu nhiên. Sự khác nhau đó dược thể
hiện rõ trên bảng phân tích phương sai. Hai diêm khác nhau cơ bản ỏ bảng
phân tích phương sai là độ tự do (DF) và trụng bình bình phương mong đợi
(EMS). Do sự khác nhau vê bản chát nên cách tính của chúng (DF và EMS)
phái khác nhau. Vì vậy, giá trị F có thể bị thay dểi. Cách tính DF và EMS
đuỢc minh họa ở các trường hỢp sau (bảng 5.12).

Bảng 5.42. Mô hinh anova thí nghiệm có hai yếu tố đểu cỏ’ định
Nguổn biến DF EMS

Yếu tố 1 (cố định) r- 1


r- 1

Yếu lố 2 (cổ định) c -1


c- 1

Tương tác (1x2) ( r - 1) ( c - 1) -------


(r-D(c-l)
Sai số rc(n- 1)
Tổng rcn-1

trong đó:
- la,' = 0,

Từ bảng này có thể nhận thấy tại sao phải thử ttị = 0 cho tất cả các i, p,
= 0 cho tất cả các j và Yij = 0 cho tất cả ij. T ấ t cả các phép kiểm tra F ở loại
thí nghiệm này đểu sử dụng “sai sỏ” làm mẫu sô.
Trong phép kiểm tra cho “hàng” thì:
cn . _2
+ ơ ,.
F . rc(n-n
Cĩ'ị

223
là một phép thử liệu a, = 0 cho tâ't cả các i không? Tương tự, có thè làm như
vậy cho các phép kiêm tra khác.

4. Thí nghiệm có hai yếu tố: một yếu tố ngẫu nhiên và một y ế u tố
cố định
4.1. Đặc
• điếm
Nội dung chính của thí nghiệm hai yếu tô’ trong đó có một yếu lô ngẫu
nhiên và một yếu tố cố định thưòng bao gồm các bước cơ bản như thí
nghiệm có hai yếu tố đều cố định. Song, do tính chất và điều kiện thay đổi
nên cách tính toán các thông số thống kê cơ bản và phương pháp phân tích
phương sai có những sự thay đổi như bảng 5.43.
Bảng 5.43. Anova của thi nghiệm haí yếu tố: một ngẫu nhiẻn và một cố định
Nguồn biến DF EMS

Yếu tố 1 (cố đnh) r-1 + nơ,^ +


.r -1
Yếu tô' 2 (ngẫu nhiên) c -1 rnơ/+nơ,' +
Tương tác giữa 1x2 (r-1 )(c-1) nơ,' + ơ /
Sai sô' rc(n-1) ơ,’
Tổng rcn-1

ghi chủ:
lu,^ = 0
IP,» = 0
I I y,' = 0
Từ bảng anova này có thể nhận thây chỉ có yêú tô"thứ nhâ't là cô định
nên tại sao phải kiểm tra a, = 0 cho tất cả các i và sử dụng trung bình bình-
phương tương tác làm mẩu sô. Tương tự, cũng sử dụng trung bình bình
phương tưđng tác làm mẫu sô" cho phương pháp kiểm tra F của ơ(.' = 0
nhưng phương pháp kiểm tra F của ơị'*^ = 0 thì sử dụng phương sai sai sô' ơ-
làm mẫu sô'
4.2. Thí du• minh hoa

Thí dụ 5-.16*. Hãy tính phương sai khôi ỉượng (P) cho một lần cân của
một cá thể và hệ 80"lặp lại với số liệu thu được từ kết quả của một thí
nghiệm nghiên cứu vể khối lượng của 10 lợn lai ba máu DR(LWxLR) chúng
đều là con của hai đực giông và mỗi con đưỢc cân hai lần tại hai trại An
Khánh và Thành Tô. Tại thí nghiệm hai yếu tô" này, yếu tô" trại là cô định

224
và yếu tố đực giống là ngẫu nhiên. Kết q u ả thí nghiệm được biểu thị ở bảng
Õ.44.
Bâng 5.44. Anova vé p của 10 lợn lai ba máu ỏ trại An Khánh và Thành Tô
vỏi yếu tố trại (cô định), đực giống (ngẫu nhiên)
Nguồn biến DF ss MS EMS

Giữa các trại (t) 1 125 125


2-1
Giữa các đực (đ) 1 45 45 IO0 / + 5ơ,^+
Tương tác (txđ) 1 5 5
Sai sổ 16 48 3

4.3. Tinh các phương sai thành phần và ứng dụng của chúng
Đê tính được các thành phần phương sai, trưốc hết chỉ cần giải các
phương trình và sau đó xác định từng thành phần phương sai.

125 = la ,'^ + 5ơ,- + ơ^.-


2 1
45 = 10ơrf- + 5ơ,- + ơp-
5 = 5ơ,- + ơ,.-
3 = 0 ;-^

5. Thí nghiệm có hai yếu tố đều là ngẫu nhiên


5.1. Đặc điểm
Tương tự như thí nghiệm có hai yếu tô" mà cả hai yếu tô" đểu cô" định
hoặc một trong hai yếu tô" đó là cô định và yếu tô”kia là ngẫu nhiên, thí
nghiệm có hai yếu tố mà cả hai yếu tố đều là ngẫu nhiên có nội dung và
cách tính toán gần giông nhau. Song, do tính chất và điểu kiện của các yếu
tô'khác nhau nên chúng có một số biến đổi được trình bày ỏ bảng 5.45.
Bàng 5.45. Anova của thi nghiệm hai yếu tố đéu là ngẳu nhiôn
Nguồn biến DF EMS

Yếu tó 1 (ngẳu nhiên) r*1 cna,^ + naĩ +


Yếu tố 2 (ngẫu nhiên) c-1 rnơc^ + na,^ +
Tương tác giữa (1x2) (r-1)(c.1) nơ,^ +
Sai số rc(n-1)
Tổng rcn-1

225
T rong trường hỢp n ày, mọi giá trị của phương pháp kiểm tra F củ a
= 0, = 0, cho tâ"t cả các r, c tương ứng sử dụng trung bình bình Ị)hưdng
tư ơng tác là m m ẫu s ố tron g lúc đó phương pháp kiểm tra F củ a tư ơ n g tác
thì sử dụng trung bình bình phưđng sai sô' làm mẫu số.
5.2. Phương p h á p tinh
T hí d ụ 5.16**. Hăy tính phưđng sai khôi lượng (P) một lần cân cho một
cá thế và hệ sô" lặp lại vối sô' liệu thu đưỢc từ kết quả của một thí nghiộni
“khổì lượng của 10 lợn lai ba máu DR(LWxLR) chúng là con của hai đực
giống được cân mỗi con hai lần tại hai trại và hai yếu tố này đều là ngẫu
nhiên. Như vậy, thí nghiệm 5.16*’ này c6 nội dung thí n g h iệm g iố n g thí dụ
5.16“ duy chỉ có một sự khác nhau là ở đây cả hai yếu tô* thí nghiệm đểu là
ngẫu nhiên. Kết quả được biểu thị ỏ bảng 5.46.

B ả n g S.46. Anova cửa thi nghiêm hai yếu tố đểu là ngẫu nhiên
Nguồn biến DF ss MS EMS

Giữa các trại (t) 1 125 125 1O0t^+ 5ơ,^ + ơ /


Giữa các đực (đ) 1 45 45 1 0 a /+ 5 a .'+ a /
Tương tác (txđ) 1 5 5
Sai số 16 48 3

5.3. Tinh các phương sai th à n h p hần và ứng dụng của chúng
Mục đích tính các phướng sai thành phần là đề xác định hệ số lặp lại,
hệ sô”di truyền và các thông số thông kê liên quan khác. Hệ số lặp lại có ý
nghĩa rất lớn trong công tác chọn lọc giông, đặc biệt là nâng cao hiệu quả
trong chọn lọc đốỉ vối các tính trạng có hệ số di truyền thấp như các tính
trạng sinh sản của gia súc. Tính các phương sai thành phần dựa vào các
phưdng trình sau:
125 = lOơ,^ + 5ơị'^ + ơ,.-
45 = lOơi^ + 5ơi^ +
5 = 5ơj^ +
3= 0/
Vậy, các phương sai thành phần cụ thế là:
= 12.
ơ / = 4,
- 0,4,
0.2 = 3

226
T ừ n h ữ n g k ết quả đó có th ê xác định (iược phương sa i k h ối lượng của
một lần cân cho mỗi cá thế vật nuòi là;
P h ư ơ n g sai p m ột lần cân = ơ,- + ơ,|- + ơ,“ + à ‘

= 12 + -1 + 0,4 + 3

= 19,4
Hộ sô”lặp lại (R) được tính theo công thức sau:

R + Oạ
•> •> •> 2
+ ơ,| + ơ, + ơ
_

19,4

= 0 ,8 2 5

III. ANOVA VỚI CÁC YỂU T ố TH Í NGHIỆM LổNG VÀO NHAU

3.1. Giới thiệu chung


Trong những thí nghiệm đã mô tả trước, mỗi một yếu tô" đểu gây ảnh
h ư íìn g d ến h ầu h ế t các y ếu tô" khác. Trong n h ữ n g trường hỢp n h ư vậy, thự c
hiện phán tích phương sai theo mô hình giao chéo nhau như đã trình bày là
thích hợp. Trong những thí nghiệm ấy, phân tích phương sai các yếu tố hầu
hết đều là ngẫu nhiên, thí dụ một cá thể đực giông ảnh hưởng đến tất cả
các trại. Song, trong thực tế chàn nuôi gia súc có nhiều thí nghiệm mà mỗi
một yêu tô chỉ ảnh hưởng đến một mẫu trong quần thể đó mà thôi. Thí dụ,
trong chăn nuôi lợn, người ta phải sử dụng nhiều đực giôVig nhưng mỗi một
cá thể dựi; giông thường chi’ phôi giông trong một trại riêng biệt có nghĩa là
con cái sinh ra ở các trại khác nhau thì khác nhau. Trong trưòng hỢp đó,
thực hiện phưđng pháp phân tích phương sai giao chéo nhau như đã trình
bày trên đây là không thích hỢp nià phải thực hiện phân tích phưđng sai
theo một kiểu khác, yếu tô”thí nghiệm lồng vào nhau và được gọi là “phần
tích phương sai lồng”.
Trong chăn nuôi lợn, gia cầm hay gia súc nhỏ nói chung, đực giống sử
dụng cho các trại chăn nuôi khác nhau hầu hết là khác nhau. Như vậy, mỗi
đực giống không gây ảnh hương đến nhiều trại khác nhau. Những thí
n g h iệm m à khi m ột yếu tố, th í dụ một lợn đực giông, ch ỉ gây ả n h h ư ỏng đ ến
một nhóm mẫu trong quần thể thì phép kiểm tra thích hợp nhất là phép
phân tích phương sai lồng.

227
Tóm lại, khi một yếu tô”, thí dụ một lợn đực giôVig (đ). chỉ gáy anh
hương lên mỗi nhóm mẫu, thí dụ tại một trại chăn nuôi lợn (t), thì ta nói
rằng yêú tô" Iđn đực giôVig đã lồng vào trong yếu tô” trại chăii nuôi lợn, và
được biểu thị bằng kí hiệu đ(t). Nhưng, trong các thí nghiệm khi có Iihiểu
yếu tố và trong số các yếu tố đó lồng vào nhau theo nhữiig mức dộ khác
nhau thi cách xây dựng mô hình thí nghiệm cũng như tính toán và phương
pháp phân tích phưđng sai cũng khác nhau. Trong thực tế, có nhiêu mức độ
lồng vào nhau, song ỏ chương này chỉ trình bày một sô* mô hình C(i bản
thường được áp dụng trong lĩnh vực nghiên cứu sinh học.

2. Các mức độ lồng khác nhau


Những thí nghiệm trong chăn nuôi gia súc và gia cầm, mà các yếu tô
này lồng vào trong một hoặc một sô" yếu tô” khác khá phố biên, đặc' biệt
trong lĩnh vực nghiên cứu di truyền và tạo giông. Mức độ các' yèu lô thí
nghiệm lồng vào nhau rất khác nhau, ở đây chỉ giói thiệu ba íiìức dộ thâ’p
nhâ*t để tham khảo và có thể ứng dụng. Các mức độ đó là:
a. Lồng ỏ mức độ 1 là một yếu tô”thí nghiệm lồng vào trong chính yếu
tô" đó.
b. Lồng ở mức độ 2 là một yếu tô" thí nghiệm lồng vào trong một yếu tô
khác.
c. Lồng ở mức độ 3 là một yễu tố thí nghiệm lồng vào trong hai yếu tố
khác, có nghĩa lậ yếu tô" thứ nhất lồng vào yếu tô" thứ hai mà yêu tô thứ hai
đã lồng vào yếu tô' thứ ba.
Nội dung, cách tính toán các thông sô* thông kê cơ bản và phương pháp
phân tích phương sai của từng mức độ lổng vào nhau được trình bày trong
các mục sau.

2.1. L ồ n g ở m ứe độ 1

a. Đặc điểm ''


Thí nghiệm với yếu tố lồng ỏ mức độ 1 là những thí nghiệm mà nhừng
con gia súc, những ngưồi hoặc những vật khác nhau đưỢc lồng vào trong
chính những yếu tố ấy. Thực tiễn, thí nghiệm chỉ có một yếu tố thì không
thể gọi là lồng vào nhau được vì thí nghiệm chỉ có một yếu tố thì lấy đâu
yếu tô" khác để lồng vào. Vì vậy, thực chất thí nghiệm chỉ có một yếu tô
không thể có sự ỉồng vào nhau.
Trong trưòng hợp này, phép phân tích phương sai thực hiện giống như
phân tích phương sai đơn cách giao chéo nhau như đã nêu ở các phần trên.

228
Nói một cách khác, tại thí nghiệm có một yếu tô, phương pháp phân tích
phướng sai lồng không khác với phân tích phương sai giao chéo nhau do đó
thực hiện phép phân tích phương sai lồng không có ý nghĩa. Nói một cách
khác tlieo Iighĩa rộng rãi hơn là không có phương pháp phân tích phương
sai lồng ỏ mức dộ 1 đôl với bộ sô liệu của các thí nghiệm chỉ có một yếu tô’
b. Nội dung và các bước tính
Thực tế, vối những thí dụ sau đây sẽ chứng minh nội dung và các bưỏc
lính cơ bản của phưdng pháp phản tích phương sai lồng ở mức độ 1 không
khác vỏi phương pháp phân tích phương sai giao chéo nhau.
Thi dụ 5,17. sử dụng bôn Iđn đực giống cho phôi vối bôn đàn lợn nái
thu dưỢc bôn nhóm lợn con. Thí nghiệm này muôn so sánh xem liệu giữa
những lợn con đó có sự sai khác rõ rệt không?
Rõ ràng, phương pháp phân tích phương sai lồng ở đây hoàn toàn
giống với phương pháp phân tích phương sai đan chéo nhau như đă trình
bày ỏ phần trên. Phương sai sai số thực chất là phương sai giữa các con
sinh ra trong các dực giông.
Thí d ụ 5.18. sản lượng sữa hằng ngày ở đàn bò hạt nhân nuôi tại
Trung tâm nghiên cứu bò và đồng cỏ Ba Vì thuộc bốn đực giống khác nhau
dưực mô lả ớ bảng 5.47. Hãy so sánh sự sai khác về sản lưỢng sữa đàn bò do
bôn đực giông tạo ra.

B ả n g 5.47. SLS đàn bò thuộc bốn đực giống


Đực giống số 1 2 3 4

SLS (kg/ngày) 10 14 9 6
10 11 10 5
13 14 11 7

X, 11 13 10 6
ss. 6 6 2 2

B ả n g 5.48. Anova về SLS đàn bò thuộc bổn đực gỉống


Nguồn biến DF ss MS F

Giữa các đực giống 3 78 26 13


Trong các đực giống (sai số) 8 16 2
Tổng 11 94

Tông bình phương sai sô' được tính như sau:

229
SS3„,» = ISS.
= SS| + SS 2 + SS;j + SS.Ị
= 16
DF = số đực giống X (số con cái trong mỗi đực giông - 1)
= 4 (3 - 1)
=8
Mỗi thành phần SSị được tính như sau:
s s , = 10'^+ 10=^+13'-^-3x 11^
=6
8 8 2 = 142 + 1 1 2 + 1 4 2 - 3 X 132

=6
55 3 = 9 2 + 10-+11--3X lO-"
=2
55 4 = 02 + 5'^ +72 - 3 X6'-^
=2
c. Kết luận
Kết quả phưđng pháp phân tích phương sai lồng không khác vói kết
quả phân tích phưđng sai đan chéo nhau kbi thí nghiệm chỉ có một yếu tố.
Phưđng pháp phân tích phưđng sai lồng ỏ mức độ một chỉ nêu một cách
khái quát, chứ không trình bày chi tiết.
2 .2 . L ồ n g ở m ứ c đ ộ 2

a. Khái niệm
Thí nghiệm có yếu tô' lồng vào nhau ở mức độ 2 cơ bản giống với thí
nghiệm có hai yếu tố đan chéo nhau, nhưng giữa chúng có một số điểm
khác nhau. Điểm khác nhau cd bản đó là tại th í nghiệm yếu tố lổng vào
n h a u thì một yếu tô' lồng vào trong một yếu tố’ khác, trong lúc đó tại th í
nghiệm đ an chéo n h a u thì mỗi một yếu tô' sẽ làm ảnh hưdng lên mọi cá
thể trong thí nghiệm đó. Thí dụ, trong một nhóm lợn đực giống tại thí
nghiệm yếu tố lồng vào nhau thì mỗi đực giông trong chúng chi’ được giao
phối vôi nái trong một trại nhất định mà không được giao phôi với các nái
thuộc hai trại khác nhau. Do có sự bố trí khác nhau ở thí nghiệm yếu tố
lồng vào nhau so với thí nghiệm bô" trí yếu tô' đan chéo nhau, thí dụ mỗi đực
giốhg có thể giao phôi vối nái trên một trại sò vôi nhiều trại khác nhau, dẫn

230
đến phóp phân tích phương sai giữa f‘húng có những điểm khác nhau.
Phương pháp phân tích phương sai lồng ồ mức (lộ 2 cùng có nhiều bước
tư ơ n g tự n h ư p h â n tích p h ư ơ n g sai ỏ những thí n g h iệ m có h a i y ế u tô" đ a n
chỏo nhau. Song thực chât chúììg (*ó những điổiìi khác nhau rõ rệt đó là
cách tính độ tự do và bình phươĩig trung bình mong đợi. Vì vậy, tại phương
pháp phân tích p h ư ơ n g sai lồng ờ mức (ìộ 2 này, chúng ta ch ỉ phân tích
những điểm khác nhau so với phương pháp phản tích phương sai của hai
yêu tô đan chéo nhau đã đựơc trình bày trước dây. Nhưng, do tính châ^t và
điều kiện của các yếu tô" thí nghiệm cô định hav ngẫu nhiên nên có thể
phân chia chúng theo các dạng khác nhau dể áp dụng các phương pháp
phân tích phướng sai thích hỢp hơn.
b. Các dạng lồng khác nhau
T h í n g h iệm lồ n g ở niức dộ 2 cùn g có thể phân ra ba d ạ n g ch ín h dựa
th eo tín h ch ấ t và đ iều k iện củ a yếu t ố c ố dịnh hay n gẫu n h iên sau đây:
- c á h a i v ế u tô" d ề u cô đ ị n h ;

- m ộ t y ô u i ố l à cô" đ ị n h v à m ộ t y ế u tô' là n g ẫ u n h i ê n ;

- c á h a i y ế u tô" đ ề u n g ẫ u I ih iê n .

Trưỏc hết, hăy nghiên cứu dặc điểm, nội dung và phương pháp tính
toán phân tích phương sai của mô hình chung loại thí nghiệm có hai yếu tô"
mà các yếu i6 đó lồng vào nhau. Mô hình thí nghiệm hai yếu tô" lồng vào
nhau có dạng chung như sau:

Bảng 5.49, Mô hình chung của thí nghiêm có hai yếu tố lồng vào nhau

Bổ 1 2 3 4

A Mẹ 1 2 3 4 5 6 7 8 9 10 11 12
Con X X X X X X X X X X X X

Bố 5 6 7 8
B Mẹ 1 2 3 4 5 6 7 8 9 10 11 12
Con X X X X X X X X X X X X

Bổ 9 10 11 12

c Me 1 2 3 4 5 6 7 8 9 10 11 12
Con X X X X X X X X X X X X

Bổ 13 14 15 16
D Mẹ 1 2 3 4 5 6 7 8 9 10 11 12
Con X X X X X X X X X X X X

231
ghi chủ:
-1 6 bố (B) khác nhau và không có bỗ' nào trùng ở các trại (T). và các bố lổng
vào trong các trại (mỗi trại có 4 đực) và đưọc kí hiệu B(T);
- 4 trại A, B. c. và D độc lập nhau:
-1 2 mẹ (cái) trong mỗi trại khác nhau;
-1 2 con (x) của từng bố. mẹ và trại đều khác nhau.

D a n s 1. C ả h a i y ể u t ổ đ ề u c ố đ i n h

Nội dung chính của mô hình thí nghiệm có hai yếu tố lồng vào nhau
mà cả hai yếu tố đều cô' định có nội dung và phương pháp phân tích phưdng
sai như sau:
1) Xây d ự n g b ả n g tổ n g hỢp a n o v a c h u n g

B ả n g 5 .5 0 . Mô hình anova cà hai yếu tô' cố định lổng vào nhau


Nguổn biến DF EMS

Giữa các hàng r-1 V 2 2


r- 1

Giữa các cột (các hàng) c-1


r(c-1)
Sai số rc(n-1)
Tổng rcn-1

Lưu ý: Để tính được giá trị F thì cả hai yếu tố hàng và cột lồng vào
hàng đều phải sử dụng EMS làm mẫu số.
Thí dụ 5.19. Mức độ giảm đau khi sử dụng hai nồng độ thuổíc codein
cao và thấp khác nhau ỏ 20 ngưòi tại bốn bệnh viện được mô tả ỏ bảng 5.51.
Hây so sánh 8ự ảnh hưồng của nồng độ thuốc codein tại bôn bệnh viện đó.

B ẩ n g 5 .51 . Kết quả của hai nổng độ thuốc codein tại bòn bệnh viện

Codein
Nồng độ thẩp cao

Bệnh viện A c Đ D

9 8 18 11
12 6 16 10
10 11 14 13
11 9 17 12
8 6 16 14

Xi 10 8 16 12

232
ghi chú;
- sử dụng nhũng liéu đùng codein khác nhau ở các bệnh viện khác nhau;
- yếu tố bệnh viện lổng vào trong yếu tố thu6c codein, nó được viết như sau:
bệnh viện (codein).

2) Các bước tính cụ thể đê xây dựng anova


Trung bình liều thâ”p = (10 + 8)/2
=9

Trung bình liều cao = (16 + 12)/2


= 14

Trung bình tổng thể = (9 + 14)/2


= 11,5

S S ,„ ,,i„ = 1 0 { 9 '^ + 1 4 ^ )-2 0 x ll.5 ^

= 125

SSbệ„hv.ạ„(code.„, = [5(10^ + 8-^) -10 X9^1 -> s s ,


= [5(16-+12-)-10 X 14'']-> s s ,
= 10 + 40

= 50

T S S = 9- + 12^ + ... + 14- - 20 X 1 1,5'"

= 223

E SS = 223 - 125 • ÕO

= 48

DF„«,,in = 2 -1
=1
= 2 X (2 -1)
= 2,0
DF.„^ = 4 x ( 5 - l )
= 16
hoặc = 1 9 - 1 - 2

= 16

233
B ả n g 5.52. Anova về hiệu quả của codeintại các bệnhviện
Nguồn biến DF ss MS F p

Giữa các mức codein 1 125 125 41.67 0,000


Giữa các bệnh viện (codein) 2 50 25 8,33 0,003
Sai sổ 16 48 3
Tổng 19 123

Như vậy, khi tính giá trị F cho các nồng độ codein và bệnh viện lồng
vào trong codein thì mẫu sô" đều cùng là giá trị bình phương trung bình sai
sô.
D ane 2. Một yếu tố cố đ ịn h vá một yếu tố ngẫu nhiên
Đặc điểm, nội dung chính của mô hình thí nghiệm kiểu lồng có hai yếu
tô*, trong đó có một yếu tô* cô* định và một yếu tô’ ngẫu nhiên dược thể hiện
cụ thế qua các bưóc sau:
1) Mô hinh chung của bảng anova

B ả n g 5.53. Anova của mô hinh lồng vào níiau có một yếu tố ngẫu nhiên và một yếu cố định

Nguồn biến DF EMS

Giữa các hàng


r -1
Giữa các cột (cảc hàng) r(c-1) nơc^ +
Sai số rc(n-l)
Tổng rcn-1

C h ú ý : Do n h â n t ố h à n g là n h â n t ố c ố đ ịn h , liên l a , = 0. T ừ b ả n g p liân
tíc h phư ơng sa i n à y có th ể n h ậ n th ấ y giá trị F củ a tti = 0 cho tấ t cá i sử
dụng cột lồng vào trong hàng làm mẫu số. Cách tính giá trị F như sau;
- đôi với h à n g thì sử d ụ n g E M S cột lồn g vào trong h à n g làm mẫu số;
- đối vối cột lồn g vào tron g h à n g th ì sử d ụ n g EM S làm m ẫu số.

2) Nội dung cơ bản


D ù n g lạ i t h í d ụ 5 .1 9 , n h ư n g ở đ â y yếu t ố cod ein là c ố đ ịn h còn yếu tô
b ện h v iệ n là n gẫu n h iên .

234
B ắ n g 5.54. Anova khi yếutôcodein lả cốđinh và yếutốbệnh viện là ngẫunhiên
Nguồn biến DF ss MS F p

Giữa các mức codein 1 125 125 6,00 0,156


Giữa các bệnh viện (ccxJein) 2 50 25 8,33 0,003
Sai sỏ 16 48 3
Tổng 19 123

D a n s 3 . C ả h a i y ế u tố đ ều n g ẫ u n h iê n
Đặc điểm, nội dung chính của mô hình t h í nghiệm có hai yếu tỗ» đều
ngẫu lìhiên lồng vào nhau được trình bày cụ thể sau đây:
1) M ô h ỉn h c h u n g củữ b ả n g ữ ĩio v ữ

Bảng 5.55. Anova khi cả hai yếu tố đều ngẫu nhiên

Nguồn biến DF EMS

Giữa các hàng r-1 cnơ,^ + r\ơj +


Giữa các cột {các hảng) r(c -1) nơc^ + ơ /
Sai số rc(n-1)
Tổng rcn-1

chú ỳ. khi tính giá trị F cấn lưu ý đến giá trị lấy làm mẩu số:
- đối với hàng thì sử dụng EMS cột lổng vào hàng làm mẫu sổ;
- đối với cột lồng vào hàng thì sử dụng EMS iảm mẫu sổ.

2) Nội dung chính


Dùng lại thí dụ 5.19 trên đây nhưng à trưòng hợp này cả hai yếu tố thí
nghiiộm codein và bệnh viện đểu là ngẫu nhiên.

B ổ n g 5.5Ổ. Anova khi hai yếu tỏ' thí nghiệm codein vả bénh viện đểu ià ngẫu nhiẻn

Nguốn biến 0F ss MS F p

Giữa các mức codein 1 125 125 5,00 0,155


Giữa các bệnh viện (codein) 2 50 25 8.33 0 003
Sai số 16 48 3
Tổng 19 223

chú ỳ: trong quá trình thực hiện phương pháp phân tích phương sai lổng thì giá trị s s của
bệnh viện lổng vảo thuốc codeln {SS v ,èn (co d e.n ) = 50) bằng giá trị s s của bệnh viện

(SS = 45) và tương tác giữa bệnh viện va thuoc cođein {SS = 5) trong thí nghiêm mà yếu
tổ đan chéo nhau.

235
2.3. Lồng ở mức độ 3
T ron g trư ờng hỢp th í n g h iệm có ba yếu tố th ì ở cuốn sách này chi đề
cập đ ến trường hỢp yếu tô" th ứ n h ấ t có th ể là cô" định h a y ngẫu n h iêii. CÒII
h ai y ế u t ố còn lại phải là n g ẫ u n h iên . Vì vậy, trường hợp th í n gh iệm có ba
yếu tô' này có thể chia chúng ra hai trưòng hỢp của yếu tố thứ nhất là cố
định hay ngẫu nhiên đê nghiên cứu một cách cụ thế.
Trườns hơD ĩ. Yếu tố thứ nhất là cố đ ịn h
T ron g trường hợp yếu tô" th ứ n h ấ t là cố đ ịn h thì cần phái n g h iên cứu
đồng thời ba yếu tố lồng vào nhau, đó là khôi (k), hàng (h) và cột (c) được
trình bày cụ thề’ qua những thí dụ sau.
1)Mô h ìn h c h u n g của anova

B á n g 5.57. Anova thí nghiêm ba yếu tố mà yếu tố thứ nhất


là cố định và hai yếu tố còn lại là ngẫu nhiên
Nguổn biến DF EMS

rcn _2 _2
Giữa các khối (k) b-1 — ỵ.u, + cntr, + nrr^ + o,
b- 1
Giửa các hàng (k) b{f-1) cna,^ + noc^ + o/
Giữa các cột (k, h) r(c-1) no/ + o,'
_ í
Sai số rc(n-1)
Tổng rcn-1

Nhận xét
Do nhân tô" khối là cố định nên Sa, = 0. Từ bảng phân tích phương sai
này có thế nhận thây rằng giá trị F của ttị = 0 cho tất cả i, sử dụng hàng
lồng vào trong khối làm mẫu số. Tóm lại, để giúp cho việc tính giá trị F một
cách dễ nhố, ngưòi ta áp dụng nguyên tắc "lùi hình tầng" d mẫu sò, cụ thế
là:
- đôi vôi k h ôi th ì sử d ụ n g E M S hàng lồng vào trong k hối làm m ẫu số;

- đôì với hàng lồng vào trong khối thì sử dụng EMS của cột lồng vào
trong hàng và khối làtn mẫu số;
- đôì với cột lồn g vào tro n g h à n g và khối th ì sử d ụ n g EM S làm m ẫu số.
2) Thí dụ minh họa
Thực hiện phướng pháp phân tích phương sai lồng đế xét ảnh hưởng
củ a k h ôi lư ợng bê (P) k h i y ếu tố" ( đ ự c g iố n g ) bô' lồn g vào trong phương

236
Ị)hấỊ) điểu trị (dt) và mẹ (con cái) fni) lổng vào trong bô"(b) và phương pháp
diếu trị.
Ráng anova đôi với khôi lượng bê (P) khi yếu tô^ bô" lồng vào trong
pluiơng pháp diều trị (đt) và mẹ (ni) lồỉig vào ti ong bô' (b) và phương pháp
điếu tì ị đưỢc thê hiện ỏ bảng 5.58,
Bảng 5,56. Anova p bè khi me ỉống vào trong bố. trong điều trị
Nguồn biến DF ss MS F p

Giữappđt 1 0,417 0.417 0.00 0,967


Giữa bố (đt) 2 390,967 195.483 15,17 0.002
Giữame(đí.b) 8 103,067 12,883 3,28 0,005
Sai số 48 188,400 3.925
Tổng 59 682,850

ghi chú:
- ppđt tà phương pháp điếu írị;
- bố (đt) là bố lổng vào trong phương pháp điều trị,
- mẹ (đt.b) là mẹ lổng vào trong bố mà bố lổng vào trong phương pháp điểu trị.

3 ) C á c h tín h g iá trị t h ử F cho các yếu t ố n h ư sa u


+ Đôi với yếu tô' phương pháp điểu trị thì bô" lồng vào trong phương
pháp diều trị sẽ đưỢc làm mẫu sô.
+ Đôì vỏi yêu tô"bô"lồng vào trong phương pháp diều trị thì mẹ lồng vào
trong bô^ và điểu trị sẻ đưỢc làm mẫu sô.
+ Đôi với yếu tô" mẹ lồng vào trong phương pháp điểu trị và bô", sẽ lấy
sai sò MS làm mẩu sô.
Trường hơp 2. Yếu tố thứ nhất ngẫu nhiên
Trong trường hỢp yếu tố thứ nhất là ngẫu nhiên thì thí nghiệm này rõ
ràng là cả ba yếu tô' thí nghiệm đều là ngẫu nhièn mà chúng tôi đã trinh
bày Irong các phần trên.
1) Mô hình chung của bảng anoưa

B á n g 5 .59 . Anova áp dụng cho ỉhỉ nghiệm cả ba yếu ỉố đéu ià ngẫu nhiên
Nguồn biến DF 6MS

Giữa các khối b- 1 rcnơb^ + cnơ,^ + + a;


Giữa các hàng (k) b(r “ 1)
Giữa các cột (k,h) r(c - 1) na/ +
Sai số rc(n -1)
Tổng rcn - 1

237
Đ ế tín h giá trị F tron g các ph ư ơn g ph áp kiểm tra củ a ƠỊ,- = 0, ơ ,“ = 0 và
= 0 th ì áp d ụ n g n g u y ên tắc ỉù i h ìn h tầ n g làm m ẫu sô, cụ th ể là:
+ Đ ốì với khốỉ th ì sử d ụ n g EM S của h à n g lồn g vào tron g khôi làm m ầu
í'
sô.

+ Đối với hàng lồng vào trong khôi thì sử dụng EMS của cột lồng vào
tron g h à n g và khối làm m ẫu số.

+ Đ ối vói cột lồn g vào tron g h à n g và khôi th ì sử d ụ n g EM S sai sô’ làm


mẫu sô.
2) Thi dụ minh họa
T h ự c h iệ n phương p h áp p h â n tích phương sa i lồn g đ ể x ét ản h h ư ỏ n g
của các n h â n tố trại (t), b ố ( đ ự c g iố n g ) (b) lồng vào tron g trại (t) v à niẹ
( c o n c á i ) (m) lồng vào tro n g trại và bô' đ ến khôi lượng (P) củ a bê.

B ả n g 5 .60 . Anova vế p bẻ khi cà ba yếu tố đểu ngẫu nhièn


Nguồn biến DF ss MS F p

Giữa các trại 1 0,417 0,417 0.00 0.967


Giữa các bố (t) 2 390.97 195.48 15.17 0.002
Giữa các mẹ (t.b) 8 103.07 12,883 3.28 0.005
Sai số 48 188 40 3,925
Tổng 59 682!a5

3) Cách tinh giá trị thử F cho các yếu tố như sau
+ Đ ối vỏi yếu tô' trạ i th ì 00' lồn g vào tron g trại sẽ được chọn làm m ẫu
số.

+ Đ ối vối y ếu t ố b ố lồ n g vào tron g trại thì m ẹ lồ n g vào tron g trại v à bô'


s ẽ được ch ọ n làm m ẫu sô*.

+ Đ ôì với y ếu tô" m ẹ lồ n g vào tron g trạ i và bô* sẽ lâ y sa i s ố M S làm m ẫu


số.

Cách tính trung binh bình phương mong đợi của các nhân tố:
MS„,i =2 X 3 X 5 X ơ,^ + 3 X + ơ,,'*
= 0 ,4 1 7

EMSbô lénguongl, ạ. = 3 X 5 X + ơ;-*


= 195,483

238
lồníĩ 1(0và Ỉiỉti ^ ^ ^nụ* ~
= 12,883
E M S = ơ ,-

= 3,925.

Cách tinh phương sai thành phần của các yếu tó


Phương sai th à n h phần sẽ được tính dựa theo các phư ơng trìn h của giá
trị tru n g b ìn h b ình phưđng m ong dợi của các yêu tô.

Giá trị đó là:


ơ,- = 3,925

= (12,883 - 3,925)/5
= 1.792

ơ , / = (195,483 • 12,883)/15
= 12,173

ơ.r,,.' = (0 .4 1 7 - 195,483)/30
= -6,502

3. l^ng dụng của các phương sai thành phần

N h ư p h ầ n p h ân tích phường sai đan chéo nhau đã trìn h b ày trên , m ục


đích tín h các th ả n h p h ầ n phương sai lồng của từng yếu tô cũ n g đ ể xác định
hộ số lặp lại. Hệ số lặp lại là một trong những tham sô' thông kê quan
trọ n g ứ ng d ụ n g vào côn g tác di truyền chọn giông vật n uôi, đặc b iệt dôì với
n h ữ n g tín h tr ạ n g có h ệ s ố di tru yền thấp. Lấy lại th í dụ với n h ữ n g s ố liệu
tương tự như bảng 5.56 và bảng phân tích phương sai ở trên để minh họa.

Bổng 5.61. Anova khi cả hai yếu tố đéu là ngiu nhiên


Nguồn biến DF ss MS EMS

Giữa các mức codein (C) 1 125 126 + 5<ỉịJ + ơ,^


Giữa các bệnh viện (codein)(bv) 2 50 25 w
Sai số 16 48 3 ơ/
Tổng 19 223

G iải các phư ờng trìn h EM S (bảng 5.55) thu được k ết quả các phướng
sa i cụ th ể n h ư sau:

239
- ơc^ = 10,
- ơ bv'^ = 4 , 4 ,

- =3
V ậ y, phư ơng sa i th à n h p h ầ n củ a m ỗi b ện h n h â n g ây n ên bởi m ột n ồ n g
độ th u ố c và ơ m ỗi b ện h v iệ n là:

P h ư ơ n g sa i th à n h p h ầ n củ a m ỗi bện h n h ân

= ơc^ + ơbv'^ +
= 10 + 4,4 + 3
= 17,4
N h ư v ậ y , h ệ s ố lặ p lạ i được tín h th eo côn g thứ c sau:

+ M ỗi b ện h n h â n đôl vối th u ố c cod ein là p hư ơng sa i th à n h p h ần củ a


m ột b ện h n h â n gây n ên bởi sự b iến đổi giữ a các n ồn g độ th uổc.
,2
R^= ------- ĩ ỉ -------
ơ 'ị + ơbv + o ị

= 10/17,4
= 57,5%
+ M ỗi b ện h n h â n đối vối cả th u ốc và b ệnh v iện là ph ư d ng sa i th à n h
p h ầ n củ a m ột b ện h n h â n g â y n ên bỏi phương sa i giữ a các n ồ n g độ th u ốc và
các b ện h v iện .
«2 . _2
« ’C+bv “
«2 ^ „ 2 ^„2

= 14,4/17,4
= 82,8%

IV. ANOVA VỚI CÁC YỂU Tố THÍ NGHIỆM


SẮP XỂP THEO HỆ PHẲ
1. Đặc điểm
T ro n g sin h học v à n ô n g n g h iệp , n h ữ n g th í n g h iệm n g h iê n cứ u v ề v ậ t
n u ôi và c â y trồng, đặc b iệ t tro n g n g h iê n cứu v ề di tru y ền và ch ọn giốn g, có
rất n h iề u th í n g h iệm m à các y ếu t ố được tổ chức b ố trí th eo dõi dự a vào h ệ
phả: d ò n g h u y ế t th ô n g h a y d òn g họ. G iả sử m uốn so sá n h n ă n g s u ấ t v ậ t

240
nuôi của một số cá thể nào đó mà những cá thế đó dã được xác định chính
xác theo hộ phíi dòng họ như bô' và niẹ chúng thì những thí nghiệm đó phải
bô Irí sắp xếp theo hệ phả dòng họ mới đánh giá được chính xác.
Phương pháp phân tích phương sai của mỏ hình thí nghiệm này khác
với các phương pháp phân tích phương sai đã trình bày trên đây. Nhò
phương pháp phân tích này, các nhà di truyền học và nghiên cứu tạo giông
đã xác định dược chính xác sự đóng góp của mỗi tổ tiên cho mỗi th ế hệ con
cháu nhằm nâng cao năng suâ't, chất lượng và hiệu quả kinh tê vật nuôi.
Đồng thòi, nhò phương pháp này đã góp phần hạn chế được các nhưỢc điểm
mà thê hệ sau còn gây ra làm ảnh hưởng đến năng suất, chất lượng và hiệu
quả kinh tô của con giông.
Thí dụ sau đây sẽ minh hoạ kiểu thí nghiệm bô’ trí sắp xếp theo hệ phả
dòng họ. Giả sử, so sánh một tính trạng nào đó của một sô" cá thể, thí dụ 48
cá thế, mà 48 cá thê đó được lây ra từ inột sô đực giôVig, thí dụ xuất phát từ
bốn cá thể đực giống (bô): Si, S2 , S.iVà S.Ị và là con của một số mẹ nhất định,
thí dụ ba mẹ: D|, Dv và D3. Như vậy, cứ mỗi cá thê bô' (S) có liên quan đến 3
cá thê niẹ (D) và mỗi cá thê mẹ có 4 cá thể con (P) tương ứng trong mỗi cá
thể bô; có nghĩa là mỗi cá thể bô" (đực) đựơc phổi vỏi 3 cá thể mẹ và đẻ ra 12
cá thế con vì mỗi cá thể mẹ sinh ra 4 cá thể con. Để phân tích loại thí
nghiệm này, mô hình có thể minh hoạ thí nghiệm bô' trí theo hệ phả đòng
họ của vật nuôi như sơ đồ 5.10.

Sơ đố 5.10. Mô hình thí nghiệm bố trí theo hệ phả dòng họ

BỐ(S,) Mẹ (D.) Con (P,) I

D, p, p. P3 P4 D„
s, D, p. p, P3 p.
D, p, p? Pi D„

D, p, p. P3 P4 D ,2
Sa D, p, P3 p, D„

D3 p, p. P3 p.

D, p, Pí Pa P4 D„
s, D, p, p. P3 P4 D„
D3 p, p. Pj P4 D„

D, p. P2 P3 p. D,4
s. D, p, p, p, P4 D„,
D3 p, p. P3 P4 D„

241
trong đó:
- s là ki hiệu bô' (tương ứng: s,. S2, S3. S4);
- D là ki hiệu mẹ (tuong ứng D,. D2, Dj);
- p là kí hiệu con (tuong ứng p„ Pj, pj. P4),
2. Phương pháp tin h các thông số thống kề cơbản và anova
Phư ơng p h áp tín h to á n các th ô n g sô' th ố n g kê cớ bản đ ể xây dựng
a n o v a của n h ữ n g th í n g h iệm được tổ chức th e o dõi dựa th eo hệ phả được
trìn h bày cụ th ể th eo các bưổc:

Tính giá trị hiệu chỉnh (CF)

CF= ~
sdp

tron g đó:

- X là tổ n g củ a tấ t cả các tổng;

- s là s ố cá th ể củ a bố;

- d là s ố cá th ể củ a mẹ;

- p là s ố cá th ể củ a con th u ộc m ỗi m ẹ và m ỗi bố.

Giá trị X được tính theo công thức


X = Sj + S2 + S;ị +
S| = Dịị + D21 + D31
8 2 ” Dj2 + D22 + D32
83 = D |3 + D2,ị + D,ị;ị
S 4 = D |4 + D 2 , + D-,.,

Tính tổng binh phương giữa các bố(SSS)


s s s = ISi-^/dp - CF
Tính tổng bình phương giữa các mẹ trong mỗỉ bỐ(DSS)
D S S = ID ,,2/p . ISi^/dp

Tính tổng bình phương giữa các con trong mỗi mẹ và trong mỗi bô
(PSS)
PSS = - I D //P

Tính tổng binh phương tổng thể (TSS)


TSS = • CF

242
a. Lập bảng anova tông hợp

Sơđố 5.14. Mô hình anova yếu tóthỉ nghiémbốtrí theo hệ phả


Nguồn biến DF ss MSS F

Giữa các bố s-1 sss SSS/s-1 s ,v s /


Giừa các mẹ trong bố d-s DSS DSS/d-s S//Sp’
Giữa các con trong
mẹ và trong mỗi bô p-d PSS PSS/p-d
Sai số (s-1)(d-s)(p-d) ESS ESS/(c-1)(t-1)(r-1)
Tổng sdp-1 TSS

Cần lưu ý rằng nếu S//Sp“ không biểu hiện ý nghĩa rõ rệt thì sự sai
khác giữ a các con trong mỗi mẹ và trong mỗi bố sẽ bị sai do nguyên nhân
của bô^ gây ra. Từ đây, ta có thể xác định được kỳ vọng hay giá trị m ong đợi
tư đ n g ứng.

b. Lập bảng xác định giá trị mong đợi của từngyèú tô thí n g h iệ m

B ả n g 5.62. Giá trị mong đợi của từng yếu tố thí nghiệm
Nguổn biến DF Giả trị mong đợi

Giữa các bô s-1 X3S /


Giữa các mẹ trong mỗi bố d-s Se^ + À is /
Giừa các con trong mẹ, trong bố p-d

Phương pháp tính các hệ sốẰ


Các hệ sô' \ đưỢc tính theo các công thức:
= l/(d-s) X (P.. - I(IP„-7p,)
X, = l/(s-l) X1(11 v-/p, ) ■I(IP,r/(p-l)
Xh= l/(s-l)x (P ..-S (IP .% )
Công dụng của phương pháp phân tích phương sai của các thí nghiệm
vối những yếu tô' đưỢc sắp xếp dựa theo hệ phả là để xác định h ệ số di
truyền đồng thời giúp cho quá trình xác định các tham s ố di truyền khác
như tương quan di truyền, giá trị giống, giá trị di truyền từng thành phần
cộng gộp, v.v. Mục đích chính của việc xác định các tham sô di truyền nhằm
giúp cho các nhà nghiên cứu gây tạo giống và chọn lọc giông có cđ sỏ khoa
học để họ tạo và chọn được những cá thê tôt nhất làm giông. Nhưng cần lưu
ý rằng, phương pháp phân tích phương sai này chỉ có thế thực hiện được

243
ch ín h xác k h i tấ t cả s ố liệ u p h ải có đ ầy đ ả h ệ phả h ay hệ h u y ế t th ố n g eủ a
nó. P h ư ơ n g pháp p h ân tích phương sa i này có th ế thực h iện trên cá hai
trư ò n g hdp sô" liệu b ằ n g n h a u và k h ác n hau.

c . NHỬNG QUY ĐỊNH KHI s ử DỤNG ANOVA

P h ư ơ n g p h áp p h â n tích phương sa i là m ột phương p h áp phân tích bảo


đ ảm vừ a ch ắ c ch ắ n v à v ừ a h iệ u q u ả cho việc kiểm tra môì q u an hệ giữ a các
m ẫ u , đặc b iệt đỐì vói n h ữ n g th í n g h iệm có n h iều yếu tô'. N h ư n g , k h i th ự c
h iệ n phư ơng pháp n à y cầ n th iế t p h ả i lư u ý các đ iêù k iện cơ bản sa u đế k ết
q u ả th u được ch ín h xác:

1. P h ư ơ n g p h áp p h â n tích phư ớng s a i chỉ thực h iện được khi p h ải th oả


m ã n tấ t cả các s ố liệu q u a n s á t th u được m ột cách h o à n to à n n g ẫ u n h iê n và
tu â n th eo sự p h â n b ố c h u ẩ n . N ếu bộ sô' liệu k hông tu ân th eo sự p h ân b ố
c h u ẩ n th ì bộ s ố liệu đó p h ả i được th ự c h iệ n phép ch u y ển d ạ n g s ố liệu trước
k h i th ự c h iệ n phép p h â n tích phư ớng sa i để bộ s ố liệu sa u khi ch u y ển d ạ n g
có đ ủ đ iểu k iện đ ể th ự c h iệ n a n o v a .

2 . P h ư đ n g pháp p h â n tích phư đn g sa i ch ỉ thự c h iện đưỢc p hải th ỏa


m ãn các phư đng sa i m ẫu p h ả i tư ơ n g t ự g iố n g n h a u . Đ ể k iểm tra các phương
s a i có tư ơn g tự b ằ n g n h a u k h ôn g cần p h ả i thực h iện phư dng p h áp k iểm tra
th ô n g qua giá trị Fcục N ế u k ế t q uả th ự c h iện phưđng p h áp k iểm tra F„„.
mà không thể hiện rõ ràng sự sai khác thì không phải kiểm tra sự sai
k h á c giữ a các cặp m ẫu. H ơn n ữ a, k h i p hư ớng sa i giữa các m ẫu k h ác n h a u
rất rõ rệt thì bộ sô" liệu đó phải đưỢc thực hiện phưđng pháp chuyển dạng sô
liệu trước khi thực hiện phương pháp phần tích phương sai nhằm làm cho
các p hư ớng s a i được b ền vữ n g.
3 . T ron g quá tr ìn h th ự c h iệ n p h ư ơ n g pháp k iểm tra F của p h ân tích
p h ư đ n g sa i th ì phư ơng s a i tro n g các m ẫu {p h ư ơ n g s a i s a i sô) lu ôn được chọn
là m m ẫ u sô 'củ a phư đng p h áp k iểm tra bỏi vì đ iều đó chỉ ra rằ n g ph ư ơng sai
tr o n g các m ẫu lu ôn n h ỏ hđn so với p hư ơn g sa i giữ a các m ẫ u và giá trị F
k iểm tra ỏ đ â y ch ỉ dự a v à o m ộ t đ u ô i củ a đư òng con g p h â n h ố ch u ẩ n . C ần
lư u ý rằn g, b ả n g p h â n b ố F tron g p h ư ơ n g pháp p h ân tích p h ư đ n g sa i ch ỉ sử
d ụ n g m ộ t đ u ô i, tro n g lú c đó ỏ b ả n g F đ ể k iểm tra sự b ằn g n h a u củ a phương
s a i n h ằ m so sá n h vổi t h oặc z đã n êu ỏ p h ần trưôc đ ây th ì giá trị đó sử
d ụ n g cho cả h a i đuôi củ a đư ờng co n g p h â n bô' chu ẩn.

244
4. Trong phường pháp phân tích phướng sai sử dụng cho thí nghiệm
chi c:ó một yếu tô' thì kích thước mẫu không cần thiết phải bằng nhau.
Trong lúc đó, phương pháp phân tích phương sai khi sử dụng phưđng pháp
kicni tra Tukey thì kích thưổc mẫu bắt buộc phải bằng nhau.
5. Trong phưdng pháp phân tích phương s a i sử dụng cho thí nghiệm có
hai yếii tô* thì phưđng sai tưđng tác giữa các yếu tô’ không có thể xác định
được, nếu mỗi mẫu chỉ có một sô’ liệu quan sát duy nhất. Trong trường hớp
này, phương sai do tương tác sẽ được kết hđp với phưdng sai trong các mẫu
và Iihư vậy, phiíđng sai do tưdng tác đưỢc coi như không đáng kể.
Đến đây, phương pháp phân tích phương sai của thí nghiệm đã được
trìiih bày khá cụ thể. Như vậy, sự sai khác giữa các yếu tô thí nghiệm hay
các niẫu đã có đầy đủ các phướng pháp kiếm tra thích hỢp tuỳ thuộc vào
tính châ’t, diều kiện, mô hình và sô’ yếu tô thí nghiệm. Vì vậy, sự sai khác
giĩía các yếu tô’ thí nghiệm hay tâ’t cả các mẫu đã được xác định rõ ý nghĩa
và mức dộ sai khác của nó.

245
BẢNG 1. PHÂN BỐ t

Phần trâm 90.0% 95.0% 97,5% 99,0% 99,5% 99.05%


Mức độ ý nghĩa kht dùng một đuôi để kiểm tra
DF 0,10 0,05 0,025 0,01 0,006 0.0005
Mức độ ý nghĩa khi dùng hai đuối để kiểm tra
0,20 0,10 0,05 0,02 0,01 0,001
1 3,078 6.314 12.706 31,821 63.657 636,62
2 1,886 2,920 4,303 6.925 9,925 31.598
3 1,638 2,353 3.182 4,514 5,841 12,941
4 1.533 2,123 2.776 3.747 4.604 8,610
5 1.476 2,015 2.571 3,365 4.032 6.859
6 1,440 1,943 2,447 3,143 3,707 5,959
7 1,415 1,895 2,365 2,998 3.499 5,405
8 1,397 1,860 2.306 2,896 3.355 5.041
9 1,383 1,833 2,262 2,821 3,250 4.781
10 1,372 1.812 2,228 2,764 3.169 4.587
11 1,363 1,796 2,201 2,718 3,106 4.437
12 1,356 1,782 2.179 2,681 3,055 4,318
13 1,350 1,771 2,160 2.650 3.012 4.221
14 1,345 1,761 2,145 2.624 2.977 4.140
15 1,341 1.753 2,131 2,602 2,947 4.073
16 1,337 1,746 2,120 2,583 2.921 4,015
17 1.333 1,740 2,110 2.567 2.898 3.965
18 1,330 1,734 2,101 2.552 2.878 3.922
18 1,328 1729 2.093 2,539 2.861 3.883
20 1,325 U 25 2,086 2,528 2.845 3,850
21 1.323 1.721 2,080 2,518 2.831 3.819
22 1,321 1,717 2.074 2.500 2,819 3.792
23 1,319 1J14 2069 2.500 2,807 3.767
24 1,318 1,711 2,064 2.467 2.797 3,745
25 1,316 1 708 2.060 2.467 2,787 3.725
26 1,315 1,706 2,056 2.479 2 779 3.707
27 1,314 1,703 2,052 2.473 2.771 3,690
28 1,313 1 701 2048 2.467 2.763 3.674
29 1.311 1,699 2,045 2.462 2,756 3.659
30 1,310 1,697 2,042 2,457 2750 3.646
40 1,303 1,684 2 021 2,423 2,704 3,551
60 1,296 1,671 2.000 2.390 2,660 3.460
120 1,289 1,658 1,980 2,358 2.617 3373
oo 1,282 1,645 1,960 2.326 2779 3,291

246
BẢNG 2. PHẢN BỐ F (P s 0,05)

Dùng để kiểm tra mức độ bằng nhau của phưong sai trước khi thực hiện
phương pháp kiểm tra I hoâc 2. sử dung hai đuôi)

247
BẢNG 2. PHÂN BỐ F (P « 0,05) (tiếp theo)

Trong đó:
< 0F của mẫu cố phường sai iớn hơn biểu thị theo cột;
- DF của mẫu có phương sai nhỏ hơn biểu thị theo hàng.

248
BẢNG 3. F<.ự(. „Ạ ị (p = 0,05)

(Dùngđểkiểmtra múcđộđổngnhất củaphươngsai trưỏckhi thưchiẻnphéntíchphươngsai)

''V. a
Dị 2 3 4 5 6 7 8 9 10 11 12

2 39,0 87.5 142 202 266 333 403 475 550 626 704

3 15.4 27.8 39,2 50,7 62,0 72.9 83,5 93,9 104 114 124

4 9.6 15,5 20,6 25,2 29,5 33.6 37.5 41.1 44.6 48,0 51,4

5 7.15 10.8 13.7 16.3 18.7 20.8 22,9 24.7 26,5 28.2 29.9

6 5.82 8,38 10,4 12.1 13.7 15.0 16.3 17.5 28,6 19.7 20,7

7 4.99 6.94 8.44 9,70 10,8 11.8 12.7 13.5 14.3 15.1 25.8

8 4,43 6.00 7.18 8.12 9.03 9.78 10.5 11.1 11.7 12.2 12.7

9 4.03 5.34 6,31 7.11 7.80 8.41 8.95 9.45 9,91 10,3 10.7

10 3.72 4.85 5,67 6.34 6.92 7.42 7.87 8.28 8.66 9,01 9.34

12 3.28 4.26 4.79 5,30 5.72 6.09 6.42 6,72 7.00 7.25 7,48

15 2.86 3.54 4,01 4.37 4,68 4,95 5.19 5.40 5.59 5.77 5,93

20 2,46 2.95 3.29 3,54 3,76 3.94 4.10 4.24 4.37 4.49 4,59

30 2,07 2.40 2,61 2.78 2.91 3,02 3,12 3.21 3.29 3,36 3,39

60 1.67 1.86 1.96 2.04 2.11 2.17 2.22 3.26 2.30 2,33 2,36

Trong đó;
- a là số mẫu đưa vào so sảnh;
- DF là độ tự do của mỗi mẫu (nếu sổ quan sát ở các mẫu không bằng nhau thì ỉấy DF của
mẫu có sổ quan sảt nhỏ hơn).

249
BẢNG 4a. PHÂN B ố F (P » 0,05)

(Dùngđểkiểmtra ýnghĩatrongphảntíchphươngsai)

1 8
1 161,5 199,5 215,7 224.6 230.2 234.0 236,8 238.9 240.5
2 18,51 19.00 19,16 19,25 19.30 19,33 9.35 19.37 19.38
3 10,13 9.55 9,28 9.12 9.01 8.94 8,89 8.85 8,81
4 7.71 6,94 6,59 6,39 6,26 6.16 6.09 6.04 6.00
5 6.61 5,79 5,41 5.19 5,05 4.95 4.88 4.82 4.77
6 5,99 5.14 4,76 4.53 4.39 4.28 4.21 4,15 4.10
7 5.59 4.74 4,35 4.12 3.97 3,87 3.79 3.73 3.68
8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39
9 5,12 4,26 3,86 3,63 3.48 3.37 3,29 3.23 3,18
10 4.96 4,10 3,71 3,48 3,33 3,22 3.14 3.07 3.02
11 4.84 3,98 3.59 3.36 3.20 3.09 3.01 2.95 2,90
12 4.75 3.89 3,49 3,26 3.11 3.00 2.91 2.85 2,80
13 4,67 3,81 3,41 3,18 3.03 ' 2.92 2.83 2.77 2.71
14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65
15 4.54 3,68 3.29 3.06 2.90 2,79 2.71 2.64 2.59
16 4.49 3.63 3.24 3.01 2,85 2.74 2,66 2,59 2.54
17 4,45 3,59 3.20 2.96 2,81 2,70 2.61 2.55 2.49
18 4.41 3.55 3,16 2,93 2.77 2.66 2.58 2.51 2.46
19 4,38 3.52 3.13 2,90 2.74 2.63 2.54 2.48 2.42
20 4,35 3,49 3.10 2,87 2.71 2.60 2.51 2.45 2.39
21 4.32 3.47 3.07 2.84 2,68 2.57 2.49 2.42 2.37
22 4.30 3,44 3.05 2,82 2,66 2,55 2.46 2.40 2,34
23 4,28 3,42 3,03 2.80 2.64 2,53 2.44 2.37 2.32
24 4.26 3,40 3,01 2,78 2.62 2.51 2,42 2.36 2,30
25 4,24 3.39 2,99 2,76 2,60 2.49 2.40 2.34 2,28
26 4,23 3,37 2,98 2.74 2,59 2.47 2.39 2.32 2.27
27 4.21 3.35 2,96 2.73 2.57 2.46 2,37 2.31 2,25
28 4,20 3.34 2.95 2.71 2,56 2,45 2.36 2.29 2.24
29 4.18 3,33 2,93 2,70 2.55 2,43 2.35 2.28 2,22
30 4.17 3,32 2.92 2,69 2,53 2,42 2,33 2.27 2.21
40 4.08 3.23 2.84 2,61 2,45 2.34 2,25 2.18 2.12
60 4,00 3.15 2.76 2.53 2,37 2,25 2.17 2.10 2.04
120 3,92 3,07 2.68 2,45 2,29 2,18 2.09 2.02 1.96
00 3.84 3.00 2,60 2.37 2.21 2.10 2.01 1,94 1,88

250
BẢNG 4a. PHÂN B ố F (P = 0,05) (tiếp theo)

Trong đó;
- DF của tử số trong phép kiểm tra F biểu thị theo còt.
- DF của mầu sò trong phép kiểm tra F biểu thị theo hàng

251
BẢNG 4b. PHÂN BỐ F (P = 0,01)

(Dùngđểkiểmtra ỷnghĩatrongphântíchphươngsai)

1 6 8
1 4052 5000 5403 5625 5764 5859 5929 5981 6023
2 98,50 99.00 99,17 99,25 99,30 99.33 99.36 99,37 99.39
3 34,11 30,82 29,46 28,71 28.24 27.91 27.67 27,49 27.34
4 21.20 18.00 16,69 15,98 15,52 15,21 14,98 14,80 14,66
5 16,26 13,27 12,06 11,39 10,97 10.67 10.46 10.29 10,16
6 13,74 10,92 9.78 9,15 8.75 8.47 8.26 8,10 7.98
7 12.25 9.55 8.45 7.85 7,46 7.19 6,99 6.84 672
8 11.26 8.65 7.59 7.01 6.63 6,37 6.18 6,03 5,91
9 10.56 8,02 6,99 6.42 6.06 5.80 5.61 5.47 5.35
10 10,04 7.56 6.55 5.99 5.64 5.39 5,20 5.06 4.94
11 9,65 7,21 6.22 5.67 5.32 5,07 4,89 4.74 4,63
12 9.33 6.93 5,95 5,41 5,06 4,82 4.64 4.50 4.39
13 9.07 6,70 5,74 5.21 4,86 4.62 4,44 4.30 4,19
14 8.86 6,51 5.56 5.04 4.69 4.46 4,28 4,14 4,03
15 8,68 6,36 5.42 4.89 4.56 4.32 4,14 4.00 3.89
16 8,53 6,23 5,29 4.77 4,44 4.20 4,03 3.89 3,78
17 8,40 6.11 5,18 4.67 4.34 4,10 3,93 3.79 3,68
18 8.29 6,01 5,09 4,58 4.25 4,01 3,84 3,71 3,60
19 8,18 5.93 5,01 4.50 4.17 3,94 3.77 3.63 3,52
20 8,10 5.85 4.94 4.43 4,10 3,87 3,70 3.56 3.46
21 8,02 5.78 4.87 4.37 4,04 3.81 3.64 3.51 3.40
22 7,95 572 4.82 4.31 3,99 3.76 3.59 3.45 3.35
23 7,88 5.66 4,76 4,26 3,94 3.71 3,54 3.41 3.30
24 7.82 5.61 4.72 4.22 3,90 3.67 3.50 3.36 3.26
25 7.77 5.57 4.68 4,18 3,85 3.63 3.46 3,32 3,22
26 7,72 5.53 4,64 4,14 3,82 3.59 3.42 3.29 3,18
27 7,68 5.49 4.60 4.11 3J8 3,56 3,39 3,26 3,15
28 7,64 5,45 4.57 4,07 3.75 3,53 3.36 3.23 3.12
29 7,60 5,42 4,54 4.04 3,73 3,50 3.33 3,20 3.09
30 7.56 5,39 4.51 4.02 3.70 3.47 3,30 3.17 3,07
40 7.31 5,18 4.31 3,83 3,51 3,29 3,12 2.99 2.89
60 7.08 4,98 4,13 3.65 3.34 3,12 2.95 2.82 2,72
120 6,85 4.79 3.95 3.48 3.17 2,96 2,79 2,66 2,56
00 6,63 4.61 3.78 3.32 3,02 2,80 2.64 2.51 2.41

252
BẢNG 4b. PHÂN B ố F (P = 0,01) (tiếp theo)

Trong đó
- DF của từ số trong phép kiểm tra F biểu thị theo cột;
- DF của mẫu số tronạ phép kiểm tra F biểu thị theo hàng

253
BẢNG 4c. PHÂN BỐ F (P = 0,001)

(Dùngđểkiểmtraýnghĩatrongphântíchphươngsai)

1 2 3 4 5 6 7 8 9 10 12 24
1 4053 5000 5404 5625 5764 5859 5929 5981 6013 6056 6107 6235 6366
2 998,5 999,0 999,3 999,5 999,6 999,7 999,7 999,8 999,8 999,3 999,4 999.5 999,5
3 167,0 148,5 141,0 137.0 134.5 132,8 131,5 130,6 129,8 141,0 128,3 125,9 123.5
4 74,13 61,25 56,16 53,43 51,71 50,52 49.65 48,99 48,47 56.16 47,41 45.77 44,05
5 47,18 37,12 33,20 31,08 29,75 28,83 28,16 27,65 27,24 33,20 26,42 25,11 23,79
6 35,51 27.00 23,70 21,92 20,80 20,03 19.46 19,03 18.69 23,70 17,99 16,90 15,75
7 29,25 21,69 18,77 17.20 16,21 15,52 15,02 14,63 14,33 18,77 13,71 12,73 11,70
8 25,41 18,49 15,83 14.39 13,48 12,86 12,40 12,05 11,77 15.83 11,19 10.30 9,34
9 22.86 16,39 13.90 12,56 11,71 11,13 10.70 10,37 10,11 13.90 9,57 8.72 7.81
10 21,04 14,91 12,55 11,28 10,48 9,93 9,52 9,20 8,96 12.55 8.44 7,64 6,76
11 19,69 13,81 11,56 10,35 9,58 9,05 8.66 8,35 8.12 11,56 763 6,85 6.00
12 18,64 12,97 10,80 9,63 8,89 8,38 8.00 7.71 7,48 10.80 7.00 6.25 5,42
13 17.82 12,31 10.21 9.07 8.35 7,86 7.49 7.21 6.98 10.21 6,52 5.78 4.97
14 17,14 11,78 9,73 8,62 7,92 7.44 7.08 6,80 6,58 9,73 6.13 5,41 4.60
15 16,59 11,34 9,34 8.25 7.57 7.09 6,74 6,47 6.26 9,34 5,81 5,10 4.31
16 16,12 10,97 9,01 7,94 7.27 6,80 6,46 6,19 5,98 9,01 5,55 4.85 4,06
17 15,72 10,66 8,73 7,68 7.02 6.66 6,22 5,96 5,75 8,73 5.32 4,63 3,85
18 15.38 10,39 8,49 7,46 6.81 6,35 6,02 5,76 5,56 8,49 5,13 4.45 3.67
19 15,08 10,16 8.28 7,27 662 6,18 5,85 5,59 5,39 8.28 497 4.29 3.51
20 14.82 9,95 8.10 7,10 6,46 6.02 5,69 5,44 5.24 8.10 4,82 4.15 3,38
21 14,59 977 7,94 6,95 632 5.88 556 531 5.11 7.94 4.70 4.03 3,26
22 14,38 9.61 7,80 6,81 6,19 5,76 5,44 5,19 4,99 7,80 458 3.92 3,15
23 14,20 9.47 7.67 6,70 6,08 5,65 5,33 5.09 4,89 7.67 4.48 3.82 3.05
24 14,03 9.34 7.55 6,59 5,98 5.55 5,23 4.99 4,80 7,55 4.39 3.74 2.97
25 13,88 9,22 7.45 6.49 5.89 5,46 5,15 4.91 4.71 7,45 4.31 3,66 2,89
26 1374 9,12 7.36 641 580 5,38 507 4,83 4.64 7,36 4,24 3,59 2.82
27 13,61 9,02 7.27 6,33 5.73 5,31 5,00 4,76 4.57 7.27 4.17 3.52 2.75
28 13,50 8,93 7.19 6,25 5,66 5,24 493 4,69 4.50 7.19 4.11 3.46 2,69
29 13,39 8,86 7.12 6,19 5,69 5,18 4.87 4,64 4,45 7.12 4,05 3.41 2,64
30 13,29 8.77 7,05 6,12 653 5,12 4,82 4,58 4,39 7.05 4,00 3,36 2,59
40 12,61 8,25 6.69 5,70 5,13 4,73 4,44 4.21 4,02 6,59 3,64 3,01 2,23
60 11,97 7.77 6.17 5,31 4.76 4,37 409 3,86 3,69 6 17 3,32 2,69 1,89
120 11,38 7,32 5.78 4.95 4,41 4,04 3.77 3,55 3,38 5,78 3,02 2,40 1,54
OD 10,83 6,91 5.42 4,62 4.10 3,74 3.47 3,27 3,10 5,42 2,74 2 13 1,00
Trong đó:
- Đô tự do của phuong sai lãn hdn biểu thị theo cột:
- Độ tự do của phưcmg sai nhỏ hđn biểu thị theo hàng

254
BẢNG 5. PHẢN BỐ r

DF Mức đô tin cậy


0,10 0,05 0,01 0,001
1 2.71 3.84 6 63 10,83
2 4.61 5,99 9 21 13.81
3 6,25 7.81 11 34 16.27
4 7.78 9,49 13 28 18.47
5 9,24 11.07 15 09 20,52
6 10.64 12.59 16.81 22,46
7 12,02 14,07 18 48 24.32
8 13.36 15,51 20,09 26,12
9 14.68 16.92 21,67 27.88
10 15,99 18,31 23.21 29,59
11 17,28 19,68 2472 31,26
12 18.55 21.03 26.22 32.91
13 19,81 22.36 27,69 34.53
14 21,06 23,68 29,14 36.12
15 22.31 25.00 30,58 37,70
16 23,54 26,30 32.00 39,25
17 24,77 27,59 33.41 40.79
18 25,99 28,87 34.81 42.31
19 27.20 30,14 36.19 43.82
20 28.41 31,41 37,57 45,31
21 29.62 32.67 38.93 46^80
22 30.81 33.92 40.29 48.27
23 32,01 35.17 41.64 49,73
24 33.20 36.42 42.98 51,18
25 34.38 37.65 44.31 52.62
26 35,56 38.89 45 64 54.05
27 36,74 40.11 46.96 55,48
28 37.92 41.34 48.28 56,89
30 40,26 43,77 50,89 59,70
40 51,81 5576 63,69 73.40
50 63.17 67.50 76,15 86.66
60 74,40 79.08 88.38 99,61
70 85,53 90,53 100,4 112,3
80 96,58 101.9 112.3 124,8
90 107.6 113,1 124.1 137,2
100 118,5 124,3 135.8 149,4

255
BẢNG 6a. KIỂM TRA SNK LSSR (P = 0,05)

0F 6 7 8 9 10
5 3,64 4,60 5,22 5,67 6,03 6,33 6.58 6,80 6,99

6 3,46 4,34 4,90 5,31 5.63 5,89 6,12 6.32 6,49

7 3,34 4,16 4,68 5,06 5,36 5.61 5,82 6,00 6,16

8 3,26 4,04 4,53 4,89 5,17 5,40 5,60 5.77 5,92

9 3,20 3,95 4,42 4,76 5,02 5.24 5,43 5,60 5.74

10 3,15 3,88 4,33 4.65 4,91 5,12 5,30 5,46 5,60

11 3,11 3,82 4,26 4,57 4,82 5,03 5,20 5,35 5,49

12 3.08 3,77 4.20 4.51 4,75 4,95 5.12 5,27 5.40

13 3,06 3,73 4,15 4,45 4,69 4,88 5,05 5,19 5.32

14 3,03 3,70 4,11 4,41 4,64 4.83 4,99 5,13 5,25

15 3,01 3,67 4,08 4,37 4,60 4,78 4,94 5,08 5.20

16 3,00 3,65 4,05 4,33 4,56 4,74 4,90 5,03 5,15

17 2,98 3,63 4,02 4,30 4,52 4,71 4,86 4,99 5.11

18 2,97 3.61 4.00 4,28 4.49 4,67 4,82 4,96 5,07

19 2.96 3,59 3.98 4.25 4.47 4.65 4,79 4,92 5.04

20 2,95 3,58 3,96 4.23 4,45 4,62 4.77 4.90 5.01

24 2,92 3,53 3,90 4,17 4,37 4,54 4,68 4,81 4,92

30 2,69 3,49 3,84 4,10 4,30 4.46 4,60 4,72 4,83

40 2,86 3,44 3.79 4,04 4,23 4,39 4,52 4,63 4,74

60 2,83 3,40 3.74 3.98 4,16 4,31 4,44 4.55 4.65

120 2,80 3,36 3,69 3,92 4,10 4,24 4,36 4,48 4,56

00 2,77 3,31 3.63 3,86 4,03 4,17 4,29 4,39 4,47

Trong đ6:
- a là số trung bbth mẫu đưa vào so sánh;
• DFlà độtưdocủa sai sô'.

256
BẢNG 6b. KIẾM TRA SNK LSSR (P = 0,01)

a %
3 4 S 6 7 8 9 10
5 5.70 6.97 7,80 8.42 8 91 9.32 9,67 9,97 10.2

6 5.24 6,33 7,03 7.56 7,97 8,32 8,61 8,87 9,10

7 4,95 5,92 6,54 7,01 7.37 7.68 7.94 8,17 8.37

8 4.74 5,63 6.20 6.63 6.96 7.24 7,47 7,68 7,87

9 4,60 5,43 5.96 6,35 6.66 6,91 7,13 7,32 7,49

10 4,43 5.27 5.77 6.14 6.43 6,67 6.87 7,05 7,21

11 5,14 5.62 5,97 6,25 6,48 6,67 6,84 6.99

12 4,32 5.04 5.50 5.84 6.10 6,32 6,51 6,67 6,81

13 4,26 4,96 5,40 5.73 5,98 6,19 6,37 6.53 6,67

14 4,21 4,89 5,32 5,63 5,88 6,08 6,26 6,41 6,54

15 4,17 4,83 5,25 5,56 5,80 5,99 6.16 6,31 6.44

16 4,13 4,78 5,19 5,49 5,72 5,92 6,08 6,22 6,35

17 4,10 4,74 5,14 5,43 5,66 5,85 6,01 6.15 6,27

18 4.07 4,70 5,09 5,38 5.60 5,79 5,94 6.08 6,20

19 4,05 4,67 5.05 5.33 5.55 5,73 5,89 6,02 6,14

20 4,02 4,64 5,02 5,29 5.51 5,69 5.84 5,97 6,09

24 3,96 4,54 4,91 5,17 5,37 5.54 5,69 5,81 5.92

30 3,89 4,45 4,80 5,05 5,24 5,40 5,54 5.65 5,76

40 3,823. 4,37 4,70 4.93 5,11 5,27 5,39 5.50 5,60


76
60 4.28 4,60 4,82 4.99 5,13 5,25 5,36 5,45
3.70
120 4,20 4,50 4,71 4,87 5,01 5,12 5,21 5,30
3,64
00 4,12 4,40 4,60 4,76 4,88 4.99 5,08 5.16

Trong đó
- a là số tmng binh m lu đua vào so sánh;
- DF là đô tư do của sai sô‘.

257
BẢNG 7a. KIẾM TRA DUNCAN LSSR (P - 0,05)

a ----------------»-------------------------
Uf 6 7 8 9 10

5 3,64 3,74 3,79 3.83 3,83 3,83 3,83 3,83 3,83

6 3,46 3.58 3,64 3.68 3.68 3.68 3,68 3,68 3,68

7 3,35 3.47 3,54 3,58 3.60 3.61 3,61 3,61 3,61

8 3.26 3,39 3.47 3,52 3,55 3,56 3,56 3,56 3.56

9 3,20 3,34 3,41 3,47 3,50 3.52 3.52 3,52 3.52

10 3.15 3.30 3,37 3,43 3,46 3,47 3,47 3.47 3.47

11 3,11 3,27 3,35 3,39 3.43 3,44 3.45 3.46 3,46

12 3,08 3,27 3,33 3,36 3,40 3,42 3.44 3,44 3,46

13 3,06 3,21 3.30 3,35 3,38 3.41 3,42 3,44 3,45

14 3,03 3.18 3,27 3,33 3,37 3.39 3.41 3,42 3.44

15 3.01 3.16 3,25 3.31 3.36 3.38 3.40 3,42 3,43

16 3.00 3,15 3,23 3,30 3,34 3.37 3,39 3.41 3,43

17 2,98 3.13 3,22 3,28 3,33 3,36 3.38 3.40 3.42

18 2.97 3,12 3,21 3,27 3,32 3,35 3,37 3,39 3.41

19 2,96 3,11 3.19 3.26 3,31 3,35 3,37 3.39 3.41

20 2,95 3.10 3.18 3,25 3,30 3.34 3.36 3,38 3.40

24 2,92 3.07 3,15 3.22 3.28 3,31 3,34 3.37 3.38

30 2,89 3,04 3,12 3,20 3,25 3,29 3,32 3,35 3,37

40 2.86 3,01 3,10 3,17 3.22 3.27 3,30 3.33 3.35

60 2.83 2,98 3,08 3.14 3,20 3,24 3.28 3.31 3.33

120 2.80 2,95 3 05 3,12 3 18 3.22 3,26 3.29 3.32

05 2,77 2,92 3,02 3,09 3,15 3,19 3,23 3,26 3,29

Trong đó:
- a là số trung binh mẩu đưa vào so sánh;
- 0F là đô tư do của sai sô.

258
BẢNG 7b. KIỂM TRA DUNCAN LSSR (p - 0,01)

10
5 5,70 5.96 6,11 6,18 6,26 6,33 6,40 6,44 6,50

6 5.24 5.51 5,65 5.73 5.81 5,88 5,95 6,00 6.00

7 4,95 5,22 5,37 5,45 5,53 5,61 5,69 5,73 5,80

8 4,74 5,00 5,14 5,23 5,32 5,40 5,47 5,51 5,50

9 4,60 4.86 4.99 5.08 5,17 5,25 5,32 5,36 5,40

10 4,48 4.73 4,88 4,96 5.06 5,13 5.20 5,24 5.28

11 4,39 4,63 4,77 4,86 4,94 5,01 5,06 5,12 5,15

12 4,32 4,55 4,68 4,76 4,84 4,92 4,96 5,02 5,07

13 4,26 4,48 4,62 4,69 4,74 4,84 4,88 4.94 4,98

14 4,21 4,42 4,55 4,63 4,70 4,78 4,83 4,87 4,91

15 4,17 4,37 4.50 4.58 4,64 4,72 4.77 4,81 4,84

16 4,13 4,34 4.45 4,53 4,60 4,67 4,72 4.76 4.79

17 4,10 4,30 4.41 4,50 4,56 4,63 4,68 4,72 4,75

18 4,07 4,27 4,38 4,46 4,53 4,59 4,64 4,69 4,71

19 4,05 4,24 4.35 4,43 4,50 4,56 4.61 4,64 4,67

20 4,02 4,22 4,33 4,40 4,47 4,53 4.58 4,61 4,65

24 3,96 4.14 4,24 4,33 4,39 4,44 4,49 4,53 4,57

30 3,89 4,06 4.16 4,22 4,32 4.36 4,41 4.45 4.48


40 3,82 3.99 4.10 4,17 4,24 4.30 4,34 4.37 4.41

60 3,76 3,92 4,03 4,12 4,17 4,23 4,27 4,31 4,34

120 3,71 3,86 3.98 4,06 4,11 4,17 4,21 4.25 4,19

00 3,64 3.80 3.90 3,98 4,04 4.09 4.14 4.17 4,20

Trong đó:
- a là sổ trung bình mẫu đưã vào so sánh;
> DF là đô tư do của sai số.

259
BẢNG 8. KIỂM TRA TUKEY (P a 0,05)

Trong đó;
• a là số trung bình mẵu đua vào so sánh;
• ĐF là đố tự do của mẫu số cửa phép kiểmtra F

260
BẢNG 8. KIỂM TRA TUKEY (P = 0,05) (tiếp theo)

261
TÀI LIỆU THAM KHẢO

1. Cochram, W.G. and R. Cox, (1957) Exphimental designs. 2nd edition


New York. John. Wiley and Sons.
2. Pisher, R A . (1925) Statistỉcal Analysis. Longman.
3. Pisher, R A . (1958) Statỉstical Tables. Longman.
4. Pisher, R A . (1974) The designs of exphiments. London Collier
Macmilỉan
5. Pisher, R A . and Yates, F. (1974) Statistỉcal Tables. Seventh Edition.
Longman.
6. Jim Flower and Lou Cohen (1990) Practical Statistics for Field
Biology. Milton Keynes, Philadelphia.
7. Lindỉey, D .v. and M iller, J.c.p. (1953) Cambridge Eỉementary
Statistừs Tabhs. Cambridge University Press.
8. Snedecor, G.w. and Cochran, W.G. (1980) Statỉstỉcal Methods.
Seventh Edition. Iowa State University Press.
9. W illiam Mendenhall, Richard L. Scheaỉĩer and Dennes D.
W ackerly (1990) Mathematical Statiatics ĩvith Applications. Third
Edition. University of Plorida, Duxbury Press Boston.
10. Yate, (1936) Incomplete randomized bỉocks.
11. Yate, (1937) The design and analysis of factorial exphiments
Commonwealth Bureau of Social Science.

262
MỤC LỤC

Trang
Lời nói đầu 3

Chương I
CHUYÊN DẠNG s ố LIỆU TRƯỚC KHI PHÂN TÍCH

A. TẠI SAO PH Ả I C H U Y Ể N D Ạ N G 4

B. CÁC PHƯƠNG PHÁP CHUYỂN DẠNG s ố LIỆU 10


I. Phướng pháp chuyến dạng số liệu thuận 10
1. Dạng cd bản 10
2. Tính chất cơ bản 11
3. K iểm tra g iá trị F trưóc và sa u khi chuyên d ạn g 12

4. T h í dụ m in h họa 13

II. Phương pháp ch u y ển d ạ n g s ố liệu không thuận 15

1. K hái n iệm 15

2. Các k iểu ch u y ển d ạ n g sô* liệ u k h ôn g thuận 15

c. CHUYỂN KẾT QUẢ ĐẢ CHUYỂN d ạ n g t r ở lạ i G ốc 32


I. C h u yến đổi k ết quả trở lại th eo thưốc đo ban đầu 32

II. Cách ch u y ển đổi k ế t quả trở lạ i thưỏc đo ban đầu 33

III. T h í dụ m in h họa 34

IV. K ết lu ậ n 39

Chương I I
KIỂM TRA MỨC ĐỘ TIN CẬY s ố TRUNG BÌNH MẨU

A. KHÁI NIỆM 40
I. Quần thể 40
II. Mẫu thí nghiệm 42

263
1. K h ái n iệm 42

2. C h ọn d u n g lư ợn g m ẫu 42

B. KIỂM TRA MỨC ĐỘ TIN CẬY s ố TRUNG BÌNH MẪư 45


I. T ạ i sa o p h ả i k iểm tra ? 45

II. P h ư ơ n g p h á p k iểm tra 46

1. N h ắ c lạ i m ột s ố p h ép tín h th ố n g kê sin h học cơ b ản củ a m ẫu 46

2. K iểm tra m ức độ tin cậy 48

3. X ác đ ịn h k h o ả n g tin cậy của s ố tru n g bình m ẫu 50

c . SAI SỐ CHUẨN 52
I. N h ắ c lạ i m ột s ố k h á i n iệm th ô n g k ê cơ bản 52

1. S a i sô”c h u ẩ n 52

2. X ác đ ịn h k h o ả n g tin cậy 53

II. Một sô* trưòng hợp đặc biệt cần lưu ý 53


1. Đơri vỊ tín h củ a bộ s ố liệu là p h ầ n trăm 54

2. T rư ò n g hỢp m ột s ố s ố liệu q u a n s á t của m ẫu bị tr ù n g lặp 55

3. Đ ộ lệch củ a các s ố tr u n g b ìn h 57

Chương I I I
SAI KHÁC GIỮA CÁC s ố TRUNG BÌNH MẨU
A. PHƯƠNG PHÁP KIỂM TRA BẰNG giá trị T 59
1. S ự p h â n b ố t 59

2. G iả th u y ế t k h ô n g 62
I. P h ư ơ n g p h áp k iểm tra t gộp 63

1. Đ ặ c đ iểm c h u n g 63

2. N h ữ n g th í dụ m in h họa 64

3. K hi ch ỉ d ù n g m ột đ u ôi củ a p h â n b ố đưòng cong ch u ẩ n 70

4. M ột s ố đ iểm cần lư u ý k h i sử d ụ n g t gộp 71

5. T rư ò n g hỢp k h ô n g d ù n g phư đng pháp k iểm tra t gộp 71

II. P h ư ơ n g p h á p k iểm tra t giả 74

264
1. Khi nào sử dụng phương pháp này 74
2. Thí dụ minh họa 75
III. Phưđng pháp kiềm tra t cặp 77
! Khi nào sử dụng phương pháp này 77
2. Thí dụ minh họa 77
3. Phương pháp kiểm tra t cặp và cách xác định khoảng tin cậy 78
4. Sử dụng phương pháp phân tích phương sai đế kiểm
tra t gộp và t cặp 79

5. Mỏ rộng phương pháp kiểm tra t cặp 82

B. P H Ư Ơ N G P H Á P KIỂM TRA BẲNG so sá n h bộ i số 83

I . Phương pháp kiểm tra sự lệchnhau có ý nghĩa nhỏ nhâ't 84


1. Giới »,hiệu ch u n g 84

2. T h í dụ m in h họa 85

3. So sánh phương pháp kiểm tra t cặp, anova và LSD 89


II. Pbướng pháp kiểm tra SNK 91
J. Khi nào sử dụng phương pháp này? 91
2. Các bưốc tính 92
3. ứng dụng cho các loại thí nghiệm khác nhau 93
4. Kết luận 98
III. P hư ơng p h áp kiểm tra D un can 98

1. Khi nào sử d ụ n g phương pháp này? 98

2 T h í dụ m in h họa 99

2.1. Các bước tính 99


2.2. K ết lu ậ n 101

r v . P h ư ơ n g p h áp kiểm tra của Bonferroni 101

1. Khi nào sử dụng phương pháp này? 101


2. P h ư d n g p h á p tín h 102
V . So s á n h các phư ơng pháp kiểm tra bằng bội s ố khác n h a u 103

Thí dụ minh họa 104

265
1. P h ư đ n g pháp kiểm tra LSD 105

2. P h ư đ n g pháp k iểm tra S N K 106

3. P h ư ơ n g pháp k iểm tra D u can 107

4. P h ư đ n g pháp kiểm tra B onferroni 108

c. PHƯƠNG PHÁP KIỂM TRA BẰNG s o s á n h tư ơ n g p h ả n 109


I. K hi n ào n ên d ù n g phưđng pháp k iểm tra
b ằ n g so sá n h tư ớng p h ản ? 109

II. T h í dụ m in h họa 109

1. P h ư ớ n g pháp tín h 110

2. P h â n ch ia k ế t quả ra ba kh ả n ă n g đ ể so sá n h 110

D. P H Ư Ơ N G P H Á P K IỂM TRA B Ằ N G so sá n h tư ơ n g
P H Ả N TR Ự C GIAO 117

I. K hái n iệm 117

II. N ội d u n g cơ bản 118

III. Bộ k h ô n g trực giao củ a các tưđng p h ả n 122

IV. T h í dụ m in h h ọa 123

V. K hi n ào n ên d ù n g phương ph áp k iểm tra tư ơng p h ản trự c giao 126

Chương IV
KIỂM TRA Sự PHÙ HỢP GIỬA THựC TẾ VÀ LÝ THUYẾT
A. P H Ư Ơ N G P H Á P KIỂM TR A f 129

I. Đ ặc đ iểm , m ục đích và nội d u n g 129

1. T ầ n s u ấ t lý th u y ế t 130

2. T ầ n s u ấ t thự c tiễ n 130

3. Tính giá trị 131


4. T ra cứu xác đ ịn h giá trị tạ i b ả n g 131

5. So sánh giá trị tính được của thí nghiệm với


tra cứu củ a b ả n g 131

II. S ử d ụ n g phư dng pháp k iểm tra kh i nào? 132

1. K hảo s á t m ột th í n g h iệm dựa th eo q u y lu ậ t sin h h ọc 132

266
2. K hão sá t một th í nghiệm dựa theo đ ịn h lu ậ t di tru yền học 132
3. Kiôm tra một thí nghiệm dựa theo khả náng
hoặc bản chất sinh học 133
III. Các phương pháp kiểm tra X' 133
1. Thí nghiệm chỉ có một yếu tô 133
2. Thí nghiệm có hai yếu tô’ 141

B. PHƯƠNG PHÁP KIỂM TRA G 147


I. Đặc điểm chung 147
II Các phương pháp kiêm tra G 147
]. Áp dụng cho tần suất thí nghiệm có một nhân tô' 148
2. Áp dụng cho tần suất thí nghiệm dạng 2 x 2 149
3. Áp dụng cho tần suất thí nghiệm dạng hàng X cột 151

c. MỘT SỐ ĐẶC ĐIỂM CỦA PHƯƠNG PHÁP KIỂM t r a 152

Chương V
PHƯƠNG PHÁP PHÂN TÍCH PHƯƠNG SAI

A. ĐẶC ĐIỂM CHƯNG 155


I. Khái niệm về phân tích phương sai 155
II. G iả th u y ế t đê sử d ụ n g a n o v a 156

l ĩ l . V ai trò và chức n ă n g của a n o v a 157

IV. Ẩ n h h ư ỏ n g của sự thừa n hận a n o v a 158

V. Các thành phần phương sai 159


1. Giả định 159
2. Phương phấp xác định các phương sai thành phần 160

B. CÁC PHƯƠNG PHÁP PHÂN TÍCH PHƯƠNG SAI 162


I. an o v a đôi vói sô"yếu tô"thí nghiệm khác nhau 162
1. Với m ột yếu tô th í nghiệm 163

2. Vói h a i yếu tô th í n ghiệm 182


3. Vối ba y ếu tô' th í n gh iệm 210

267
II. A n o v a vổi tín h ch ấ t và đ iều k iện của các yếu tố 214
1. T h í n g h iệm chỉ có m ột yếu t ố c ố đ ịn h 215

2. T h í n g h iệm chỉ có m ột yếu tô' n gẫu n h iên 218

3. T h í n g h iệm có h ai yếu tố đều c ố đ ịn h 223

4. Thí nghiệm có hai yếu tô": một yêu tố ngẫu nhiên và một yếu 224
tô”cố định 225
5. T h í n g h iệm có h ai yếu t ố đều là n gẫu n h iê n 225

III. A n o v a đối vối yếu t ố th í n g h iệm lồn g vào n h a u 227

1. Giới th iệu ch u n g 227

2. Các mức độ lồng khác nhau 228


3. ứ n g d ụ n g của các phương sa i th à n h phần 239

IV. A n o v a đốỉ với yếu tô' th í n g h iệm sắ p xếp th eo h ệ phả 240

1. Đặc điểm chung 240


2. Phư đng pháp tín h các th ô n g s ố th ô n g kê cơ b ản và anova 242

c. NHỮNG QUY ĐỊNH KHI s ử DỰNG ANOVA 244


B ả n g tra cứu 246

T à i liệu th am k h ảo 262
M ục lục 263

268

You might also like