You are on page 1of 4

1 Kiểm tra tính độc lập: So sánh P(B | A) và P(B)

Mục tiêu bài học: Xác định hai biến cố có độc lập hay không.
Như ta thấy trong phần Phân tích Dữ liệu Thăm dò, khi nào tình huống có nhiều hơn một
biến, thông thường là quan tâm tới việc xác định các biến có liên quan hay không. Trong xác
suất, ta nhắc tới các biến cố độc lập, và trong học phần đầu tiên ta đã nói rằng hai biến cố A và B
là độc lập nếu biến cố A xảy ra mà không ảnh hưởng tới xác suất xảy ra của biến cố B. Giờ đây
sau khi được học về xác suất có điều kiện, ta có thể công thức hóa định nghĩa về tính độc lập của
các biến cố và phát triển bốn cách đơn giản để xác thực hai biến cố có độc lập với nhau hay
không. Ta sẽ gọi đây là những "phép thử tính độc lập" sử dụng ví dụ, và sau đó tổng kết lại.
Ví dụ
Ta cùng xem lại bảng dữ liệu hai chiều dành cho 500 học sinh ở một trường trung học,
được phân loại theo giới tính và việc họ có đeo khuyên ở một hay hai bên tai không.

Giới Xỏ
Không xỏ khuyên Tổng
tính khuyên

Nam 36 144 180

Nữ 288 32 320

Tổng 324 176 500

Ta có kỳ vọng hai biến này liên quan tới nhau hay không? Có nghĩa là, ta có kỳ vọng việc
đeo khuyên tai phụ thuộc vào việc học sinh đó là nam hay nữ? Hoặc, để nói một cách khác, việc
biết được giới tính của học sinh có ảnh hưởng tới xác suất việc học sinh đeo khuyên tai hay
không? Để trả lời được câu hỏi này, ta có thể so sánh xác suất tổng của biến cố đeo khuyên tai
với xác suất có điều kiện của việc đeo khuyên tai mà học sinh đó là nam giới. Theo trực giác cho
ta thấy trường hợp sau sẽ có xác suất thấp hơn: học sinh nam có xu hướng không đeo khuyên tai,
trong khi học sinh nữ có đeo. Thật vậy, đối với học sinh nói chung, xác suất có xỏ lỗ tai (biến cố
E) là P (E) = 324/500 = 0,648. Nhưng xác suất có xỏ lỗ tai với học sinh là nam chỉ là P (E | M) =
36/180 = 0,20.
Như dự đoán, P (E | M) thấp hơn P (E). Xác suất của một học sinh có tai xỏ thay đổi
(trong trường hợp này, thấp hơn) khi chúng ta biết rằng học sinh là nam giới, và do đó các biến
cố E và M là biến phụ thuộc. (Nếu E và M là độc lập, biết hoặc không biết rằng học sinh là nam
giới sẽ không tạo ra sự khác biệt ... nhưng chúng lại là biến phụ thuộc.)
Ví dụ này đã minh họa một cách để xác định liệu hai biến cố có độc lập hay không bằng
cách so sánh P(B | A)vàP(B).
Nếu hai biến cố tương đương (ví dụ biết hoặc không biết được việc biến cố A xuất hiện
có ảnh hưởng tới xác suất việc xảy ra biến cố B hay không) thì hai biến cố đó là  độc lập. Nếu
không, nếu xác suất thay đổi phụ thuộc vào việc biết trước việc biến cố A xuất hiện hay không,
vậy hai biến cố đó là không độc lập. Tương tự, sử dụng các lý giải tương đồng, ta có thể so
sánh P(A | B)vàP(A).

2 Kiểm tra tính độc lập: Các phương pháp khác


Mục tiêu bài học: Xác định hai biến cố có độc lập hay không.
Chú thích
Nhắc lại ví dụ đeo khuyên tai. Ta đã kiểm tra tính độc lập của biến cố M (là Nam giới) và
E (có đeo khuyên tai) bằng cách so sánh P(E) với P(E | M).
Một cách khác để kiểm tra tính độc lập đó là so sánh P(E | M) với P(E | không M) [giống
như P(E | F)]. Trong trường hợp của ta, P(E | M) = 36/180 = 0.2, trong khi P(E | không M) =
288/320 = 0.9, và do hai kết quả khác biệt, ta có thể nói rằng các biến cố E và M là không độc
lập.
Nói chung, một phương pháp khác để kiểm tra tính độc lập của biến cố A và B là so
sánh P(B | A) và P(B | không A). Nói cách khác, hai biến cố là độc lập nếu xác suất của một
biến cố không thay đổi khi ta biết biến cố còn lại xảy ra hoặc ta biết rằng biến cố còn lại không
xảy ra. Điều này có thể biểu diễn là P(B | A) và P(B | không A) sẽ khác khi P(B) và P(B | A)
khác, vậy nên đây là một cách hoàn hảo khác để nhận biết biến cố là phụ thuộc hay độc lập.

3 2 biến cố độc lập


Trước khi phát biểu quy tắc tổng quát cho biến cố độc lập, ta cùng xem xét ví dụ mà được
minh họa bằng một cách khác mà ta có thể dùng để kiểm tra hai biến cố có độc lập hay không:
Ví dụ
Một nhóm 100 sinh viên đại học được khảo sát về giới tính và việc họ quyết định chọn
một chuyên ngành hay chưa.

Đã quyết
Chưa quyết định Tổng
định

Nữ 27 33 60

Nam 18 22 40
Tổn 45 55 100
g

Trước hết, chúng ta sẽ không nhất thiết phải có bất kỳ lý do thuyết phục nào để mong đợi
rằng việc quyết định một chuyên ngành sẽ phụ thuộc vào giới tính của sinh viên. Chúng ta có thể
kiểm tra tính độc lập bằng cách so sánh xác suất tổng thể của việc quyết định với xác suất của
việc quyết định của sinh viên nữ:
P(D) = 45/100 = 0.45 và P(D | F) = 27/60 = 0.45.
Thực sự là hai xác suất đã cho ta biết, điều như ta đã kỳ vọng, là việc quyết định chọn
ngành học là độc lập với giới tính. Lưu ý rằng hai xác suất này cũng bằng với P(D | M), có xác
suất là 18/40 = 0.45.
Bây giờ ta hãy cùng tiếp cận vấn đề của biến độc lập theo một cách khác: trước tiên, ta có
thể ghi nhớ rằng xác suất của việc đã quyết định là 45/100 = 0.45.

Đã quyết
Chưa quyết định Tổng
định

Nữ 27 33 60

Nam 18 22 40

Tổn 45 55 100
g

Xác suất của biến cố là nữ là 60/100 = 0.60.

Đã quyết
Chưa quyết định Tổng
định

Nữ 27 33 60

Nam 18 22 40

Tổn 45 55 100
g

Nếu việc quyết định là độc lập với giới tính, vậy 45% trong số 60% học sinh trong lớp là
nữ đã quyết định chuyên ngành, nói cách khác, xác suất của nữ giới đã chọn chuyên ngành bằng
với xác suất của nữ giới nhân với xấc suất của việc đã quyết định. Nếu các biến cố F và D là độc
lập, ta có P(F và D) = P(F) * P(D).
Thực ra, P(F và D) = 27/100 = 0.27 = P(F) * P(D) = 0.45 * 0.60. Điều này chứng minh
cách xác minh tính độc lập của ta.
Nói chung, một cách khác để xác định tính độc lập của biến cố A và B đó là so sánh P(A
và B) với P(A) * P(B). Nếu hai xác suất bằng nhau, như vậy A và B là hai biến cố độc lập, nếu
không hai biến cố là phụ thuộc.
Ta cùng tổng kết tất cả các phương pháp khả thi ta đã xem để kiểm tra tính độc lập của
các biến cố trong một quy tắc:
Hai biến cố A và B là độc lập nếu một trong những phép tính dưới đây đúng:
P(B | A) = P(B)
P(A | B) = P(A)
P(B | A) = P(B | không A)
P(A và B) = P(A) * P(B)
Chú thích
Những phương trình khác nhau này trở nên tương đương, để nếu một trong các phương
trình đúng, thì tất cả các phương trình khác cũng đúng, và nếu một trong các phương trình không
đúng, tất cả các phương trình còn lại đều không đúng. (Đây là trường hợp với cùng một lý do của
việc biết được một trong các giá trị P(A và B), P(A và không B), P(không A và B), hoặc P(không
A và không B), cùng với P(A) và P(B), cho phép ta xác định các ô còn lại của bảng dữ liệu hai
chiều.)
Do đó, để kiểm tra liệu biến cố A và B có độc lập hay không, chỉ cần kiểm tra một trong
bốn phương trình thỏa mãn - phương trình mà dễ dàng nhất cho bạn.

You might also like