Professional Documents
Culture Documents
Mục tiêu bài học: Xác định hai biến cố có độc lập hay không.
Như ta thấy trong phần Phân tích Dữ liệu Thăm dò, khi nào tình huống có nhiều hơn một
biến, thông thường là quan tâm tới việc xác định các biến có liên quan hay không. Trong xác
suất, ta nhắc tới các biến cố độc lập, và trong học phần đầu tiên ta đã nói rằng hai biến cố A và B
là độc lập nếu biến cố A xảy ra mà không ảnh hưởng tới xác suất xảy ra của biến cố B. Giờ đây
sau khi được học về xác suất có điều kiện, ta có thể công thức hóa định nghĩa về tính độc lập của
các biến cố và phát triển bốn cách đơn giản để xác thực hai biến cố có độc lập với nhau hay
không. Ta sẽ gọi đây là những "phép thử tính độc lập" sử dụng ví dụ, và sau đó tổng kết lại.
Ví dụ
Ta cùng xem lại bảng dữ liệu hai chiều dành cho 500 học sinh ở một trường trung học,
được phân loại theo giới tính và việc họ có đeo khuyên ở một hay hai bên tai không.
Giới Xỏ
Không xỏ khuyên Tổng
tính khuyên
Nữ 288 32 320
Ta có kỳ vọng hai biến này liên quan tới nhau hay không? Có nghĩa là, ta có kỳ vọng việc
đeo khuyên tai phụ thuộc vào việc học sinh đó là nam hay nữ? Hoặc, để nói một cách khác, việc
biết được giới tính của học sinh có ảnh hưởng tới xác suất việc học sinh đeo khuyên tai hay
không? Để trả lời được câu hỏi này, ta có thể so sánh xác suất tổng của biến cố đeo khuyên tai
với xác suất có điều kiện của việc đeo khuyên tai mà học sinh đó là nam giới. Theo trực giác cho
ta thấy trường hợp sau sẽ có xác suất thấp hơn: học sinh nam có xu hướng không đeo khuyên tai,
trong khi học sinh nữ có đeo. Thật vậy, đối với học sinh nói chung, xác suất có xỏ lỗ tai (biến cố
E) là P (E) = 324/500 = 0,648. Nhưng xác suất có xỏ lỗ tai với học sinh là nam chỉ là P (E | M) =
36/180 = 0,20.
Như dự đoán, P (E | M) thấp hơn P (E). Xác suất của một học sinh có tai xỏ thay đổi
(trong trường hợp này, thấp hơn) khi chúng ta biết rằng học sinh là nam giới, và do đó các biến
cố E và M là biến phụ thuộc. (Nếu E và M là độc lập, biết hoặc không biết rằng học sinh là nam
giới sẽ không tạo ra sự khác biệt ... nhưng chúng lại là biến phụ thuộc.)
Ví dụ này đã minh họa một cách để xác định liệu hai biến cố có độc lập hay không bằng
cách so sánh P(B | A)vàP(B).
Nếu hai biến cố tương đương (ví dụ biết hoặc không biết được việc biến cố A xuất hiện
có ảnh hưởng tới xác suất việc xảy ra biến cố B hay không) thì hai biến cố đó là độc lập. Nếu
không, nếu xác suất thay đổi phụ thuộc vào việc biết trước việc biến cố A xuất hiện hay không,
vậy hai biến cố đó là không độc lập. Tương tự, sử dụng các lý giải tương đồng, ta có thể so
sánh P(A | B)vàP(A).
Đã quyết
Chưa quyết định Tổng
định
Nữ 27 33 60
Nam 18 22 40
Tổn 45 55 100
g
Trước hết, chúng ta sẽ không nhất thiết phải có bất kỳ lý do thuyết phục nào để mong đợi
rằng việc quyết định một chuyên ngành sẽ phụ thuộc vào giới tính của sinh viên. Chúng ta có thể
kiểm tra tính độc lập bằng cách so sánh xác suất tổng thể của việc quyết định với xác suất của
việc quyết định của sinh viên nữ:
P(D) = 45/100 = 0.45 và P(D | F) = 27/60 = 0.45.
Thực sự là hai xác suất đã cho ta biết, điều như ta đã kỳ vọng, là việc quyết định chọn
ngành học là độc lập với giới tính. Lưu ý rằng hai xác suất này cũng bằng với P(D | M), có xác
suất là 18/40 = 0.45.
Bây giờ ta hãy cùng tiếp cận vấn đề của biến độc lập theo một cách khác: trước tiên, ta có
thể ghi nhớ rằng xác suất của việc đã quyết định là 45/100 = 0.45.
Đã quyết
Chưa quyết định Tổng
định
Nữ 27 33 60
Nam 18 22 40
Tổn 45 55 100
g
Đã quyết
Chưa quyết định Tổng
định
Nữ 27 33 60
Nam 18 22 40
Tổn 45 55 100
g
Nếu việc quyết định là độc lập với giới tính, vậy 45% trong số 60% học sinh trong lớp là
nữ đã quyết định chuyên ngành, nói cách khác, xác suất của nữ giới đã chọn chuyên ngành bằng
với xác suất của nữ giới nhân với xấc suất của việc đã quyết định. Nếu các biến cố F và D là độc
lập, ta có P(F và D) = P(F) * P(D).
Thực ra, P(F và D) = 27/100 = 0.27 = P(F) * P(D) = 0.45 * 0.60. Điều này chứng minh
cách xác minh tính độc lập của ta.
Nói chung, một cách khác để xác định tính độc lập của biến cố A và B đó là so sánh P(A
và B) với P(A) * P(B). Nếu hai xác suất bằng nhau, như vậy A và B là hai biến cố độc lập, nếu
không hai biến cố là phụ thuộc.
Ta cùng tổng kết tất cả các phương pháp khả thi ta đã xem để kiểm tra tính độc lập của
các biến cố trong một quy tắc:
Hai biến cố A và B là độc lập nếu một trong những phép tính dưới đây đúng:
P(B | A) = P(B)
P(A | B) = P(A)
P(B | A) = P(B | không A)
P(A và B) = P(A) * P(B)
Chú thích
Những phương trình khác nhau này trở nên tương đương, để nếu một trong các phương
trình đúng, thì tất cả các phương trình khác cũng đúng, và nếu một trong các phương trình không
đúng, tất cả các phương trình còn lại đều không đúng. (Đây là trường hợp với cùng một lý do của
việc biết được một trong các giá trị P(A và B), P(A và không B), P(không A và B), hoặc P(không
A và không B), cùng với P(A) và P(B), cho phép ta xác định các ô còn lại của bảng dữ liệu hai
chiều.)
Do đó, để kiểm tra liệu biến cố A và B có độc lập hay không, chỉ cần kiểm tra một trong
bốn phương trình thỏa mãn - phương trình mà dễ dàng nhất cho bạn.