You are on page 1of 6

Nghĩa Vũ (facebook.

com/nghiavuc)

HƯỚNG DẪN PHÂN TÍCH BÀI TOÁN THỐNG KÊ


Học phần Lý thuyết xác suất và thống kê toán
—–o0o—–

Các khái niệm


Trước tiên ta cần nhớ và phân biệt được các khái niệm sau :

• X đại lượng ngẫu nhiên.

• E(X) = µ kỳ vọng toán (trung bình trên đám đông)

• X trung bình mẫu (trung bình trên mẫu)

• x giá trị cụ thể của trung bình mẫu

• V ar(X) = σ 2 phương sai (trên đám đông)

• σ độ lệch tiêu chuẩn

• S 02 phương sai mẫu điều chỉnh

• s02 giá trị cụ thể của phương sai mẫu điều chỉnh

• S 0 độ lệch tiêu chuẩn mẫu điều chỉnh

• s0 giá trị cụ thể của độ lệch tiêu chuẩn mẫu điều chỉnh

• p tỉ lệ trên đám đông

• f tỉ lệ trên mẫu

• ε sai số

• n kích thước mẫu

• γ độ tin cậy

• α mức ý nghĩa

1. Bài toán uớc lượng.


Bài toán ước lượng có sự ràng buộc giữa 3 yếu tố: sai số ε (hay khoảng tin cậy), kích
thước mẫu n và độ tin cậy γ. Do đó đề bài luôn cho biết 2 yếu tố và yêu cầu tìm yếu tố còn lại

Bài toán ước lượng được trình bày qua 4 bước:

1
Nghĩa Vũ (facebook.com/nghiavuc)

- Đặt tên ĐLNN (hoặc tỉ lệ p), các thông số (µ, X, f ) cần thiết.

- Xác định thống kê phù hợp (U, T )

- Xác định phân vị, biến đổi biểu thức ước lượng.

- Thay số và kết luận

1.1. Ước lượng về kỳ vọng toán.

• Tóm tắt bài toán: Liệt kê tất cả các số liệu đã cho.

• Phân tích.

- Xác định ĐLNN là gì, có tính chất gì −→ thống kê cần xây dựng là U hay T .

- Xác định bài toán ước lượng kỳ vọng trên đám đông (ước lượng µ khi biết x) hay
trên mẫu (ước lượng X khi biết µ).

- Xác định khoảng tin cậy (hai phía, phải, trái) −→ phân vị cần tìm.

- Xác định 2 trong 3 thông số đã cho là sai số (khoảng tin cậy), kích thước mẫu
hay độ tin cậy từ đó ta phải tìm yếu tố còn lại

Ví dụ bài 5.20

• Tóm tắt:

+ X doanh thu trong một ngày của cửa hàng.

+ n = 16 (kích thước mẫu)

+ x = 35 (trung bình trên mẫu)

+ s0 = 3 (giá trị cụ thể của độ lệch tiêu chuẩn mẫu điều chỉnh)

+ γ = 90% (độ tin cậy) −→ α = 1 − 0.9 = 0.1

• Phân tích

+ X là ĐLNN có phân phối chuẩn, phương sai chưa biết (n < 30) −→ thống kê cần
xây dựng là T .

+ Vì x = 35 (cho thông tin trên mẫu) nên cần ước lượng kỳ vọng toán trên đám
đông (ước lượng µ)

+ Ước lượng với khoảng tin cậy 2 phía (mặc định nếu không yêu cầu ước lượng giá
(n−1)
trị tối đa hay tối thiểu) −→ phân vị cần tìm tα/2

2
Nghĩa Vũ (facebook.com/nghiavuc)

+ Như vậy bài toán đã cho kích thươc mẫu n = 16 và độ tin vậy γ = 90% −→ ta
cần xác định khoảng tin cậy (sai số)

• Trình bày

Gọi X là doanh thu trong một ngày của cửa hàng


Gọi µ là doanh thu trung bình một ngày của cửa hàng trên đám đông
Gọi X là doanh thu trung bình một ngày của cửa hàng trên mẫu.
Vì X ∼ N (µ, σ 2 ) với σ chưa biết nên

X −µ
T = ∼ N (0; 1)
S0

n

(n−1)
Ta tìm được phân vị tα/2 sao cho

(n−1)
P (|T | < tα/2 ) = 1 − α = γ

Thay biểu thức của T vào và biến đổi ta được

P (X − ε < µ < X + ε) = 1 − α = γ

S 0 (n−1)
Trong đó ε = √ t
n α/2
(n−1) (15)
Ta có: γ = 90% → α = 1 − 0.9 = 0.1,n = 16 → tα/2 = t0.05 = 1.753
3
Và s0 = 3, x = 35 suy ra ε = √ 1.753 = 1.315
16
Nên ta có khoảng tin cậy (35 - 1.315; 35 + 1.315) hay (33.685 ; 36,315)

Kết luận: Với độ tin cậy 90% có thể nói rằng doanh thu trung bình một ngày của cửa
hàng nằm trong khoảng (33.685 ; 36.315) triệu đồng.

Chú ý :

- Nếu bài toán trên cho µ khi đó ta cần ước lượng trên mẫu (X) và biểu thức ước lượng
sẽ là:

P (µ − ε < X < µ + ε) = 1 − α = γ

(n−1)
- Nếu là ước lượng một phía (tối đa hay tối thiểu) thì phân vị cần tìm là tα

- Khoảng tin cậy phải dùng để ước lượng giá trị tối thiểu trên đám đông, ước lượng giá
trị tối đa trên mẫu.

3
Nghĩa Vũ (facebook.com/nghiavuc)

- Khoảng tin cậy trái dùng để ước lượng giá trị tối đa trên đám đông, ước lượng giá trị
tối thiểu trên mẫu.

1.2. Ước lượng tỷ lệ.

• Tóm tắt bài toán: Liệt kê tất cả số liệu đã cho.

• Phân tích.

- Xác định p là gì (thống kê luôn là U ).

- Xác định bài toán ước lượng trên đám đông (ước lượng p nếu bài toán đã cho f )
hay ước lượng trên mẫu (ước lượng f nếu bài toán đã cho p).

- Xác định khoảng tin cậy (hai phía, phải, trái) −→ phân vị cần tìm.

- Xác định 2 trong 3 thông số đã cho là sai số (khoảng tin cậy), kích thước mẫu
hay độ tin cậy từ đó ta phải tìm yếu tố còn lại

1.3. Ước lượng phương sai.

• Tóm tắt bài toán: Liệt kê tất cả các thông số đã cho.

• Phân tích.

- Xác định X là gì (thống kê luôn là χ2 ).


2(n−1)
- Xác định khoảng tin cậy (hai phía, phải, trái) −→ phân vị cần tìm là χα/2 ,
2(n−1) 2(n−1)
χα hay χ1−α .

2. Bài toán kiểm định.


2.1. Kiểm định giả thuyết thống kê về kỳ vọng toán.
Cần phân biệt các khái niệm µ , µ0 và x.

+ µ là giá trị trung bình của ĐLNN trên thực tế (trên đám đông).

+ µ0 là giá trị trung bình của ĐLNN trong giả thuyết.

+ x là giá trị trung bình của ĐLNN trên mẫu

• Tóm tắt bài toán

• Phân tích.

- Xác định ĐLNN là gì, có tính chất gì −→ tiêu chuẩn kiểm định (TCKĐ) cần xây
dựng là U hay T .

4
Nghĩa Vũ (facebook.com/nghiavuc)

- Xác định µ0 .

- Căn cứ vào ý nghĩa yêu cầu xác định H1 .

2.2. Kiểm định giả thuyết thống kê về tỷ lệ.


Cần phân biệt các khái niệm p, p0 và f .

+ p là tỷ lệ các phần tử mang dấu hiệu của thực tế (trên đám đông).

+ p0 là tỷ lệ các phần tử mang dấu hiệu của giả thuyết.

+ f là tỷ lệ các phần tử mang dấu hiệu trên mẫu

• Tóm tắt bài toán

• Phân tích.

- Xác định p là gì.

- Xác định p0 .

- Căn cứ vào ý nghĩa yêu cầu xác định H1 .

2.3. Kiểm định giả thuyết thống kê về phương sai.


Cần phân biệt các khái niệm σ 2 , σ02 và s02 .

+ σ 2 là phương sai của ĐLNN trên thực tế (trên đám đông).

+ σ02 là phương sai của ĐLNN trong giả thuyết.

+ s02 là giá trị cụ thể của phương sai mẫu điều chỉnh (phương sai trên mẫu)

• Tóm tắt bài toán

• Phân tích.

- Xác định X là gì.

- Xác định σ02 .

- Căn cứ vào ý nghĩa yêu cầu xác định H1 .

Chú ý.

1. θ0 phải là giá trị cố định.

5
Nghĩa Vũ (facebook.com/nghiavuc)

2. Việc xác định H1 phải căn cứ vào toàn bộ ý nghĩa của giả thuyết, tránh việc chỉ căn
cứ vào một từ như "lớn", "nhỏ" . . . .

3. Nếu phân vân giữa việc xác định là bài toán số 2 (H1 : θ > θ0 ) hay bài toán số 3
(H1 : θ < θ0 ) ta có thể sử dụng suy luận như sau. Giả sử H0 đúng và H1 đúng khi đó
hai khẳng định trên phải khác nhau về mặt ý nghĩa. Khi đó bài toán 2 và bài toán 3
sẽ có một trường hợp xảy ra cả H0 và H1 đều đúng và ta cần loại bài toán này và lựa
chọn bài toán còn lại (ví dụ bài 6.51).

You might also like