BÀI TOÁN SUY DIỄN THỐNG KÊ

Suy diễn TK về TB mẫu: X∼N(μ,σ2), p(a < X < b) = ?
Cách 1: Theo bài ra: X∼N(μ,σ2)
Với mẫu có n quan sát, ta có X ∼ N ( μ ,

σ2

= σ X2 )

n
⎛b−μ ⎞
⎛a−μ ⎞
p (a < X < b) = φ0 ⎜
⎟ − φ0 ⎜

⎝ σX ⎠
⎝ σX ⎠


Hoặc tìm p X − μ < ε = 2φ0 ⎜ ε ⎟
σ

X ⎠

(

)

Cách 2:
Theo bài ra: X∼N(μ,σ2), với mẫu có n quan sát, ta có
X ∼ N (μ ,

σ2
n

= σ X2 ) ⇒ G = U =

X − μ ( X − μ)
=
∼ N (0,1)
Se( X )
σX

⎡a − μ
b−μ⎤
p=(a<X<b)=p ⎢
<U<
⎥ = p [... < U < ...]
σ
σ
⎣ X
X ⎦
Cách 3:

σ

σ

Tổng quát: p ⎜ μ − uα < X < μ + uα ⎟ =1 − (α1 + α 2 ) = 1 − α
n
n


Khoảng đối xứng hay tìm chênh lệch:
1

2

σ
σ
σ




p⎜μ −
uα /2 < X < μ +
uα /2 ⎟ = 1 − α hoặc p ⎜ X − μ <
uα /2 ⎟ = 1 − α
n
n
n



Khoảng giá trị tối đa:
σ


p⎜ X ≤ μ +
uα ⎟ =1 − α
n ⎠

Khoảng giá trị tối thiểu:
σ


p⎜ X ≥ μ −
uα ⎟ =1 − α
n ⎠

Suy diễn TK về phương sai mẫu
• Khoảng gt 2 phía
σ2 2
⎡ σ2 2

2
p⎢
χ 1−α/ 2 (n − 1) < S <
χ α/ 2 (n − 1)⎥ = 1 − α
n −1
⎣ n −1

• GT tối thiểu α1=α, α2=0

σ2 2


p ⎢S 2 ≥
χ 1−α (n − 1)⎥ = 1 − α
n −1


• GT tối đa α1=0, α2= α
σ2 2
⎡ 2

p ⎢S ≤
χ α (n − 1)⎥ = 1 − α
n −1

Suy diễn TK về tần suất mẫu

Đk: n >5 và

p
1− p

1− p
p

n < 0,3 hoặc n ≥100. Khi đó f pp chuẩn

Cách 1: Giống suy diễn trung bình mẫu
Cách 2: Giống suy diễn trung bình mẫu
Cách 3:
● Khoảng GT đối xứng




p(1-p)
p(1-p)
p(1-p)
P ⎜⎜ p uα < f < p +
u α ⎟⎟ = 1 − α hoặc P ⎜⎜ f − p ≤
u α ⎟⎟ = 1 − α
2
2
2
n
n
n




● Khoảng GT tối thiểu

p(1-p) ⎞
P ⎜⎜ f ≥ p −
uα ⎟⎟ = 1 − α
n


● Khoảng GT tối đa

p(1-p) ⎞
P ⎜⎜ f ≤ p +
uα ⎟⎟ = 1 − α
n

Suy diễn TK về hiệu hai trung bình mẫu (tự đọc)
Suy diễn TK về hiệu hai tần suất mẫu (tự đọc)
Suy diễn TK về tỷ số hai phương sai (tự đọc)
Ước lượng μ của X ∼N(μ,σ2)
σ2 đã biết
σ

σ2 chưa biết

σ


P⎜ X −
uα /2 < μ < X +
uα /2 ⎟ = 1 − α
n
n


σ


P⎜μ ≤ X +
uα ⎟ = 1 − α
n ⎠

σ


P⎜μ ≥ X −
uα ⎟ = 1 − α
n ⎠

S ( n −1)
S ( n −1) ⎞

P⎜ X −
tα /2 < μ < X +
tα /2 ⎟ = 1 − α
n
n


S ( n −1) ⎞

P⎜μ ≤ X +
tα ⎟ = 1 − α
n


S ( n −1) ⎞

P⎜μ ≥ X −
tα ⎟ = 1 − α
n

Kích thước mẫu n để I≤I0 hay ε≤ε0:
4σ 2 2
σ2 2
n ≥ 2 uα 2 hoặc n ≥ 2 uα 2
ε0
I0

Kích thước mẫu n để I≤I0 hay ε≤ε0:
- Trước hết điều tra một mẫu kích thước m≥2
- Kích thước mẫu n cần điều tra được tính
n≥

4S 2 ( m −1) 2
S 2 ( m −1) 2
hay

t
n
(α2 )
(t )
I 02
ε 02 α 2

⇒ Điều tra thêm (n-m) quan sát

Ước lượng p của X ∼A(p)
n≥100

P⎜ f −

f (1 − f )
n

uα /2 < μ < X +

N<100
f (1 − f )
n


uα /2 ⎟ = 1 − α

P ( p1 < μ < p2 ) = 1 − α

Trong đó:


f (1 − f ) ⎞
P⎜ p ≤ f +
uα ⎟ = 1 − α


n



f (1 − f ) ⎞
P⎜ p ≥ f −
uα ⎟ = 1 − α


n

2
2
2nf + uα/2
± uα/2 4nf (1 − f ) + uα/2
p1 , p2 =
2
2(n + uα/2
)

Kích thước mẫu n để I≤I0 hay ε≤ε0:
n≥

4 f (1 − f ) 2
f (1 − f ) 2
uα 2 hoặc n ≥
uα 2
2
I0
ε 02

Ước lượng σ2 của X ∼N(μ,σ2)
μ đã biết

μ chưa biết

⎛ n.S*2
n.S*2 ⎞
2
p ⎜ 2( n ) < σ < 2( n ) ⎟ = 1 − α
⎜χ
χ 1−α 2 ⎟⎠
⎝ α2
⎛ 2 n.S*2 ⎞
p ⎜ σ ≤ 2( n ) ⎟ = 1 − α
χ 1−α ⎠

⎛ (n-1).S2
(n-1).S2 ⎞
2
p ⎜ 2( n−1) < σ < 2( n−1) ⎟ = 1 − α
⎜ χ
χ 1−α 2 ⎟⎠
⎝ α2
⎛ 2 (n-1).S2 ⎞
p ⎜ σ ≤ 2( n −1) ⎟ = 1 − α
χ 1−α

⎛ 2 n.S*2 ⎞
p ⎜ σ ≥ 2( n ) ⎟ = 1 − α
χα ⎠

⎛ 2 (n-1).S2 ⎞
p ⎜ σ ≥ 2( n −1) ⎟ = 1 − α
χα

Kiểm định giả thuyết về μ của X ∼N(μ,σ2)
⎧ H 0 : μ = μ0

⎩ H1 : μ ≠ μ 0
⎧ H 0 : μ ≥ μ0

⎩ H1 : μ < μ 0
⎧ H 0 : μ ≤ μ0

⎩ H1 : μ > μ 0

MBB đối với H0 khi σ2 đã biết

MBB đối với H0 khi σ2 chưa biết

⎧⎪
⎫⎪
X − μ0 n
Wα = ⎨U =
; | U |> uα/2 ⎬
σ
⎪⎩
⎪⎭
⎧⎪
⎫⎪
X − μ0 n
Wα = ⎨U =
; U < −u α ⎬
σ
⎪⎩
⎪⎭
⎧⎪
⎫⎪
X − μ0 n
Wα = ⎨U =
; U > uα ⎬
σ
⎪⎩
⎪⎭


( X − μ0 ) n
⎪⎧
( n −1) ⎪
Wα = ⎨T =
; | T |> tα/2

S
⎪⎩
⎭⎪

(

)

(

)

⎧⎪
⎫⎪
( X − μ0 ) n
Wα = ⎨T =
; T < −tα( n −1) ⎬
S
⎩⎪
⎭⎪

(

)

⎧⎪
⎫⎪
( X − μ0 ) n
Wα = ⎨T =
; T > tα( n −1) ⎬
S
⎪⎩
⎪⎭

Kiểm định so sánh hai tham số μ1, μ2 của X1 ∼N(μ1,σ12), X2 ∼N(μ2,σ22)
MBB đối với H0 khi σ2 đã biết

⎧ H 0 : μ1 = μ2

⎩ H1 : μ1 ≠ μ 2

⎧ H 0 : μ1 ≥ μ 2

⎩ H1 : μ1 < μ2





( X1 − X 2 )


Wα = ⎨U =
; | U |> uα/2 ⎬
2
2
σ1 σ 2


+


n1 n2






( X1 − X 2 )


Wα = ⎨U =
; U < −uα ⎬
2
2
σ1 σ 2


+


n1 n2

MBB đối với H0 khi σ2 chưa biết
n1, n2 đủ lớn





X1 − X 2


Wα = ⎨U =
; | U |> uα/2 ⎬
2
2
S1 S 2


+


n1 n2






X1 − X 2


Wα = ⎨U =
; U < −u α ⎬
2
2
S1 S 2


+


n1 n2

⎧ H 0 : μ1 ≤ μ 2

⎩ H1 : μ1 > μ 2





( X1 − X 2 )


Wα = ⎨U =
;
U
>
u

α
σ12 σ 22


+


n1 n2





X1 − X 2


Wα = ⎨U =
;
U
u
>

α
S12 S 22


+


n1 n2

Kiểm định GT về σ2 và so sánh hai tham số σ12, σ22
MBB đối với H0 khi μ chưa biết

MBB đối với H0 khi μ1, μ2 chưa biết

⎧⎪ 2 (n − 1) S ⎡ χ < χ
⎫⎪
⎪⎧ H 0 : σ = σ

=
=
W
χ
;
2
2

⎢ 2 2( n −1) ⎬
α
⎪⎩ H1 : σ ≠ σ 0
σ 02
⎣ χ > χ α/2 ⎭⎪
⎩⎪


⎪⎧ H 0 : σ = σ
S12 ⎡ F < F1−α/ 2 (n1 − 1, n2 − 1) ⎫

; ⎢

2
2 Wα = ⎨ F =
2
⎪⎩ H1 : σ 1 ≠ σ 2
F
F
n
n
(
1,
1)
>


S

α/
2
1
2
2

⎧⎪ H 0 : σ 2 ≥ σ 02
⎧ 2 (n − 1) S 2 2 2( n −1) ⎫
Wα = ⎨χ =
; χ < χ 1−α ⎬

2
2
2
⎪⎩ H1 : σ < σ 0
σ
0

⎧⎪ H 0 : σ 12 ≥ σ 22


S12
Wα = ⎨ F = 2 ; F < F1−α (n1 − 1, n2 − 1) ⎬

2
2
⎪⎩ H1 : σ 1 < σ 2
S2

⎧⎪ H 0 : σ 2 ≤ σ 02
⎧ 2 (n − 1) S 2 2 2( n −1) ⎫
Wα = ⎨χ =
; χ >χα ⎬

2
2
2
⎪⎩ H1 : σ > σ 0
σ
0

⎧⎪ H 0 : σ 12 ≤ σ 22

2
2
⎪⎩ H1 : σ 1 > σ 2

2

2
0

2

2

2( n −1)
1− α/2

2
1

2
2



S12
Wα = ⎨ F = 2 ; F > Fα (n1 − 1, n2 − 1) ⎬
S2

Kiểm định GT về P và so sánh hai tham số P1, P2
MBB đối với H0

MBB đối với H0

⎧ H 0 : P = P0
⎧⎪
⎫⎪
( f − p0 ) n

W
=
U
=
;
U
>
u

α
α/ 2 ⎬
⎩ H1 : P ≠ P0
p (1 − p )

⎧ H 0 : P1 = P2

⎩ H1 : P1 ≠ P2




Wα = ⎨ U =




f1 − f 2

; U > uα/2 ⎬
⎛1 1⎞

f (1 − f ) ⎜ + ⎟

⎝ n1 n2 ⎠

⎧ H 0 : P ≥ P0
⎧⎪
⎫⎪
( f − p0 ) n

=
=
<

W
U
;
U
u

α
α⎬
⎩ H1 : P < P0
p (1 − p )

⎧ H 0 : P1 ≥ P2

⎩ H1 : P1 < P2




Wα = ⎨ U =




f1 − f 2

; U < −u α ⎬
⎛1 1⎞

f (1 − f ) ⎜ + ⎟

⎝ n1 n2 ⎠

⎧ H 0 : P ≤ P0

⎩ H1 : P > P0

⎧ H 0 : P1 ≤ P2

⎩ H1 : P1 > P2




Wα = ⎨ U =




f1 − f 2

; U > uα ⎬
⎛1 1⎞

f (1 − f ) ⎜ + ⎟

⎝ n1 n2 ⎠

⎩⎪

⎩⎪

0

0

⎭⎪

0

0

⎭⎪

( f − p0 ) n
⎪⎧
⎪⎫
Wα = ⎨U =
; U > uα ⎬
p0 (1 − p0 )
⎪⎩
⎪⎭

Bài tập
1) Điều tra ngẫu nhiên 200 sinh viên của một trường đại học thấy có 110 sinh viên nữ và 90 nam.
Trong số sinh viên nữ, có 20 người đi làm thêm ngoài giờ học, trong số sinh viên nam có 19 người đi
làm thêm ngoài giờ học. Với mức ý nghĩa 5% hãy cho kết luận về điều nghi ngờ sau:
a) Tỷ lệ giới trong sinh viên của trường đại học này là như nhau.
b) Tỷ lệ sinh viên nam đi làm ngoài giờ lớn hơn tỷ lệ nữ đi làm ngoài giờ.
2) Trường đào tạo lái xe ô tô TX đã đào tạo được 5000 lái xe cho tỉnh A. Kiểm tra ngẫu nhiên 1500
người ở tỉnh A thấy có 200 người có bằng lái xe ô tô, trong đó có 150 người có bằng lái xe do trường
TX cấp.
a) Ước lượng số người đã có bằng lái xe ô tô của tỉnh A tối đa với độ tin cậy 95%.
b) Có thể cho rằng 15% số người của tỉnh A đã có bằng lái xe ô tô không? α=5%.
3) Điêu tra ngẫu nhiên 100 sản phẩm của một lô hàng thì thấy có 90 chính phẩm. Một lô hàng đủ điều
kiện xuất khẩu nếu có tỷ lệ chính phẩm đạt từ 95% trở lên.
a) Với mức ý nghĩa 5%, hãy cho biết lô hàng có xuất khẩu được không?
b) Nếu khẳng định tỷ lệ chính phẩm của lô hàng là 95%, với xác suất 0,9 cho biết khi kiểm tra
một mẫu 169 sản phẩm thì có ít nhất bao nhiêu phế phẩm.
4) Chiều cao thanh niên vùng M là biến ngẫu nhiên phân phối chuẩn với µ=165 cm, σ2=102 cm2. Người
ta đo ngẫu nhiên chiều cao của 100 thanh niên vùng đó.
a) Xác suất để chiều cao trung bình của 100 thanh niên đó sẽ sai lệch so với chiều cao trung bình
của thanh niên vùng M không vượt quá 2 cm là bao nhiêu?
b) Khả năng chiều cao trung bình của số thanh niên trên vượt quá 168 cm là bao nhiêu?
c) Nếu muốn chiều cao trung bình đo được sai lệch so với chiều cao trung bình của tổng thể (của
tất cả các thanh niên vùng M) không vượt quá 1 cm với xác suất 0,99 thì phải tiến hành đo chiều cao
của bao nhiêu thanh niên.
d) với kích thước mẫu là 100 thì độ lệch tiêu chuẩn mẫu sẽ lớn hơn giá trị thật của nó ít nhất bao
nhiêu lần với xác suất 0,05.
5) Một lô hàng đủ điều kiện xuất khẩu nếu tỷ lệ phế phẩm không vượt quá 5%. Vậy nếu kiểm tra 100
sản phẩm thì với tỷ lệ phế phẩm thực tế kiểm tra tối đa là bao nhiêu thì có thể cho phép xuất khẩu lô
hàng mà khả năng không mắc sai lầm là 95%.
6): Mức tiêu hao xăng/100 km của xe A (XA) thuộc Công ty 3A là biến ngẫu nhiên phân phối chuẩn.
Điều tra ngẫu nhiên mức tiêu hao xăng/100 km của 100 xe loại trên, người ta thu được bảng số liệu sau:
XA (lít) 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5
Số xe
5
10 15 20 29 10 6
5
a) Với xác suất 95%, mức tiêu hao xăng tối thiểu cho 100 km là bao nhiêu?
b) Trước đây tỷ lệ xe A tiêu hao xăng ít nhất 8 lít/100 km là 0,45. Với mức ý nghĩa 5%, hãy cho biết tỷ
lệ này có lớn hơn trước đây không?

7): Doanh thu (X- triệu đồng) của các cửa hàng bán đồ điện trong một tháng trong một tháng là bnn pp
chuẩn. Điều tra ngẫu nhiên 144 cửa hàng kinh doanh mặt hàng trên ở địa phương A trong tháng 2,
người ta thu được các số liệu sau đây:

144

∑ xi = 2376;
i =1

144

∑ (x − x )
i =1

i

2

= 3575 .

a) Tỷ lệ các cửa hàng cùng loại trong toàn quốc có doanh thu từ 20 triệu đồng/tháng trở lên bằng 42%.
Với mức ý nghĩa 5%, hãy cho biết sự khác biệt về tỷ lệ này của địa phương A trong tháng 2 so với toàn
quốc hay không? Biết rằng trong mẫu 144 cửa hàng nói trên có 58 cửa hàng có doanh thu ít nhất 20
triệu/tháng.
b) Hãy tìm khoảng tin cậy đối xứng cho mức doanh thu trung bình với hệ số tin cậy 95%.
c) Theo thống kê, trước đây độ phân tán (σ) của doanh thu/tháng của các cửa hàng trên bằng 5,2 triệu.
Với mức ý nghĩa 5%, hãy cho biết độ phân tán trong tháng 2 có nhỏ hơn so với trước đây không?
d) Từ mẫu ngẫu nhiên gồm 169 cửa hàng kinh doanh mặt hàng tương tự ở địa phương B, người ta thu
được sai số tiêu chuẩn mẫu bằng 5,5. Với mức ý nghĩa 5% hãy cho biết độ phân tán của doanh thu ở A
có nhỏ hơn ở B hay không? Doanh thu các cửa hàng vùng B cũng là biến ngẫu nhiên phân bố chuẩn.
8) Năng suất một giống lúa tại vùng A là biến ngẫu nhiên phân phối chuẩn. Người ta đã thu hoạch ngẫu
nhiên 100 khu ruộng, được số liệu sau:
Năng suất (tấn/ha) 2,5 3,0 3,5 4,0 4,5 5,0 5,5
Số điểm thu hoạch 8
13 22 24 15 10 8
a) Trước đây năng suất trung bình của giống lúa trên bằng 3,8 tấn/ha, với mức ý nghĩa 5% hãy cho biết
năng suất có tăng lên hay không?
b) Với hệ số tin cậy 95%, tìm khoảng tin cậy cho phương sai của năng suất.
c) Thu hoạch ngẫu nhiên 100 điểm ở vùng B người ta tính được năng suất trung bình là 3,7 tấn và độ
lệch tiêu chuẩn là 0,9 tấn. Với mức ý nghĩa 5% có thể cho rằng năng suất giống lúa ở vùng A lớn hơn
năng suất vùng B hay không? Năng suất vùng B cũng là bnn pp chuẩn.
9) Tỷ lệ phế phẩm của một sản phẩm được sản xuất trên dây chuyền A là 10%.
a) Với xác suất 0,95 hãy cho biết nếu kiểm tra 200 sản phẩm của dây chuyền A thì sẽ có tối đa bao
nhiêu phế phẩm.
b) Kiểm tra 100 sản phẩm được sản xuất trên dây chuyền B thấy có 12 phế phẩm, với mức ý nghĩa 5%
có thể cho rằng tỷ lệ phế phẩm của 2 dây chuyền là như nhau.
10) Để tìm hiểu tính hình tiêu thụ sản phẩm trong một tuần tại các đại lý sau một đợt quảng cáo, công
ty Y thu thập ngẫu nhiên doanh thu bán hàng ở 101 đại lý và có kết quả:
Doanh thu (triệu đồng) 25 26 27 28 29 30
Số đại lý
10 18 30 22 15 6
Giả sử doanh số bán của đại lý là biến ngẫu nhiên có phân phối chuẩn.
a) Biết rằng doanh thu bán hàng trung bình của đại lý trước khi có đợt quảng cáo là 25,5 triệu đồng.
Với mức ý nghĩa 5%, hãy cho biết về hiệu quả của đợt quảng cáo.
b) Thống kê doanh thu trước quảng cáo của 101 đại lý được chọn ngẫu nhiên, người ta thu được S2=3.
Với mức ý nghĩa 5% có thể cho rằng doanh thu của đại lý sau đợt quảng cáo đã ổn định hơn chưa?

11) Để ước lượng số tờ bạc giả của một loại giấy bạc, người ta đánh dấu 200 tờ bạc giả loại này
rồi tung vào lưu thông. Sau một thời gian ngắn kiểm tra 600 tờ bạc giả loại này có 15 tờ được
đánh dấu. Với độ tin cậy 95% hãy ước lượng số tờ bạc giả loại này. (ĐS: (5134; 15799)

Sign up to vote on this title
UsefulNot useful