You are on page 1of 25

TRƯỜNG ĐẠI HỌC THƯƠNG MẠI

KHOA KINH TẾ VÀ KINH DOANH QUỐC TẾ


----------

BÀI THẢO LUẬN


LÝ THUYẾT XÁC SUẤT THỐNG KÊ TOÁN

Nhóm thực hiện : Nhóm 5


Giảng viên hướng dẫn : Ths. Mai Hải An
Lớp học phần : 231_AMAT1011_02

1
MỤC LỤC
CHƯƠNG I: CƠ SỞ LÝ THUYẾT.............................................................................3
1.1. Ước lượng bằng khoảng tin cậy........................................................................................3
1.1.1. Khái niệm về ước lượng bằng khoảng tin cậy.............................................................3
1.1.2. Ước lượng kỳ vọng toán của đại lượng ngẫu nhiên ( ĐLNN)......................................3
1.1.3 Ước lượng tỷ lệ...........................................................................................................5
1. 2. Kiểm định giả thuyết thống kê........................................................................................6
1.2.1. Khái niệm về kiểm định giả thuyết thống kê.................................................................6
1.2.2 Kiểm định giả thuyết về các tham số...........................................................................9
1.2.2.1 Kiểm định giả thuyết về kỳ vọng toán của một ĐLNN..............................................9
1.2.2.2 So sánh 2 kì vọng toán của 2 ĐLNN.................................................................12
CHƯƠNG II KẾT QUẢ NGHIÊN CỨU..................................................................15
2.1. Kết quả điều tra:............................................................................................................15
2.2. Kết quả giải quyết vấn đề:..............................................................................................16
2.2.1 Vấn đề 1: Ước lượng tỷ lệ các bạn sinh viên đang đi làm thêm.....................16
2.2.2. Vấn Đề 2: Ước lượng thu nhập trung bình hàng tháng của các bạn sinh viên
đang đi làm thêm.............................................................................................................17
2.2.3. Vấn đề 3: So sánh mức chi tiêu trung bình hàng tháng của nhóm các bạn đang đi
làm thêm và nhóm còn lại.................................................................................................18
2.2.4. Vấn đề 4 Liệu rằng mức chi tiêu trung bình hàng tháng của các bạn sinh viên đang đi
làm thêm có đến 3 triệu đồng hay không?.........................................................................20
CHƯƠNG III KẾT LUẬN.........................................................................................22
3.1. Tóm tắt kết quả nghiên cứu...........................................................................................22
3.2. Kết luận chung...............................................................................................................22
TÀI LIỆU THAM KHẢO..........................................................................................23

1
BẢNG PHÂN CÔNG CÔNG VIỆC
STT Họ và Tên Công Việc Nhận xét Đánh giá
điểm

41 Khuất Thị Hoa Thư ký


Tổng hợp Word

42 Đỗ Duy Hoàng Thuyết trình

43 Nguyễn Huy Hoàng Làm PowerPoint

44 Lê Thị Hồng Vấn đề 2

45 Lê Thị Thu Huệ Vấn đề 1

46 Nguyễn Thị Ngọc Huyền Cơ sở lý thuyết

47 Dương Quang Hùng Vấn đề 3

48
Lê Minh Hùng Trưởng nhóm

49 Nguyễn Quốc Hưng Kết luận

50 Đỗ Thị Bích Hường Vấn đề 4

Nguyễn Trọng Phượng Thuyết trình

2
CHƯƠNG I: CƠ SỞ LÝ THUYẾT
1.1. Ước lượng bằng khoảng tin cậy
1.1.1. Khái niệm về ước lượng bằng khoảng tin cậy
Ước lượng bằng khoảng tin cậy là phương pháp sử dụng các dữ liệu mẫu để
ước lượng giá trị của một thông số trong quần thể và cung cấp một khoảng tin cậy xác
suất cho phép giá trị thực sự của thông số nằm trong đó.
Giả sử cần ước lượng tham số θ của đại lượng ngẫu nhiên X trên đám đông
Chọn mẫu ngẫu nhiên W ={ X 1 , X 2 , … , X n ,θ }
Từ ước lượng điểm tốt nhất của θ xây dựng thống kê:
G=f ( X 1 , X 2 , … , X n ,θ)

Sao cho G có quy luật xác định và có biểu thức chứa θ


Với γ =1−α cho trước, xác định α 1 ≥ 0 , α 2 ≥ 0 thỏa mãn α 1+ α 2 =α
Từ đó xác định các phân vị g1−α và gα1 2

P ( g1−α < G< gα )=1−α 1−α 2=1−α


1 2

¿ ¿
P(θ 1<θ <θ2 )=1−α

Trong đó:
 γ =1−α gọi là độ tin cậy
¿ ¿
 Khoảng (θ1 , θ2 ¿ được gọi là khoảng tin cậy
¿ ¿
 I=θ2−θ 1được gọi là độ dài khoảng tin cậy
1.1.2. Ước lượng kỳ vọng toán của đại lượng ngẫu nhiên ( ĐLNN)
Để ước lượng kỳ vọng toán E(X) = µ của ĐLNN X, từ đám đông ta lấy ra mẫu
ngẫu nhiên W= (X1, X2…, Xn). Từ mẫu này ta tìm được trung bình mẫu và phương sai
điều chỉnh, ta sẽ ước lượng µ thông qua trung bình mẫu
a) ĐLNN X phân phối theo quy luật chuẩn với đã biết

( n)
2
σ X−μ
X N ( μ ; σ 2 ) , thì X N μ ; . Suy ra :U = N (0 ; 1)
Do σ
√n
α
TH1: khoảng tin cậy đối xứng của µ (α 1 = α 2= )
2

Với α (0,1) tìm được u α2 thỏa mãn:

P(−u α <U < u α )=1−α


2 2

3
σ σ
Thay U vào  P( X−u α < μ< X +u α )=1−α
2 √n 2 √n

σ
⇒ Khoảng tin cậy phải của μ là( X - ε , X + ε ), sai số ε =u α
2 √n

TH2: khoảng tin cậy phải (ước lượng giá trị tối thiểu)
Với α (0,1) tìm được uα thỏa mãn:
P(U < uα )=1−α
σ
Thay U vào  P(μ> X−u α )=1−α
√n
σ σ
⇒ Khoảng tin cậy phải của μ là( X −uα ; +∞ ), và giá trị tối thiểu của μ là X −uα
√n √n
TH3: khoảng tin cậy trái (để ước lượng giá trị tối đa)
Với α (0,1) tìm được uα thỏa mãn:
P(U >−uα )=1−α
σ
Thay U vào  P(μ< X +uα )=1−α
√n
σ σ
⇒ Khoảng tin cậy phải của μ là(−∞ ; X +u α ;), và giá trị tối đa của μ là X +u α
√n √n
b) ĐLNN X phân phối theo quy luật chuẩn, phương sai chưa biết, n < 30
X−μ
Vì X N ( μ,σ 2) ⇒ T= '
T n-1
s /√ n
TH1: Khoảng tin cậy đối xứng (α 1= α 2= α /2)
Với γ =1- α tìm được t (n−1)
α / 2 thỏa mãn:

P(|T |<t α /2 )=1−α =γ


n−1

s ' n−1 s ' n−1


Thay T ta có: P( X - t α / 2 < μ< X + t α / 2 ) =1- α =γ
√n √n
s ' n−1
⇒ Khoảng tin cậy đối xứng của μ: ( X - ε, X + ε) với ε = t α/ 2
√n
TH2: Khoảng tin cậy phải (α 1= 0, α 2= α ) ước lượng μmin, X max
Với α (0,1) tìm được t n−1
α thỏa mãn:
n−1
P(T <t α )=1−α =γ
s ' n−1
Thay T vào  P( X− t < μ)=1−α =γ
√n α

4
s ' n−1
⇒ Khoảng tin cậy phải của μ( X - ε ,+ ∞ ) với ε = tα
√n
'
s n−1
μmin= X - tα .
√n
s ' n−1
X max= tα + μ
√n
TH3: Khoảng tin cậy trái (α 1= α , α 2= 0) ước lượng μmax, X min
Với α (0,1) tìm được t n−1
α thỏa mãn:
n−1
P(−t α <T )=1−α =γ
s ' n−1
Thay T vào  P( X+ t α < μ)=1−α =γ
√n
s ' n−1
⇒Khoảng tin cậy trái của μ( X + ε; + ∞ ) với ε = tα
√n
s ' n−1
μmax= X + tα
√n
s ' n−1
X min= tα + μ
√n

c) Trường hợp chưa biết quy luật phân phối của X nhưng n > 30
σ2 X −µ
n>30 X ≃ N (μ , )U= ≃ N (0 , 1)
Do n σ
√n

Hoàn toàn tương tự phần 1.1 ta có:


σ
- Khoảng tin cậy đối xứng của µ: ( X - ε, X + ε) với ε = u
√ n α/2
σ σ
- Khoảng tin cậy phải của µ là ( X - ε ,+ ∞ ) với ε = uα (µmin = X - u)
√n √n α
σ σ
- Khoảng tin cậy trái của µ là (- ∞ , X + ε) với ε = uα (µmax = X + u)
√n √n α
1.1.3 Ước lượng tỷ lệ
- Giả sử đám đông có N phần tử với M phần tử mang dấu hiệu A
M
⇒p= là tỷ lệ các phần tử mang dấu hiệu A trên đám đông
N
- Cần ước lượng p: Lấy mẫu có n phần tử với n A phần tử mang dấu hiệu A
nA
⇒f= là tỷ lệ các phần tử mang dấu hiệu A trên mẫu
n

5
f−p
≃ N ( 0 ; 1)
( )
pq U=
- Khi n đủ lớn => f ≃ N p ,
n
. Thống kê: pq
n √
α
TH1: Khoảng tin cậy đối xứng: (α 1=α 2= )
2

Chọn phân vị: u1− α2 =−u α2 ¿ u α2

P( −u α2 <U <u α2 ¿=1−α =γ

 Khoảng tin cậy đối xứng của p:


Do n lớn, lấy p ≈ f ⇒ q ≈1−f

(f −
√ f ( 1−f )
n
uα ; f +
2 √
f ( 1−f )
n
ua)
2

 Khoảng tin cậy đối xứng của f:

( p−
√ pq
n 2
u α ; p+
pq
√u )
n α2

TH2: Khoảng tin cậy trái: (α 1=α , α 2=0 ¿


Chọn phân vị u1−α =−u α thỏa mãn:
P (uα <U ¿=1−α =γ
 Khoảng tin cậy ước lượng p max:
Do n lớn, lấy p ≈ f ⇒ q ≈1−f

(0; f +
√ f ( 1−f )
n
uα ¿

 Khoảng tin cậy ước lượng f min:

( p−
√ pq
u ; 1)
n α̇
TH3: Khoảng tin cậy phải (α 1=0 , α 2=α ¿
Chọn phân vị: uα
P(U < uα )=1−α =γ

 Khoảng tin cậy ước lượng p min:

(f −
√ f ( 1−f )
n
uα ; 1)

 Khoảng tin cậy ước lượng f max:

6
(0; p+
√ pq
u ¿
n α̇

 Sai số ước lượng:

ε=
√ pq
n 2
uα ≈

f (1−f )
n
ua
2

1. 2. Kiểm định giả thuyết thống kê


1.2.1. Khái niệm về kiểm định giả thuyết thống kê
1.2.1.1 Khái niệm chung
Giả thuyết về quy luật phân phối xác suất của đại lượng ngẫu nhiên về giá trị của
tham số của đại lượng ngẫu nhiên hoặc về tính độc lập của các đại lượng ngẫu nhiên
được gọi là giả thuyết thống kê
 Giả thuyết được đưa ra kiểm định được gọi là giả thuyết gốc. Kí hiệu H 0
 Một giả thuyết khác H 0 được gọi là đối thuyết. Kí hiệu là H 1
 H 0 và H 1 lập thành cặp giả thuyết thống kê và lựa chọn theo nguyên tắc nếu
chấp nhận H 0 thì bác bỏ H 1 và ngược lại
Ví dụ: Xét một đại lượng ngẫu nhiên X. Từ một cơ sở nào đó người ta tìm được
E ( X )=μ0 nhưng nghi ngờ về điều này, tùy từng trường hợp cụ thể người ta có thể đưa
ra các cặp giả thuyết khác nhau về E ( X )=μ0:

{ H 0 : μ=μ0
H 1 : μ ≠ μ0
hoặc { H 0 : μ=μ0
H 1 : μ> μ 0
hoặc { H 0 : μ=μ0
H 1 : μ< μ 0

Công việc tiến hành theo một quy tắc hay một thủ tục nào đó để từ một mẫu cụ
thể được lấy ra từ đám đông cho phép ta đi đến quyết định: chấp nhận hay bác bỏ một
giả thuyết thống kê được gọi là kiểm định giả thuyết thống kê.

1.2.1.2 Phương pháp để kiểm định một giả thuyết thống kê


Nguyên tắc chung của việc kiểm định giả thuyết thống kê là sử dụng nguyên lý xác
suất nhỏ: “nếu một biến cố có xác suất khá bé thì trong thực hành ta có thể coi nó
không xảy ra trong một lần thực hiện phép thử”.
a) Tiêu chuẩn kiểm định
Xét một cặp giả thuyết thống kê H 0, H 1. Từ đám đông ta chọn ra một mẫu ngẫu
nhiên kích thước n: W= {X1, X2…, Xn}. Từ mẫu này ta xây dựng một thống kê
G=f ( X 1 , X 2 , … , X n ,θ n)

7
Trong đó θ0 là một tham số liên quan đến H 0 sao cho nếu H 0 đúng thì quy luật phân
phối xác suất của G hoàn toàn xác định. Một thống kê như vậy gọi là tiêu chuẩn kiểm
định (TCKĐ).
b) Miền bác bỏ, quy tắc kiểm định
Giả sử H0 đúng khi đó G có quy luật phân phối xác định, với mức ý nghĩa α khá bé
cho trước ta có thể tìm được miền W α
P(G ∈W α /H 0)=α

Trong đó:
 W α: là miền bác bỏ
 α : mức ý nghĩa
Theo nguyên lý xác suất nhỏ, biến cố (G ∈W α /H 0 ) có thể coi là không xảy ra trong
một lần thực hiện phép thử
Do đó với mẫu cụ thể w=(x1 , x 2 , … , x n) ta tìm được gtn =f (x 1 , x 2 , … , x n ,θ n) mà
gtn ∈ W α thì giả thuyết H0 tỏ ra không đúng, ta có cơ sở để bác bỏ H0

 Quy tắc kiểm định:


 Tính toán gtn =f (x 1 , x 2 , … , x n ,θ n)
 Nếu gtn ∈ W α thì bác bỏ H0, chấp nhận H1
 Nếu gtn ∉ W α thì chưa có cơ sở để bác bỏ H 0 (trong thực hành vẫn chấp nhận H 0)

1.2.1.3 Thủ tục kiểm định giả thuyết thống kê.


Với mức ý nghĩa α xây dựng bài toán kiểm định H0/H1
Với mẫu W =( X 1 , X 2 , … , X n ) xây dựng tiểu chuẩn kiểm định G thích hợp
Tìm miền bác bỏ W α
Tính toán, nếu gtn ∈ W α thì bác bỏ H0, chấp nhận H1
nếu gtn ∉ W α thì ta chấp nhận H0

1.2.1.4 Các loại sai lầm khi kiểm định


Theo quy tắc kiểm định trên ta có thể mắc hai loại sai lầm như sau :
Sai lầm loại một là sai lầm bác bỏ giả thuyết H 0 khi chính H 0 đúng . Ta thấy xác
suất mắc sai lầm loại một bằng α . Thật vậy , theo quy tắc kiểm định trên , từ một mẫu
cụ thể sau khi tính được gtn mà thấy gtn ∈ Wα thì bác bỏ H 0. Nhưng thực ra theo công
thức thì biến cố (GϵWα /H 0 ¿ vẫn có thể sảy ra với xác suất bằng α .α được gọi là mức
định nghĩa

8
Sai lầm loại hai là sai lầm chấp nhận H 0 khi chính nó sai . Nếu ký hiệu xác suất
mắc sai lầm loại hai là β thì ta có :
P(Gϵ W α /H 1 ¿=β
Vì biến cố (Gϵ W α / H 1) và biến cố (G∈Wα / H 1 ¿ là hai biến cố đối lập nên,
P(GϵWα /H 1 ¿=1−β
Xác suất 1- β được gọi là lực kiểm định
Sai lầm loại một và sai lầm loại hai có quan hệ mật thiết với nhau:
Khi kích thước mẫu xác định ,nếu giảm α thì β tăng và ngược lại . Do đó không thể lấy
α tùy ý được.

Tuy nhiên với TCKĐ xác định, một khích thước mẫu cho trước và mức ý nghĩa
α xác định ta có thể tìm được miền Wα sao cho xác suất mắc sai lầm lần hai β bé nhất
( tức là lực kiểm định lớn nhất). Những miền bác bỏ mà ta sẽ sử dụng sau này đều làm
cực tiểu sai lầm loại hai trong những điều kiện nói trên.

1.2.2 Kiểm định giả thuyết về các tham số


1.2.2.1 Kiểm định giả thuyết về kỳ vọng toán của một ĐLNN
Giả sử ĐLNN X có E(X)=µ, Var(X) = σ 2 với µ chưa biết. Với mức ý nghĩa α ta
kiểm định giả thuyết H 0 : μ=μ 0
Lấy mẫu W =( X 1 , X 2 , … X n ) ta có:
n n
1 1
x= ∑ X i ; s 2= ∑ 2

n i=1 n−1 i=1


( x i−x )

a) ĐLNN X có phân phối chuẩn σ 2 đã biếtt:


Do X có phân phối chuẩn với σ 2 đã biết nên ta có :

( )
2
σ
X N μ;
n

Tiêu chuẩn kiểm định:


X−u0
U=
σ
√n
Nếu H 0 đúng thì U~N(0;1)

9
{ H 0 : μ=μ0
Bài toán 1: H : μ ≠ μ
1 0

Với mức ý nghĩaα ta tìm được phân vị chuẩn uα ∕ 2


p (|U|> uα ∕ 2) =α
Do α khá bé theo nguyên lý xác suất nhỏ ta có thể coi biến cố (|U |>uα ∕ 2 ) không xảu ra
trong 1 lần thực hiện phép thử.
x−μ0
utn =
Nên nếu trong 1 lần lấy mẫu ta tìm được σ mà ( utn >uα ∕ 2 )thì giả thuyết H 0 tỏ ra
√n
không đúng, ta có cơ sở bác bỏ H 0
Ta có miền bác bỏ:W α ={utn :|utn|> uα ∕ 2 }
Quy tắc kiểm định
 Nếu utn ∈ W α ta bác bỏ H 0 chấp nhận H 1
 Nếu utn ∉ W α ta chấp nhận H 0 bác bỏ H 1

{ H 0 : μ=μ0
Bài toán 2: H : μ> μ
1 0

Với mức ý nghĩaα ta tìm được phân vị chuẩn uα


P ( U >u α ) =α
Do α khá bé theo nguyên lý xác suất nhỏ ta có thể coi biến cố ( U >u α ) không xảu ra
trong 1 lần thực hiện phép thử.
x−μ0
utn =
Nên nếu trong 1 lần lấy mẫu ta tìm được σ mà ( utn >uα )thì giả thuyết H 0 tỏ ra
√n
không đúng, ta có cơ sở bác bỏ H 0
Ta có miền bác bỏ: W α ={ utn :utn >uα }
Quy tắc kiểm định:
 Nếu utn ∈ W α ta bác bỏ H 0 chấp nhận H 1
 Nếu utn ∉ W α ta chấp nhận H 0 bác bỏ H 1

{ H 0 : μ=μ0
Bài toán 3: H : μ< μ
1 0

Với mức ý nghĩaα ta tìm được phân vị chuẩn uα


P ( U <−u α ) =α
Do α khá bé theo nguyên lý xác suất nhỏ ta có thể coi biến cố ( U ←u α ) không xảu ra
trong 1 lần thực hiện phép thử.

10
x−μ0
utn =
Nên nếu trong 1 lần lấy mẫu ta tìm được σ mà ( utn ←uα )thì giả thuyết H 0 tỏ ra
√n
không đúng, ta có cơ sở bác bỏ H 0
Ta có miền bác bỏ: W α ={ utn :utn ←uα }
Quy tắc kiểm định:
 Nếu utn ∈ W α ta bác bỏ H 0 chấp nhận H 1
 Nếu utn ∉ W α ta chấp nhận H 0 bác bỏ H 1
b) Chưa biết quy luật phân phối của ĐLNN X, n>30
 Do X chưa biết quy luật phân phối, n>30 nên ta có:

( )
2
σ
X ≅ N μ;
n
X−μ0
U=
XDTCKĐ: σ
√n
Nếu H 0 đúng thì U ≈ N (0 , 1)
Do đó các bài toán kiểm định được giải quyết giống trường hợp 2.1.1 và ta lấy σ ≈ s'
c) ĐLNN X có phân phối chuẩn với σ 2 chưa biết
 Do X có phân phối chuẩn với σ 2 chưa biết nên
X−μ 0
T=
XDTCKĐ: S'
√n
Nếu H 0 đúng thì T T (n−1)

{ H 0 : μ=μ0
Bài toán 1: H : μ ≠ μ
1 0

Với mức ý nghĩaα ta tìm được phân vị chuẩn t (n−1)


α/ 2

P (|T |>t (n−1)


α / 2 ) =α

Do α khá bé theo nguyên lý xác suất nhỏ ta có thể coi biến cố |T |>t (n−1)
α / 2 không xảy ra

trong 1 lần thực hiện phép thử.


X −μ0
t tn =
S ' mà (|t tn|>t α /2 )thì giả thuyết H 0 tỏ
(n−1)
Nên nếu trong 1 lần lấy mẫu ta tìm được
√n
ra không đúng, ta có cơ sở bác bỏ H 0
Ta có miền bác bỏ:W α ={t tn :|t tn|> t α /2 }
(n−1)

Quy tắc kiểm định:


 Nếu utn ∈ W α ta bác bỏ H 0 chấp nhận H 1
 Nếu utn ∉ W α ta chấp nhận H 0 bác bỏ H 1
11
{ H 0 : μ=μ0
Bài toán 2: H : μ> μ
1 0

Với mức ý nghĩaα ta tìm được phân vị chuẩn t (n−1)


α

P ( T >t (n−1)
α )=α
Do α khá bé theo nguyên lý xác suất nhỏ ta có thể coi biến cố T > t (n−1)
α không xảu ra
trong 1 lần thực hiện phép thử.
X −μ0
t tn =
S ' mà ( t tn >t α )thì giả thuyết H 0 tỏ ra
(n−1)
Nên nếu trong 1 lần lấy mẫu ta tìm được
√n
không đúng, ta có cơ sở bác bỏ H 0
Ta có miền bác bỏ:W α ={t tn :t tn >t (n−1)
α }
Quy tắc kiểm định:
 Nếu utn ∈ W α ta bác bỏ H 0 chấp nhận H 1
 Nếu utn ∉ W α ta chấp nhận H 0 bác bỏ H 1

{ H 0 : μ=μ0
Bài toán 3: H : μ< μ
1 0

Với mức ý nghĩaα ta tìm được phân vị chuẩn t (n−1)


α

P ( T <−t (n−1)
α )=α
Do α khá bé theo nguyên lý xác suất nhỏ ta có thể coi biến cố T ←t (n−1
α
)
không xảu ra
trong 1 lần thực hiện phép thử.
X −μ0
t tn =
S ' mà ( t tn ←t α )thì giả thuyết H 0 tỏ ra
(n−1 )
Nên nếu trong 1 lần lấy mẫu ta tìm được
√n
không đúng, ta có cơ sở bác bỏ H 0
Ta có miền bác bỏ:W α ={t tn :t tn ←t (n−1)
α }
Quy tắc kiểm định:
 Nếu utn ∈ W α ta bác bỏ H 0 chấp nhận H 1
 Nếu utn ∉ W α ta chấp nhận H 0 bác bỏ H 1

1.2.2.2 So sánh 2 kì vọng toán của 2 ĐLNN


Xét 2 Đlnn X 1, X 2 Ký hiệu E ( X 1) =μ1, E ( X 2) =μ2, Var ( X 1 ) =σ 1 , Var ( X 2 ) =σ 2 . Trong đó
2 2

μ1 μ2chưa biết. Với mức ý nghĩa α cho trước ta cần kiểm định giả thuyết H 0 : μ1=μ2.

 Chọn từ đám đông thứ nhất ra mẫu kích thước n1 :W 1=( X 11 , X 12 ,… X 1 n ). Từ đó ta 1

tính được

12
n1 n1
1 1
X 1 = ∑ X 1 i và S1 = ∑
2 2
(X 1i −X 1) .
n 1 i=1 n1−1 i=1

 Chọn từ đám đông thứ nhất ra mẫu kích thước n2 :W 2=( X 21 , X 22 , … X 2 n ). Từ đó ta2

tính được
n2 n2
1 1
X 2 = ∑ X 2 i và S12= ∑ ( X 2i −X 2 )2 .
n 2 i=1 n2−1 i=1

Ta xét các trường hợp sau:


a) X 1 , X 2 đều có phân phối chuẩn với các phương sai σ 12 , σ 22 đã biết
Theo… ta có :
X 1−X 2−( μ 1−μ2 )
U= N (0 ,1)


2 2
σ1 σ2
+
n 1 n2

Nên, nếu H 0 đúng thì


X 1 −X 2
U= N (0 , 1)


2 2
σ1 σ2
+
n1 n2

Ta có:

1
{ 1
H 0 : μ 1=μ2
Bài toán 1: H : μ ≠ μ
2

Với miền bác bỏ:W α ={utn :|utn|> uα ∕ 2 }


X 1−X 2
utn =
Trong đó

2 2
σ 1 σ2
+
n1 n2

1
{ 1
H 0 : μ 1=μ2
Bài toán 2: H : μ > μ
2

Với miền bác bỏ: W α ={ utn :utn >uα }

1
{ 1
H 0 : μ 1=μ2
Bài toán 3: H : μ < μ
2

Với miền bác bỏ: W α ={ utn :utn ←uα }


b) Chưa biết quy luật phân phối xác suất của X 1 , X 2 nhưng n1 >30,n2 >30
2 2
σ σ
Vì n1 >30,n2 >30 nên X 1 ≅ N (μ 1 , 1 ), X 2 ≅ N (μ 2 , 2 )
n1 n2

13
X 1−X 2−( μ 1−μ2 )
U= ≅ N (0 , 1)
Ta có:

2 2
σ1 σ2
+
n 1 n2

(làm như phần a)


c) X 1 , X 2 đều có phân phối chuẩn với các phương sai σ 12 , σ 22 chưa biết, Kích thước
mẫu nhỏ
( X 1−X 2 )−( μ1−μ2 )
T= T (n 1+ n2−2)

√ √
2 2
( n1 −1 ) S ' 1 + ( n2−1 ) S ' 2 1 1
+
n1+ n2−2 n 1 n2

Nên nếu H 0 đúng thì


( X 1−X 2)
T= T (n 1+ n2−2)

√ √
2 2
( n1 −1 ) S ' 1 + ( n2−1 ) S ' 2 1 1
+
n1+ n2−2 n 1 n2

Ta có:

1
{ 1
H 0 : μ 1=μ2
Bài toán 1: H : μ ≠ μ
2

Với miền bác bỏ:W α ={t tn :|t tn|> t α /2 }


(n1+n2−2)

(X 1−X 2 )
t tn =

√ √
2 2
Trong đó: ( n1−1 ) S ' 1 + ( n2−1 ) S ' 2 1 1
+
n1 +n 2−2 n1 n 2

1
{ 1
H 0 : μ 1=μ2
Bài toán 2: H : μ > μ
2

Với miền bác bỏ:W α ={t tn :t tn >t α }


(n1+ n2−2 )

1
{ 1
H 0 : μ 1=μ2
Bài toán 3: H : μ > μ
2

Với miền bác bỏ:W α ={t tn :t tn ←t α }


(n1+n2−2)

14
CHƯƠNG II KẾT QUẢ NGHIÊN CỨU
2.1. Kết quả điều tra:
Tiến hành khảo sát điều tra mẫu về các bạn sinh viên Trường Đại học Thương
Mại để giải quyết các đề tài với mức ý nghĩa 5% và độ tin cậy 95%

2.1.1. Sau khi thu thập dữ liệu, nhóm thu được kết quả như sau:

Tổng số sinh viên khảo sát (người) 116

Sinh viên đang đi làm thêm (người) 78

Sinh viên không đi làm thêm (người) 38

2.1.2. Kết quả nghiên cứu mức thu nhập hàng tháng của các bạn sinh viên đang đi làm
thêm như sau:

Mức thu nhập A<2 2≤A≤4 A>4


(triệu/tháng)

Sinh viên đang đi làm thêm 27 35 16


(người)

Ta có bảng số liệu sau:

xi ni xini xi2 ni

1 27 27 27

3 35 105 315

5 16 80 400

Tổng 78 2915 742

15
2.1.3. Kết quả nghiên cứu mức chi tiêu hàng tháng của các bạn sinh viên như sau:

Mức
Chi tiêu B
(triệu/tháng) B<1 1≤B≤2 2≤B≤3 B>3

Sinh viên (người)

Đang đi làm thêm 6 35 14 23

Không đi làm thêm 4 10 14 10

Ta có bảng số liệu sau:

Sinh viên đang đi làm thêm: Sinh viên không đi làm thêm:

xi ni xini xi2 ni xi ni xini xi2 ni

0.5 6 3 1.5 0.5 4 2 1

1.5 35 52.5 78.75 1.5 10 15 22.5

2.5 14 35 87.5 2.5 14 35 87.5

3.5 23 80.5 281.75 3.5 10 35 122.5

Tổng 78 171 449.5 Tổng 78 87 233.5

2.2. Kết quả giải quyết vấn đề:


2.2.1 Vấn đề 1: Ước lượng tỷ lệ các bạn sinh viên đang đi làm thêm
Lời giải:
Ý nghĩa α=5%
Độ tin cậy γ=95%
Gọi f là tỷ lệ sinh viên đang đi làm thêm trên mẫu.
Gọi p là tỷ lệ sinh viên đang đi làm thêm trên đám đông.

16
Vì n = 116 khá lớn nên f có phân phối xấp xỉ chuẩn.

(
f ≃N p,
pq
)⇒U =
f−p
≃ N (0 , 1)


n pq
n

Ta tìm được uα /2 sao cho: P (|U|< uα/ 2 ) ≈ 1−α


Thay biểu thức của U vào công thức trên và biến đổi tương đương ta có:

P(|f − p|<
√ pq
u ) ≈ 1−α
n α/ 2
⟺ P(f −ε < p< f + ε )≈ 1−α

Trong đó: ε =
√ pq
.u
n α/ 2
78
Vì p chưa biết, n lớn nên ta lấy: p ≈ f = =0 ,78 ; q ≈ 1−f =0 , 22
100
Mặt khác ta có: 1−α=0 , 95⟹ α /2=0,025

Tra bảng ta có u0,025=1 , 96 nên ε ≈


√ 0 ,78.0 , 22
116
.1 , 96=0,0385.1 , 96=0,0754

Thay số vào ta có:


0 , 78−0,0754< p< 0 ,78+ 0,0754 hay 0,7046< p <0,8554

Kết luận: Với độ tin cậy 0,95 ta có thể nói rằng tỷ lệ sinh viên đang đi làm thêm của
Trường Đại học Thương mại nằm trong khoảng (0,7046 ; 0,8554).

2.2.2. Vấn Đề 2: Ước lượng thu nhập trung bình hàng tháng của các bạn sinh
viên đang đi làm thêm
Ý nghĩa α=5%
Độ tin cậy γ=95%
Gọi X là thu nhập hàng tháng của các bạn sinh viên đang đi làm thêm
μ là thu nhập trung bình hàng tháng của các bạn sv đang đi làm thêm

x̄ là thu nhập trung bình hàng tháng của các bạn sv đang đi làm thêm trên mẫu
Do n=78 > 30, X chưa biết quy luật nên XDTK:
x̄ – μ
U= σ ≈ N ( 0 , 1 )
√n
Chọn phân vị = Uα/2 =U0,05/2=1,96

17
1 1
x̄ = *∑ ¿∗xi = *212=2,72
n 78

2 1
s' = *[ 742 – 78*(2.72 ¿ ¿2] = 2,14
78−1
 s’=1,46
 Khoảng tin cậy đối xứng μ :
1, 46 1 , 46
(2 , 72− ∗1 , 96 ; 2 ,72+ ∗1 , 96) = (2,396 ; 3,044)
√78 √ 78
Kết luận: thu nhập trung bình của các bạn sinh viên đang đi làm thêm ĐHTM là
(2,396 ; 3,044) (triệu đồng)

2.2.3. Vấn đề 3: So sánh mức chi tiêu trung bình hàng tháng của nhóm các bạn
đang đi làm thêm và nhóm còn lại
2.2.3.1. Ước lượng mức chi tiêu trung bình hàng tháng của nhóm các bạn đang đi
làm thêm:
Ý nghĩa α=5%
Độ tin cậy γ=95%
Gọi X là mức chi tiêu hàng tháng của các bạn sinh viên đang đi làm thêm
μ là mức chi tiêu trung bình hàng tháng của các bạn sv đang đi làm thêm trên đám
đông
x̄ là mức chi tiêu trung bình hàng tháng của các bạn sv đang đi làm thêm trên mẫu
Ta có γ =0.95, n=78
k
1
X= . ∑ x . n =2.19
n i=1 i i

S’=
√ 1
n−1
. ¿ ¿= 0.989

Vì n=78>30 nên:

( )
2
σ X−μ
X ≃ N μ, ⇒U = ≃ N (0 ,1)
n σ
√n
Chọn phân vị U 1− α2 =−U α2

P(−u α <U < u α )=1−α =γ


2 2

σ σ
⇒ P( x − .u α < μ< x + . u α )=γ
√n 2 √n 2

18
⇒ khoảng tin cậy đối xứng của μ : x−
( σ
.u α ; x+
√n 2
σ
.u α
√n 2 )
Với n=78, X =2.19 , σ ≈ S ' =0.989 ,
γ =0.95⇒ α =0.05 , u α =u0.025=1.96 , ta có:
2

(2.19− 0.989
√78
x 1.96 ; 2.19+
0.989
√ 78
x 1.96
)
⇒ (1.97 ; 2.4)
Vậy mức chi tiêu trung bình của các bạn sinh viên đang đi làm thêm ĐHTM là (1.97 ;
2.4) (triệu đồng)

2.2.3.2. Ước lượng mức chi tiêu trung bình hàng tháng của nhóm các bạn không đi
làm thêm
Ý nghĩa α=5%
Độ tin cậy γ=95%
Gọi X là mức chi tiêu hàng tháng của các bạn sinh viên không đi làm thêm
μ là mức chi tiêu trung bình hàng tháng của các bạn sv không đi làm thêm trên đám
đông
x̄ là mức chi tiêu trung bình hàng tháng của các bạn sv không đi làm thêm trên mẫu
Ta có γ =0.95, n=38
k
1
X= . ∑ x . n =2.29
n i=1 i i

S’=
√ 1
n−1
. ¿ ¿=0,961

Vì n = 38 > 30 nên:

( )
X ≃ N μ,
σ2
n
⇒U =
X−μ
σ
≃ N (0 ,1)

√n
Chọn phân vị U 1− α2 =−U α2

P(−u α <U < u α )=1−α =γ


2 2

σ σ
⇒ P( x − .u α < μ< x + . u α )=γ
√n 2 √n 2

⇒ khoảng tin cậy đối xứng của μ : x−


( σ
.u α ; x+
√n 2
σ
.u α
√n 2 )
19
Với n=38, X =2.29 , σ ≈ S ' =0.961 ,
γ =0.95⇒ α =0.05 , u α =u0.025=1.96 , ta có:
2

(2.29− 0.961
√38
x 1.96 ; 2.29+
0.961
√ 38
x 1.96
)
⇒(1.98 ; 2.59)
Vậy mức chi tiêu trung bình của các bạn sinh viên không đi làm thêm ĐHTM là
(1.98 ; 2.59) (triệu đồng)

2.2.3.3. So sánh mức chi tiêu trung bình hàng tháng của nhóm các bạn đang đi làm
thêm và nhóm còn lại
Gọi
X 1 là mức chi tiêu hàng tháng của các bạn sinh viên đang đi làm thêm

X 2 là mức chi tiêu hàng tháng của các bạn sinh viên không đi làm thêm

Ta có: n1=78 , X 1=2.19 , S '21=0.978


'2
n2 =38 , X 2=2.29 , S 2 =0.923

Có cặp giả thuyết thống kê: { H 0 : μ =μ


1

H 1 : μ1 ≠ μ 2
2

Giả sử giả thuyết H 0 đúng thì ta có thống kê:


X 1−X 2
U= ∼ N (0 ,1)


2 2
σ1 σ 2
+
n 1 n2

Ta có miền bác bỏ: W α ={utn :|utn|> u α2 }

Ta thay các giá trị trên, với σ ≈ s ' ta có:


2.19−2.29
utn = =−0.521

√ 0.978 0.923
78
+
38

Với mức ý nghĩa α =5 %=0.05 , ta có u α2 =U 0.025=1.96

⇒ u tn ∉W α ⇒chưa đủ cơ sở để ta bác bỏ H 0

Kết luận: Với mức ý nghĩa 5%, mức chi tiêu trung bình hàng tháng của nhóm các bạn
đang đi làm thêm và nhóm còn lại là như nhau.

20
2.2.4. Vấn đề 4 Liệu rằng mức chi tiêu trung bình hàng tháng của các bạn sinh
viên đang đi làm thêm có đến 3 triệu đồng hay không?
Tóm tắt bài toán: n= 78; μ0 = 3; α= 0,05
Gọi X là mức chi tiêu trong một tháng của một sinh viên đang đi làm thêm
μ là mức chi tiêu trung bình trong một tháng của một sinh viên đang đi làm thêm
trên đám đông
X là mức chi tiêu trung bình trong một tháng của một sinh viên đang đi làm thêm
trên mẫu
Bước 1: Xây dựng tiêu chuẩn kiểm định
Với mức ý nghĩa α = 0,05 cần kiểm định H0: μ = μ0 (=3)
H1: μ < μ0
2
σ
Vì n = 78 > 30 nên X ≃ N (μ; )
n
X−μO
XDTCKĐ: U = σ
√n
Bước 2: Với α= 0,05 cho trước ta tìm được phân vị chuẩn Uα sao cho
P (U < - Uα ) = α
Vì α khá bé nên ta có miền bác bỏ:
X−μO
Wα = { Utn : Utn < - Uα } trong đó Utn = σ
√n
Tính toán và kết luận
α = 0,05 → Uα = 1,65
n
1 57
X= ∑
n i=1
X i ni =
26
= 2,19 (triệu đồng)

1
S'2 = ¿ - n X 2 ) = 0,97
n−1
→S’ = 0,984
Vì n đủ lớn → σ ≈ S’ = 0,984
X−μO 2 ,19−3
⇨Utn = σ = σ = -7,27 < -1,65 → Utn ∈ Wα nên ta bác bỏ H0
√ n √ n

21
Kết luận: Với mức ý nghĩa 0,05 ta có thể nói rằng mức chi tiêu trung bình hàng tháng
của các bạn đang đi làm thêm thấp hơn 3 triệu đồng, tức định mức trên là cao hơn so
với thực tế.

22
CHƯƠNG III KẾT LUẬN
3.1. Tóm tắt kết quả nghiên cứu
Sau khi thực hiện khảo sát các bạn sinh viên đại học Thương Mại và qua
phương pháp ước lượng và kiểm định ta thấy:
 Với độ tin cậy cao (0,95) ta có thể nói rằng tỷ lệ sinh viên đang đi làm thêm của
Trường Đại học Thương mại nằm trong khoảng (0,7046 ; 0,8554)
Qua khảo sát 116 bạn sinh viên có 78 bạn sinh viên đang đi làm thêm. Ta thấy
số lượng sinh viên đang đi làm thêm tại trường đại học Thương Mại khá cao,
điều này cho biết các bạn sinh viên rất để tâm đến việc trải nghiệm cuộc sống từ
rất sớm hoặc để có thêm kinh nghiệm và kĩ năng cho ngành học của mình.
 Qua khảo sát và ước lượng thu nhập hàng tháng của các bạn sinh viên đang đi
làm thêm ta có thể thấy thu nhập trung bình của các bạn sinh viên dao động
trong khoảng từ 2-3 triệu đồng. Với sinh viên thì thu nhập này thì không quá
thấp cũng không quá cao vì đa số các bạn sinh viên đều làm công việc bán thời
gian, mức thu nhập đó có thể phục vụ hầu như đầy đủ nhu cầu của 1 sinh viên
trong 1 tháng.
 Sau khi so sánh mức chi tiêu hàng tháng của các bạn đang đi làm thêm và nhóm
còn lại ta thấy mức chi tiêu của họ là như nhau
 Qua khảo sát và kiểm định ta thấy mức chi tiêu của các bạn đang đi làm thêm là
thấp hơn 3 triệu đồng. Kết quả này cho thấy mức ý nghĩa là 0,05, tức là có khả
năng xảy ra ngẫu nhiên. Vì vậy, không thể kết luận rằng mức chi tiêu trung bình
hàng tháng của các bạn đi làm thêm thấp hơn 3 triệu đồng dựa trên kết quả này.
Cần phải thu thập thông tin và dữ liệu bổ sung để có được kết luận chính xác
hơn về mức chi tiêu của nhóm này.
3.2. Kết luận chung
Vậy sau khi khảo sát ta có thể đánh giá được số lượng sinh viên đi làm thêm
cũng như mức chi tiêu của các nhóm đối tượng được khảo sát tại đại học Thương Mại.
Tỉ lệ sinh viên đi làm thêm cao cho biết về nhu cầu kiếm thêm thu nhập của sinh viên
hiện nay. Còn về mức thu nhập chênh lệch do các vấn đề liên quan đến thời gian làm
việc, kĩ năng hay ngành học

23
TÀI LIỆU THAM KHẢO
1. Trần Lệ Trương (1971), Giáo trình xác suất thống kê, Trường Thương nghiệp
Trung ương.
2. Mai Chi (2008), Lý thuyết xác suất và thống kê toán, Trường Đại học Thương mại.

24

You might also like