You are on page 1of 27

PHẦN II: THỐNG KÊ TOÁN

1. Cơ sở lý thuyết mẫu
2. Ước lượng tham số
3. Kiểm định giả thuyết thống kê.
CHƯƠNG I: CƠ SỞ LÝ THUYẾT MẪU

1. Tổng thể và mẫu


2. Cách trình bày 1 mẫu
3. Các đặc trưng mẫu
4. Những phương pháp xác suất của đặc trưng mẫu
5. Suy diễn thống kê (SV tự đọc)
Thống kê là gì?

Có thể nghiên cứu dân số của 1 quốc gia theo các đặc điểm
sau:

Tuổi tác Trình độ văn hoá

Địa bàn cư trú Nghề nghiệp


Tuổi, trình độ văn hoá: dấu hiệu định lượng.

Địa bàn, nghề nghiệp: dấu hiệu định tính.

Nhược điểm?
Thống kê mô tả: Là bước đầu của thống kê, có mục đích
thu thập và hệ thống hoá số liệu, tính các số đặc trưng thực
nghiệm, và tìm ra quy luật phân phối thực nghiệm của hiện
tượng cần nghiên cứu.

A. Tổng thể
Toàn bộ tập hợp các phần tử đồng nhất theo một dấu hiệu
nghiên cứu định tính hoặc định lượng nào đó, được gọi là
Tổng thể nghiên cứu hay tổng thể.

Số phần tử của tổng thể nghiên cứu: kích thước của tổng
thể (hữu hạn hoặc vô hạn).
Ví dụ:
B. Mẫu ngẫu nhiên
1. ĐN mẫu ngẫu nhiên
Giả sử cần nghiên cứu bnn X. Bnn X phải có QLPP xác suất
thông qua bảng PPXS hoặc hàm phân bố hay hàm mật độ
xs. Bnn X có các đặc trưng EX (μ), DX (σ2) và xác suất p (X
thuộc tập A).
Đối với X thì 3 tham số μ, σ2, p tồn tại nhưng ta chưa biết
chính xác giá trị của chúng và muốn tìm.
Để làm: thu thập các thông tin về X bằng các quan sát độc
lập về X. Gọi Xi là bnn chỉ việc quan sát thứ i, khi đó nhận
được W =(X1, X2, … , Xn) đgl mẫu ngẫu nhiên cỡ n. Mẫu có
tính chất
E(Xi) = μ; V(Xi) = σ2
3. Cách trình bày 1 mẫu

Tổng quát: Sắp xếp số liệu thành dãy (x1,x2,…,xn) thoả mãn

x1 ≤ x2 ≤ … ≤ xn.

3.1 Trường hợp mẫu (x1, x2, …, xn) có ít các xi khác


nhau: ta thu gọn mẫu thành bảng phân bố tần số như sau:
X x1’ x2 ’ …. xk ’
Tần số n1 n2 … nk
Tần suất n1/n n2/n …. nk/n

Với xi’ là tất cả các số liệu trong mẫu thoả mãn :

x1’ < x2’ < … <xk’. ni = số các xj trong mẫu bằng xi’. Có Σ ni = n.
Ví dụ 4: Giá của một mặt hàng sau tết tại 8 cửa hàng như
sau:

(95, 109, 99, 98, 105, 99, 109, 102). Hãy lập bảng tần số và
biểu đồ tần suất.

3.2. Trường hợp mẫu có nhiều các xi khác nhau: Ta


chọn k khoảng [ai-1, ai): i = 1..k sao cho
!
!!! [!!!! , !! ) !ℎứ! !ọ! !! và giao của 2 khoảng bất kỳ là rỗng

Bảng phân bố tần số ghép lớp:


X a0 -> a1 a1 -> a2 … ak-1 -> ak
Tần số n1 n2 … nk

Theo Sturges (1926): số lớp ghép hợp lý:

k = 1 + log2 n ≈ 1 + 3.32 lg n
Ví  dụ  
Ví dụĐo  chiều  cao  của  36  sinh  viên  nam  của  một
5: Đo chiều cao của 36 sinh viên nữ trường: của một trường,
được số liệu sau:
160 161 161 162 162 162 163 163 163
160 161 161 162 162 162 163 163 163 164 164 164
164 164 164 164 165 165 165 165 165
166
164 165 165 166 166
165 165 165166
166 166167166167
166 168
167 167168 168
168 169 169 170 171 171 172 172 174
168 168 168 168 169 169 170 171 171 172 172 174
Ta  có  bảng  phân  bố  tần  số  ghép  lớp  
Bảng phân bố tần số ghép lớp:
Chiều   159,5-162,5 162,5-165,5 165,5-168,5 168,5- 171,5 171,5-174,5
cao
Tần  số 6 12 10 5 3
3.3. Nếu ở mỗi lớp ghép, trong mỗi khoảng thứ I, chọn một
số xi’ làm đại diện- xi’ = trung điểm của 2 đầu mút của
khoảng- => có bảng tần số:

X x1’ x2’ … xk’


Tần số n1 n2 … xk

Ví dụ 6: Vẫn ví dụ trên, ta có bảng phân bố tần số sau:

Chiều 161 164 167 170 173


cao
Tần số 6 12 10 5 3
4. Một số thống kê đặc trưng của mẫu

Xét mẫu ngẫu nhiên: (X1,X2,…, Xn) .

Một hàm của mẫu ngẫu nhiên (X1,X2,…, Xn) được gọi là
thống kê, ký hiệu

G = f(X1,X2,…, Xn)
.
MỘT SỐ THỐNG KÊ THÔNG DỤNG

4.1. Trung bình mẫu


! ! ! !
!= !!! !! =! !!! !! !! !!!
! !

Nếu E Xi = μ; V Xi = σ2 thì:
!!
! ! = !, ! ! =
!

Độ lệch chuẩn của TBM, dùng để phản ánh sai số của ước
lượng, thường gọi là sai số chuẩn của TBM:
!
Se X =
n
4.2. Độ lệch bình phương trung bình

4.3. Phương sai mẫu S2

Độ lệch chuẩn mẫu: S

S = (S2)1/2
— Tạo bang tần số
table(x)

— Tính các giá trị đặc trưng mẫu:


mean(x) # gia tri trung binh mau - x
ngang

sd(x) # do lenh chuan mau - s

var(x) # phuong sai mau - s^2

median(x) #cho tring vị md


4.4. Thực hành tính các đặc trưng

570ES plus:mode -> 3 -> 1 -> on -> shift -> 1 -> 5 ->2
580 VNX: mode -> 6 -> 1 -> AC -> OPTN -> mũi tên xuống -> 4 -
>Q
x = c(rep(2.3,2),
rep(2.8,6),rep(3,15),rep(3.5,10),rep(4,10),rep(4.5,
5))

570 ES plus: shift -> mode-> mũi tên xuống -> 4 ->1 -> mode -> 3 -> 1
rồi nhập số liệu
AC -> shift -> 1 -> 4 ->1 (2,3,4) ra n (TRUNG BÌNH MẪU, căn của MS, S)
580 VNX: Shift -> menu -> mũi tên xuống -> 3 -> 1-> menu -> 6 ->1
rồi nhập số liệu
AC-> optn ->2-> (ra các giá trị đặc trưng của mẫu)
5. Những phân phối xác suất của một số thống kê đặc
trưng mẫu

+ Nếu X tuân theo quy luật phân phối chuẩn, biết σ:

(1)

+ Nếu X tuân theo quy luật phân phối chuẩn, không


biết σ:

(2)

+Nếu X tuân theo quy luật phân phối bất kỳ với n > 30:

(3)
+ Nếu X tuân theo quy luật phân phối chuẩn, biết μ:

(4)

+ Nếu X tuân theo quy luật phân phối chuẩn, không biết μ:

(5)

+Nếu dấu hiệu nghiên cứu phân phối theo quy luật không-
một. Tần suất f sẽ phân phối theo quy luật không-một, với
các tham số E(f) = p, D(f) = [p(1-p)]/n với p là xác suất (cơ
cấu) của tổng thể. Thì tần suất sẽ xấp xỉ phân phối chuẩn với
E(f) = p, D(f) = [p(1-p)]/ n.

(6)
6. Suy diễn thống kê

Quy luật phân phối xác suất của các thống kê đặc trưng
mẫu phản ánh mối liên hệ chặt chẽ giữa các tham số của
mẫu với các tham số tương ứng của tổng thể nghiên cứu.

Suy diễn thống kê: Nếu đã biết quy luật phân phối xác suất
cũng như các tham số đặc trưng của tổng thể, ta dùng các
kết quả đó để suy đoán các tính chất của mẫu ngẫu nhiên
rút ra từ tổng thể (Từ tổng thể rút ra kết luận về mẫu).

— X=c(rep(825,5), rep(875,10),,,,)
— Mean(x) histogram(x)

— sd(x)
6.1. Suy diễn về mẫu ngẫu nhiên rút ra từ tổng thể
phân phối chuẩn

Giả sử dấu hiệu nghiên cứu của tổng thể, mô hình hoá bởi
bnn phân phối theo quy luật chuẩn N(μ, σ2).

— Suy đoán về giá trị của trung bình mẫu trong hợp
BNN X tuân theo quy luật chuẩn và biêt σ

Xét thống kê

U phân phối theo quy luật chuẩn N(0,1). Với xác suất 1 – α
cho trước, tìm được α1, α2 sao cho α1 + α2 = α và các giá trị
tới hạn

(1)
Suy ra:

![!!!!! < !U <!u!! ] = !1 − !!!


Hay

! !
! ! −! !!! <!! < !! +! !!! = !1 − !!!
! !

Bài toán:

1. Tìm xác suất sao cho TBM (phương sai mẫu, tỷ lệ mẫu)
thuộc khoảng (a,b) ( >a; <b)?

2. Giả sử biết xác suất để TBM (phương sai mẫu, tỷ lệ mẫu)


thuộc khoảng nào đó đã biết, cần tìm khoảng đó?
Ví dụ 1: Một công ty sản xuất chi tiết máy với khối lượng chi
tiết là bnn phân phối chuẩn có khối lượng đóng gói trung
bình là 340 gam và độ lệch chuẩn là 10 gam. Lấy ngẫu nhiên
16 chi tiết để kiểm tra.

a. Tìm xác suất để khối lượng trung bình của các chi tiết
nằm trong khoảng từ 335 gam đến 345 gam?

b. Tìm xác suất để khối lượng trung bình của các chi tiết
lớn hơn 340 gam?

c. Với xác suất 0.99 thì khối lượng trung bình của các chi
tiết đó nằm trong khoảng nào xung quanh giá trị trung
bình?
a.

+X: TRọng lượng gói mỳ (gam); X ≈ N(340, 102);

+ Tìm xác suất để trung bình mẫu thuộc (335, 345):


570ES plus:

mode -> 3 -> 1 -> on -> shift -> 1 -> 5 ->2

580 VNX
mode -> 6 -> 1 -> AC -> OPTN -> mũi tên xuống -> 4 -
>Q
b. Để trung bình mẫu lớn hơn 340: thường chọn α2 = 0, nên α1
= α.

Vậy:
c. Tìm a,b:

!!! =!!!! =!!!.!!" = 0.496!


! !
! = !! −! !!!! = 338.76;!! = !! +! !!!! = 341.24!
! !
— Suy đoán về phương sai mẫu
Ta có:

Với xác suất 1- α, tìm được α1, α2 sao cho: α1 + α2 = α và các


giá trị tới hạn

(2.1)
Ví dụ 2: Xí nghiệp sử dụng một loại nguyên liệu với lượng
tạp chất là bnn phân phối chuẩn với phương sai là 20
(gam)2/1 kg nguyên liệu. Từ một lô nguyên liệu, lấy ngẫu
nhiên ra 16 kg. Tìm xác suất để độ phân tán của lượng tạp
chất trong mẫu hàng này nằm trong khoảng (9.68; 33.33)
gam2?

+ X= lượng tạp chất/1kg nguyên liệu trong mẫu hàng (gam)

+ X ≈ N(μ, 202); n = 16; Cần tìm 1 – α để

P( 9.68 < S2 <33.33) = 1 – α

+ Ta có
Ta có:

Vậy: P (9.68 ≤ S2 ≤ 33.33) = 1 – α = 1- α1 – α2 = 0.9 J

You might also like