Professional Documents
Culture Documents
1. Cơ sở lý thuyết mẫu
2. Ước lượng tham số
3. Kiểm định giả thuyết thống kê.
CHƯƠNG I: CƠ SỞ LÝ THUYẾT MẪU
Có thể nghiên cứu dân số của 1 quốc gia theo các đặc điểm
sau:
Nhược điểm?
Thống kê mô tả: Là bước đầu của thống kê, có mục đích
thu thập và hệ thống hoá số liệu, tính các số đặc trưng thực
nghiệm, và tìm ra quy luật phân phối thực nghiệm của hiện
tượng cần nghiên cứu.
A. Tổng thể
Toàn bộ tập hợp các phần tử đồng nhất theo một dấu hiệu
nghiên cứu định tính hoặc định lượng nào đó, được gọi là
Tổng thể nghiên cứu hay tổng thể.
Số phần tử của tổng thể nghiên cứu: kích thước của tổng
thể (hữu hạn hoặc vô hạn).
Ví dụ:
B. Mẫu ngẫu nhiên
1. ĐN mẫu ngẫu nhiên
Giả sử cần nghiên cứu bnn X. Bnn X phải có QLPP xác suất
thông qua bảng PPXS hoặc hàm phân bố hay hàm mật độ
xs. Bnn X có các đặc trưng EX (μ), DX (σ2) và xác suất p (X
thuộc tập A).
Đối với X thì 3 tham số μ, σ2, p tồn tại nhưng ta chưa biết
chính xác giá trị của chúng và muốn tìm.
Để làm: thu thập các thông tin về X bằng các quan sát độc
lập về X. Gọi Xi là bnn chỉ việc quan sát thứ i, khi đó nhận
được W =(X1, X2, … , Xn) đgl mẫu ngẫu nhiên cỡ n. Mẫu có
tính chất
E(Xi) = μ; V(Xi) = σ2
3. Cách trình bày 1 mẫu
Tổng quát: Sắp xếp số liệu thành dãy (x1,x2,…,xn) thoả mãn
x1 ≤ x2 ≤ … ≤ xn.
x1’ < x2’ < … <xk’. ni = số các xj trong mẫu bằng xi’. Có Σ ni = n.
Ví dụ 4: Giá của một mặt hàng sau tết tại 8 cửa hàng như
sau:
(95, 109, 99, 98, 105, 99, 109, 102). Hãy lập bảng tần số và
biểu đồ tần suất.
k = 1 + log2 n ≈ 1 + 3.32 lg n
Ví dụ
Ví dụĐo chiều cao của 36 sinh viên nam của một
5: Đo chiều cao của 36 sinh viên nữ trường: của một trường,
được số liệu sau:
160 161 161 162 162 162 163 163 163
160 161 161 162 162 162 163 163 163 164 164 164
164 164 164 164 165 165 165 165 165
166
164 165 165 166 166
165 165 165166
166 166167166167
166 168
167 167168 168
168 169 169 170 171 171 172 172 174
168 168 168 168 169 169 170 171 171 172 172 174
Ta có bảng phân bố tần số ghép lớp
Bảng phân bố tần số ghép lớp:
Chiều 159,5-162,5 162,5-165,5 165,5-168,5 168,5- 171,5 171,5-174,5
cao
Tần số 6 12 10 5 3
3.3. Nếu ở mỗi lớp ghép, trong mỗi khoảng thứ I, chọn một
số xi’ làm đại diện- xi’ = trung điểm của 2 đầu mút của
khoảng- => có bảng tần số:
Một hàm của mẫu ngẫu nhiên (X1,X2,…, Xn) được gọi là
thống kê, ký hiệu
G = f(X1,X2,…, Xn)
.
MỘT SỐ THỐNG KÊ THÔNG DỤNG
Nếu E Xi = μ; V Xi = σ2 thì:
!!
! ! = !, ! ! =
!
Độ lệch chuẩn của TBM, dùng để phản ánh sai số của ước
lượng, thường gọi là sai số chuẩn của TBM:
!
Se X =
n
4.2. Độ lệch bình phương trung bình
S = (S2)1/2
Tạo bang tần số
table(x)
570ES plus:mode -> 3 -> 1 -> on -> shift -> 1 -> 5 ->2
580 VNX: mode -> 6 -> 1 -> AC -> OPTN -> mũi tên xuống -> 4 -
>Q
x = c(rep(2.3,2),
rep(2.8,6),rep(3,15),rep(3.5,10),rep(4,10),rep(4.5,
5))
570 ES plus: shift -> mode-> mũi tên xuống -> 4 ->1 -> mode -> 3 -> 1
rồi nhập số liệu
AC -> shift -> 1 -> 4 ->1 (2,3,4) ra n (TRUNG BÌNH MẪU, căn của MS, S)
580 VNX: Shift -> menu -> mũi tên xuống -> 3 -> 1-> menu -> 6 ->1
rồi nhập số liệu
AC-> optn ->2-> (ra các giá trị đặc trưng của mẫu)
5. Những phân phối xác suất của một số thống kê đặc
trưng mẫu
(1)
(2)
+Nếu X tuân theo quy luật phân phối bất kỳ với n > 30:
(3)
+ Nếu X tuân theo quy luật phân phối chuẩn, biết μ:
(4)
+ Nếu X tuân theo quy luật phân phối chuẩn, không biết μ:
(5)
+Nếu dấu hiệu nghiên cứu phân phối theo quy luật không-
một. Tần suất f sẽ phân phối theo quy luật không-một, với
các tham số E(f) = p, D(f) = [p(1-p)]/n với p là xác suất (cơ
cấu) của tổng thể. Thì tần suất sẽ xấp xỉ phân phối chuẩn với
E(f) = p, D(f) = [p(1-p)]/ n.
(6)
6. Suy diễn thống kê
Quy luật phân phối xác suất của các thống kê đặc trưng
mẫu phản ánh mối liên hệ chặt chẽ giữa các tham số của
mẫu với các tham số tương ứng của tổng thể nghiên cứu.
Suy diễn thống kê: Nếu đã biết quy luật phân phối xác suất
cũng như các tham số đặc trưng của tổng thể, ta dùng các
kết quả đó để suy đoán các tính chất của mẫu ngẫu nhiên
rút ra từ tổng thể (Từ tổng thể rút ra kết luận về mẫu).
X=c(rep(825,5), rep(875,10),,,,)
Mean(x) histogram(x)
sd(x)
6.1. Suy diễn về mẫu ngẫu nhiên rút ra từ tổng thể
phân phối chuẩn
Giả sử dấu hiệu nghiên cứu của tổng thể, mô hình hoá bởi
bnn phân phối theo quy luật chuẩn N(μ, σ2).
Suy đoán về giá trị của trung bình mẫu trong hợp
BNN X tuân theo quy luật chuẩn và biêt σ
Xét thống kê
U phân phối theo quy luật chuẩn N(0,1). Với xác suất 1 – α
cho trước, tìm được α1, α2 sao cho α1 + α2 = α và các giá trị
tới hạn
(1)
Suy ra:
! !
! ! −! !!! <!! < !! +! !!! = !1 − !!!
! !
Bài toán:
1. Tìm xác suất sao cho TBM (phương sai mẫu, tỷ lệ mẫu)
thuộc khoảng (a,b) ( >a; <b)?
a. Tìm xác suất để khối lượng trung bình của các chi tiết
nằm trong khoảng từ 335 gam đến 345 gam?
b. Tìm xác suất để khối lượng trung bình của các chi tiết
lớn hơn 340 gam?
c. Với xác suất 0.99 thì khối lượng trung bình của các chi
tiết đó nằm trong khoảng nào xung quanh giá trị trung
bình?
a.
580 VNX
mode -> 6 -> 1 -> AC -> OPTN -> mũi tên xuống -> 4 -
>Q
b. Để trung bình mẫu lớn hơn 340: thường chọn α2 = 0, nên α1
= α.
Vậy:
c. Tìm a,b:
(2.1)
Ví dụ 2: Xí nghiệp sử dụng một loại nguyên liệu với lượng
tạp chất là bnn phân phối chuẩn với phương sai là 20
(gam)2/1 kg nguyên liệu. Từ một lô nguyên liệu, lấy ngẫu
nhiên ra 16 kg. Tìm xác suất để độ phân tán của lượng tạp
chất trong mẫu hàng này nằm trong khoảng (9.68; 33.33)
gam2?
+ Ta có
Ta có: