Professional Documents
Culture Documents
BÀI TẬP NHÓM THỐNG KÊ
BÀI TẬP NHÓM THỐNG KÊ
Bảng phân phối tần số, tần suất phần trăm của 20 người tiêu dùng về số tiền chi cho
bữa ăn sáng + cà phê (ng.đ)
75 - 89 7 7 35
=0.35
20
90 - 104 6 6 30
=0.3
20
105 - 119 3 3 15
=0.15
20
120 - 134 2 2 10
=0.1
20
Tổng 20 1 100
Nhận xét:
- Chỉ 10% người tiêu dùng có số tiền chi cho bữa ăn sáng + cà phê trong khoảng
60 - 74 ngàn đồng và khoảng 120 - 134 ngàn đồng.
- Phần trăm lớn nhất (35%) có số tiền chi cho bữa ăn sáng + cà phê trong khoảng
75-89 ngàn đồng.
- Hơn 1 nửa (55%) trong tổng số người khảo sát chi trên 90 nghìn đồng cho
bữa ăn sáng và cà phê.
b/ Xây dựng biểu đồ phân phối và nhận xét về hình dạng phân phối. ( XONG)
BIỂU ĐỒ PHÂN PHỐI VỀ SỐ TIỀN CHI CHO BỮA SÁNG VÀ CÀ PHÊ CỦA
NGƯỜI TIÊU DÙNG
Nhận xét:
- Biểu đồ lệch về hướng bên phải
- Nhiều nhất là ở mức chi tiêu 75-89 ngàn (chiếm 35% với 7 người)
- Ít nhất là ở mức chi tiêu 60-74 ngàn (chiếm 10% với 2 người)
c. Tập dữ liệu trên có giá trị bất thường không? Nếu có là giá trị nào? Tại sao?
(XONG)
Bảng thống kê chi tiêu cho bữa ăn sáng + cà phê của 20 người khảo sát sắp xếp theo
thứ tự từ bé đến lớn:
60 65 75 80 80
85 85 85 85 90
90 92 95 100 100
105 110 115 125 132
np 20× 25
+ Phân vị thứ nhất: i = = =5
100 100
np 20× 75
+ Phân vị thứ ba: i = = = 15
100 100
→ Tập dữ liệu trên không có giá trị bất thường ( giá trị < 52.5 hoặc > 132.5) trong
dữ liệu khảo sát chi tiêu của người tiêu dùng về số tiền chi cho bữa ăn sáng và cà
phê.
d/ Vẽ biểu đồ hộp và râu. ( ghi lại Q1 Q3 ở câu c rồi mới chèn biểu đồ nha )
(XONG)
Tính trung vị,vì tập dữ liệu có 20 quan sát là số chẵn nên trung vị là
giá trị thứ 10+giá trị thứ 11 90+90
Q2 = = = 90
2 2
BIỂU ĐỒ HỘP VỀ SỐ TIỀN CHI CHO BỮA ĂN SÁNG + CÀ PHÊ CỦA
NGƯỜI TIÊU DÙNG
e/ Có thể quan sát thấy điều gì về thông tin chi tiêu của người tiêu dùng cho bữa
ăn sáng + cà phê? ( XONG )
- Ta thấy số tiền dùng nhiều nhất và ít nhất cho bữa sáng + cà phê lần lượt là 132
nghìn đồng và 60 nghìn đồng
- Khoảng biến thiên = giá trị dữ liệu max - giá trị dữ liệu min = 132 - 60 = 72
nghìn đồng. Ta thấy khoản chi tiêu trải dài, người tiêu dùng chi nhiều mức giá
cho bữa ăn sáng + cà phê (từ mức giá bình dân 60, 70 nghìn đồng tới mức giá
khá cao là 125, 132 nghìn đồng)
- Đa số người khảo sát chi khoảng 75 - 89 nghìn đồng cho bữa ăn sáng và cà phê
(7 người, chiếm 35%)
- Chỉ có 2 người khảo sát (chiếm 10%) chi khoảng 60 - 74 nghìn đồng hoặc 120
- 134 nghìn đồng cho bữa ăn sáng và cà phê
Bài 2: Thời gian vào mạng internet của 2 mẫu sinh viên nữ và sinh viên nam trong
một tuần (giờ/tuần), được trình bày trong 2 biểu đồ nhánh và lá dưới đây:
Bảng thống kê thời gian vào mạng internet của nữ: ( giờ/ tuần)
9 10 12 14 15
16 16 17 18 18
19 20 20 20 21
21 22 23 24 25
26 29 30 32 35
Bảng thống kê thời gian vào mạng internet của nam: ( giờ/ tuần )
9 10 11 12 14
15 15 16 16 18
19 19 19 20 20
21 22 22 24 25
26 28 30 32 32
1/ Tính trung vị trong từng trường hợp. So sánh thời gian vào mạng internet của
nam và nữ. ( XONG )
- Trung vị trong trường hợp của nữ: vì tập dữ liệu có 25 quan sát là số lẻ nên
trung vị là 20.
- Trung vị trong trường hợp của nam: vì tập dữ liệu có 25 quan sát là số lẻ nên
trung vị là 19.
- Thời gian trung bình sử dụng internet của nữ:
Σx i 9+10+12+...+30+32+35
x= = =20.48 giờ/tuần
n 25
→ Vậy thời gian sử dụng internet trung bình của nam ít hơn thời gian sử dụng internet
trung bình của nữ. ( 19.8 giờ < 20.48 giờ )
2/ Tính mốt trong từng trường hợp. So sánh thời gian vào mạng internet của
nam và nữ. ( XONG )
- Trong trường hợp nữ: Mode = 20 (giá trị này xuất hiện 3 lần)
- Trong trường hợp nam: Mode = 19 (giá trị này xuất hiện 3 lần)
→Nhận xét: Đa số thời gian sử dụng internet của nữ nhiều hơn thời gian sử
dụng internet của nam (20 giờ >19 giờ)
3/ So sánh đặc trưng phân phối về thời gian vào mạng internet của nam và nữ.
( XONG )
Nữ:
2
Σ( xi −x)
+ Phương sai: s = 2
n−1
2 2 2 2
(9−20.48) +(10−20.48) +...+(32−20.48) +(35−20.48)
= = 43.01
24
+ Độ lệch chuẩn: s = √❑ = √ ❑ = 6.56
3
n x i−x
+ Hệ số bất đối xứng cho mẫu: skewness = × Σ( ) =
(n−1)(n−2) s
3 3 3 3
25 9−20.48 10−20.48 32−20.48 35−20.48
×[( ) +( ) +...+( ) +( ) ] = 0.39
24 ×23 6.56 6.56 6.56 6.56
Nhận xét:
- Lượng thời gian vào mạng của nữ dao động đa số (8 lần) trong khoảng từ 20
giờ đến 24 giờ.
- Hình dáng của phân phối tần số thời gian vào mạng của nữ lệch phải vừa phải.
Nam:
Σ( xi −x)2
+ Phương sai: s2 = =
n−1
2 2 2 2
(9−20.48) +(10−20.48) +...+( 32−20.48) +(32−20.48)
= 42.83
24
+ Độ lệch chuẩn: s = √❑ = √ ❑ = 6.54
3
n x −x
+ Hệ số bất đối xứng cho mẫu: skewness = Σ( i ) =
(n−1)(n−2) s
3 3 3 3
25 9−20.48 10−20.48 32−20.48 32−20.48
×[( ) +( ) +...+( ) +( ) ] = 0.29
24 ×23 6.54 6.54 6.54 6.54
Nhận xét:
- Lượng thời gian vào mạng của nam dao động đa số (8 lần) trong khoảng từ 15
giờ đến 19 giờ.
- Hình dáng của phân phối tần số thời gian vào mạng của nam lệch phải vừa
phải.
→Cả hai biểu đồ đều lệch phải vừa phải nhưng ở trường hợp của nữ thì
lệch phải nhiều hơn (skewness 0.39 > 0.29)