Professional Documents
Culture Documents
Bảng chéo thống kê
Bảng chéo thống kê
Thu thập dữ liệu và trình bày thống kê về bảng chéo, đồ thị phân tán, mối quan
hệ giữa hai biến.
_____________________________________________________________________
_____________________________________________________________________
_____
A. Thu thập dữ liệu
- Tên đề tài: KHẢO SÁT TÌNH HÌNH ĐI MUỘN CỦA SINH VIÊN UEH.
- Bảng khảo sát để thu thập dữ liệu gồm 6 câu hỏi như sau:
1. Giới tính của bạn là gì?
2. Bạn đã từng đi học muộn hay không?
3. Bạn đi học muộn trung bình bao nhiêu phút?
4. Khoảng cách từ nhà đến trường của bạn là bao nhiêu? (Đơn vị: m)
- Từ đó nhóm chúng em thu thập được bảng dữ liệu như sau:
Giới
STT Đi học muộn Thời gian đi muộn (phút) Khoảng cách (m)
tính
1 Nữ Đã từng 20 7000
2 Nữ Đã từng 10 800
3 Nữ Đã từng 5 2000
4 Nữ Đã từng 10 9500
5 Nữ Đã từng 10 1400
6 Nam Chưa từng 0 19000
7 Nữ Đã từng 10 1000
8 Nữ Đã từng 10 5000
9 Nam Đã từng 10 3000
11 Nữ Đã từng 10 3500
12 Nữ Đã từng 20 2500
13 Nữ Đã từng 20 4000
14 Nữ Đã từng 20 3000
15 Nam Đã từng 5 3000
16 Nữ Đã từng 20 900
17 Nữ Đã từng 30 800
18 Nữ Đã từng 20 2500
19 Nam Đã từng 15 9000
20 Nữ Đã từng 30 8000
21 Nam Đã từng 10 6000
22 Nữ Đã từng 15 5000
23 Nữ Đã từng 20 3000
24 Nữ Đã từng 30 800
25 Nữ Đã từng 30 1900
26 Nữ Đã từng 5 500
33 Nữ Đã từng 30 1500
38 Nữ Đã từng 10 4000
49 Nữ Đã từng 15 9000
50 Nam Đã từng 10 50
51 Nam Đã từng 15 9000
52 Nữ Đã từng 60 3000
55 Nữ Đã từng 5 2800
56 Nữ Đã từng 5 2900
57 Nữ Đã từng 5 2800
58 Nữ Đã từng 10 5000
59 Nữ Đã từng 10 15000
60 Nữ Đã từng 10 4000
61 Nữ Đã từng 10 3000
69 Nữ Đã từng 60 3000
74 Nữ Đã từng 75 4500
76 Nữ Đã từng 60 250
86 Nữ Đã từng 25 250
87 Nữ Đã từng 25 2000
88 Nữ Chưa từng 50 2000
89 Nữ Đã từng 30 3000
91 Nữ Đã từng 25 3000
B. Trình bày thống kê về bảng chéo, đồ thị phân tán, mối quan hệ giữa hai biến.
1. Phân tích số liệu
- Trong quá trình phân tích, những số liệu không đáng kể (dữ liệu = 0) đã được loại
bỏ;
- Từ bảng dữ liệu trên, ta sắp xếp được hai bảng theo thứ tự tăng dần của hai biến thời
gian đi trễ và khoảng cách từ nhà đến trường như sau:
Bảng 1.1. Bảng dữ liệu thu thập về biến thời gian đi muộn (phút)
Bảng 1.2. Bảng dữ liệu thu thập về biến khoảng cách (m)
50 250 250 300 400 400 500 500 600 600
800 800 800 800 900 900 1000 1000 1400 1400
200
1500 1500 1500 1900 2000 0 2000 2000 2500 2500
300
2500 2800 2800 3000 3000 0 3000 3000 3000 3000
350
3000 3000 3000 3000 3000 0 3500 4000 4000 4000
500
4500 5000 5000 5000 5000 0 5000 5000 5000 6000
670
6000 6000 6000 6000 6300 0 6700 7000 7000 7500
800
8000 8000 8000 8000 8000 0 9000 9000 9000 9500
1300
10000 0 13000 13000
2. Bảng chéo
- Bảng chéo đã tóm tắt dữ liệu cho hai biến định lượng gồm: thời gian đi trễ và khoảng
cách.
- Các nhãn bên trái và bên trên xác định các nhóm của hai biến. (Như Bảng 2.1)
2.1. Độ rộng của nhóm
→ Để thuận tiện hơn trong phân phối tần số, độ rộng của nhóm thời gian đi trễ được
lấy dựa theo phương trình là 9 và độ rộng của nhóm khoảng cách từ nhà đến trường
được lấy dựa theo phương trình là 3500. (Trong quá trình nghiên cứu, phép tính đã
được lược bỏ những giá trị quá xa)
Bảng 2.1. Bảng chéo khảo sát tình hình đi muộn của sinh viên UEH theo thời
gian đi muộn và khoảng cách từ nhà đến trường
Bảng 2.2. Phân phối tần suất phần trăm cho dữ liệu thời gian đi trễ và khoảng
cách từ nhà đến trường theo hàng ngang
Thời gian (phút)
Khoảng cách
(m) 11 - 31 -
< 11 20 21 - 30 40 >= 41 Tổng
<1000 40.00 33.33 20.00 0.00 6.67 100
1000 -- 4500 51.61 22.58 22.58 0.00 3.23 100
4501 -- 8000 50.00 18.18 18.18 13.64 0.00 100
>=8001 42.86 57.14 0.00 0.00 0.00 100
Nhận xét:
- Dựa vào bảng tần số đã tính:
Với khoảng cách dưới 4000m, trong tổng số phần trăm, phần trăm đi trễ dưới 20 phút
( tức là 47,92 %) chiếm phần trăm nhiều nhất và trên 60 phút ( 2,08%) chiếm phần
trăm ít nhất.
- Phần trăm theo cột:
Bảng 2.3. Phân phối tần suất phần trăm cho dữ liệu thời gian đi trễ và khoảng
cách từ nhà đến trường theo cột
Khoảng cách Thời gian (phút)
(m) < 11 11 -- 20 21 -- 30 31 -- 40 >= 41
<1000 16.67 25.00 21.43 0.00 50.00
1000 -- 4500 44.44 35.00 50.00 0.00 50.00
4501 -- 8000 30.56 20.00 28.57 100.00 0.00
>=8001 8.33 20.00 0.00 0.00 0.00
Tổng 100 100 100 100 100
ngang:
Nhận xét:
Trong khoảng thời gian đi trễ dưới 20 phút, trong tổng số phần trăm, phần trăm
khoảng cách dưới 4000m (50%) chiếm số phần trăm nhiều nhất, và trên 12000
(6,52%) chiếm số phần trăm ít nhất.
3. Đồ thị phân tán
3.1. Phân tích dữ liệu
- Trình bày đồ họa về mối quan hệ giữa hai biến định lượng: Thời gian đi muộn và
khoảng cách;
- Biến khoảng cách được biểu diễn ở trục hoành và biến thời gian đi muộn trên trục
tung;
- Những điểm giá trị trên đồ thị thể hiện mối quan hệ tổng quát giữa hai biến;
- Trong đó, đường xu hướng cung cấp một xấp xỉ về mối quan hệ về thời gian đi muộn
và khoảng cách.
3.2.
- Ta có bảng dữ liệu sau khi xử lý như sau:
Bảng 3.1. Bảng dữ liệu thu thập về hai biến thời gian đi muộn (phút) và khoảng
cách (m)
Hình 3.1. Đồ thị phân tán của hai biến thời gian đi muộn (phút) và khoảng cách
(m)
Nhận xét:
- Đồ thị phân tán cho biết mối quan hệ giữa hai biến thời gian đi muộn (phút) và
khoảng cách từ nhà đến trường (m).
- Khoảng thời gian đi muộn (phút) càng nhiều liên hệ với khoảng cách từ nhà đến
trường (m) càng xa.
- Trong đồ thị, các điểm dữ liệu phân bố theo xu hướng thành một đường thẳng dốc
lên nên 2 biến này có mối liên hệ tuyến tính thuận chiều nhưng giữa 2 biến thể hiện
mối quan hệ yếu.
4. Mối quan hệ giữa hai biến
- Sau khi dùng các dữ liệu ta có bảng sau:
Bảng 4.1 Bảng tính phương sai, độ lệch chuẩn của hai biến thời gian (phút) và khoảng
cách (m)