Professional Documents
Culture Documents
TS Dương Đề Tài
Chương 2: Thống kê mô tả
I. Khái niệm thống kê và các loại thang đo dữ liệu
1.1. Mẫu, tổng thể, dữ liệu định tính, dữ liệu định lượng
1.2. Thống kê mô tả, thống kê suy diễn
1.3. Dữ liệu thứ cấp, dữ liệu sơ cấp.
1.4. Cấp bậc đo lường và các loại thang đo dữ liệu.
Chương 2: Thống kê mô tả
3 TS Dương Đề Tài
1
27/03/2024
Thống kê mô tả
Là phương pháp sử dụng để tóm tắt hoặc mô tả một tập hợp dữ liệu.
Các công cụ số dùng để mô tả thường dùng nhất là trung bình cộng và
độ lệch chuẩn, yếu vị, trung vị...
Các công cụ trực quan thường dùng nhất là các biểu đồ/
Tổng thể
Là tập hợp các đơn vị (hay phần tử) thuộc hiện tượng nghiên cứu, cần
quan sát. Các đơn vị (hay phần tử) cấu thành tổng thể thống kê gọi là đơn
vị tổng thể.
Ví dụ về tổng thể
Muốn thu thập số liệu về thu nhập trung bình một hộ gia đình ở TP
HCM thì tổng thể sẽ là tổng số hộ của TP HCM.
Muốn tìm chiều cao trung bình của sinh viên trong lớp học thì tổng thể
sẽ là toàn bộ sinh viên trong lớp đó.
5 TS Dương Đề Tài
Ví dụ minh họa
Tổng thể sinh viên của một trường;
Tổng thể các doanh nghiệp trên một địa bàn;
...
6 TS Dương Đề Tài
2
27/03/2024
Ví dụ minh họa
Tổng thể những người không đồng ý (ủng hộ) một vấn đề nào đó;
Tổng thể những người ưa thích nghệ thuật cải lương;
....
7 TS Dương Đề Tài
Tổng thể đồng chất (đồng nhất) và không đồng chất (đồng nhất)
Tổng thể giống nhau ở một hay một số đặc điểm chủ yếu có liên quan
trực tiếp đến mục đích nghiên cứu được gọi là tổng thể đồng chất
(đồng nhất);
Ngược lại thì được gọi là tổng thể không đồng chất (không đồng nhất)
Ví dụ minh họa
Nếu mục đích nghiên cứu là tìm hiểu hiệu quả sử dụng vốn của các
doanh nghiệp dệt trên địa bàn thì tổng thể các doanh nghiệp dệt là
tổng thể đồng chất; còn tổng thể các doanh nghiệp là tổng thể không
đồng chất
8 TS Dương Đề Tài
Tính chất
Tổng thể thống kê có thể hữu hạn hoặc vô hạn (không thể hoặc khó
xác định được số đơn vị tổng thể; ví dụ như tổng thể trẻ sơ sinh, tổng
thể sản phẩm do một loại máy sản suất ra...)
Khi xác định tổng thể thống kê, cần phải:
Giới hạn về thực thể (tổng thể là tổng thể gì)
Giới hạn về không gian (tổng thể tồn tại ở không gian, khu vực nào)
Giới hạn về thời gian (tổng thể tồn tại ở thời gian nào)
9 TS Dương Đề Tài
3
27/03/2024
Tính chất
Tổng thể thống kê có thể hữu hạn hoặc vô hạn (không thể hoặc khó
xác định được số đơn vị tổng thể; ví dụ như tổng thể trẻ sơ sinh, tổng
thể sản phẩm do một loại máy sản suất ra...)
Khi xác định tổng thể thống kê, cần phải:
Giới hạn về thực thể (tổng thể là tổng thể gì)
Giới hạn về không gian (tổng thể tồn tại ở không gian, khu vực nào)
Giới hạn về thời gian (tổng thể tồn tại ở thời gian nào)
10 TS Dương Đề Tài
10
Ví dụ minh họa
100 sinh viên trong một trường ĐH được chọn để tính chiều cao trung
bình sinh viên của trường đó;
50 khách hàng mua sắm ở siêu thị đươc chọn để hoàn thành một cuộc
điều tra về sự thỏa mãn của khách hàng khi mua sắm.
11 TS Dương Đề Tài
11
12 TS Dương Đề Tài
12
4
27/03/2024
13 TS Dương Đề Tài
13
14 TS Dương Đề Tài
14
15
5
27/03/2024
16
17 TS Dương Đề Tài
17
Việc lựa chọn đáp án sẽ cho ta dữ liệu thu được có sự hơn kém nhưng không
thể hiện rõ rệt sự hơn kém này.
18 TS Dương Đề Tài
18
6
27/03/2024
19 TS Dương Đề Tài
19
Ví dụ về thang đo khoảng
Nhiệt độ, 32 𝐶 > 30 𝐶 và 80 𝐶 > 78 𝐶. Sự chênh lệch giữa
32 𝐶 và 30 𝐶 cũng giống như sự chênh lệch giữa 80 𝐶 và
78 𝐶.
Hãy đánh giá mức độ thân thiện của nhân viên bán hàng tại
siêu thị:
Rất không thân thiện Rất thân thiện
1 2 3 4 5
20 TS Dương Đề Tài
20
21 TS Dương Đề Tài
21
7
27/03/2024
22 TS Dương Đề Tài
22
23 TS Dương Đề Tài
23
Ví dụ minh họa
• Bạn A có 5 triệu, bạn B có 10 triệu. Như vậy, số tiền của B gấp
đôi số tiền của A.
• Nếu quy đổi sang đơn vị tiền khác như dollar, pound…thì số
tiền của B vẫn gấp đôi số tiền của A.
• Nếu số tiền của A bị mất thì số tiền của A còn 0 đồng. Số 0 ở
đây là giá trị thật
24 TS Dương Đề Tài
24
8
27/03/2024
Ví dụ minh họa
• Nhiệt độ là thang đo khoảng, ví dụ nhiệt độ hôm nay là
12 𝐶 (53.6 𝐹) và hôm qua là 6 𝐶 (42.8 𝐹), ta không thể nói
rằng hôm nay ấm hơn hôm qua gấp 2 lần (vì ta đổi từ độ C
sang độ F thì không còn gấp đôi nữa.
• Nếu nhiệt độ là 0 𝐶 thì không có nghĩa là không có nhiệt độ.
Ở đây 0 𝐶 lạnh hơn 6 𝐶. Như vậy, nhiệt độ không có trị số 0
thật.
25 TS Dương Đề Tài
25
26
Ví dụ 1
Để đánh giá về chất lượng giảng dạy của giảng viên trường A
khóa 2016 gồm 2000 sv, người ta chọn ra 200 sv. Bạn hãy vui
lòng dựa trên nhận định của mình trả lời các câu hỏi sau:
a) Tổng thể và mẫu cần khảo sát là bao nhiêu phần tử?
b) Nêu môt số lí do tại sao cuộc khảo sát này lại chọn mẫu mà
không khảo sát toàn bộ tổng thể.
27 TS Dương Đề Tài
27
9
27/03/2024
Giải:
a) Tổng thể là 2000 sv. Mẫu là 200 sv.
b) Một số lí do cho việc chọn mẫu là:
o Mẫu ít tốn kém chi phí hơn tổng thể khi khảo sát;
o Mẫu khảo sát nhanh và thuận lợi hơn;
o Mẫu có nhiều hình thức khảo sát hơn phù hợp với các yêu
cầu khác nhau của các chủ đề nghiên cứu khác nhau.
28 TS Dương Đề Tài
28
Ví dụ 2
Trong một chủ đề nghiên cứu, bạn hãy cho biết dữ liệu thu thập của
các câu hỏi sau thuộc vào thang đo nào? Tại sao?
Câu 1. Trong những môn bạn đã hoặc đang học sau đây, môn nào
bạn cảm thấy khó khăn nhất? (có thể chọn nhiều đáp án):
29 TS Dương Đề Tài
29
Ví dụ 2 (tt)
Câu 2. Cho biết mức độ hiệu quả khi áp dụng nhưgnx hình thức giải
quyết sau đây cho những khó khăn gặp phải ở trên:
30 TS Dương Đề Tài
30
10
27/03/2024
Ví dụ 2 (tt)
Câu 3. Cho biết kết quả bạn đạt được ở những môn đã học:
31 TS Dương Đề Tài
31
Ví dụ 2 (tt)
Câu 4. Bạn vui lòng cho biết mức phí hợp lý cho một môn học trong
thời gian 3 tháng mà bạn có thể trả?..................(vui lòng ghi rõ một
số tiền cụ thể)
32 TS Dương Đề Tài
32
Giải:
Câu 1. Dữ liệu thu thập thuộc vào thang đo định danh vì:
• Thông tin thu thập được chỉ cho chúng ta biết được môn học
gặp khó khăn là môn nào.
• Không thể kết luận việc khó khăn của môn học A cao hơn
mức độ khó khăn của môn học B và ngược lại
33 TS Dương Đề Tài
33
11
27/03/2024
Giải:
Câu 2. Dữ liệu thu thập thuộc thang đo khoảng vì thông tin thu
thập được cho biết:
• Sự khác biệt về mức độ hiệu quả giữa các lựa chọn;
• Có sự hơn kém ở các mức độ hiệu quả;
• Và sự hơn kém này thể hiện rõ ở các dạng số cụ thể, cho dù
sự khác biệt thể hiện qua con số này không thật sự chính xác.
34 TS Dương Đề Tài
34
Giải:
Câu 3. Dữ liệu thu thập thuộc thang đo thứ bậc vì thông tin thu
thập được cho biết:
• Có sự khác biệt giữa các khoảng điểm số;
• Sự khác biệt này có sự hơn kém về mặt điểm số;
35 TS Dương Đề Tài
35
Giải:
Câu 4. Dữ liệu thu thập thuộc thang đo tỉ lệ vì thông tin thu thập
được cho biết:
• Có sự khác biệt về số tiền;
• Có sự hơn kém giữa các số tiền cụ thể;
• Sự khác biệt này thể hiện chính xác bằng các con số cụ thể.
36 TS Dương Đề Tài
36
12
27/03/2024
Ví dụ minh họa
Kết quả học tập của sinh viên có thể lấy từ phòng đào tạo hay thư kí
khoa như điểm trung bình, số môn thi lại… là dữ liệu thứ cấp
37 TS Dương Đề Tài
37
Dữ liệu sơ cấp
Là dữ liệu thu thập trực tiếp, ban đầu từ đối tượng nghiên cứu.
Dữ liệu sơ cấp đáp ứng tốt nhu cầu nghiên cứu nhưng phải tốn
kém chi phí và thời gian rất nhiều.
Khi thực hiện một nghiên cứu cụ thể, người nghiên cứu có thể sử
dụng dữ liệu từ một nguồn có sẵn đã công bố hay chưa công bố,
hoặc phải tự mình thu thập các dữ liệu cần thiết cho nghiên cứu.
38 TS Dương Đề Tài
38
39 TS Dương Đề Tài
39
13
27/03/2024
40 TS Dương Đề Tài
40
41 TS Dương Đề Tài
41
42 TS Dương Đề Tài
42
14
27/03/2024
43
44 TS Dương Đề Tài
44
Kĩ thuật lấy mẫu phi xác suất Chọn mẫu định mức
Chọn mẫu thuận tiện
45 TS Dương Đề Tài
45
15
27/03/2024
46 TS Dương Đề Tài
46
47 TS Dương Đề Tài
47
48 TS Dương Đề Tài
48
16
27/03/2024
49 TS Dương Đề Tài
49
50 TS Dương Đề Tài
50
51 TS Dương Đề Tài
51
17
27/03/2024
52 TS Dương Đề Tài
52
53
Dạng bảng tần số, tần suất, tần suất tích lũy (tt)
Việc cộng dồn các giá trị tần số, tần suất cho ta các giá trị tích lũy
54 TS Dương Đề Tài
54
18
27/03/2024
55 TS Dương Đề Tài
55
56 TS Dương Đề Tài
56
57 TS Dương Đề Tài
57
19
27/03/2024
Ví dụ minh họa
Thực hiện xây dựng nhánh và lá cho dữ liệu sau:
Dữ liệu trong mẫu điều tra về tuổi của các học viên tham gia một khóa học
tại một trung tâm như sau:
28 23 30 24 19 21 39 22 22 31 37 33
20 30 35 21 26 27 25 29 27 21 25 28
26 29 29 22 32 27
58 TS Dương Đề Tài
58
Giải:
Dữ liệu hiên có chỉ ở hàng chục, nhỏ nhất là 19 và lớn nhất là 39.
Nhánh là hàng chục;
Lá là hàng đơn vị.
Vậy nhánh có 3 giá trị là 1, 2 và 3.
1. Xây dựng nhánh cho biểu đồ. Sắp xếp các giá trị nhánh tăng dần
2. Xây dựng lá cho biểu đồ
Lần lượt xếp các dữ liệu quan sát về tuổi sv vào 3 nhánh
Bắt đầu từ dòng 1 của dữ liệu từ trái qua phải.
Kết quả Sắp xếp lại
59 TS Dương Đề Tài
59
60 TS Dương Đề Tài
60
20