You are on page 1of 20

27/03/2024

Trường Đại học Kinh tế - Luật


Khoa Toán Kinh tế

Học phần: Thống kê trong kinh doanh


Chương 2:
Thống kê mô tả

TS Dương Đề Tài

Chương 2: Thống kê mô tả
I. Khái niệm thống kê và các loại thang đo dữ liệu
1.1. Mẫu, tổng thể, dữ liệu định tính, dữ liệu định lượng
1.2. Thống kê mô tả, thống kê suy diễn
1.3. Dữ liệu thứ cấp, dữ liệu sơ cấp.
1.4. Cấp bậc đo lường và các loại thang đo dữ liệu.

II. Trình bày dữ liệu bằng bảng và đồ thị


2.1. Bảng tần số, tần suất, tần suất tích lũy.
2.2. Biểu đồ hình cột, thanh
2.3. Biểu đồ hình tròn
2.4. Biểu đồ nhánh lá
2 TS Dương Đề Tài

Chương 2: Thống kê mô tả

III. Tóm tắt dữ liệu bằng các đại lượng thống kê mô tả


3.1. Các đặc trưng đo lường khuynh hướng tập trung: trung bình, trung
vị, tứ phân vị, số yếu vị.
3.2 Các đặc trưng đo lường khuynh hướng phân tán: khoảng biến thiên,
độ trải giữa, phương sai, độ lệch chuẩn, hệ số biến thiên.
3.3 Khảo sát hình dạng phân phối của tập dữ liệu: dạng đối xứng, dạng
lệch, hệ số lệch.

3 TS Dương Đề Tài

1
27/03/2024

I. Khái niệm thống kê và các loại thang đo dữ liệu

Thống kê mô tả
 Là phương pháp sử dụng để tóm tắt hoặc mô tả một tập hợp dữ liệu.
 Các công cụ số dùng để mô tả thường dùng nhất là trung bình cộng và
độ lệch chuẩn, yếu vị, trung vị...
 Các công cụ trực quan thường dùng nhất là các biểu đồ/

Thống kê suy diễn


Là quá trình sử dụng phép toán thống kê để đánh giá thông tin mô tả từ dữ
liệu mẫu, nhằm xác định tính đáng tin cậy của thông tin này bằng cách
kiểm chứng các giả thuyết, từ đó dự đoán hoặc ra quyết định trên cơ sở
thu thập thông tin từ kết quả quan sát mẫu
4 TS Dương Đề Tài

I. Khái niệm thống kê và các loại thang đo dữ liệu

Tổng thể
Là tập hợp các đơn vị (hay phần tử) thuộc hiện tượng nghiên cứu, cần
quan sát. Các đơn vị (hay phần tử) cấu thành tổng thể thống kê gọi là đơn
vị tổng thể.

Ví dụ về tổng thể
 Muốn thu thập số liệu về thu nhập trung bình một hộ gia đình ở TP
HCM thì tổng thể sẽ là tổng số hộ của TP HCM.
 Muốn tìm chiều cao trung bình của sinh viên trong lớp học thì tổng thể
sẽ là toàn bộ sinh viên trong lớp đó.

5 TS Dương Đề Tài

I. Khái niệm thống kê và các loại thang đo dữ liệu

Tổng thể bộc lộ


Là tổng thể có thể trực tiếp quan sát hoặc nhận biết được.

Ví dụ minh họa
 Tổng thể sinh viên của một trường;
 Tổng thể các doanh nghiệp trên một địa bàn;
 ...

6 TS Dương Đề Tài

2
27/03/2024

I. Khái niệm thống kê và các loại thang đo dữ liệu

Tổng thể tiềm ẩn


Khi xác định tổng thể không trực tiếp quan sát hoặc nhận biết được, ta gọi
đó là tổng thể tiềm ẩn

Ví dụ minh họa
 Tổng thể những người không đồng ý (ủng hộ) một vấn đề nào đó;
 Tổng thể những người ưa thích nghệ thuật cải lương;
 ....

7 TS Dương Đề Tài

I. Khái niệm thống kê và các loại thang đo dữ liệu

Tổng thể đồng chất (đồng nhất) và không đồng chất (đồng nhất)
 Tổng thể giống nhau ở một hay một số đặc điểm chủ yếu có liên quan
trực tiếp đến mục đích nghiên cứu được gọi là tổng thể đồng chất
(đồng nhất);
 Ngược lại thì được gọi là tổng thể không đồng chất (không đồng nhất)

Ví dụ minh họa
 Nếu mục đích nghiên cứu là tìm hiểu hiệu quả sử dụng vốn của các
doanh nghiệp dệt trên địa bàn thì tổng thể các doanh nghiệp dệt là
tổng thể đồng chất; còn tổng thể các doanh nghiệp là tổng thể không
đồng chất
8 TS Dương Đề Tài

I. Khái niệm thống kê và các loại thang đo dữ liệu

Tính chất
 Tổng thể thống kê có thể hữu hạn hoặc vô hạn (không thể hoặc khó
xác định được số đơn vị tổng thể; ví dụ như tổng thể trẻ sơ sinh, tổng
thể sản phẩm do một loại máy sản suất ra...)
 Khi xác định tổng thể thống kê, cần phải:
 Giới hạn về thực thể (tổng thể là tổng thể gì)
 Giới hạn về không gian (tổng thể tồn tại ở không gian, khu vực nào)
 Giới hạn về thời gian (tổng thể tồn tại ở thời gian nào)

9 TS Dương Đề Tài

3
27/03/2024

I. Khái niệm thống kê và các loại thang đo dữ liệu

Tính chất
 Tổng thể thống kê có thể hữu hạn hoặc vô hạn (không thể hoặc khó
xác định được số đơn vị tổng thể; ví dụ như tổng thể trẻ sơ sinh, tổng
thể sản phẩm do một loại máy sản suất ra...)
 Khi xác định tổng thể thống kê, cần phải:
 Giới hạn về thực thể (tổng thể là tổng thể gì)
 Giới hạn về không gian (tổng thể tồn tại ở không gian, khu vực nào)
 Giới hạn về thời gian (tổng thể tồn tại ở thời gian nào)

10 TS Dương Đề Tài

10

I. Khái niệm thống kê và các loại thang đo dữ liệu

Mẫu và đơn vị mẫu


 Mẫu bao gồm một số đơn vị được chọn ra từ tổng thể chung theo một
phương pháp lấy mẫu nào đó; đảm bảo tính đại diện cho tổng thể.

Ví dụ minh họa
 100 sinh viên trong một trường ĐH được chọn để tính chiều cao trung
bình sinh viên của trường đó;
 50 khách hàng mua sắm ở siêu thị đươc chọn để hoàn thành một cuộc
điều tra về sự thỏa mãn của khách hàng khi mua sắm.

11 TS Dương Đề Tài

11

I. Khái niệm thống kê và các loại thang đo dữ liệu

Dữ liệu định tính


 Phản ánh tính chất, sự hơn kém của các đối tượng nghiên cứu, là các
dữ liệu ban đầu không được thể hiện dưới dạng số; ví dụ như giới tính,
vùng địa lý, ngành học, ...

Dữ liệu định lượng


 Phản ánh mức độ hay mức độ hơn kém, là các dữ liệu có thể cân,
đong, đo, đếm được; ví dụ như thời gian làm thêm của sinh viên trong
một tuần; số lượng sản phẩm bán ra, điểm số trong bài kiểm tra, thu
nhập hàng tháng của sinh viên làm thêm...

12 TS Dương Đề Tài

12

4
27/03/2024

I. Khái niệm thống kê và các loại thang đo dữ liệu

Dữ liệu rời rạc


 Là dữ liệu mà các giá trị có thể có nó là hữu hạn hay vô hạn đếm được;
ví dụ như số công nhân trong một doanh nghiệp; số sản phẩm sản xuất
trong một ngày của phân xưởng.

Dữ liệu liên tục


 Là dữ liệu mà các giá trị có thể có của nó có thể lấp kín cả một khoảng
trên trục số; ví dụ như trọng lượng, chiều cao của sinh viên, năng suấ
của một loại cây trồng...

13 TS Dương Đề Tài

13

I. Khái niệm thống kê và các loại thang đo dữ liệu

Các loại thang đo


 Thang đo định danh (Norminal)
 Thang đo thứ bậc
 Thang đo khoảng
 Thang đo tỉ lệ

14 TS Dương Đề Tài

14

I. Khái niệm thống kê và các loại thang đo dữ liệu

Thang đo định danh (Norminal scale)


 Sử dụng cho biến định tính, dùng để thống kê thuộc tính của dữ liệu;
 Người ta sử dụng các mã số để phân loại cho các đối tượng và không
mang ý nghĩa nào khác; ví dụ như giới tính thì Nam kí hiệu số 0, Nữ kí
hiệu số 1...
 Giữa các con số hay kí hiệu ở đây không có quan hệ hơn kém, chỉ
dùng để đếm tần số xuất hiện của các biểu hiện;
 Thước đo độ tập trung duy nhất là Yếu vị (ModX);
 Chúng ta hay gặp thang đo định danh trong các câu hỏi về thông tin cá
nhân của từng người hay thông tin của doanh nghiệp
15 TS Dương Đề Tài

15

5
27/03/2024

I. Khái niệm thống kê và các loại thang đo dữ liệu

Ví dụ về Thang đo định danh


Trong một chủ đề nghiên cứu, người ta đưa ra hai câu hỏi sau:
Câu 1: Tình trạng hôn nhân của Anh/Chị là:
A. Độc thân B. Đã lập gia đình C. Khác
Câu 2: Công ty của Anh/Chị đang hoạt động chính trong lĩnh vực nào:
A. Sản suất B. Xây dựng
C. Dịch vụ D. Thương mại

Mỗi người sẽ chọn một trong các mã số A, B, C cho câu 1 hoặc A, B,


C, D cho câu 2.
Các mã số này là thang đo định danh.
16 TS Dương Đề Tài

16

I. Khái niệm thống kê và các loại thang đo dữ liệu

Thang đo thứ bậc (Ordinal scale)


 Sử dụng cho biến định tính; mỗi con số đại diện cho một tính chất;
 Sự hơn kém của các con số thể hiện sự hơn kém của các tính chất; thể
hiện sự xếp hạng, có mối quan hệ so sánh giữa các đối tượng;
 Sự chênh lệch giữa các biểu hiện không nhất thiết phải bằng nhau;
 Thường gặp các thang đo thứ bậc trong các câu hỏi dạng so sánh.

17 TS Dương Đề Tài

17

I. Khái niệm thống kê và các loại thang đo dữ liệu


Ví dụ về thang đo thứ bậc
Câu 1. Anh/Chị vui lòng cho biết kết quả học tập của mình đạt được khi tốt
nghiệp THPT:
A. Trung bình B. Trung bình – Khá C. Khá D. Giỏi
Câu 2. Anh/Chị hãy xếp hạng các chủ đề sau theo mức độ quan tâm (chủ đề nào
quan tâm nhất thì ghi số 1, quân tâm thứ 2 ghi số 2 và quan tâm thứ 3 ghi số 3:
 Thể thao  Thời trang  Thời sự
Câu 3. Thu nhập của Anh/Chị hằng tháng là:
 Dưới 6 triệu đồng  Từ 6 đến 10 triệu đồng
 Từ 10 đến 14 triệu đồng  Trên 14 triệu đồng

Việc lựa chọn đáp án sẽ cho ta dữ liệu thu được có sự hơn kém nhưng không
thể hiện rõ rệt sự hơn kém này.
18 TS Dương Đề Tài

18

6
27/03/2024

I. Khái niệm thống kê và các loại thang đo dữ liệu

Thang đo khoảng (Interval scale)


 Sử dụng cho biến định lượng và các dữ liệu định tính có phản ánh
sự hơn kém được thể hiện bằng những con số nhưng không
mang ý nghĩa tuyệt đối.
 Thang đo khoảng cho phép đo lường một cách tương đối sự khác
nhau giữa hai giá trị bất kỳ; còn trong thang đo thứ bậc thì không
thể, vì nó chỉ cho biết giá trị này lớn hơn giá trị khác mà thôi.
 Chúng ta hay gặp thang đo khoảng trong các câu hỏi phỏng vấn
dạng đánh giá.

19 TS Dương Đề Tài

19

I. Khái niệm thống kê và các loại thang đo dữ liệu

Ví dụ về thang đo khoảng
 Nhiệt độ, 32 𝐶 > 30 𝐶 và 80 𝐶 > 78 𝐶. Sự chênh lệch giữa
32 𝐶 và 30 𝐶 cũng giống như sự chênh lệch giữa 80 𝐶 và
78 𝐶.
 Hãy đánh giá mức độ thân thiện của nhân viên bán hàng tại
siêu thị:
Rất không thân thiện Rất thân thiện
1 2 3 4 5

20 TS Dương Đề Tài

20

I. Khái niệm thống kê và các loại thang đo dữ liệu

Ví dụ về thang đo khoảng (tt)


 Đề nghị quý Thầy/Cô cho biết ý kiến về tầm quan trọng của
các mục tiêu đào tạo SV đại học sau đây bằng cách khoanh
tròn các con số trên thang đo đánh giá chỉ mức độ từ 1 (không
quan trọng) đến 5 (quan trọng):

21 TS Dương Đề Tài

21

7
27/03/2024

I. Khái niệm thống kê và các loại thang đo dữ liệu

Thang đo tỉ lệ (Ratio scale)


 Sử dụng cho biến định lượng, là loại thang đo cao nhất chứa
đựng tất cả đặc tính của thang đo khoảng; ngoài ra, thang đo
này có một giá trị số 0 “thật”, cho phép lấy tỉ lệ so sánh giữa 2
giá trị thu thập cho nên gọi là thang đo tỉ lệ;
 Trong thang đo tỷ lệ, có thể nhận dạng, phân loại đối tượng,
xếp hạng đối tượng và so sánh sự khác biệt.
 Đây là thang đo có ý nghĩa nhất trong các loại thang đo.

22 TS Dương Đề Tài

22

I. Khái niệm thống kê và các loại thang đo dữ liệu

Sự khác nhau giữa thang đo khoảng và thang đo tỉ lệ


 Điểm 0 trong thang đo tỉ lệ là một giá trị số thật;
 Trong thang đo khoảng, sự so sánh về mặt tỉ lệ giữa các giá
trị không có ý nghĩa.

23 TS Dương Đề Tài

23

I. Khái niệm thống kê và các loại thang đo dữ liệu

Ví dụ minh họa
• Bạn A có 5 triệu, bạn B có 10 triệu. Như vậy, số tiền của B gấp
đôi số tiền của A.
• Nếu quy đổi sang đơn vị tiền khác như dollar, pound…thì số
tiền của B vẫn gấp đôi số tiền của A.
• Nếu số tiền của A bị mất thì số tiền của A còn 0 đồng. Số 0 ở
đây là giá trị thật

24 TS Dương Đề Tài

24

8
27/03/2024

I. Khái niệm thống kê và các loại thang đo dữ liệu

Ví dụ minh họa
• Nhiệt độ là thang đo khoảng, ví dụ nhiệt độ hôm nay là
12 𝐶 (53.6 𝐹) và hôm qua là 6 𝐶 (42.8 𝐹), ta không thể nói
rằng hôm nay ấm hơn hôm qua gấp 2 lần (vì ta đổi từ độ C
sang độ F thì không còn gấp đôi nữa.
• Nếu nhiệt độ là 0 𝐶 thì không có nghĩa là không có nhiệt độ.
Ở đây 0 𝐶 lạnh hơn 6 𝐶. Như vậy, nhiệt độ không có trị số 0
thật.

25 TS Dương Đề Tài

25

I. Khái niệm thống kê và các loại thang đo dữ liệu

Tổng kết về thang đo


• Thang đo định danh và thang đo thứ bậc sử dụng cho dữ liệu
định tính nên được gọi là thang đo định tính;
• Thang đo khoảng và thang đo tỉ lệ sử dụng cho dữ liệu định
lượng nên còn có tên gọi là thang đo định lượng.
• Dữ liệu thuộc vào các thang đo bậc cao có thể chuyển thành
các thang đo bậc thấp hơn nhưng ngược lại thì không thể
Thang đo tỉ lê → Thang đo khoảng → Thang đo thứ bậc → Thang
đo định danh
26 TS Dương Đề Tài

26

I. Khái niệm thống kê và các loại thang đo dữ liệu

Ví dụ 1
Để đánh giá về chất lượng giảng dạy của giảng viên trường A
khóa 2016 gồm 2000 sv, người ta chọn ra 200 sv. Bạn hãy vui
lòng dựa trên nhận định của mình trả lời các câu hỏi sau:
a) Tổng thể và mẫu cần khảo sát là bao nhiêu phần tử?
b) Nêu môt số lí do tại sao cuộc khảo sát này lại chọn mẫu mà
không khảo sát toàn bộ tổng thể.

27 TS Dương Đề Tài

27

9
27/03/2024

I. Khái niệm thống kê và các loại thang đo dữ liệu

Giải:
a) Tổng thể là 2000 sv. Mẫu là 200 sv.
b) Một số lí do cho việc chọn mẫu là:
o Mẫu ít tốn kém chi phí hơn tổng thể khi khảo sát;
o Mẫu khảo sát nhanh và thuận lợi hơn;
o Mẫu có nhiều hình thức khảo sát hơn phù hợp với các yêu
cầu khác nhau của các chủ đề nghiên cứu khác nhau.

28 TS Dương Đề Tài

28

I. Khái niệm thống kê và các loại thang đo dữ liệu

Ví dụ 2
Trong một chủ đề nghiên cứu, bạn hãy cho biết dữ liệu thu thập của
các câu hỏi sau thuộc vào thang đo nào? Tại sao?
Câu 1. Trong những môn bạn đã hoặc đang học sau đây, môn nào
bạn cảm thấy khó khăn nhất? (có thể chọn nhiều đáp án):

29 TS Dương Đề Tài

29

I. Khái niệm thống kê và các loại thang đo dữ liệu

Ví dụ 2 (tt)
Câu 2. Cho biết mức độ hiệu quả khi áp dụng nhưgnx hình thức giải
quyết sau đây cho những khó khăn gặp phải ở trên:

30 TS Dương Đề Tài

30

10
27/03/2024

I. Khái niệm thống kê và các loại thang đo dữ liệu

Ví dụ 2 (tt)
Câu 3. Cho biết kết quả bạn đạt được ở những môn đã học:

31 TS Dương Đề Tài

31

I. Khái niệm thống kê và các loại thang đo dữ liệu

Ví dụ 2 (tt)
Câu 4. Bạn vui lòng cho biết mức phí hợp lý cho một môn học trong
thời gian 3 tháng mà bạn có thể trả?..................(vui lòng ghi rõ một
số tiền cụ thể)

32 TS Dương Đề Tài

32

I. Khái niệm thống kê và các loại thang đo dữ liệu

Giải:
Câu 1. Dữ liệu thu thập thuộc vào thang đo định danh vì:
• Thông tin thu thập được chỉ cho chúng ta biết được môn học
gặp khó khăn là môn nào.
• Không thể kết luận việc khó khăn của môn học A cao hơn
mức độ khó khăn của môn học B và ngược lại

33 TS Dương Đề Tài

33

11
27/03/2024

I. Khái niệm thống kê và các loại thang đo dữ liệu

Giải:
Câu 2. Dữ liệu thu thập thuộc thang đo khoảng vì thông tin thu
thập được cho biết:
• Sự khác biệt về mức độ hiệu quả giữa các lựa chọn;
• Có sự hơn kém ở các mức độ hiệu quả;
• Và sự hơn kém này thể hiện rõ ở các dạng số cụ thể, cho dù
sự khác biệt thể hiện qua con số này không thật sự chính xác.

34 TS Dương Đề Tài

34

I. Khái niệm thống kê và các loại thang đo dữ liệu

Giải:
Câu 3. Dữ liệu thu thập thuộc thang đo thứ bậc vì thông tin thu
thập được cho biết:
• Có sự khác biệt giữa các khoảng điểm số;
• Sự khác biệt này có sự hơn kém về mặt điểm số;

35 TS Dương Đề Tài

35

I. Khái niệm thống kê và các loại thang đo dữ liệu

Giải:
Câu 4. Dữ liệu thu thập thuộc thang đo tỉ lệ vì thông tin thu thập
được cho biết:
• Có sự khác biệt về số tiền;
• Có sự hơn kém giữa các số tiền cụ thể;
• Sự khác biệt này thể hiện chính xác bằng các con số cụ thể.

36 TS Dương Đề Tài

36

12
27/03/2024

I. Khái niệm thống kê và các loại thang đo dữ liệu

Dữ liệu thứ cấp


 Là dữ liệu thu thập từ những nguồn có sẵn, đó chính là những dữ
liệu đã qua tổng hợp, xử lí.
 Dữ liệu thứ cấp có ưu điểm là thu thập nhanh, rẻ,…nhưng đôi khi
ít chi tiết và ít đáp ứng nhu cầu nghiên cứu.

Ví dụ minh họa
Kết quả học tập của sinh viên có thể lấy từ phòng đào tạo hay thư kí
khoa như điểm trung bình, số môn thi lại… là dữ liệu thứ cấp

37 TS Dương Đề Tài

37

I. Khái niệm thống kê và các loại thang đo dữ liệu

Dữ liệu sơ cấp
 Là dữ liệu thu thập trực tiếp, ban đầu từ đối tượng nghiên cứu.
 Dữ liệu sơ cấp đáp ứng tốt nhu cầu nghiên cứu nhưng phải tốn
kém chi phí và thời gian rất nhiều.

 Khi thực hiện một nghiên cứu cụ thể, người nghiên cứu có thể sử
dụng dữ liệu từ một nguồn có sẵn đã công bố hay chưa công bố,
hoặc phải tự mình thu thập các dữ liệu cần thiết cho nghiên cứu.

38 TS Dương Đề Tài

38

I. Khái niệm thống kê và các loại thang đo dữ liệu

Nguồn dữ liệu thứ cấp


 Nội bộ: các số liệu báo cáo của các phòng ban, bộ phận.
 Cơ quan thống kê nhà nước như tổng cục thống kê, cục thống kê..
 Cơ quan chính phủ: số liệu do bộ, cơ quan, UBND… công bố
 Báo và tạp chí: số liệu magn tính thời sự và cập nhật cao
 Các tổ chức, hiệp hội, viện nghiên cứu...
 Các cty nghiên cứu và cung cấp thông tin theo yêu cầu

39 TS Dương Đề Tài

39

13
27/03/2024

I. Khái niệm thống kê và các loại thang đo dữ liệu

Nguồn dữ liệu sơ cấp


Các cuộc điều tra, khảo sát để thu thập dữ liệu ban đầu có thể được
chia thành nhiều loại.
 Căn cứ vào tính chất liên tục hay không liên tục của việc ghi
chép dữ liệu mà chia ra điều tra thường xuyên hay điều tra
không thường xuyên;
 Căn cứ vào phạm vi khảo sát và thu thập thực tế mà chia ra
điều tra toàn bộ hay điều tra không toàn bộ.

40 TS Dương Đề Tài

40

I. Khái niệm thống kê và các loại thang đo dữ liệu

Điều tra thường xuyên


 Là tiến hành thu thập, ghi chép dữ liệu ban đầu về hiện tượng nghiên
cứu một cách có hệ thống theo sát quá trình biến động của hiện tượng.

Điều tra không thường xuyên


 Là tiến hành thu thập, ghi chép dữ liệu ban đầu một cách không liên
tục, mà chỉ tiến hành khi có nhu cầu cần nghiên cứu hiện tượng.
 Dữ liệu của cuộc điều tra không thường xuyên phản ánh trạng thái hiện
tượng tại một thời điểm nhất định.

41 TS Dương Đề Tài

41

I. Khái niệm thống kê và các loại thang đo dữ liệu

Điều tra toàn bộ


 Là tiến hành thu thập, ghi chép dữ liệu ban đầu trên tất cả các đơn vị
của tổng thể hiện tượng nghiên cứu.

Điều tra không toàn bộ


 Là tiến hành thu thập, ghi chép dữ liệu trên một số đơn vị được chọn ra
từ toàn bộ các đơn vị thuộc tổng thể hiện tượng nghiên cứu.
 Tùy theo cách chọn số đơn vị để tiến hành điều tra mà có thể chia
thành 3 loại cụ thể sau: điều tra chuyên đề, điều tra chọn mẫu và
điều tra trọng điểm.

42 TS Dương Đề Tài

42

14
27/03/2024

I. Khái niệm thống kê và các loại thang đo dữ liệu

Điều tra chuyên đề


 Là tiến hành điều tra trên một số ít đơn vị của tổng thể như lại đi sâu
nghiên cứu nhiều khía cạnh của đơn vị đó.

Điều tra chọn mẫu


 Được thực hiện bằng cách chọn ra một số phần tử hay đơn vị thuộc
tổng thể đơn vị nghiên cứu để thu thập dữ liệu thực tế.

Điều tra trọng điểm


 Là tiến hành thu thập dữ liệu trên bộ phận chủ yếu nhất, tập trung nhất
trong toàn bộ tổng thể hiện tượng nghiên cứu.
43 TS Dương Đề Tài

43

I. Khái niệm thống kê và các loại thang đo dữ liệu

Các phương pháp thu thập dữ liệu sơ cấp


 Dữ liệu sơ cấp thường được thu thập theo một quy trình bài bản, tùy
theo loại nghiên cứu thống kê là nghiên cứu thử nghiệm hay nghiên
cứu quan sát.
 Trong nghiên cứu thử nghiệm, researcher đo đạc và thu thập data
trên các biến kết quả trong những điều kiện khác nhau của các biến
nguyên nhân có ảnh hưởng đang nghiên cứu;
 Trong nghiên cứu quan sát thì các data cần thiết có thể thu thập từ
nhiều người cung cấp thông tin khác nhau

44 TS Dương Đề Tài

44

I. Khái niệm thống kê và các loại thang đo dữ liệu

Các kĩ thuật chọn mẫu


Có hai kĩ thuật lấy mẫu là: Chọn mẫu ngẫu nhiên đơn giản
Chọn mẫu hệ thống
 Kĩ thuật lấy mẫu xác suất
Chọn mẫu cả khối (cụm) và
nhiều giai đoạn
Chọn mẫu phân tầng
Chọn mẫu phán đoán

 Kĩ thuật lấy mẫu phi xác suất Chọn mẫu định mức
Chọn mẫu thuận tiện

45 TS Dương Đề Tài

45

15
27/03/2024

I. Khái niệm thống kê và các loại thang đo dữ liệu

1. Chọn mẫu ngẫu nhiên đơn giản


 Là phương pháp chọn mẫu trong đó mỗi đơn vị của tổng thể được chọn
với sự ngẫu nhiên như nhau.
 Trước hết, chuẩn bị khung lấy mẫu hay dàn chọn mẫu gồm danh sách
các đơn vị của tổng thể cần nghiên cứu, cần thu thập dữ liệu. Các đơn
vị trong danh sách này có thể được sắp xếp theo một thứ tự nào đó
như vần abc, theo quy mô, theo địa chỉ… và được gán cho một số thứ
tự đơn vị thứ nhất đến đơn vị cuối cùng.
 Thực hiện lấy mẫu đơn vị ra bằng nhiều cách như bốc thăm, quay số
hay dùng số ngẫu nhiên…

46 TS Dương Đề Tài

46

I. Khái niệm thống kê và các loại thang đo dữ liệu

2. Chọn mẫu hệ thống


Là phương pháp lấy mẫu thông qua các bước sau:
B1. Chuẩn bị danh sách chọn mẫu, xếp thứ tự theo 1 quy ước nào đó,
đánh số thứ tự cho các đơn vị. Tổng số đơn vị là 𝑁.
B2. Xác định cỡ mẫu muốn lấy là 𝑛.
B3. Chia 𝑁 đơn vị tổng thể thành 𝑘 nhóm với 𝑘 = 𝑁/𝑛, trong đó 𝑘 được gọi
là khoảng cách chọn mẫu.
B4. Trong 𝑘 đơn vị đầu tiên, chọn ngẫu nhiên ra một đơn vị, các đơn vị
mẫu tiếp theo được chọn cách đơn vị mẫu đầu tiên một khoảng 𝑘; 2𝑘; 3𝑘 …

47 TS Dương Đề Tài

47

I. Khái niệm thống kê và các loại thang đo dữ liệu

3. Chọn mẫu cả khối (cụm) và nhiều giai đoạn


 Đầu tiên, tổng thể được chia thành nhiều khối, mỗi khối được xem như
một tổng thể con, lấy ngẫu nhiên đơn giản 𝑚 khối, sau đó khảo sát hết
các đối tượng trong các khối mẫu đã được lấy ra.
 Trong một khối mẫu chọn ra, chỉ khảo sát một số đơn vị trong khối này
thôi. Đây chính là chọn mẫu nhiều giai đoạn.

48 TS Dương Đề Tài

48

16
27/03/2024

I. Khái niệm thống kê và các loại thang đo dữ liệu

3. Ví dụ minh họa chọn mẫu cả khối (cụm) và nhiều giai đoạn


 Quận Gò Vấp có 19 phường, sau khi chọn ra 2 phường mẫu thì khảo
sát hết tất cả các hộ trong phường;
 Hoặc quận Gò Vấp có 700 tổ dân phố, sau khi chọn ra 7 tổ dân phố
mẫu thì sẽ khảo sát hết tất cả các hộ trong 7 tổ dân phố này.

49 TS Dương Đề Tài

49

I. Khái niệm thống kê và các loại thang đo dữ liệu

4. Chọn mẫu phân tầng


 Tổng thể nghiên cứu được chia thành các tầng lớp, mục tiêu là để các
giá trị của các đối tượng tổng thể ta quan tâm thuộc cùng một tầng
càng ít khác nhau càng tốt.
 Sau đó các đơn vị mẫu được chọn từ các tầng lớp này theo phương
pháp lấy mẫu xác suất thông thường như lấy mẫu ngẫu nhiên đơn giản
hay lấy mẫu hệ thống.

50 TS Dương Đề Tài

50

I. Khái niệm thống kê và các loại thang đo dữ liệu

4. Chọn mẫu phân tầng (tt)


Giả sử cần lấy 𝑛 đơn vị mẫu từ 𝑁 đơn vị tổng thể, các đơn vị tổng thể
được phân tầng thành 𝑘 lớp.
 Nếu dùng phân bổ mẫu đều thì công thức tính số lượng đơn vị mẫu lấy
ra trong từng tầng lớp đơn giản là:
𝑛
𝑛 =𝑛 =⋯=𝑛 =
𝑘
 Nếu dùng mẫu phân bổ theo tỉ lệ thì công thức tính số lượng đơn vị
mẫu lấy ra trong từng tầng lớp sẽ theo tỉ lệ thức 𝑛/𝑁, tức là:
𝑛 𝑛 𝑛 𝑛
= =⋯= =
𝑁 𝑁 𝑁 𝑁

51 TS Dương Đề Tài

51

17
27/03/2024

I. Khái niệm thống kê và các loại thang đo dữ liệu

4. Ví dụ minh hoạn về chọn mẫu phân tầng


Một trường đại học có 20.000 sv ở 4 hệ đào tạo và cấp bậc khác nhau cho
trong bảng sau. Số lượng mẫu dự định lấy là 1000 (5% tổng thể).
Nếu phân bổ mẫu từng tầng theo tỉ lệ thì chúng ta sẽ lấy 5% đơn vị mẫu ở
mỗi tầng như trong bảng sau:
Hoặc có thể áp dụng
một cách phân bổ đơn
vị mẫu vào các tầng
khác, đó là phân bổ đều
1000 mẫu/4 tầng = 250
đơn vị mẫu ở mỗi tầng.

52 TS Dương Đề Tài

52

II. Dữ liệu bằng bảng và đồ thị


Dạng bảng tần số, tần suất, tần suất tích lũy
Bảng tần số gồm 2 phần:
1. Trị số của biến nghiên cứu, kí hiệu 𝑥 ;
2. Số lần xuất hiện của trị số gọi là tần số, kí hiệu 𝑓
Cũng có thể thể hiện tần số bằng hình thức phần trăm %
Trị số của biến (𝒙𝒊) Tần số (𝒇𝒊) Tần suất (%)
𝑥 𝑓 𝑓1/𝑛
𝑥 𝑓 𝑓 /𝑛
... ... ...
𝑥 𝑓 𝑓 /𝑛
Tổng số ∑ 𝑓 =𝑛 100%
53 TS Dương Đề Tài

53

II. Dữ liệu bằng bảng và đồ thị

Dạng bảng tần số, tần suất, tần suất tích lũy (tt)
Việc cộng dồn các giá trị tần số, tần suất cho ta các giá trị tích lũy

Trị số của biến (𝒙𝒊) Tần số (𝒇𝒊) Tần suất (%)


𝑥 𝑓 𝑓 /𝑛
𝑥 𝑓 +𝑓 (𝑓 + 𝑓 )/𝑛
... ... ...
𝑥 𝑓 + 𝑓 +⋯+ 𝑓 (𝑓 + 𝑓 + ⋯ + 𝑓 )/𝑛

54 TS Dương Đề Tài

54

18
27/03/2024

II. Dữ liệu bằng bảng và đồ thị

Biểu đồ hình cột, thanh


Trục hoành thể hiện giá trị của biến; trục tung thể hiện tần số.

55 TS Dương Đề Tài

55

II. Dữ liệu bằng bảng và đồ thị

Biểu đồ hình tròn


Nhóm giá trị khác nhau được phân biệt dựa trên màu sắc...

56 TS Dương Đề Tài

56

II. Dữ liệu bằng bảng và đồ thị

Biểu đồ nhánh và lá cho dữ liệu


Các dữ liệu thu thập được sẽ được tách thành 2 phần:
 Phần nhánh và phần lá;
 Việc phân chia này chỉ có tính quy ước và khá linh hoạt;
 Các chữ số bên phải của dữ liệu là lá, tương ứng các chữ số còn lại
bên tay trái là nhánh.
Việc xây dựng tuân theo quy ước sau:
 Xây dựng nhánh cho biểu đồ. Sắp xếp các giá trị nhánh tăng dần;
 Xây dựng lá cho biểu đồ. Lần lượt xếp các dữ liệu quan sát của dữ liệu
và theo thứ tự từ trái qua phải.

57 TS Dương Đề Tài

57

19
27/03/2024

II. Dữ liệu bằng bảng và đồ thị

Ví dụ minh họa
Thực hiện xây dựng nhánh và lá cho dữ liệu sau:
Dữ liệu trong mẫu điều tra về tuổi của các học viên tham gia một khóa học
tại một trung tâm như sau:
28 23 30 24 19 21 39 22 22 31 37 33
20 30 35 21 26 27 25 29 27 21 25 28
26 29 29 22 32 27

58 TS Dương Đề Tài

58

II. Dữ liệu bằng bảng và đồ thị

Giải:
Dữ liệu hiên có chỉ ở hàng chục, nhỏ nhất là 19 và lớn nhất là 39.
 Nhánh là hàng chục;
 Lá là hàng đơn vị.
Vậy nhánh có 3 giá trị là 1, 2 và 3.
1. Xây dựng nhánh cho biểu đồ. Sắp xếp các giá trị nhánh tăng dần
2. Xây dựng lá cho biểu đồ
Lần lượt xếp các dữ liệu quan sát về tuổi sv vào 3 nhánh
Bắt đầu từ dòng 1 của dữ liệu từ trái qua phải.
Kết quả Sắp xếp lại

59 TS Dương Đề Tài

59

II. Dữ liệu bằng bảng và đồ thị

60 TS Dương Đề Tài

60

20

You might also like