You are on page 1of 14

46

CHƯƠNG
13
NGUYÊN LÝ THỐNG KÊ VÀ
CÁC KHÁI NIỆM CƠ BẢN
Mục lục chương 3

3.1 Một số khái niệm dùng trong thống kê ........................................................ 46


3.2 Tổng hợp và trình bày dữ liệu thống kê ....................................................... 52

3.1. Một số khái niệm dùng trong thống kê.

Trong quá trình ứng dụng thống kê để giải quyết các vấn đề, đối với một đối tượng nghiên cứu, vì
những lý do thực tế đôi khi ta không thể thu thập toàn bộ dữ liệu, mà ta chỉ nghiên cứu trên một
phần, một bộ phận của đối tượng. Do đó dữ liệu thống kê được dùng theo hai mục tiêu là thống kê
mô tả và thống kê suy diễn.

Thống kê mô tả: dùng để tóm tắt dữ liệu, mô tả dữ liệu dưới dạng số hay dùng các công cụ đồ họa.
Tóm tắt dưới dạng số thường dùng giá trị trung bình, độ lệch chuẩn, trung vị, yếu vị. Công cụ đồ
họa thường dùng là biểu đồ và đồ thị.

Thống kê suy diễn: dùng để mô hình hóa các kiểu biến thiên của dữ liệu và rút ra các kết luận cho
tổng thể mà ta không có điều kiện để nghiên cứu hết đội tượng mà ta quan tâm. Các kết luận có
thể thiên về ước lượng, kiểm định, dự đoán, mô tả mối liên hệ hay mô hình hóa mối liên hệ. Ngoài
ra còn các kỹ thuật khác mô hình hóa dữ liệu như: phân tích phương sai, dãy số và chuỗi thời gian
và khai thác dữ liệu.

Tổng thể thống kê và đơn vị tổng thể, và mẫu.


Tổng thể thống kê (còn gọi là tổng thể chung) là tập hợp các đơn vị cá biệt (hay phần tử) thuộc
hiện tượng nghiên cứu, cần quan sát, thu thập và phân tích mặt lượng của chúng theo một hay
CHƯƠNG 3 : NGUYÊN LÝ THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN 47

một số đặc điểm nào đó. Các đơn vị cá biệt cấu thành nên tổng thể thống kê gọi là đơn vị tổng thể.
Tuỳ mục đích nghiên cứu mà xác định tổng thể và từ tổng thể xác định được đơn vị tổng thể.

 Tổng thể bộc lộ : là tổng thể mà trong đó các đơn vị có thể trực tiếp quan sát. (Ví dụ: tổng
thể sinh viên của một trường đại học, tổng thể các siêu thị, tổng thể các ngân hàng)
 Tổng thể tiềm ẩn : là tổng thể mà các đơn vị không thể trực tiếp quan sát hay nhận biết
(Ví dụ: các hiện tượng kinh tế xã hội, quan điểm về một vấn đề, các hiện tượng tự nhiên)
 Tổng thể đồng nhất và không đồng nhất : (đồng nhất) khi các đơn vị tổng thể có cùng
một hay nhiều đặc điểm liên quan trực tiếp đến mục địch nghiên cứu. (Ví dụ : mục đích
nghiên cứu là tìm hiểu về hiệu quả sử dụng vốn của doanh nghiệp trên một khu vực. Trong
mục đích nghiên cứu đó, doanh nghiệp dệt trong khu vực đó là tổng thể đồng nhất, nhưng
tổng thể tất cả các doanh nghiệp trong khu vực đó là tổng thể không đồng nhất vì mỗi
doanh nghiệp ở những ngành kinh tế khác nhau sẽ có quy mô, tính chất khác nhau dẫn
đến mức độ sử dụng vốn sẽ khác nhau.)
 Tổng thể có thể hữu hạn hoặc vô hạn, phụ thuộc vào thời gian hoặc không gian. Do
đó khi xác định tổng thể ngoài các giới hạn về đặc điểm tổng thể còn cần giới hạn tổng thể
về thời gian và không gian.

Mẫu dữ liệu : Một nhóm các đơn vị tổng thể được chọn một cách ngẫu nhiên, độc lập từ tổng thể
được gọi là mẫu dữ liệu.

Tiêu thức.
Tiêu thức thống kê là các đặc tính (hay đặc điểm thống kê) của đơn vị tổng thể.

Mỗi đơn vị tổng thể có nhiều tiêu thức. Mỗi tiêu thức có thể biểu hiện giống nhau hoặc khác nhau
ở các đơn vị tổng thể. Tiêu thức được phân chia theo các tiêu chuẩn sau:
i. Tiêu thức bất biến và tiêu thức biến động.
 Tiêu thức bất biến biểu hiện giống nhau ở mọi đơn vị tổng thể, căn cứ vào tiêu thức này người
ta tập hợp các đơn vị tổng thể để xây dựng nên tổng thể.
Ví dụ 3.1 Tiêu thức quốc tịch “Việt Nam”xây dựng tổng số dân Việt Nam. Giới tính “nam”, “nữ”
xây dựng tổng thể dân số nữ, dân số nam.
 Tiêu thức biến động là tiêu thức biểu hiện của nó không giống nhau ở các đơn vị tổng thể,
dựa trên sự thay đổi đơn vị t’ổng thể trên tiêu thức này mà giúp phân tích đặc trưng của tổng
thể.
Ví dụ 3.2 Số lượng, độ tuổi, sai số, chất lượng ….
ii. Tiêu thức số lượng và tiêu thức thuộc tính.
 Tiêu thức số lượng là tiêu thức thể hiện trực tiếp bằng con số, đặc trưng đó quan sát được
bằng các biện pháp cân đo đong đếm.
Ví dụ 3.3 Độ tuổi, mức lương, số đo,...
 Tiêu thức thuộc tính là tiêu thức thể hiện không bằng con số, phản ánh loại hoặc chất của
đơn vị.
Ví dụ 3.4 Giới tính, quốc tịch, chất lượng, trình độ ngoại ngữ…
Lượng biến.
Lượng biến là biểu hiện cụ thể về lượng của các đơn vị tổng thể theo tiêu thức số lượng.
Có hai loại lượng biến. Lượng biến rời rạc và lượng biến liên tục.
 Lượng biến rời rạc: là lượng biến mà các giá trị có thể có của nó là hữu hạn hay vô hạn nhưng
có thể đếm được.
Ví dụ 3.5 Số công nhân trong một doanh nghiệp; số sản phẩm sản xuất ra trong một ngày của
một xí nghiệp…..
48

 Lượng biến liên tục: là lượng biến mà các giá trị có thể có của nó được lấp kín cả một khoảng
trên trục số.
Ví dụ 3.6 năng suất cây trồng; chiều cao của trẻ, giá bán của cố phiếu, sai số chi tiết máy,….
Tham số.
Tham số tổng thể là giá trị đặc trưng của tổng thể dùng để mô tả đặc trưng của hiên tượng nghiên
cứu.

Tham số mẫu là tham số dựa trên đặc trưng tổng thể và tính toán trên mẫu số liệu để suy đoán
ngược lại cho tham số tổng thể. (Ví dụ: giá trị trung bình mẫu dùng để ước lượng cho kỳ vọng của
tổng thể, phương sai mẫu dùng để ước lượng cho phương sai của tổng thể…)

Thang đo.
Thang đo là các quy định về giá trị cho dữ liệu thu thập. Có 4 cấp thang đo theo mức độ thông tin
tăng dần: định danh, thứ bậc, khoảng cách và tỷ lệ.
i. Thang đo định danh: (hay còn gọi là thang đo phân loại, định nghĩa - Nominal Scale) là thang
đo sử dụng cho các tiêu thức thuộc tính, dùng các mã số để phân loại các đối tượng. Thang đo dịnh
danh không mang ý nghĩa nào cả mà chỉ để lượng hoá các dữ liệu cần cho nghiên cứu. Người ta
thường dùng các chữ số tự nhiên như 1, 2, 3, 4... để làm mã số.
Ví dụ 3.7 Giới tính của người trả lời : nam (0) , nữ (1).
Ví dụ 3.8 Hệ thống rạp mà bạn hài lòng nhất : Lotte Cinema (1) ; CGV (2) ; Cinemar (3) ; BHD
Star Cineplex (4) ; Cinebox (5).
Ví dụ 3.9 Một cuộc khảo sát về dân số, bạn được hỏi như sau :”vui lòng cho biết tình trạng hôn
nhân của bạn hiện nay”
Độc thân □1
Đang có gia đình □2
Ở góa □3
Ly thân hoặc ly dị □4
Việc tính toán giữa các giá trị này không mang ý nghĩa nào (trung bình, phương sai), một số phép
toán dùng cho thang đo định danh như là: đếm, tần suất, giá trị mode, hoặc các phép kiểm định.

ii. Thang đo thứ bậc: (- Ordinal Scale) là thang đo sự chênh lệch giữa các biểu hiện của tiêu thức
có quan hệ thứ bậc hơn kém. Sự chênh lệch này không nhất thiết phải bằng nhau. Nó được dùng
cho cả tiêu thức thuộc tính và tiêu thức số lượng.
Ví dụ 3.10 Trình độ tay nghề của công nhân theo bậc thợ 1,2,3,4,5. Phân loại giảng viên trong các
trường đại học như Giáo sư, Phó Giáo sư, Giảng viên chính, Giảng viên.
Ví dụ 3.11 Đánh giá mức độ rất hài lòng, hài lòng, không hài lòng và rất không hài lòng. Giữa các
mức độ đánh giá không khó có một sự xác định rõ ràng. Một bảng khảo sát với câu hỏi như sau:
“bạn hài lòng như thế nào về mùi sản phẩm dầu gội X-men mà bạn vừa dùng thử: hài lòng, bình
thường, không hài lòng”. Và điều này không cho ta biết được là mức hài lòng này gấp 2 hay 10 lần
so với mức bình thường, hay không hài lòng.
Ví dụ 3.12 Thu nhập của anh chị hàng tháng
1. < 5 triệu đồng 2. Từ 5 đến 10 triệu 3. Từ 10 đến 15 triệu
4. > 15 triệu đồng.

iii. Thang đo khoảng: (- interval scale) là thang đo thứ bậc có khoảng cách đều nhau. Nó được
dùng cho cả tiêu thức thuộc tính và tiêu thức số lượng. Thang đo khoảng cho phép chúng ta đo
lường một cách chính xác sự khác nhau giữa hai giá trị đơn vị.
CHƯƠNG 3 : NGUYÊN LÝ THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN 49

Ví dụ 3.13 Một bảng khảo sát như sau: “theo anh, chị tầm quan trọng của các yếu tố sau đây như
thế nào với cuộc sống của một người (Mức đánh giá từ 1 (không quan trọng) cho đến 7 (rất quan
trọng))”
1. Có nhiều tiền 1 2 3 4 5 6 7
2. Đạt trình độ học vấn cao 1 2 3 4 5 6 7
3. Có địa vị trong xã hội 1 2 3 4 5 6 7
4. Có quan hệ rộng rãi 1 2 3 4 5 6 7
5. Có sức khỏe tốt 1 2 3 4 5 6 7
Ví dụ 3.14 Anh (chị) hãy đánh giá mức độ quan trọng của các yếu tố sau trong một thông tin
quảng cáo trên truyền hình:
Mức độ quan trọng
Yếu tố rất quan khá quan quan trọng khá không rất không
trọng trọng quan trọng quan trọng
Sự ngắn gọn dễ nhớ 1 2 3 4 5
Hình ảnh 1 2 3 4 5
Âm thanh 1 2 3 4 5

Với việc phân ra các định mức rõ ràng thì việc đo lường thái độ hay ý kiến thì thang do khoảng
cung cấp nhiều thông tin hơn so với thang đo thứ bậc. Những phép toán sử dụng trên thang đo
này cũng nhiều hơn so với hai thang đo trước như: tính khoảng biến thiên, số trung bình, độ lệch
chuẩn…
Một điểm cần chú ý trong thang đo khoảng không có điểm 0 tuyệt đối, nên phép toán thực hiện ở
đây chỉ là các phép toán cộng trừ. Nghĩa là tỷ số giữa các giá trị thu thập được không có ý nghĩa,
tuy nhiên các khoảng chênh lệch giữa các giá trị thì có thể lấy tỷ lệ được (Ví dụ: chênh lệch này
gấp đôi chênh lệch kia)
Ví dụ 3.15 Trong thang đo độ bách phân, điểm 0 ( 0 o C ) chỉ là điểm được quy ước, tại đó nước
chuyển sang thể rắn, còn nhiệt độ lại có thể xuống đến các điểm dưới 0. Đặc điểm này dẫn đến việc
so sánh tỷ lệ giữa các trị số đo không có ý nghĩa. Cụ thể là nhiệt độ trung bình của thành phố A là
30o C , thành phố B là 10o C , ta không thể nói thành phố A nóng gấp 3 lần thành phố B.

iv. Thang đo tỷ lệ: (- ration scale) là thang đo có tất cả các đặc tính khoảng cách và thứ tự của
thang đo khoảng, ngoài ra điểm “0” trong thang đo tỷ lệ là một giá trị tuyệt đối (là giá trị gốc trên
thang đo) nên ta có thể thực hiện các phép toán chia để tính tỷ lệ nhằm mục đích so sánh.
Ví dụ 3.16 Thu nhập trung bình của ông A là 5 triệu đồng một tháng, và của ông B là 10 triệu đồng
một tháng, thì ta hoàn toàn có thể nói lương ông B gấp 2 lần lương ông A về ý nghĩa thu nhập.
Thang đo tỷ lệ được sử dụng rất rộng rãi để đo lường các hiện tượng kinh tế - xã hội, như: thu
nhập, chi tiêu, thời gian lao động, tuổi, số con ... Các đơn vị đo lường vật lý thông thường (kg, mét,
lít ..) cũng là các thang đo loại này.
Theo tuần tự, thang đo sau có chất lượng đo lường cao hơn thang đo trước, đồng thời việc xây
dựng thang đo cũng phức tạp hơn. Song không phải cứ sử dụng thang tỷ lệ là tốt nhất, mà phải tuỳ
thuộc vào đặc điểm của hiện tượng và tiêu thức nghiên cứu mà chọn thang đo thích hợp. Hai loại
đầu chưa có tiêu chuẩn đo, thuộc loại thang định tính. Đó là loại thang đo mà khi thay đổi từ giá
trị này sang giá trị khác thì đối tượng đo đã có sự thay đổi về chất, chúng phù hợp với việc đo
lường các tiêu thức thuộc tính. Hai loại sau đã có tiêu chuẩn đo, khi chuyển từ một điểm này sang
điểm khác trên thang thì có sự thay đổi về lượng, nhưng chưa chắc đã có sự thay đổi về chất. Đây
là loại thang đo định lượng, phù hợp để đo lường các tiêu thức số lượng.
Khi dữ liệu đã thu thập xong, chúng ta vẫn có thể chuyển đổi từ dữ liệu định lượng sang dữ liệu
định tính. Nghĩa là chuyển từ thang đo tỷ lệ, khoảng sang thang đo định danh và thang đo thứ bậc.
Nhưng chuyển đổi theo chiều ngược lại thì không thể.
50

Thiết kế thang đo.


Có 2 kỹ thuật thiết kế thang đo cơ bản là:
i. Kỹ thuật tạo thang đo so sánh
Mục đích: Tạo ra những so sánh trực tiếp giữa các đối tượng nghiên cứu. Thường có 4 dạng như
sau:
Thang đo so sánh từng cặp:
Ví dụ 3.17 So sánh mức độ ưa thích giữa 5 nhãn hiệu dầu gội đầu : A, B, C, D, E. Bằng cách tạo ra
những so sánh từng cặp : A-B, A-C, A-D, A-E, B-C, B-D, B-E, C-D, C-E, D-E.
So sánh mức độ quan trọng của các yếu tố nghiên cứu, khi khách hàng muốn mua một chiếc xe
máy, bằng cách tạo ra những so sánh từng cặp giữa các yếu tố: giá - độ bền - kiểu dáng – màu sắc.

Thang đo này đơn giản nhưng chỉ thích hợp trong trường hợp các yếu tố được đưa vào so sánh
từng cặp có số lượng không nhiều và có thể đưa ra ngay sự lựa chọn chính xác. Tuy nhiên những
đánh giá trong so sánh từng cặp này thường không là ý thích tuyệt đối. Đôi khi những giả thiết về
các so sánh bắc cầu sẽ làm sai lệch kết quả.

Thang đo xếp hạng theo thứ tự:


Đưa ra nhiều đối tượng cùng một lần và tạo ra sự xếp hạng thứ tự giữa chúng về một đặc điểm
nào đó. Ví dụ: Hãy xếp hạng theo thứ tự từ 1 đến 5 cho 5 nhãn hiệu dầu gội sau đây về tác dụng
đem lại sự bóng mượt cho tóc (số 1 là tốt nhất, số 5 là xấu nhất)

Người trả lời phải phân biệt sự hơn kém giữa các đối tượng, tốn ít thời gian hơn, dễ trả lời hơn (ở
ví dụ trên, nếu là so sánh cặp thì người trả lời phải có 10 lần xếp hạng theo từng cặp). Tuy nhiên
chỉ có thể áp dụng kỹ thuật này đối với dữ liệu có thể xếp theo thứ tự. Người trả lời thường chú ý
đến những xếp hạng đầu và cuối, hơn là các xếp hạng ở giữa. Nếu người trả lời không có sẵn ý
thích so sánh giữa các đối tượng thì câu trả lời của họ sẽ không có ý nghĩa. Không thể biết được lý
do vì sao người trả lời xếp hạng như vậy.

Thang đo có tổng số điểm cố định:


Người nghiên cứu đưa ra một tổng điểm cố định phù hợp với đặc thù của đối tượng nghiên cứu,
sau đó yêu cầu người trả lời chia tổng điểm này bằng số tuyệt đối hay tương đối cho các đối tượng
được liệt kê sẵn

Ví dụ 3.18 Hãy chia 100% cho sự đánh giá của bạn về tầm quan trọng của các yếu tố sau đây khi
bạn quyết định mua quần áo thể thao cho chơi tenis. Yếu tố nào được bạn đánh giá càng quan
trọng thì bạn cho điểm càng cao, nếu nó hoàn toàn không quan trọng đối với bạn thì bạn hãy cho
điểm 0. Tiện lợi khi mặc …..%, bền ….%, nhãn hiệu nổi tiếng……%, kiểu dáng…..%, giá cả hợp lý….%,
hợp thời trang…..%/. Cộng 100%
Cho phép phân biệt nhanh sự khác biệt giữa các nội dung được đánh giá. Tuy nhiên thang đo không
liệt kê được hết các nội dung của vấn đề đang nghiên cứu (ví dụ ngoài 7 yếu tố trên có thể có
những yếu tố có tầm quan trọng đối với người tiêu dùng nhưng lại không được nêu trong bảng
cho điểm này). Dễ gặp trường hợp người trả lời cho điểm nhiều hơn hay ít hơn tổng điểm cố định.
Dễ gây sự nhầm lẫn và chán nản cho người trả lời khi phải tính toán chia cho hết tổng điểm. Thông
thường chỉ nên liệt kê tối đa là 10 khoản mục.

Kỹ thuật thang đo Q-Sort:


Người nghiên cứu dùng thang đo so sánh để sắp xếp các đối tượng theo thứ tự tăng dần hay giảm
dần về cường độ để đo lường thái độ của người điều tra về một đối tượng nào đó. Để đảm bảo độ
tin cậy khi đo lường, nên hỏi từ 60 đến 90 người (đạt tiêu chuẩn mẫu lớn).

Ví dụ 3.19 Công ty Đồng Tâm có 80 slogan gợi ý từ các chuyên gia, muốn chọn ra 1 slogan, cách
thức tiến hành cho các đối tượng được hỏi như sau:
CHƯƠNG 3 : NGUYÊN LÝ THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN 51

Bước 1: dùng thang điểm 5 (rất hay: 5, hay: 4, không ý kiến: 3, không hay : 2, rất không hay: 1)
chọn ra 10 slogan mà bạn cho là rất hay.
Bước 2: từ 70 slogan còn lại, chọn ra 10 slogan mà bạn cho là hay.
Bước 3: từ 60 slogan còn lại, chọn ra 15 slogan mà bạn cho là không hay
Bước 4: từ 45 slogan còn lại, chọn ra 15 slogan mà bạn cho là rất không hay
Bước 5: 30 slogan còn lại là số slogan mà bạn không có ý kiến
ii. Kỹ thuật tạo thang đo không so sánh:
Mục đích: Các đối tượng được đo lường một cách độc lập với nhau. Bao gồm các dạng sau:

Thang đo tỷ lệ liên tục:


Có nghĩa là sử dụng thang đo khoảng để tạo ra các mục lựa chọn, người trả lời sẽ chọn một mục
để đánh dấu vào đó. Số mục là chẵn hay lẻ không có sự sai biệt gì đáng kể. Nếu dùng số lẻ thì người
trả lời hay có xu hướng “trung dung” bằng cách chọn mục ở giữa, còn nếu dùng số chẵn thì người
trả lời sẽ thể hiện nghiêng nhiều hơn về hướng nào.

Ví dụ 3.20 Cho biết ý kiến của bạn về vấn đề….. : Đồng ý □, Không đồng ý □
Bạn ưa thích ngành học của mình ở mức độ nào:
Rất thích □ Khá thích □ Bình thường □ Không thích □ Rất ghét □

Thang điểm Likert:


Đây là một dạng thang đo lường về mức độ đồng ý hay không đồng ý với các mục được đề nghị,
được trình bày dưới dạng một bảng. Trong bảng thường bao gồm 2 phần: Phần nêu nội dung, và
phần nêu những đánh giá theo từng nội dung đó; với thang đo này người trả lời phải biểu thị một
lựa chọn theo những đề nghị được trình bày sẵn trong bảng.

Ví dụ 3.21 Một mẫu thang điểm Likert nghiên cứu đánh giá của khách hàng đối với hoạt động của
1 cửa hàng:
Hoàn toàn Nói chung Không có Không Hoàn toàn
Nội dung nhận định
đồng ý là đồng ý ý kiến đồng ý không đồng ý
Đa dạng về chủng loại hàng 1 2 3 4 5
Đa dạng về mẫu mã cho mỗi
1 2 3 4 5
chủng loại hàng
Trưng bày hàng đẹp 1 2 3 4 5

Thang điểm có hai cực đối lập:


Đây là một thang điểm, được biểu hiện dưới dạng một dãy số liên tục từ 1 đến 5, hay từ 1 đến 7,
hay từ -3 đến +3; trong đó hai cực của thang đo này luôn đối lập nhau về mặt ngữ nghĩa. Dữ liệu
thu được trong thang đo này thường được phân tích dưới dạng điểm trung bình của tất cả mẫu
nghiên cứu theo từng nội dung được hỏi, và kết quả được trình bày dưới dạng biểu đồ để có thể
so sánh trực quan những đánh giá riêng biệt của hai hay nhiều đối tượng nghiên cứu với nhau.

Ví dụ 3.22 Hãy nêu các nhận định của bạn về các mặt sau đây của nhà hàng A. Hãy khoanh tròn
số tương ứng với sự lựa chọn của bạn:
Sạch 1 2 3 4 5 6 7 Bẩn
Rẻ 1 2 3 4 5 6 7 Đắt
Phục vụ nhanh 1 2 3 4 5 6 7 Phục vụ chậm
Ngon 1 2 3 4 5 6 7 Dở
Thang điểm Stapel:
Đây là một thang điểm, được biểu hiện dưới dạng một dãy số liên tục từ dương (+) đến âm (-),
chẳng hạn từ +3 đến -3, +5 đến -5 để đo lường hướng và cường độ của thái độ của người trả lời.
Trong thang đo này chỉ dùng một tính từ duy nhất, thường tương ứng với số 0 nằm ở giữa. Là một
biến tướng của thang điểm có hai cực đối lập.
52

Ví dụ 3.23 Nếu dùng thang điểm Stapel cho nhận định về nhà hàng A thì thiết kế như sau:
+3 +2 +1 0 -1 -2 -3
Sạch □ □ □ □ □ □ □
Rẻ □ □ □ □ □ □ □
Phục vụ nhanh □ □ □ □ □ □ □
Ngon □ □ □ □ □ □ □
Thang đo này tránh khó khăn cho người hỏi khi phải tìm những cặp từ diễn tả các trạng thái đối
nghịch nhau

iii. Các tiêu chuẩn để đánh giá thang đo:


Độ tin cậy: Một thang đo cung cấp những kết quả nhất quán qua những lần đo khác nhau được coi
là đảm bảo độ tin cậy vì nó đã loại trừ được những sai số ngẫu nhiên, đảm bảo chất lượng của dữ
liệu thu thập. Để đánh giá độ tin cậy của thang đo thường dùng 3 cách sau:
 Đo lường lặp lại: dùng 1 cách đo lường cho người trả lời nhưng ở hai thời điểm khác nhau
(thường cách khoảng từ 2 đến 4 tuần) để xem kết quả thu được có tương tự nhau không.
 Đo lường bằng dụng cụ tương đương: Dùng dụng cụ đo lường tương đương đối với cùng một
sự vật để xem kết quả thu được có tương tự nhau không.

Giá trị của thang đo: là khả năng đo lường đúng những gì mà nhà nghiên cứu cần đo. Muốn đảm
bảo gía trị của thang đo, cần xác định đúng các đặc tính cần đo và lựa chọn các cấp độ đo lường
thích hợp.

Giữa độ tin cậy và giá trị của thang đo có mối liên hệ chặt chẽ với nhau: Một thang đo muốn có giá
trị thì phải đảm bảo độ tin cậy tức là loại trừ được sai số ngẫu nhiên. Một thang đo đảm bảo được
độ tin cậy thì chưa hẳn đã có giá trị nếu còn tồn tại sai số hệ thống.

Tính đa dạng của thang đo: Một thang đo phải đáp ứng được nhiều mục đích sử dụng: giải thích
cho kết quả nghiên cứu, từ kết quả thu thập đưa ra những kết luận suy đoán khác.

Tính dễ trả lời: Khi thu thập dữ liệu bằng phương thức phỏng vấn, không được để xảy ra tình
trạng người được hỏi từ chối trả lời vì khó trả lời, hay tình trạng đưa ra những nhận định sai lệch
bản chất do cách đặt câu hỏi không phù hợp

3.2. Thu thập và trình bày dữ liệu thống kê.


Xác định dữ liệu và phương pháp thu thập dữ liệu sơ cấp
Dữ liệu sơ cấp là những dữ liệu chưa có sẵn, được thu thập lần đầu, do chính người nghiên cứu
thu thập. Trong thực tế, khi dữ liệu thứ cấp không đáp ứng được yêu cầu nghiên cứu, hoặc không
tìm được dữ liệu thứ cấp phù hợp thì các nhà nghiên cứu sẽ phải tiến hành thu thập dữ liệu sơ
cấp.

Các dữ liệu sơ cấp sẽ giúp giải quyết cấp bách và kịp thời những vấn đề đặt ra. Dữ liệu sơ cấp là
do trực tiếp thu thập nên độ chính xác cao hơn. Tuy nhiên,dữ liệu sơ cấp phải qua quá trình nghiên
cứu thực tế mới có được, vì vậy việc thu thập dữ liệu sơ cấp thường tốn nhiều thời gian và chi phí.
Vì vậy, các nhà nghiên cứu sẽ phải cân nhắc khi nào sẽ phải thu thập dữ liệu sơ cấp và lựa chọn
phương pháp thu thập hiệu quả để hạn chế nhược điểm này.
1. Xác định vấn đề cần nghiên cứu.
2. Thiết lập kế hoạch nghiên cứu.
3. Tiến hành thu thập dữ liệu.
4. Phân tích dữ liệu thu thập được.
5. Phân bổ các kết quả phân tích.
Các phương pháp thu thập dữ liệu sơ cấp
i. Phương pháp điều tra trực tiếp
CHƯƠNG 3 : NGUYÊN LÝ THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN 53

Đây là phương pháp thu thập dữ liệu trực tiếp qua đối tượng nghiên cứu. Phương pháp này được
thực hiện bằng một số hình thức như phỏng vấn trực tiếp, phỏng vấn qua điện thoại, trả lời bảng
câu hỏi...
ii. Phương pháp quan sát
Phương pháp này được áp dụng khi đối tượng nghiên cứu không sẵn sàng cung cấp thông tin, hoặc
cố tình cung cấp thông tin không chính xác.Lúc này, người nghiên cứu sẽ phải dùng các giác quan
hoặc máy móc để quan sát các hành vi, thói quen của đối tượng nghiên cứu trong một khoảng thời
gian cố định. Từ đó phân tích kết quả và có được dữ liệu.
iii. Phương pháp khảo sát trực tuyến
Với sự xuất hiện của Internet, các dữ liệu có thể thu thập được bằng các khảo sát qua thư điện tử
hay các website. Ưu điểm của phương pháp này là thu thập dữ liệu rất nhanh với số lượng lớn,
tiết kiệm chi phí hơn so với phương pháp thu thập truyền thống.
Các kỹ thuật lấy mẫu dữ liệu
i. Kỹ thuật lấy mẫu theo xác suất.
Chọn mẫu ngẫu nhiên (hay chọn mẫu xác suất) là phương pháp chọn mẫu mà khả năng được chọn
vào tổng thể mẫu của tất cả các đơn vị của tổng thể đều như nhau. Đây là phương pháp tốt nhất
để ta có thể chọn ra một mẫu có khả năng đại biểu cho tổng thể. Vì có thể tính được sai số do chọn
mẫu, nhờ đó ta có thể áp dụng được các phương pháp ước lượng thống kê, kiểm định giả thuyết
thống kê trong xử lý dữ liệu để suy rộng kết quả trên mẫu cho tổng thể chung
Tuy nhiên ta khó áp dụng phương pháp này khi không xác định được danh sách cụ thể của tổng
thể chung (ví dụ nghiên cứu trên tổng thể tiềm ẩn); tốn kém nhiều thời gian, chi phí, nhân lực cho
việc thu thập dữ liệu khi đối tượng phân tán trên nhiều địa bàn cách xa nhau,…
ii. Lấy mẫu ngẫu nhiên đơn giản.
Trước tiên lập danh sách các đơn vị của tổng thể chung theo một trật tự nào đó : lập theo vần của
tên, hoặc theo quy mô, hoặc theo địa chỉ…, sau đó đánh số thứ tự các đơn vị trong danh sách; rồi
rút thăm, quay số, dùng bảng số ngẫu nhiên, hoặc dùng máy tính để chọn ra từng đơn vị trong tổng
thể chung vào mẫu.
Thường vận dụng khi các đơn vị của tổng thể chung không phân bố quá rộng về mặt địa lý, các
đơn vị khá đồng đều nhau về đặc điểm đang nghiên cứu. Thường áp dụng trong kiểm tra chất
lượng sản phẩm trong các dây chuyền sản xuất hàng loạt.
iii. Lấy mẫu ngẫu nhiên hệ thống.
Trước tiên lập danh sách các đơn vị của tổng thể chung theo một trật tự quy ước nào đó, sau đó
đánh số thứ tự các đơn vị trong danh sách. Đầu tiên chọn ngẫu nhiên 1 đơn vị trong danh sách ;
sau đó cứ cách đều k đơn vị lại chọn ra 1 đơn vị vào mẫu,…cứ như thế cho đến khi chọn đủ số đơn
vị của mẫu. Ví dụ : Dựa vào danh sách bầu cử tại 1 thành phố, ta có danh sách theo thứ tự vần của
tên chủ hộ, bao gồm 240.000 hộ. Ta muốn chọn ra một mẫu có 2000 hộ. Vậy khoảng cách chọn là :
k= 240000/2000 = 120, có nghĩa là cứ cách 120 hộ thì ta chọn một hộ vào mẫu.
iv. Lấy mẫu cả khối/cụm và lấy mẫu theo giai đoạn.
Trước tiên lập danh sách tổng thể chung theo từng khối (như làng, xã, phường, lượng sản phẩm
sản xuất trong 1 khoảng thời gian…). Sau đó, ta chọn ngẫu nhiên một số khối và điều tra tất cả các
đơn vị trong khối đã chọn. Thường dùng phương pháp này khi không có sẵn danh sách đầy đủ của
các đơn vị trong tổng thể cần nghiên cứu. Ví dụ : Tổng thể chung là sinh viên của một trường đại
học. Khi đó ta sẽ lập danh sách các lớp chứ không lập danh sách sinh viên, sau đó chọn ra các lớp
để điều tra.
v. Lấy mẫu phân tầng.
Trước tiên phân chia tổng thể thành các tổ theo 1 tiêu thức hay nhiều tiêu thức có liên quan đến
mục đích nghiên cứu (như phân tổ các DN theo vùng, theo khu vực, theo loại hình, theo quy mô,…).
Sau đó trong từng tổ, dùng cách chọn mẫu ngẫu nhiên đơn giản hay chọn mẫu hệ thống để chọn
ra các đơn vị của mẫu. Đối với chọn mẫu phân tầng, số đơn vị chọn ra ở mỗi tổ có thể tuân theo tỷ
lệ số đơn vị tổ đó chiếm trong tổng thể, hoặc có thể không tuân theo tỷ lệ. Ví dụ : Một toà soạn báo
muốn tiến hành nghiên cứu trên một mẫu 1000 doanh nghiệp trên cả nước về sự quan tâm của
họ đối với tờ báo nhằm tiếp thị việc đưa thông tin quảng cáo trên báo. Toà soạn có thể căn cứ vào
54

các tiêu thức : vùng địa lý (miền Bắc, miền Trung, miền Nam) ; hình thức sở hữu (quốc doanh,
ngoài quốc doanh, công ty 100% vốn nước ngoài,…) để quyết định cơ cấu của mẫu nghiên cứu.
vi. Chọn mẫu nhiều giai đoạn (multi-stage sampling):
Phương pháp này thường áp dụng đối với tổng thể chung có quy mô quá lớn và địa bàn nghiên
cứu quá rộng. Việc chọn mẫu phải trải qua nhiều giai đoạn (nhiều cấp). Trước tiên phân chia tổng
thể chung thành các đơn vị cấp I, rồi chọn các đơn vị mẫu cấp I. Tiếp đến phân chia mỗi đơn vị
mẫu cấp I thành các đơn vị cấp II, rồi chọn các đơn vị mẫu cấp II…Trong mỗi cấp có thể áp dụng
các cách chọn mẫu ngẫu nhiên đơn giản, chọn mẫu hệ thống, chọn mẫu phân tầng, chọn mẫu cả
khối để chọn ra các đơn vị mẫu. Ví dụ :Muốn chọn ngẫu nhiên 50 hộ từ một thành phố có 10 khu
phố, mỗi khu phố có 50 hộ. Cách tiến hành như sau : Trước tiên đánh số thứ tự các khu phố từ 1
đến 10, chọn ngẫu nhiên trong đó 5 khu phố. Đánh số thứ tự các hộ trong từng khu phố được chọn.
Chọn ngẫu nhiên ra 10 hộ trong mỗi khu phố ta sẽ có đủ mẫu cần thiết.
vii. Kỹ thuật lấy mẫu phi xác suất.
Lấy mẫu thuận tiện
Có nghĩa là lấy mẫu dựa trên sự thuận lợi hay dựa trên tính dễ tiếp cận của đối tượng, ở những
nơi mà nhân viên điều tra có nhiều khả năng gặp được đối tượng. Chẳng hạn nhân viên điều tra
có thể chặn bất cứ người nào mà họ gặp ở trung tâm thương mại, đường phố, cửa hàng,.. để xin
thực hiện cuộc phỏng vấn. Nếu người được phỏng vấn không đồng ý thì họ chuyển sang đối tượng
khác. Lấy mẫu thuận tiện thường được dùng trong nghiên cứu khám phá, để xác định ý nghĩa thực
tiễn của vấn đề nghiên cứu; hoặc để kiểm tra trước bảng câu hỏi nhằm hoàn chỉnh bảng; hoặc khi
muốn ước lượng sơ bộ về vấn đề đang quan tâm mà không muốn mất nhiều thời gian và chi phí.
Lấy mẫu định mức
Là phương pháp mà phỏng vấn viên là người tự đưa ra phán đoán về đối tượng cần chọn vào mẫu.
Như vậy tính đại diện của mẫu phụ thuộc nhiều vào kinh nghiệm và sự hiểu biết của người tổ chức
việc điều tra và cả người đi thu thập dữ liệu. Chẳng hạn, nhân viên phỏng vấn được yêu cầu đến
các trung tâm thương mại chọn các phụ nữ ăn mặc sang trọng để phỏng vấn. Như vậy không có
tiêu chuẩn cụ thể “thế nào là sang trọng” mà hoàn toàn dựa vào phán đoán để chọn ra người cần
phỏng vấn
Lấy mẫu phán đoán
Đối với phương pháp chọn mẫu này, trước tiên ta tiến hành phân tổ tổng thể theo một tiêu thức
nào đó mà ta đang quan tâm, cũng giống như chọn mẫu ngẫu nhiên phân tầng, tuy nhiên sau đó ta
lại dùng phương pháp chọn mẫu thuận tiện hay chọn mẫu phán đoán để chọn các đơn vị trong
từng tổ để tiến hành điều tra. Sự phân bổ số đơn vị cần điều tra cho từng tổ được chia hoàn toàn
theo kinh nghiệm chủ quan của người nghiên cứu. Chẳng hạn nhà nghiên cứu yêu cầu các vấn viên
đi phỏng vấn 800 người có tuổi trên 18 tại 1 thành phố. Nếu áp dụng phương pháp chọn mẫu định
ngạch, ta có thể phân tổ theo giới tính và tuổi như sau:chọn 400 người (200 nam và 200 nữ) có
tuổi từ 18 đến 40, chọn 400 người (200 nam và 200 nữ) có tuổi từ 40 trở lên. Sau đó nhân viên
điều tra có thể chọn những người gần nhà hay thuận lợi cho việc điều tra của họ để dễ nhanh
chóng hoàn thành công việc.
Xác định quy mô mẫu.
i. Mức độ chính xác do việc chọn mẫu mang lại:
Mức độ chính xác do việc chọn mẫu mang lại tỷ lệ thuận với bình phương của quy mô mẫu. Khi
tăng quy mô mẫu lên k lần thì mức độ chính xác sẽ tăng lên k lần.
Ví dụ 3.24 Khi tăng quy mô mẫu từ 500 người lên 1000 người, tức tăng gấp 2 lần thì mức độ chính
xác tăng lên gấp √2 lần, tức là tăng 40%. Còn muốn tăng độ chính xác lên gấp 2 lần thì phải tăng
quy mô mẫu lên gấp 4 lần.
Chú ý: Mức độ chính xác do việc chọn mẫu mang lại khác mức độ chính xác của kết quả điều tra.
Bởi vì mức độ chính xác của kết quả điều tra chịu tác động của nhiều yếu tố như: mức độ chính
xác do việc chọn mẫu mang lại, bảng câu hỏi đã được xây dựng hoàn chỉnh chưa, vấn viên đã làm
đúng quy trình chưa,…
CHƯƠNG 3 : NGUYÊN LÝ THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN 55

ii. Sai số do chọn mẫu:


Sai số do chọn mẫu là chênh lệch giữa giá trị tham số thu được trên mẫu và giá trị tham số đó trên
tổng thể chung
iii. Khoảng tin cậy:
Khoảng tin cậy là khoảng giá trị mà dựa vào giá trị tham số trên mẫu, ta ước lượng giá trị tham số
của tổng thể sẽ rơi vào đó
iv. Độ tin cậy:
Là khả năng đúng khi ta ước lượng giá trị tham số của tổng thể nằm trong khoảng tin cậy.
Chú ý: Chỉ có mẫu được chọn theo phương pháp chọn mẫu xác suất, ta mới có thể xác định được
khoảng tin cậy và độ tin cậy.
Phân tổ
Phân tổ thống kê là căn cứ vào một (hay một số) tiêu thức nào đó để tiến hành phân chia các đơn vị
của hiện tượng nghiên cứu thành các tổ có tính chất khác nhau.

Các hiện tượng và quá trình kinh tế xã hội là những tổng thể vô cùng phong phú, phức tạp vì chúng
tồn tại và phát triển dưới các loại hình thức khác nhau. Mỗi loại hình có qui mô và đặc điểm khác
nhau. Do vậy, muốn phản ánh dược đúng bản chất và quy luật phát triển của hiện tượng nghiên
cứu, mà chỉ dựa vào những con số đặc trưng chung thì chưa đủ mà ta phải tìm cách nêu lên cho
được đặc điểm riêng của từng bộ phận cấu thành nên tổng thể, phải đánh giá cho tầm quan trọng
và mối liên hệ tác động qua lại giữa chúng với nhau, để qua đó thấy được đầy đủ đặc điểm chung
của toàn bộ tổng thể nghiên cứu. Do vậy, cần thiết phải phân tổ thống kê. Phân tổ thống kê được
xem là phương pháp cơ bản để tổng hợp thống kê. Đồng thời cũng là một phương pháp quan trọng
của phân tích thống kê.

i. Phân tổ theo tiêu thức thuộc tính


Xác định số tổ theo tiêu thức thuộc tính là do bản chất của hiện tượng nghiên cứu quyết định.
 Trường hợp thuộc tính có ít biểu hiện thì mỗi biểu hiện là một tổ.
Ví dụ 3.25 Giới tính, trình độ chuyên môn, trình độ văn hóa, loại hình doanh nghiệp...
 Trường hợp thuộc tính có nhiều biễu hiện thì ta ghép một số biểu hiện tương tự nhau thành
một tổ
Ví dụ 3.26 Phân tổ dân số theo ngôn ngữ, phân tổ sản phẩm xuất khẩu theo các ngành công nghiệp
ii. Phân tổ theo tiêu thức số lượng
Theo tiêu thức này sự khác nhau giữa các tổ thể hiện về trị số lượng biến, có 2 trường hợp
 Tiêu thức số lượng có ít trị số.
Ví dụ 3.27 phân tổ các hộ gia đình theo nhân khẩu, số con, điểm thi môn học ....
 Tiêu thức số lượng có nhiều trị số
Ví dụ 3.28 Phân tổ theo độ tuổi, phân tổ công nhân trong xí nghiệp theo năng suất lao động, trọng
lượng của một loại gia súc.
 Trong trường hợp này ta phân tổ có khoảng cách tổ, mỗi tổ có giới hạn trên và giới hạn dưới
 Trị số chênh lệch giữa giới hạn trên và giới hạn dưới của mỗi tổ gọi là khoảng
 Tùy theo mục đích cụ thể của phân tổ và đặc điểm biến thiên của lượng biến tiêu thức để quyết
định xem phân tổ có khoảng cách đều hay không đều.
 Khi phân tổ có khoảng cách đều nhau, trị số khoảng cách tổ được xác định (trong trường hợp
chỉ số liên tục)
xmax  xmin
h
k
Trong đó ℎ : Trị số khoảng cách tổ
56

: sổ tổ
: Trị số quan sát lớn nhất.
: Trị số quan sát bé nhất.
Ví dụ 3.29 Bảng số liệu về năng suất lúa (tạ/ha)
Mức năng suất lúa (tạ/ha) Số hộ
36-38 6
38-40 13
49-42 25
42-44 40
44-46 11
46-48 5
Tổng cộng 100
 Khi phân tổ có khoảng cách đều nhau, trị số khoảng cách tổ được xác định (trong trường hợp
chỉ số rời rạc)
xmax  xmin   k  1
h
k
Ví dụ 3.30 Bảng số liệu về tuổi nghề của công nhân một xí nghiệp
Tuổi nghề Số công nhân
5-7 80
8-10 210
11-13 360
14-16 225
17-19 125
Tổng cộng 1000
 Phân tổ mở là phân tổ mà tổ đầu tiên không có giới hạn dưới, tô cuối cùng không có giới hạn
trên, các tổ còn lại có thể có khoảng cách tổ đều hoặc không đều. Mục đích của việc phân tổ
mở là để tổ đầu tiên và tổ cuối cùng chứa các đơn vị có trị số lượng biến đột biến và tránh việc
hình thành quá nhiều tổ.
Ví dụ 3.31 Bảng số liệu về năng suất lúa (tạ/ha)
Mức năng suất lúa (tạ/ha) Số hộ
<35 5
35-40 10
40-45 20
45-50 12
50 3
Tổng cộng 100
iii. Phân tổ liên hệ.
 Giữa các tiêu thức mà thống kê nghiên cứu thường có mối quan hệ với nhau. Mối liên hệ này
thể hiên sự thay đổi trị số tiêu thức này sẽ dẫn đến sự thay đổi của tiêu thức kia theo một qui
luật nhất định.
Mức đầu tư thức ăn Số cơ Mức bình quân tổ Tăng trọng bình quân
(kg/con/ngày) sở (kg/con/ngày) (g/con/ngày)
<1,4 3 1,31 292
1,4-1,6 5 1,52 318
1,6-1,8 4 1,69 334
CHƯƠNG 3 : NGUYÊN LÝ THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN 57

1,8-2,0 5 1,90 356


2,0-2,2 6 2,13 369
2,2-2,4 5 2,25 381
2,4 7 2,43 397
Tổng cộng 35 1,97 356
Trình bày dữ liệu thống kê
Số liệu thu thập được được trình bày trên bảng thống kê. Bảng thống kê là một hình thức biểu hiện
các tài liệu thống kê một cách có hệ thống, hợp lý và rõ ràng, nhằm nêu lên các đặc trưng về mặt
lượng của hiện tượng nghiên cứu.

Những yêu cầu đối với việc xây dựng bảng thống kê:
 Quy mô của bảng không nên quá lớn
 Các tiêu đề, tiêu mục cần được ghi chính xác, ngắn gọn và dễ hiểu
 Các hàng, cột thường được ký hiệu bằng chữ hoặc bằng số
 Các chỉ tiêu giải thích trong bảng cần được sắp xếp theo thứ tự hợp lý, phù hợp mục đích
nghiên cứu
 Cách ghi các số liệu vào trong bảng thống kê
 Nếu hiện tượng không có số liệu thì ghi dấu gạch ngang ( - )
 Nếu số liệu còn thiếu, sau này bổ sung thì ghi ký hiệu 3 chấm (…)
 Ký hiệu gạch chéo (x): ô cấm
 Các số liệu trong cùng một cột, có đơn vị tính toán giống nhau phải ghi theo trình độ chính xác
như nhau
 Các số cộng và tổng cộng có thể ghi ở đầu hoặc cuối hàng và cột

Cấu thành bảng thống kê


 Về hình thức
Các hàng ngang, cột dọc: phản ánh quy mô của bảng thống kê
Tiêu đề của bảng: phản ánh nội dung của bảng và của từng chi tiết trong bảng
Tiêu đề chung là tên gọi của bảng, ở phía trên đầu bảng
 Tiêu đề nhỏ (tiêu mục) là tên riêng của mỗi hàng và cột
Các tài liệu con số: được ghi vào các ô của bảng, phản ánh đặc trưng về mặt lượng của hiện tượng
nghiên cứu
 Về nội dung
Phần chủ đề (phần chủ từ): nêu lên tổng thể của hiện tượng nghiên cứu
Cách lập bảng dữ liệu cho dữ liệu định tính.
Trong trường hợp đặc điểm thống kê ta đang nghiên cứu có dữ liệu dạng định tính. Bảng tần số
được lập với các thông tin như sau

 Cột thứ nhất: Liệt kê tất cả các biểu hiện có thể có của đối tượng nghiên cứu.
 Cột thứ hai : là cột tần số, được điền số liệu bằng cách đếm xem có bao nhiêu quan sát có
cùng 1 biểu hiện, kí hiệu tương ứng với biểu hiện thứ k là nk . Tổng của tất cả các tần số
bằng số lượng cỡ mẫu quan sát n .
 Cột thứ ba : là cột tần suất. Tần suất tương ứng với từng biểu hiện được tính bằng cách lấy
giá trị tần số tương ứng chia cho số lượng cỡ mẫu, kí hiệu tương ứng với biểu hiện thứ k
nk
là f k  .100% . Tổng của cột tần suất tương ứng bằng 100% dữ liệu quan sát.
n
Đại lượng thống kê Tần số Tần suất
58

n1
Biểu hiện định tính 1 n1 f1 
n
… … …
nk
Biểu hiện định tính k nk fk 
n
Tổng n 100%
Cách lập bảng dữ liệu cho dữ liệu định lượng.
Trong trường hợp đặc điểm thống kê ta đang nghiên cứu có ít biểu hiện giá trị, thì cấu trúc của
bảng tần số giống cấu trúc của bảng dữ liệu định tính. Cấu trúc gồm dòng là các biểu hiện của
lượng biến và các cột trong bảng gồm : tần số của biểu hiện lượng biến, tần suất tương ứng và tần
suất tích lũy.

Đại lượng thống kê Tần số Tần suất Tần suất tích lũy
1
n1
Biểu hiện lượng biến 1 n1 f1 
N
f i 1
i

… … … …
k
nk
Biểu hiện lượng biến k nk fk 
N
 f  100%
i 1
i

Tổng N 100%
Trong trường hợp đặc điểm thống kê ta đang nghiên cứu có nhiều biểu hiện giá trị. Thì trước khi
tiến hành lập bảng tần số cho dữ liệu ta tiến hành phân tổ cho lượng biến, thì khi đó bảng tần số
thu được tương ứng với các tổ dữ liệu sẽ hoàn toàn giống với hai trường hợp trên.

Bảng tần số kết hợp hai biến.


Trong trường hợp bảng tần số mô tả đặc điểm của mẫu nghiên cứu theo một biến dưới sự phân
tách của một biến khác. Cấu trúc bảng có dạng như sau :
Biến thứ nhất
Thông tin mẫu điều
Tổ (1) .. Tổ (m)
tra
Tần số Tần suất … Tần số Tần suất
n11 n1m
Tổ (1) n11 f11  … n1m f1 m 
N1 Nm
Biến thứ
… … … … … …
hai
nn1 nnm
Tổ (n) nn1 f n1  … nnm fnm 
N1 Nm
Tổng cột N1 100% … Nm 100%

2001 2002 2003

Ví dụ: Số
Cơ cấu Số lượng Cơ cấu Số lượng Cơ cấu
lượng
(%) (Người) (%) (Người) (%)
(Người)
Tổng số 1000 100,0 1140 100,0 1310s 100,0
Tiểu học 500 50,0 600 53,0 700 53,5
Trung học cơ sở 300 30,0 320 28,0 360 27,5
Trung học phổ thông 200 20,0 220 19,0 250 19,0
Trong trường hợp có nhiều hơn hai biến thì ta nhóm dòng theo từng nhóm biến.
CHƯƠNG 3 : NGUYÊN LÝ THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN 59

Đồ thị, biểu đồ thống kê


Đồ thị thống kê là các hình vẽ hoặc đường nét hình học dùng để miêu tả có tính chất quy ước các
tài liệu thống kê:
Đặc điểm
 Sử dụng con số kết hợp với hình vẽ, đường nét và màu sắc
 Trình bày một cách khái quát đặc điểm về bản chất và xu hướng phát triển
 Có tính quần chúng, có sức hấp dẫn và sinh động.
Một số dạng biểu đồ khoa học dùng trong thống kê và dùng trong môn học và một số dạng của đồ
thị dùng trong báo cáo khoa học.

You might also like