You are on page 1of 65

Chương 2

THU THẬP DỮ LIỆU


NỘI DUNG
2.1. Xác định dữ liệu cần thu thập
2.2. Dữ liệu thứ cấp và dữ liệu sơ cấp
2.3. Các kỹ thuật lấy mẫu
2.4. Xây dựng kế hoạch điều tra thống kê
2.5. Sai số trong điều tra thống kê
2.1. Xác định dữ liệu cần thu thập
- Xác định dữ liệu cần thu thập là hiểu rõ vấn đề
nghiên cứu, mục tiêu nghiên cứu
- Khi hiểu rõ vấn đề nghiên cứu, vấn đề ưu tiên
sẽ giúp giảm chi phí, thời gian và công sức cho
việc thu thập dữ liệu.

Ví dụ: (i) nghiên cứu vấn đề nghèo đói ở nông


thôn; (ii) vấn đề di dân từ nông thôn ra thành
thị; (iii) sử dụng mạng xã hội trong sinh viên
2.2. Dữ liệu thứ cấp và sơ cấp
2.2.1. Dữ liệu thứ cấp:
- Dữ liệu thứ cấp là những dữ liệu, thông
tin đã có trong một tài liệu nào đó, đã
được thu thập cho một mục đích khác
- Dữ liệu thứ cấp có thể được phân thành
2 phân nhóm chính đó là dữ liệu tài liệu,
dữ liệu dựa vào các cuộc khảo sát
Dữ liệu thứ cấp

Tài liệu Khảo sát

Khảo sát
Tài liệu Tài liệu Điều tra Khảo sát
liên tục
văn bản phi văn bản thống kê đặc biệt
và định kỳ

Thí dụ:
Thí dụ: Thí dụ: Thí dụ: • Chính phủ Thí dụ:
• Dữ liệu của các • Phương tiện • Điều tra - Thị trường • Khảo sát
doanh nghiệp lao động
truyền thông dân số của chính
như nhân sự, - GDP, GNP
như TV, đài phát • Điều tra • Tổ chức phủ
kinh doanh
• Thông tin về thanh việc làm - Khảo sát • Khảo sát
các tổ chức như • Băng đĩa ghi • Điều tra thái độ nhân của các tổ
địa chỉ, email, âm mức sống viên chức
bản ghi nhớ • Băng ghi hình hộ gia đình - Đánh giá • Khảo sát
• Tạp chí mức độ hài của giới học
• Báo chí lòng khách thuật
• Bảng phỏng hàng
vấn
2.2.1. Dữ liệu thứ cấp
- Ưu điểm:
+ Tiết kiệm chi phí
+ Thời gian thu thập nhanh
- Hạn chế
+ Không đáp ứng đúng nhu cầu
+ Dễ lạc hậu theo thời gian
+ Khó tiếp cận
2.2.1. Dữ liệu thứ cấp
Dữ liệu thứ cấp có thể được hình thành từ
hai nguồn:
- Dữ liệu bên trong doanh nghiệp (internal
secondary data)
- Dữ liệu bên ngoài doanh nghiệp (external
secondary data)
2.2.1. Dữ liệu thứ cấp

Từ bộ phận kế toán

Từ bộ phận kinh doanh


DỮ
LIỆU Từ bộ phận nhân sự

BÊN Từ bộ phận sản xuất


TRONG
Từ bộ phận Marketing

Từ bộ phận khác
2.2.1. dữ liệu thứ cấp

1 Nguồn từ sách báo

DỮ 2 Nguồn từ Chính phủ

LIỆU Nguồn từ các tổ chức và hiệp hội


3
BÊN
NGOÀI 4 Nguồn từ các phương tiện truyền thông

5 Nguồn từ thông tin thương mại


Nguồn từ sách báo, tạp chí
o Nghiên cứu Kinh tế - Viện KH – XH Việt Nam
o Economic Development – Viện KH – XH Việt Nam
o Thương mại – Bộ Công Thương
o Tài chính – Bộ Tài chính
o Kinh tế & dự báo – Bộ Kế hoạch & Đầu tư
o Du lịch Việt Nam – Bộ VH – TT – DL
o Kinh tế và phát triển – ĐH KTQD Hà Nội
o Phát triển kinh tế - ĐH Kinh tế Tp HCM
o Khoa học Thương mại – ĐH Thương mại Hà Nội
o Tạp chí khoa học – ĐH HUFI
Nguồn từ chính phủ
o Tổng cục thống kê Việt Nam: www.gso.gov.vn
o Cổng thông tin điện tử các tỉnh, thành
TP. Hồ Chí Minh: www.hochiminhcity.gov.vn
o Các Bộ và các Sở tại các tỉnh
Bộ Văn hóa Thể thao Du lịch: www.cinet.gov.vn
Bộ Công Thương: www.viettrade.gov.vn
www.moit.gov.vn
www.vinanet.com.vn
Bộ Kế hoạch Đầu tư: www.mpi.gov.vn
Các trường, viện nghiên cứu:
Đại học HUFI: http://hufi.edu.vn
Nguồn từ các tổ chức và hiệp hội
o Chương trình phát triển Liên Hiệp Quốc:
www.undp.org.vn
o Liên Hiệp Quốc tại Việt Nam:
www.un.org.vn
o Ngân hàng Thế giới tại Việt Nam:
www.worldbank.org.vn
o Phòng Thương mại và Công nghiệp Việt
Nam: www.vcci.com.vn
o Giá hàng hóa: dexmundi.com/commodities/
Nguồn từ các tổ chức và hiệp hội
• https://data.worldbank.org
https://fred.stlouisfed.org
https://markets.businessinsider.com
• https://www.usinflationcalculator.com
• https://www.gso.gov.vn/
Cách tìm kiếm dữ liệu thứ cấp
 Thư viện
Thư viện Trường, Trung tâm học liệu Đại HUFI, Thư viện Tổng hợp TP.
HCM, thư viện Quốc gia Tp. HCM
Các tài liệu lưu trữ: sách, tạp chí, tài liệu nghe nhìn, các luận văn, các
văn bản nhà nước…
- Ưu điểm:
+ Tài liệu sẵn có
+ Dễ tìm kiếm
+ Chất lượng được kiểm chứng
- Hạn chế:
+ Lượng tài liệu có hạn
+ Không thống kê đến từng bài báo
+ Thông tin chậm cập nhật
Cách tìm kiếm dữ liệu thứ cấp
 Các trung tâm tài liệu
- Trung tâm thông tin phát triển Việt Nam (VDIC)
www.vdic.org.vn
- Viện nghiên cứu kinh tế và phát triển Tp Hồ Chí Minh
 Các cơ sở dữ liệu
Thường được các tổ chức lớn xây dựng bằng cách tập hợp
thông tin tóm tắt từ rất nhiều các tạp chí chuyên ngành
khác nhau, sắp xếp và tổ chức sao cho việc tìm kiếm
thông tin được dễ dàng hơn
Các loại cơ sở dữ liệu:
+ Tra cứu tóm tắt hoàn toàn miễn phí, không có toàn văn
+ Tra cứu tóm tắt miễn phí, truy cập toàn văn thu phí
+ Tra cứu tóm tắt miễn phí, truy cập một số miễn phí
+ Cả tra cứu và truy cập đều thu phí
Cách tìm kiếm dữ liệu thứ cấp
Các danh bạ mạng
- Phân loại và sắp xếp các website theo các
chủ đề lớn – nhỏ, chính – phụ …, giúp
người dùng mạng dễ tìm kiếm hơn
- Một số danh bạ mạng:
+ Open directory (http://www.dmoz.org) : là một
trong những danh bạ mạng phổ thông lớn nhất
+ Google directory
(http://www.directory.google.com)
2.2.2. Dữ liệu sơ cấp
Khái niệm
- Dữ liệu sơ cấp là những dữ liệu được nhà
nghiên cứu thiết kế thu thập và sử dụng
trực tiếp cho mục đích nghiên cứu của mình
- Ưu điểm: Đáp ứng tốt nhu cầu và mục tiêu
nghiên cứu
- Hạn chế: Tốn kém chi phí và thời gian
Dữ liệu định tính – Dữ liệu định lượng
2.2.2. dữ liệu sơ cấp
Các phương pháp thu thập dữ liệu sơ cấp
- Quan sát
- Nhóm tiêu điểm

- Thực nghiệm

- Điều tra phỏng vấn


Phương pháp quan sát
Nội dung
Là phương pháp thu thập dữ liệu bằng việc
sử dụng các giác quan và các thiết bị hỗ trợ
để ghi nhận lại các hiện tượng hoặc hành vi
của con người
Phân loại
- Quan sát trực tiếp và quan sát gián tiếp
- Quan sát ngụy trang và quan sát công khai
- Quan sát do con người và do thiết bị
Phương pháp quan sát
Ưu điểm: Phù hợp với các nghiên cứu về
hành vi
Nhược điểm
+ Chỉ quan sát được hành vi mà không giải thích
được
+ Đối tượng quan sát có thể thay đổi hành vi
+ Thiết bị quan sát trục trặc
+ Quan sát, ghi chép không cẩn thận
Nhóm tiêu điểm (focus group)
Nội dung: Là phương pháp được tiến hành
bằng cách phỏng vấn một nhóm khách hàng
với số lượng nhất định (5 – 12 người)
Ưu điểm
+ Thu thập được thông tin đa dạng
+ Khách quan
Nhược điểm
+ Tính đại diện thấp
+ Chất lượng thông tin phụ thuộc vào khả năng của
điều tra viên
Nhóm tiêu điểm (focus group)
Biện pháp nâng cao hiệu quả
- Người tham gia: ít nhất từ 5 người, nhiều
nhất từ 12 người
- Người tham gia phải có đủ kiến thức và
kinh nghiệm
- Người điều khiển: cởi mở, thân thiện, am
hiểu về thông tin lĩnh vực muốn khai thác
Phương pháp thực nghiệm
Nội dung
- Là phương pháp thu thập dữ liệu bằng cách
quan sát, theo dõi, đo đạc qua các thí
nghiệm
- Gồm các bước: lập giả thuyết, xác định
biến, bố trí thí nghiệm, thu thập số liệu để
kiểm chứng giả thuyết
Phương pháp thực nghiệm
Các loại biến
- Biến độc lập: là các yếu tố, điều kiện bị
thay đổi trên đối tượng nghiên cứu sẽ ảnh
hưởng đến kết quả thí nghiệm
- Biến phụ thuộc: là những chỉ tiêu đo đạc và
bị ảnh hưởng trong suốt quá trình thí
nghiệm, hay có thể nói kết quả đo đạc phụ
thuộc vào sự thay đổi của biến độc lập
Phương pháp điều tra phỏng vấn
 Nội dung
Là phương pháp sử dụng một loạt các câu hỏi mà nhà nghiên
cứu đưa ra để phỏng vấn người trả lời
 Các loại sai biệt trong điều tra
- Do chọn mẫu
- Do điều tra viên
- Do người trả lời
- Do xử lý dữ liệu
Phương pháp điều tra phỏng vấn
Phân loại
- Phỏng vấn cá nhân

- Phỏng vấn qua điện thoại

- Điều tra bằng bảng hỏi


Phỏng vấn cá nhân
Nội dung
Là hình thức tiếp xúc trực tiếp theo đó người
điều tra ở trong tình huống đối mặt với
người được phỏng vấn
Phân loại:
- Tính chất: Phỏng vấn có thỏa thuận trước
và phỏng vấn chặn đường
- Địa điểm: Phỏng vấn trong nhà và phỏng
vấn ngoài phố
Phỏng vấn cá nhân
Ưu điểm
- Cơ hội phản hồi thông tin
- Cơ hội làm rõ những câu trả lời phức tạp
- Độ dài phỏng vấn
- Khả năng hoàn tất
- Khả năng minh họa
- Tỷ lệ trả lời
- Tỷ lệ hưởng ứng
Phỏng vấn cá nhân
Hạn chế
- Các đặc tính nhân chủng học
- Chi phí cao
- Từ chối trả lời câu hỏi tế nhị
- Khả năng tái phỏng vấn
Phỏng vấn qua điện thoại
 Nội dung
Là hình thức phỏng vấn được thực hiện qua điện thoại nhằm
thu thập dữ liệu từ đối tượng điều tra bằng cách nêu câu
hỏi và ghi nhận câu trả lời qua điện thoại
 Ưu điểm
- Thời gian thực hiện nhanh
- Chi phí thực hiện thấp
- Giảm tính cá nhân trực tiếp
- Khả năng hợp tác
- Khả năng tái phỏng vấn
Phỏng vấn qua điện thoại
Hạn chế
- Không gian giao tiếp không trực tiếp
- Tính đại diện của mẫu
- Thời gian phỏng vấn ngắn
- Khả năng minh họa và giải thích
Điều tra bằng bảng hỏi
 Nội dung
Là phương thức thu thập dữ liệu không có sự tiếp xúc nào giữa người
phỏng vấn và người được phỏng vấn ngoài bảng câu hỏi và các hướng
dẫn trả lời được gửi đến
 Các đặc điểm của điều tra qua thư
- Sự năng động về mặt địa lý
- Quy mô mẫu điều tra
- Chi phí điều tra
- Sự vắng mặt của điều tra viên
- Sự tiêu chuẩn hóa bảng câu hỏi
- Phản hồi thông tin
- Thời gian hoàn tất
- Tỷ lệ trả lời
Các phương pháp thu thập dữ liệu sơ cấp
Các phương pháp thu thập dữ liệu sơ cấp
2.3. Các kỹ thuật lấy mẫu
Khái niệm:
- Chọn mẫu (sampling) là chọn lấy 1 số
thành phần trong tổng thể (population), để
rút ra các kết luận về tổng thể đó.
- Đơn vị NC: 1 thành phần của tổng thể
(population element) là 1 cá thể/cá nhân mà
người NC sẽ tiến hành các đo lường.
- Khung mẫu: Danh sách tất cả các thành
phần của tổng thể mà dựa vào đó chúng ta rút
ra mẫu.
2.3. Các kỹ thuật lấy mẫu
Tại sao phải lấy mẫu:
Do tốn kém thời gian và chi phí khi NC tổng
thể
- Lợi thế của điều tra mẫu:
* Chi phí thấp
* Vẫn đạt được tốt hơn độ chính xác cần có
của kết quả.
* Tốc độ thu thập dữ liệu cao hơn
* Tính sẳn có của các thành phần tổng thể.
CÁC BƯỚC THIẾT KẾ MẪU
1. Tổng thể mục tiêu
- Khi xác định vấn đề NC và đặt câu hỏi NC, ta
phải đã biết tổng thể mục tiêu là gì.
- Đối tượng và phạm vi NC. Vd: Hộ gia đình, DN
hoặc cá nhân.
2. Các tham số (parameters) cần quan tâm
- Các chỉ số thể hiện cho tổng thể: là các chỉ số tổng
hợp các biến của tổng mà chúng ta quan tâm: giá
trị trung bình, phương sai,...
- Các chỉ số thống kê mẫu: cũng mô tả các biến trên
nhưng của mẫu.
Từ các chỉ số thống kê mẫu  ước lượng và tham
chiếu các chỉ số thống kê của tổng.
CÁC BƯỚC THIẾT KẾ MẪU
3. Khung mẫu
- Danh sách tất cả các thành phần trong tổng mà sẽ được rút
mẫu ra.
- Một khung mẫu lý tưởng: 1 danh sách hoàn thiện, đầy đủ và
đúng tất cả các thành viên của tổng.
4. Phương pháp chọn mẫu phù hợp:
- Người NC phải quyết định chọn mẫu xác suất hay phi xác suất?
- Việc chọn mẫu xác suất sẽ cho người NC có thể đạt được các
ước lượng cho nhiều chỉ tiêu NC khác nhau dựa trên sự tin
cậy của xác suất.
CÁC BƯỚC THIẾT KẾ MẪU
5. Cần cỡ mẫu bao nhiêu là vừa?
- Cỡ mẫu là số đơn vị NC mà ta cần có trong 1 mẫu khi rút ra
từ tổng thể mục tiêu.
- Có 2 quan điểm về cở mẫu:
(i) Cỡ mẫu phải đủ lớn để đại diện cho tổng thể.
(ii) Cỡ mẫu phải tương ứng với 1 tỷ lệ nào đó so với kích cỡ của
tổng mà nó được rút ra.
Cả 2 quan điểm cũng chưa chính xác
- Với mẫu phi xác suất: Số lượng nhóm phụ, các nguyên tắc lựa
chọn và hạn chế về ngân sách là yếu tố quyết định cỡ mẫu.
- Với mẫu xác suất: cỡ mẫu phụ thuộc vào sự biến thiên của các
chỉ số thống kê của tổng và mức độ chính xác của kết quả mà
ta muốn có.
CÁC BƯỚC THIẾT KẾ MẪU
5. Cần cỡ mẫu bao nhiêu là vừa?
Một số nguyên tắc ảnh hưởng đến xác định cỡ mẫu:
- Tổng thể biến thiên càng nhiều thì cỡ mẫu phải lớn để đạt tính
chính xác.
- Độ chính xác mong muốn càng tăng thì cỡ mẫu phải càng lớn
- Phạm vi sai số càng nhỏ thì cỡ mẫu phải càng lớn
- Mức độ tin cậy của ước lượng càng cao thì cỡ mẫu phải càng
lớn.
- Khi tổng thể có nhiều nhóm phụ, thì cỡ mẫu phải càng lớn để
cỡ mẫu của từng nhóm phụ phải đạt yêu cầu tối thiểu.
- Hạn chế về ngân sách cũng ảnh hưởng đến cỡ mẫu, cách chọn
mẫu và phương pháp thu thập dữ liệu. Hạn chế ngân sách làm
các nhà NC áp dụng các phương pháp chọn mẫu phi xác suất.
2.3.1. Chọn mẫu xác suất
1. Chọn mẫu xác suất ngẫu nhiên đơn giản (simple
Random Sampling): Hay còn gọi lấy mẫu ngẫu nhiên
Chọn mẫu 1 cách ngẫu nhiên từ khung mẫu bằng các bảng số
ngẫu nhiên, hoặc bằng máy tính.
Thực hiện:
- Đánh số mỗi phần tử trong khung mẫu với 1 con số duy nhất, từ
0, 1, 2,...
- Lựa chọn các phần tử bằng con số ngẫu nhiên cho đến khi đạt
được cỡ mẫu mong muốn (mỗi phần tử đều có xác suất được
chọn như nhau).
2.3.1. Chọn mẫu xác suất
1. Chọn mẫu xác suất ngẫu nhiên đơn giản (simple
Random Sampling):
- danh sách lớp hiện có 60 sinh viên trong bảng
tính excel bằng hàm = RANDBETWEEN
(1:60) sau đó chọn ra 6 người trong danh sách
có số phát ra từ 1 đến 6;
- phần mềm R- Console dùng lệnh: > sample
(1:60,6) cho kết quả |42 41 43 25 3 7| tức sinh
viên có thứ tự trong danh sách 42, 41, 43, 25,
3,7 được chọn;
2.3.1. Chọn mẫu xác suất
2. Chọn mẫu hệ thống (Systematic Sampling):
- Đòi hỏi bạn lựa chọn mẫu theo khoản (interval) đều đặn từ
khung lấy mẫu.
- Ta chọn lấy thành phần thứ kth trong tổng thể, bắt đầu 1 con
số ngẫu nhiên trong phạm vi từ 1 đến k.
* Thành phần thứ kth gọi là bước nhảy (skip interval), K = Tổng
thể/cỡ mẫu
Các bước thực hiện:
- Xác định, lập danh sách và đánh số các phần tử của tổng thể
(sắp xếp ngẫu nhiên tổng trước khi chọn mẫu nếu tổng thể
được sắp xếp theo trật tự sẵn có)
- Xác định bước nhảy K
- Xác định con số khởi đầu cách ngẫu nhiên
- Rút mẫu bằng cách chọn tất cả các phần tử theo các bước nhảy
Kth
2.3.1. Chọn mẫu xác suất
2. Chọn mẫu hệ thống (Systematic Sampling):
• chia danh sách lớp 60 ra 6 nhóm, mỗi nhóm có 10
người, dùng hàm RANDBETWEEN (1:10) trong nhóm
1, bạn nào trong danh sách có giá trị 1 được chọn,
bạn kế tiếp trong nhóm thứ 2 có thứ tự từ bạn ở vị
trí nhóm 1 vừa chọn cộng thêm 10 đơn vị và tiếp tục
chọn người thứ 3, thứ 4, thứ 5, thứ 6.
• thực hiện chọn người đầu tiên nhóm 1 từ 1 đến 10
trên phần mềm R bằng lệnh:
• > sample (1:10,1) cho kết quả |[1] 2| tức người thứ 2
trong nhóm 1 được chọnvà người kế tiếp là thứ 12,
22, 32, 42, 52 là những người được chọn để điều tra.
2.3.1. Chọn mẫu xác suất
3. Chọn mẫu phân tầng (Stratified Sampling):
- Là 1 biến thể của chọn mẫu ngẫu nhiên, trong đó ta chia tổng
thể thành 2 hay nhiều tầng (nhóm) quan trọng và có ý nghĩa,
dựa vào 1 hay 1 số thuộc tính. Sau đó rút ra từ mỗi tầng này.
- Phương pháp này có ưu nhược giống với chọn mẫu ngẫu
nhiên đơn giản, nhưng hệ quả thống kê cao hơn.
Cần chú ý khi phân tầng:
* Chi phí: phân tầng càng nhiều  chi phí càng lớn
* Kích cỡ tổng mẫu cần có và mẫu phân bổ như thế nào giữa
các tầng.
Đối với phân mẫu theo tầng khác nhau: theo tỷ lệ hoặc không
theo tỷ lệ.
Chọn mẫu phân tầng theo tỷ lệ thì cỡ mẫu của mỗi tầng đúng
theo tỷ lệ của các thành phần có trong từng tầng so với tổng
số.
2.3.1. Chọn mẫu xác suất
3. Chọn mẫu phân tầng (Stratified Sampling):
- dùng hàm RANDBETWEEN (1:10) cho nhóm 1;
kế tiếp RANDBETWEEN (11:20) cho nhóm 2 và tiếp tục cho
các nhóm còn lại
- dùng R bằng câu lệnh sample cho 6 nhóm có
kết quả sau:
• > sample (1:10,1) [1] 9; > sample (11:20,1) [1]
14; > sample (21:30,1) [1] 23; > sample
(31:40,1) [1] 40; > sample (41:50,1) [1] 49;
sample (50:60,1) [1] 55 ; tức danh sách 6 người
được chọn có số thứ tự là : 9;14;23;40;49;55
2.3.1. Chọn mẫu sác xuất
4. Chọn mẫu theo nhóm (Cluster Sampling):
Lấy mẫu theo cụm nhìn bề ngoài giống lấy mẫu phân tầng.
Các nhóm căn cứ trên dạng ghép nhóm tự nhiên. Hay còn gọi
Chọn mẫu theo vùng
Vd: Có thể ghép nhóm dữ liệu theo loại hình công ty hoặc khu
vực địa lý
2.3.1. Chọn mẫu sác xuất
4. Chọn mẫu theo nhóm (Cluster Sampling):
Giả sử chúng ta thực hiện khảo sát tình hình sinh hoạt
của các hộ dân tại các chung cư trên địa bàn quận Tân
Phú, do có nhiều chung cư trên địa bàn nên ta có thể
chọn 2 chung cư tiêu biểu trong tổng số các chung cư
trên địa bàn, chúng ta có thể chọn ngẫu nhiên 2 chung
cư trong tổng số (giả sử có 20 chung cư trên địa bàn)
bằng cách phát ngẫu nhiên hay bốc thăm; Nếu mẫu ta
chọn là 200 hộ thì có thể chia ra mỗi chung cư là 100
và tiến hành chọn ngẫu nhiên 100 hộ trong tổng số hộ
của mỗi chung cư
2.3.1. Chọn mẫu xác suất
5. Chọn mẫu nhiều giai đoạn (Double sampling ):
- Trong nghiên cứu định lượng, các thông tin có được từ các cuộc
nghiên cứu ban đầu để làm cơ sở cho việc chọn mẫu tiếp theo.
NC kinh tế – xã hội:
& Giai đoạn đầu tiên là NC khám phá, tìm hiểu các thông tin cơ
bản của tổng thể (thông tin rộng). Áp dụng các phương pháp
lấy mẫu trên
- & Giai đoạn sau, dựa vào kết quả NC giai đoạn trước, NC
chuyên sâu, tìm hiểu chi tiết và chuyên sâu. Áp dụng các
phương pháp lấy mẫu trên
2.3.1. Chọn mẫu xác suất
5. Chọn mẫu nhiều giai đoạn (Double sampling ):
• Chọn mẫu nhiều cấp, là phương pháp tổ chức chọn
mẫu phải thông qua ít nhất hai giai đoạn (cấp) chọn
trung gian. Đầu tiên xác định các đơn vị mẫu cấp 1
sau đó các đơn vị mẫu cấp 1 lại được phân chia thành
các đơn vị chọn mẫu cấp 2 và cứ như thế cho đến cấp
cuối cùng.
Trong mỗi cấp có thể áp dụng các cách chọn
mẫu ngẫu nhiên đơn giản, chọn mẫu hệ thống,
chọn mẫu phân tầng, chọn mẫu cả khối để
chọn ra các đơn vị mẫu
2.3.1. Chọn mẫu xác suất
5. Chọn mẫu nhiều giai đoạn (Double sampling ):
• Chọn ngẫu nhiên 100 khách hàng của công ty điện
lực trên địa bàn quận 5 Tp. HCM để điều tra về độ
hài lòng khi sử dụng điện kế điện tử; trên địa bàn
quận 5 có 15 phường, mỗi phường có 5 khu phố,
mỗi khu phố có 300 hộ. Cách tiến hành như sau:
Trước tiên đánh số thứ tự các phường từ 1 đến 15,
chọn ngẫu nhiên trong đó 10 phường. Đánh số thứ
tự các khu phố từ 1 đến 5 và chọn ngẫu nhiên 1 khu
phố (của 10 phường được chọn). Đánh số thứ tự của
300 hộ trong từng khu phố được chọn ra từ 10
phường, Chọn ngẫu nhiên ra 10 hộ trong mỗi khu
phố ta sẽ có đủ mẫu cần thiết.
2.3.2. Chọn mẫu phi xác suất
Chọn mẫu phi xác suất là cách chọn người cần phỏng vấn
không có tính ngẫu nhiên; kết quả thường bị thiên lệch.
Lý do để chọn phương pháp này là:
- Đáp ứng được yêu cầu chọn mẫu theo mục tiêu đặt ra (là đối
tượng điều tra của tổng thể);
- Khi không cần phải tổng quát hóa các kết quả nghiên cứu cho
tổng thể thì không quan tâm tính đại diện cho tổng. Điều này phù
hợp với nghiên cứu khám phá và lấy ý kiến chuyên gia;
- Do chi phí và thời gian ít;
- Khi chúng ta không biết tổng thể nghiên cứu, không có khung
mẫu và không có cơ sở để chọn mẫu xác suất nên phải chọn mẫu
phi xác suất;
- Khi người tham gia nghiên cứu (đối tượng) không có sự ngang
bằng về cơ hội chọn lựa giống nhau.
2.3.2. Chọn mẫu phi xác suất
1. Chọn mẫu thuận tiện (Convenience Sampling):
Việc lựa chọn 1 cách tình cờ những phần tử dễ lấy nhất cho
mẫu của bạn. Quy trình chọn mẫu được tiếp tục cho đến khi
đạt cỡ mẫu cần thiết.
VD: Vào siêu thị phỏng vấn khách hàng về thói quen đi siêu thị,
mức chi tiêu bình quân mỗi lần đi siêu thị của họ...
• Mặc dù kỹ thuật này được sử dụng rộng rãi nhất nhưng dễ có
xu hướng sai lệch. Độ tin cậy thấp nhưng chi phí rẽ, dễ tiến
hành vì các nhà nghiên cứu có quyền tự do lựa chọn bất kỳ ai
họ muốn để phỏng vấn.
Trong giai đoạn NC khám phá có thể áp dụng phương pháp
này.
2.3.2. Chọn mẫu phi xác suất
2. Chọn mẫu theo mục đích (Purposive Sampling) hay phán
đoán (Judgemental Sampling):
Sử dụng phán đoán để lựa chọn các phần tử nhằm trả lời các
câu hỏi NC và đạt được các mục tiêu 1 cách tốt nhất.
* Dạng này được sử dụng khi làm việc với mẫu rất nhỏ như
NC tình huống hay lựa chọn các phần tử đặc biệt chứa nhiều
thông tin, hoặc phù hợp khi sử dụng vào các giai đoạn đầu của
NC khám phá.
VD: NC về những người giàu có, ta chọn những người sinh sống
ở chung cư cao cấp, biệt thự, khách VIP của hệ thống nhà
hàng, khách sạn, hãng bay...
2.3.2. Chọn mẫu phi xác suất
3. Chọn mẫu theo hạn ngạch (Quota Sampling)
- Là 1 kiểu của lấy mẫu phân tầng nhưng sự lựa chọn những
phần tử trong mỗi tầng hoàn toàn phi ngẫu nhiên.
- Thường được sử dụng trong các cuộc khảo sát phỏng vấn.
Dựa trên tiền đề là mẫu sẽ đại diện cho tổng thể vì sự biến
động trong mẫu đối với các biến số cũng giống như biến động
trong mẫu.
Các bước thực hiện:
- Chia tổng thể thành những nhóm cụ thể
- Tính toán hạn mức cho mỗi nhóm dựa vào dữ liệu liên quan có
sẵn
- Giao một nhiệm vụ cho mỗi người phỏng vấn, nói rõ số lượng
các phần tử trong mỗi hạn mức mà họ phải thu thập dữ liệu.
- Tổng hợp dữ liệu của những người phỏng vấn để cung cấp 1
mẫu đầy đủ.
2.3.2. Chọn mẫu phi xác suất
3. Chọn mẫu theo hạn ngạch (Quota Sampling)
2.3.2. Chọn mẫu phi xác suất
4. Chọn mẫu mở rộng dần (Snowball Sampling)
Thường được sử dụng khi khó xác định/khó tiếp cận các thành
viên của tổng thể mong muốn. Phù hợp cho các NC định tính.
Do đó, ta cần:
- Liên lạc với 1 hay 2 phần tử
- Đề nghị các phần tử này xác định các phần tử tiếp theo.
- Đề nghị các phần tử mới này xác định các phần tử tiếp theo (và
cứ thế)
- Dừng lại khi không tìm thêm phần tử mới hay cỡ mẫu đủ lớn
để NC.
Do việc xác định tiếp theo như thế nên vấn đề sai lệch là lớn và vì
những người được hỏi có xu hướng tìm những người tương tự,
nên mẫu đồng nhất.
2.3.3. Xác định cỡ mẫu
• Trong nghiên cứu khoa học, cỡ mẫu tối thiểu
được xác định qua công thức:
• Kích cỡ mẫu tối thiểu = số biến × 5
• Nếu số biến là 20, thì kích cỡ mẫu tối thiểu là 20
x 5 = 100; nếu ta làm một khảo sát cần thu thập
20 biến quan sát thì cỡ mẫu tối thiểu cần phải có
là 100.

Theo Saunders, Lewis and Thornhill (2008),kích cở mẫu tối thiểu


đối với kích cở tổng thể khác nhau và mức ý nghĩa khác nhau
như sau (bảng kế bên):
2.3.3. Xác định cỡ mẫu
2.4. Sai số trong điều tra thống kê
- KN :
Là chênh lệch giữa các trị số của tiêu thức điều tra
mà ta thu thập được so với trị số thực tế của hiện
tượng nghiên cứu.
- Các loại sai số :

+ Sai số do đăng kí
• Do đo lường
• Do trình độ, ý thức của điều tra viên
• Do đơn vị điều tra
• Do kế hoạch điều tra
• Do lỗi in ấn biểu mẫu, phiếu câu hỏi …
+ Sai số do tính chất đại biểu
62
2.5. Sai số trong điều tra thống kê

- Các biện pháp hạn chế sai số:


+ Làm tốt công tác chuẩn bị điều tra
+ Theo dõi, kiểm tra quá trình điều tra.
+ Làm tốt công tác tuyên truyền vận động

63
Một nhà sx đồ hộp cho biết tỷ lệ võ hộp bị biến dạng
tại nhà máy của ông ta luôn dưới mức 3%. Rút ngẫu
nhiên 500 hộp trong 1 lô sx, thấy tỷ lệ hộp bị biến
dạng là 3,2%. Hãy xác định:
• Tổng thể thống kê
• Mẫu
• Tham số mẫu
• Tham số tổng thể

64
Bài tập vận dụng
Truy cập vào trang web https://data.worldbank.org; lấy dữ liệu theo
năm từ năm 1960-2020 của các quốc gia trên thế giới cho các nhóm
chỉ tiêu như
• GDP growth (annual %)
• Inflation, consumer prices (annual %)
• GDP per capita growth (annual %)
• Deposit interest rate (%)
• Lending interest rate (%)
• Poverty headcount ratio at national poverty lines (% of population)
• Poverty headcount ratio at $1.90 a day (2011 PPP) (% of population)
• Poverty headcount ratio at $5.50 a day (2011 PPP) (% of population)
• Mortality rate, under-5 (per 1,000 live births); Truy xuất ra excel và
lưu; làm cho từng chỉ tiêu một cho từng sheet

You might also like