You are on page 1of 79

Chương 2

LẤU MẪU
Nội dung

1. Qui trình lấy mẫu

2. Dữ liệu cho nghiên cứu

3. Phương pháp lấy mẫu

4. Kiểm tra và chỉnh lý dữ liệu.

5. Mã hóa dữ liệu

6. Mô tả dữ liệu

2-2
Qui trình lấy mẫu
• Vì sao phải lấy mẫu?
Để thu thập thông tin tổng thể
 Thời gian
 Chi phí
 Khi không thể nghiên cứu tổng thể.

Sự chính xác
Chi phí

2-3
Qui trình lấy mẫu

1. Xác
4. Lựa
định tổng 6. Lựa
2. Xác 3. Xác chọn 5. Xác 7. Tiến
thể đối chọn sơ
định đơn định cấu phương định kích hành chọn
tượng đồ chọn
vị lấy mẫu trúc mẫu pháp chọn cỡ mẫu mẫu
nghiên mẫu
mẫu
cứu

2-4
Qui trình lấy mẫu

•Tổng thể: Tập hợp tất cả các phần tử


đang được nghiên cứu.
N: Kích thước tổng thể.

Mẫu: Những đơn vị được chọn ra từ


tổng thể để quan sát.
n: kích thước mẫu. Tham số: Đặc tính của tổng thể.
Thuộc tính: Đặc tính của mẫu.
2-5
Qui trình lấy mẫu
Tổng thể Mẫu

Kết quả tính toán từ dữ liệu Kết quả tính toán từ dữ liệu
tổng thể được gọi là tham số mẫu được gọi là thuộc tính.
 Tên của tất cả cử tri đi bầu  Tổng thể
 Thu nhập của tất cả các gia đình sống ở Thành phố  Tổng thể
 Mẫu ngẫu nhiên là một quá trình, trong đó mẫu phải được chọn
ngẫu nhiên.
2-6
Qui trình lấy mẫu
2. Đơn vị lấy mẫu: Một hay nhóm các phần tử để từ đó thực
hiện việc lấy mẫu. Ví dụ: Hộ gia đình.
3. Cấu trúc mẫu: Danh sách các đơn vị lấy mẫu phục vụ
việc lấy mẫu.

2-7
Qui trình lấy mẫu

•4. Phương pháp lấy mẫu


1. Mẫu phi xác suất.
2. Mẫu xác suất - ngẫu nhiên.

Mẫu phi xác xuất


- Lấy mẫu không ngẫu nhiên.
- Không biết xác suất xuất hiện của các phần tử, chọn mẫu phụ
thuộc vào nhà nghiên cứu.
- Các thông số của mẫu không thể dùng để ước lượng, kiểm
định các thông số tổng thể.

2-8
Qui trình lấy mẫu
Mẫu xác suất
- Biết trước xác suất xuất hiện của các phần tử trong mẫu.
- Quá trình chọn mẫu tuân theo quy luật toán, không thể tự ý
thay đổi.
- Các thông số của mẫu có thể dùng để ước lượng hoặc kiểm
định thông số tổng thể.

Độ chính xác của hai phương pháp lấy mẫu


- Không chắc rằng lấy mẫu xác suất chính xác hơn lấy mẫu phi
xác suất.
- Lấy mẫu xác suất kiểm soát được sai số của việc lấy mẫu.

2-9
Qui trình lấy mẫu

TT Mẫu phi xác suất Mẫu xác suất


1 Mẫu thuận tiện Ngẫu nhiên đơn giản
2 Mẫu phán đoán Hệ thống
3 Mẫu theo lớp Phân tầng
4 Mẫu theo mầm Theo nhóm (Cluster)

2-10
Qui trình lấy mẫu

Mẫu phi xác suất


1. Mẫu thuận tiện (convenience sampling)
+ Mẫu được chọn dựa trên tính “dễ tiếp xúc” và “cơ hội
thuận tiện”.
+ Nhược điểm: Không xác định được sai số lấy mẫu và
không thể kết luận cho tổng thể từ kết quả lấy mẫu
+ Sử dụng phổ biến khi bị giới hạn về thời gian và chi phí.
Ví dụ: lấy mẫu dựa trên mối quan hệ, quen biết.

2-11
Qui trình lấy mẫu

2. Mẫu phán đoán (Judment)


+ Nhà nghiên cứu tự phán đoán sự thích hợp của các phần tử
để mời họ tham gia vào mẫu.
+ Đặc điểm tương tự mẫu thuận tiện, nhưng nếu khả
năng/kinh nghiệm phán đoán tốt thì cho mẫu tốt hơn thuận
tiện.

 Mẫu phi xác suất chưa chắc đã rẻ, nhưng thường tồn tại nhiễu.

2-12
Qui trình lấy mẫu

•3. Mẫu theo lớp (quota sampling)


• + Tổng thể đã được phân tổ trước  người thực hiện nghiên
cứu chỉ cần chọn đủ số lượng mẫu (để đảm bảo tỷ lệ mẫu và
các đặc trưng kiểm soát) mà không cần ngẫu nhiên.
• + Có thể sử dụng một hoặc nhiều thuộc tính kiểm soát như
tuổi, giới tính, thu nhập, loại hình doanh nghiệp.
• + Sử dụng phổ biến trong nghiên cứu.

2-13
Qui trình lấy mẫu
4. Mẫu theo mầm (snow ball)
+ Chọn ngẫu nhiên những người được phỏng vấn ban đầu,
những người tiếp theo được chọn theo lời giới thiệu của
những người phỏng vấn trước đó.
+ Sử dụng thích hợp khi tổng thể ít hoặc khó nhận ra đối
tượng cần thu thập thông tin.

Đặc tính của mẫu xác suất


– Kiểm soát được sai số của việc lấy mẫu
– Kiểm định, suy luận tổng thể từ mẫu.

2-14
Qui trình lấy mẫu
1. Mẫu ngẫu nhiên (xác suất)
 Lấy mẫu ngẫu nhiên dựa trên việc đã biết phân bố của tổng thể.
 Phần tử được chọn vào tập mẫu có xác suất như nhau và biết
trước.
 Qui trình
 Phát số ngẫu nhiên
+ Rút thăm, thẻ ngẫu nhiên
+ Dùng bảng số ngẫu nhiên nếu tổng thể lớn
+ Dùng hàm: Rand().
+…
 Kiểm định giả thuyết.
 Ưu điểm: Đơn giản nếu đã có khung lấy mẫu đầy đủ
 Nhược điểm: Không khả thi khi tổng thể lớn. 2-15
Qui trình lấy mẫu
Rút thăm

2-16
Qui trình lấy mẫu

Bảng số ngẫu nhiên

684257954125632140
582032154785962024
362333254789120325
985263017424503686

2-17
Qui trình lấy mẫu

2. Ngẫu nhiên phân tổ


+ Phổ biến nhất vì tính chính xác và đại diện cao
+ Chia tổng thể ra từng nhóm nhỏ theo 1 tiêu thức nào đó gọi là
tiêu thức phân tổ (thu nhập, giới tính, tuổi tác, trình độ học
vẫn, nhân khẩu...)
+ Chọn mẫu ngẫu nhiên cho từng tổ với kích thước mẫu tỉ lệ với
độ lớn của tổ
+ Tiêu chí phân tổ (phù hợp) ảnh hưởng đến độ chính xác mẫu.

2-18
Qui trình lấy mẫu
Ngẫu nhiên phân tổ

2-19
Qui trình lấy mẫu
3. Ngẫu nhiên phân vùng
Vùng 1 Vùng 2

Vùng 3

Vùng 5

Vùng 4
2-20
Qui trình lấy mẫu

Ngẫu nhiên phân vùng


 Phân chia tổng thể thành nhiều nhóm dựa trên địa giới, dữ
liệu cùng vùng thường cùng khu vực hay lân cận nhau.
 Mẫu được chọn ngẫu nhiên từ các nhóm
 Có thể phân nhóm nhiều bước: tiếp tục chọn nhóm con trong
nhóm.
 Chọn mẫu theo khu vực (area sampling) là một dạng của
chọn mẫu theo nhóm với các nhóm được phân chia theo khu
vực địa lý.

2-21
Qui trình lấy mẫu

Phân vùng 2 cấp


Thành phố có 200 khu phố, mỗi khu phố có 20 hộ gia đình. Cỡ
mẫu n = 100 hộ gia đình thì tỷ lệ chọn sẽ là n/N= 1/40.
Chọn mẫu ngẫu nhiên theo vùng 2 cấp:
• Cấp khu phố: với tỷ lệ chọn 1/b
• Cấp hộ gia đình: với tỷ lệ chọn 1/h

2-22
Qui trình lấy mẫu  Vậy theo yêu cầu thì tỷ lệ chọn toàn thể
là: (1/b).(1/h) = 1/b.h = 1/40; m.k = 100.
Các phương án lấy mẫu

Phương Tỷ lệ cấp Tỷ lệ cấp Tỷ lệ toàn Số khu Số hộ gia


án 1 2 thể phố cấp 1 đình cấp 2
(1/b) (1/h) (1/b.h) (m) (k)
1 1/2 1/20 1/40 100 1
2 1/4 1/10 1/40 50 2
3 1/8 1/5 1/40 25 4
4 1/10 ¼ 1/40 20 5
5 1/20 ½ 1/40 10 10
6 1/40 1 1/40 5 20
2-23
Qui trình lấy mẫu

Mẫu xác suất vs. phi xác suất

Xác suất Phi xác suất


Tính đại diện cao; Tiết kiệm thời gian và
Ưu điểm khái quát hóa cho tổng chi phí
thể
Tốn thời gian và chi Tính đại diện thấp
Nhược điểm
phí
Nghiên cứu mô tả, Nghiên cứu thử
Phạm vi sử dụng khám phá và quan hệ nghiệm, thăm dò.
nhân quả.

2-24
Cỡ mẫu

•Yếu tố ảnh hưởng đến cỡ mẫu


 Mục tiêu nghiên cứu
 Yêu cầu của dữ liệu phân tích
 Thời gian
 Chi phí
 Cỡ mẫu tương quan với độ lớn của tổng thể.

2-25
Cỡ mẫu
Sample size

Quantitative Qualitative

Z π(1  π)
2
 Zs 
2
n  n
x  E 2

2-26
Cỡ mẫu
Chất lượng (qualitative)
• Mức độ biến động của dữ liệu: V =  (1 – ) tỷ lệ thuận với
cỡ mẫu.  là tỷ lệ xuất hiện của các phần tử trong đơn vị lấy
mẫu đúng như mục tiêu chọn mẫu (0    1)
• Độ tin cậy liên hệ với giá trị Z (90%, 95%)
• Tỷ lệ sai số ước lượng E (nếu điều tra toàn bộ tổng thể thì E
= 0)

Công thức

2-27
Cỡ mẫu

Trị Z ứng với độ tin cậy thông dụng

Độ tin cậy* (%) Z


90.00 1.65
95.00 1.96
95.45 2.00
99.00 2.58
99.73 3.00
* Độ tin cậy = 1 - α
Qui trình lấy mẫu
Ví dụ: Để xác định tỷ lệ học sinh bệnh thiếu máu bậc tiểu học; tiến
hành khảo sát một trường được tỷ lệ học sinh thiếu máu  = 30%.
Tính kích thước mẫu ở khoảng tin cậy 95% và cho phép sai số
(mẫu) so với tỷ lệ thiếu máu thực là 4%?
Lời giải

[0.3(1  0.3)]1.962
n 2
 504.21 ~ 505
(0.04)

2-29
Qui trình lấy mẫu
Ví dụ
• Mức ý nghĩa = 5% (độ tin cậy 95%)
• Mức độ xuất hiện tham số tổng thể ở mẫu:  = 0.05
• Sai số ước lượng trung bình D = 5%
(D được cho trong trường hợp này được thay thế E)
Tính cỡ mẫu?
Lời giải
α = 0.05  Z = 1.96 (Tra bảng Chuẩn)

 1     Z2 /2
n
D2
0.05 1  0.05   1.962
n 2
 73
0.05
Qui trình lấy mẫu

Cỡ mẫu (số lượng) phụ thuộc


Độ chính xác mong muốn
Mức biến động

Công thức
2
Zs
n=
αx

Trong đó Z: Trị thống kê tương ứng với độ tin cậy


s: Độ lệch chuẩn của mẫu ban đầu
x : Trung bình mẫu ban đầu
 : Tỷ lệ sai lệch mẫu.
Qui trình lấy mẫu

Cỡ mẫu (số lượng)


Giá trị tuyệt đối E = αx, tức E là sai số tuyệt đối.

2
Zs
n=
E

Độ lệch chuẩn S

∑(xi - x)2 ∑(Quan sát i - x)2


S = =
n–1 Kích thước mẫu - 1
Qui trình lấy mẫu
Ví dụ
Độ tin cậy 95%; độ lệch chuẩn s = 1.0
Trung bình mẫu = 3.0, tỷ lệ sai lệch cho phép  = 0.05
Tính cỡ mẫu?
Lời giải
α = 0.05 x = 3.0 s = 1.0
Độ tin cậy 5%  Z = 1.96 (tra bảng phân phối chuẩn)
2
Zs
n=
αx
2
1.96  1,0
n= = 170.74 ≈ 171
0.05  3
Qui trình lấy mẫu

Ví dụ
Nghiên cứu tham số của một tổng thể với độ lệch chuẩn tổng thể 
= 46. Với sai số khi lấy mẫu D = 4 vẫn được chấp thuận. Hãy xác
định kích thước mẫu ở độ tin cậy 99%?
Lời giải

Z 2 2
n
D2

2.582 x 46 2
n  880.3 ~ 881
42
2-34
Qui trình lấy mẫu
Xác định cỡ mẫu trong chọn mẫu phi xác suất
 Quyết định cỡ mẫu trong chọn mẫu phi xác suất thường được
thực hiện một cách chủ quan.
 Yếu tố quyết định then chốt trong việc chọn mẫu là chi phí và
thời gian.

2-35
Qui trình lấy mẫu
Sơ đồ lấy mẫu
• Trường hợp địa bàn rộng
• Cần quản lý chặt chẽ nhóm nghiên cứu
• Vẽ phác họa sơ đồ khu vực chọn mẫu, đánh dấu các số nhà
trên địa bàn
• Chia nhỏ các ô trên bản đồ Thành phố, đánh số thứ tự các ô,
chọn ngẫu nhiên 100 ô để xác định các hộ gia đình, cửa
hàng được chọn làm mẫu.

2-36
Dữ liệu cho nghiên cứu

•Yêu cầu (dữ liệu)


•(1) Dữ liệu phải phù hợp với mục tiêu và vấn đề nghiên cứu.
•(2) Dữ liệu phải chính xác, và tin cậy
•(3) Thỏa tiêu chí Thời gian & Chi phí (hiệu quả của nghiên cứu).
•(4) Dữ liệu phải mang tính hệ thống và khách quan (không định
kiến).

2-37
Dữ liệu cho nghiên cứu
Dữ liệu

Dữ liệu Dữ liệu
thứ cấp sơ cấp

Bên trong Bên ngoài

Cần nghiên
Sẵn sàng Tài liệu đã Cơ sở dữ
cứu Khách hàng
sử dụng xuất bản liệu
sâu
2-38
Dữ liệu thứ cấp
So sánh dữ liệu Thứ cấp vs. Sơ cấp

Tiêu chí Sơ cấp Thứ cấp


1. Mục đích thu thập Nghiên cứu cụ thể Cho nghiên cứu khác
2. Tiến trình thu thập Bảy bước Nhanh và dễ (sẵn)
3. Chi phí Cao Thấp
4. Thời gian Dài Ngắn

2-39
Dữ liệu thứ cấp
Tài liệu đã được xuất bản

Tài liệu đã được


xuất bản

Nguồn kinh tế Nguồn chính phủ

Hướng Thư mục Danh mục Dữ liệu Trung tâm Nguồn chính
dẫn thống kê dữ liệu phủ khác

2-40
Dữ liệu thứ cấp
Cơ sở dữ liệu

Cơ sở dữ liệu
(máy tính)

On-Line Internet Off-Line

Dữ liệu cá Cơ sở dữ liệu Directory Cơ sở dữ liệu


Dữ liệu số
nhân toàn văn Databases chuyên dùng

2-41
Dữ liệu thứ cấp
Khách hàng
Hộ gia đình /người
tiêu dùng

Mail

Lịch sử mua sắm Media D.vụ scanner điện tử

Nghiên cứu Dữ liệu về nhu Thông tin cá TT. cá nhân từ


cầu, sức mua nhân truyền hình,
internet

Hành vi Đánh giá hiệu


Tổng quan
& lối sống quả quảng cáo 2-42
Dữ liệu thứ cấp
Doanh nghiệp
Doanh nghiệp

Bán lẻ Cung ứng Nhà máy

Audits

Cung cấp dịch


Trực tiếp Báo cáo
vụ
2-43
Đánh giá dữ liệu thứ cấp
Dữ liệu thứ cấp có trả lời cho các Không
câu hỏi của vấn đề nghiên cứu không Dừng

Dữ liệu thứ cấp có phù hợp với Không


thời gian nghiên cứu không
Có thể
Có xử lý lại Không
Không các số liệu
Dữ liệu thứ cấp đó có áp dụng
được với tổng thể nghiên cứu không?
cho phù Dừng
hợp
Có không
Đơn vị đo lường có phù hợp Không
với thiết kế nghiên cứu không?


Có Không
Sử Dữ liệu thứ cấp có
dụng tin cậy không? Dừng
2-44
Dữ liệu sơ cấp

Dữ liệu cho nghiên cứu

Dữ liệu thứ cấp Dữ liệu sơ cấp

Nghiên cứu định tính Nghiên cứu định lượng

Mô tả Nhân quả

Dữ liệu Dữ liệu quan sát & Dữ liệu thực


điều tra dữ liệu khác nghiệm
2-45
Dữ liệu sơ cấp
Nghiên cứu Định lượng vs. Định tính

Nghiên cứu Định tính Nghiên cứu định lượng

Lượng hóa bằng dữ liệu,


Tìm hiểu nguyên nhân, phân tích dữ liệu để thông
Mục tiêu
động lực của sự việc. hiểu bản chất của sự việc

Kích thước mẫu bé, mẫu


Kích thước mẫu không mang tính đại diện Kích thước mẫu lớn
Thu thập dữ liệu Không cấu trúc Có cấu trúc
Phân tích dữ liệu Phi thống kê Thống kê
Phát triển dựa trên sự Hướng dẫn kế hoạch
Đầu ra thông hiểu ban đầu hành động
2-46
Dữ liệu sơ cấp
Nghiên cứu định tính
Nghiên cứu định tính

Trực tiếp (Non Gián tiếp


disguised) (Disguised)

Projective
Techniques
Phỏng vấn nhóm Phỏng vấn sâu

Association Completion Construction Expressive


Techniques Techniques Techniques Techniques
2-47
Thu thập dữ liệu

•Phương pháp
• Interviewing: Phỏng vấn khách hàng và chuyên gia về lĩnh vực liên
quan.
• Questionnaires: Bảng câu hỏi.
• Observation: Quan sát.
• Background reading: Nghiên cứu tài liệu tổ chức và tài liệu hệ
thống thông tin (phần mềm) đang tồn tại.
• Phỏng vấn nhóm.

2-48
Phỏng vấn
Người phỏng vấn Doanh nghiệp

Lên kế hoạch phỏng vấn Xác nhận kế hoạch


phỏng vấn
Chuẩn bị chủ đề, câu hỏi, Xắp xếp nhân sự tham
nhân sự tham gia phỏng vấn gia phỏng vấn

Gởi chủ đề phỏng vấn

Đặt câu hỏi Trả lời

Ghi nhận

Kiểm tra và đánh giá kết quả Bổ sung hoặc xác nhận kết
quả
Tìm kiếm các quan điểm
khác 2-49
Phỏng vấn – các loại câu hỏi

•Câu hỏi mở: có phạm vi trả lời tự do, kết quả không tuân theo một
vài tình huống cố định
•Ví dụ: Ưu điểm của hệ thống phân phối của công ty bạn đang làm
việc?
•Câu hỏi đóng: là câu hỏi mà sự trả lời là việc chọn lựa một hoặc
nhiều trong những tình huống xác định trước.
• Ví dụ: Ưu điểm của hệ thống thông tin công ty bạn đang sử dụng
(chỉ chọn một)?
• Có dễ dàng truy cập đến tất cả dữ liệu
• Thời gian phản hồi nhanh
• Khả năng chạy đồng thời với các ứng dụng khác.

2-50
Phỏng vấn
•Ví dụ

Kế hoạch phỏng vấn tổng quan


Hệ thống: Doanh nghiệp A
Người lập: Kỳ Duyên Ngày lập: 01/01/2017
Ngày bắt Ngày kết
TT Chủ đề Yêu cầu
đầu thúc
1 Qui trình bán Nắm rõ tất qui trình về bán lẻ, 02/09/2013 02/09/2013
điện thoại di bán sỉ, và qui trình xử lý đơn
động đặt hàng
2 Qui trình đặt mua Nắm qui trình khách hàng đặt 03/09/2013 03/09/2013
điện thoại mua điện thoại
3 Quản lý nhập Qui trình quản trị hàng hóa tồn 05/09/2013 05/09/2013
xuất tồn kho kho
4 Hệ thống máy Tìm hiểu kỹ về tài nguyên máy 10/09/2013 10/09/2013
móc, phần mềm móc, trang thiết bị, phần mềm,
hệ điều hành đang sử dụng của
tổ chức
2-51
Phỏng vấn
Bảng câu hỏi và ghi nhận trả lời
Người được phỏng vấn: Lam Ngày: 01/01/2017
Câu hỏi Ghi nhận
Câu hỏi 1: Trả lời:
Khách hàng đặt hàng dưới hình Gọi điện thoại, đến tận đại lý, gởi fax
thức nào? Kết quả quan sát:
Đáng tin cậy
Câu hỏi 2: Trả lời:
Tất cả đơn đặt hàng của khách Phải thanh toán trước hoặc ngay khi giao.
hàng phải được thanh toán trước Kết quả quan sát:
rồi mới giao hàng? Thái độ không chắc chắn
Câu hỏi 3: Trả lời
Chị muốn hệ thống mới sẽ giúp Dữ liệu chỉ nhập một lần và hệ thống tự động
cho Chị điều gì? phát sinh báo cáo các loại
Kết quả quan sát
Không tin tưởng lắm, hình như đã triển khai
thất bại một lần 2-52
Phỏng vấn nhóm
từ xa qua video
conference

Nhiều người phỏng Phân tích Người phỏng


vấn viên vấn

Trả lời về kỹ thuật


Nhiều đối tượng được Câu hỏi về nghiệp
vụ
phỏng vấn
Mỗi người phỏng vấn Phỏng vấn
nhóm
đặt câu hỏi và ghi nhận Câu hỏi về kỹ Trả lời về nghiệp
thuật vụ
lại ý kiến về lãnh vực
mình
Trả lời về tổng
quan…
Câu hỏi tổng
quan, …

2-53
Bảng câu hỏi - Questionnaires
•Nhằm đạt được thông tin từ nhiều người và kết quả có thể phân tích
thống kê.
•Đặc điểm
• Bảng câu hỏi có thể được gởi qua thư, email, hoặc dựa web
• Dùng thu thập ý kiến hoặc dữ kiện.
• Bảng câu hỏi phải được thiết kế tốt và dễ trả lời
•Các loại câu hỏi
• Câu hỏi mở: câu trả lời có thể không đoán trước được.
• Câu hỏi đóng: Câu trả lời được chọn từ danh sách cung cấp trước.
• Có thể dùng câu hỏi đóng và hạn chế câu hỏi mở
• Các câu hỏi đóng có thể:
• Multi-choice questions: Câu hỏi nhiều chọn lựa
• Rating questions: Câu hỏi đánh giá từ yếu tới mạnh
• Ranking questions: Câu hỏi xếp hạng. từ 1 – 10 hoặc tỉ lệ %

2-54
Bảng câu hỏi

•Yêu cầu
• Trình bày mục đích của việc điều tra
• Hướng dẫn điền câu trả lời.
• Thời hạn gởi câu trả lời.
• Hình thức bảng câu hỏi phải tiện dụng cho nạp vào máy tính.
• Chừa đủ chỗ để trả lời
• Có chỗ để nhận xét
• Trong bảng câu hỏi cần ghi rõ họ tên/ký tên xác nhận trách nhiệm
thông tin của người trả lời để tiện việc liên lạc, trao đổi.

2-55
Nghiên cứu tài liệu

Tài liệu giao dịch: chứng từ, thư từ, thông


báo,…
Tài liệu Tài liệu lưu: sổ sách, tập tin, báo cáo,…
hoàn Tài liệu tổng hợp: báo cáo, thống kê, kế hoạch
chỉnh Tài liệu tổ chức, chính sách: cấu trúc tổ chức,
mô tả công việc, qui trình, thủ tục, các quy
Tài liệu định nội bộ, chủ trương, chính sách, các quy
định bất thành văn…

Tài liệu Tài liệu bổ sung: bảng hỏi, phiếu thu thập,…
làm tiếp Tài liệu nghiên cứu: báo cáo nghiên cứu,…
Tài liệu chuẩn bị: cuộc họp, máy tính,…
=> Cung cấp người phân tích khung tổng quát về hệ thống thông tin;
hỗ trợ phát hiện những điểm thiếu chính xác, thiếu chặt chẽ của hệ
thống hiện tại. 2-56
Observation - Quan sát hiện trường

 Quan sát trực tiếp tại nơi làm việc, hiện trường xem xét quy
trình làm việc thực tế của tổ chức nhằm tìm kiếm điều thực sự
xảy ra, không phải điều người ta nói.
 Quan sát người ta thực hiện xử lý công việc như thế nào và
điều gì xảy ra để biết được thực trạng luân chuyển thông tin
trong tổ chức.
 Quan sát thụ động: Quan sát các hoạt động mà không bị dừng ngang hoặc
không tham gia trực tiếp  dùng camera
 Quan sát chủ động: Tham gia trực tiếp vào các hoạt động.

2-57
Quan sát hiện trường

− Tham gia trực tiếp vào một bước hay cả quy trình
nghiệp vụ => ghi nhận, nắm bắt những thông tin cần
thiết.
− Đạt được các dữ liệu định lượng để làm cơ sở cho các
cải tiến được cung cấp bởi hệ thống mới.

Biện pháp này bổ sung thêm những kết quả khảo sát của
những biện pháp khác.

2-58
Kiểm tra hiệu chỉnh dữ liệu

• Kiểm tra thực địa: xác định tính trung thực và chính xác
của dữ liệu

• Chỉnh lý dữ liệu: bổ sung thiếu sót và hiệu chỉnh các sai sót

2-59
Kiểm tra hiệu chỉnh dữ liệu

Kiểm tra thực địa


• Kiểm tra phần xác nhận
• Giám sát viên tổ chức kiểm tra thực địa ít nhất 20% số mẫu
• Trở lại địa chỉ đã chọn mẫu, hỏi một vài chỉ tiêu quan
trọng để đối chiếu.

2-60
Kiểm tra hiệu chỉnh dữ liệu

Hiệu chỉnh dữ liệu


• Những cuộc phỏng vấn giả tạo
• Câu trả lời không đầy đủ
• Câu trả lời lạc đề, sai nội dung
• Câu trả lời không đọc được.

2-61
Kiểm tra hiệu chỉnh dữ liệu

Nguyên tắc hiệu chỉnh


• Bổ sung, chỉnh sửa nếu có khoảng 20% sai sót trở lên
• Hiệu chỉnh sai sót nhỏ từ việc suy luận từ các câu trả lời khác
• Dùng viết màu khác để chỉnh sửa, không được xóa dữ liệu gốc
• Thống nhất nguyên tắc chỉnh lý chung.

2-62
Mã hóa dữ liệu
Nguyên tắc mã hóa
• Tính phù hợp
Cách phân loại/nhóm phải phù hợp với mục tiêu nghiên cứu.
Ví dụ: phân loại theo độ tuổi.
• Tính toàn diện
Mã số phải bảo phủ hết dữ liệu nghiên cứu, tiểu mục khác
nên chiếm tỷ trọng nhỏ.
• Tính loại trừ lẫn nhau
Mỗi trả lời chỉ tương ứng với một mã số.
• Tính đơn nguyên
Mỗi trả lời chỉ tương ứng với một nghĩa, một câu không được
có 2 ý. 2-63
Mã hóa dữ liệu

Là quá trình gán mã số (số hoặc nhãn) cho các biến và các câu
trả lời.
Các bước mã hóa
 Đặt tên biến cho các câu hỏi
 Chuyển tập các lựa chọn trả lời thành tập số/nhãn phù hợp, có
ý nghĩa
 Lưu ý câu hỏi mở, câu hỏi có lựa chọn “khác”, câu hỏi có câu
trả lời “không biết”.

2-64
Thực hiện trên SPSS
hoặc Excel
Phương pháp nghiên cứu Marketing

2-65
Mã hóa dữ liệu
Tạo biến mới
Mục đích: Tạo ra các biến trung gian, biến mới từ tập dữ liệu
gốc
Thực hiện (phần mềm SPSS Ver. 18 trở về sau)
Transform  Compute Variables 
Đưa biến cần mã hóa vào ô Numeric Expression và chọn công
thức tính toán thích hợp.
Đặt tên biến mới ở ô Target Variable.
Sau khi có biến mới  Quay lại màn hình khai báo biến để gán
các nhãn cho biến mới.
Ví dụ: Tính toán biến lại biến thâm niên của người lao động ở
một doanh nghiệp bằng nhân đôi thâm niên.
2-66
Mã hóa dữ liệu
Tạo biến mới

2-67
Mã hóa dữ liệu
Mã hóa lại dữ liệu
Mục đích: Tạo ra các biến mới từ dữ liệu gốc.
Thủ tục (phần mềm SPSS ver. 18)
Transform  Recode Different Variables 
Đưa biến cần mã hóa vào ô Numeric Expression  Output
Variable.
Đặt tên biến mới ở ô Name và gán nhãn ở ô Label.
Sau đó vào ô Old – New value để mã hóa lại dữ liệu
Khi có biến mới, quay lại màn hình khai báo biến để gán nhãn cho
các giá trị mới được tạo ra
Sau khi có biến mới  Quay lại màn hình khai báo biến để gán
các nhãn cho biến mới.
2-68
Mã hóa dữ liệu
Ví dụ: Mã hóa lại biến thâm niên của người lao động, thay giá
trị gốc 15 bằng giá trị mới: 15.5.

2-69
Mô tả dữ liệu
Thống kê mô tả
Mục đích: Biểu diễn các tham số thống kê cơ bản của tổng thể,
mẫu
(1) Mức độ tập trung
• Trung bình (mean)
• Số mode
• Trung vị (Median)
(2) Mức độ phân tán
• Phương sai hay độ lệch chuẩn (Var/St.d)
• Khoảng biến thiên (Range)
• Hệ số biến động (C.V)
2-70
Mô tả dữ liệu
Cửa sổ lệnh descriptives

2-71
Mô tả dữ liệu
1. Từ menu Analyze  Descriptive Statistics 
Descriptives…, xuất hiện hộp thoại
2. Chọn 1 hay nhiều biến (định lượng) muốn tính điểm trung
bình đưa vào khung Variable(s).
3. Click vào ô Options… để xuất hiện hộp thoại Descriptive
Options. Chọn các đại lượng thống kê muốn tính toán bằng
cách click vào ô vuông cần thiết.
4. Chọn cách sắp xếp kết quả tính toán theo thứ tự danh sách
biến (Variable list), thứ tự Alphabetic của nhãn biến, thứ tự
tăng dần (Ascending list), và thứ tự giảm dần (Descending
list).
5. Click Continue để trở về hộp thoại Descriptive  Ok để
thực hiện lệnh.
2-72
Mô tả dữ liệu

Ý nghĩa của từng giá trị trung


bình đối với thang đo khoảng
(Interval Scale)
Giá trị khoảng cách
= (Maximum - Minimum) / n
= (5 -1) / 5
= 0.8

2-73
Mô tả dữ liệu

Giá trị trung bình Ý nghĩa


1.00 - 1.80 Rất không đồng ý/Rất không hài lòng/Rất không
quan trọng
1.81 - 2.60 Không đồng ý/Không hài lòng/ Không quan trọng
2.61 - 3.40 Không ý kiến/trung bình
3.41 - 4.20 Đồng ý/ Hài lòng/ Quan trọng
4.21 - 5.00 Rất đồng ý/ Rất hài lòng/ Rất quan trọng

2-74
Mô tả dữ liệu
Phân tích tần số
Mục đích: Tìm ra cấu trúc của hiện tượng nghiên cứu
Ứng dụng: Thường được sử dụng cho các trường hợp sau.
• Đếm tần số xuất hiện ở dữ liệu đầu vào
• Phân tích tỷ trọng, phân bố của các thành phần trong tổng
thể
• Biểu thị sự chọn lựa nhãn hiệu, sản phẩm được ưa thích.

2-75
Mô tả dữ liệu

Qui trình phân tích tần số


1. Sau khi mở file dữ liệu, vào menu Analyze  Descriptive
Statistics  Frequencies

2-76
Mô tả dữ liệu
Màn hình sẽ xuất hiện hộp thoại sau

2. Chọn biến muốn tính tần số (biến tham nien[TN]) bằng cách
nhấp chuột vào tên biến rồi đưa sang khung Variable(s).
2-77
Mô tả dữ liệu
3. Click Ok. Trường hợp muốn vẽ biểu đồ thực hiện thêm bước
4 trước khi click Ok.

4. Để vẽ biểu đồ click chuột vào


ô Charts…. Chọn dạng biểu
đồ ở Chart type, chọn giá trị thể
hiện trên biểu đồ là số đếm
(frequencies) hay phần trăm
(percentages). Click Continue
để trở lại hộp thoại Frequencies
 Ok để thực hiện lệnh.

2-78
Tài liệu tham khảo

[1] TS. Nguyễn Đình Thọ, Nguyễn Thị Mai Trang, “Nghiên cứu
marketing”, NXB. Đại học Quốc gia TP. HCM 2007.
[2] TS. Đinh Bá Hùng Anh, “Nghiên cứu khoa học trong Kinh tế - Xã
hội”, NXB. Kinh tế Tp. HCM 2016.
[3] Bài giảng của giảng viên.

2-79

You might also like