You are on page 1of 12

Phần 1:

Phương pháp nghiên cứu khoa học

Chương 4: Phương pháp phân tích số liệu


1. Thống kê mô tả
- Phân phối tần số
- Phân tích so sánh
- Các số độ tập trung
- Các số đo độ biến động
2. Thống kê suy rộng tham số mẫu cho tổng thể
- Phân tích bảng chéo
- Phân tích phương sai ANOVA
- Phân tích hồi qui và tương quan
1
- Các mô hình dự báo
1

Phương pháp phân tích số liệu

- Thống kê có hai chức năng chính: thống kê mô tả và


thống kê suy rộng. Được sử dụng trong một NC để mô tả
và suy rộng thông tin mẫu cho tổng thể và kết luận các
vấn đề NC có căn cứ khoa học.
- Mục tiêu chương này: Giới thiệu một số pp phân tích đơn
giản nhằm giúp hiểu được tính logic phần phương pháp
nghiên cứu trong đề cương
- SV cần tìm hiểu thêm nhiều pp phân tích định lượng cũng
như định tính nhằm đáp ứng nhiều mục tiêu khác nhu
trong NC (Phân tích nhân tố EFA, Logit, Probit…)

1
Phân phối tần số (Frequency)

 Bảng phân phối tần số:


+ Mô tả đặc tính phân phối của một mẫu số liệu
thô
+ Thể hiện phân tổ hay cơ cấu của một chỉ tiêu
nào đó theo phần trăm của tổng số mẫu hay số
mẫu thực (không tính missing value)
 Phân phối tần số tích lũy (Cumulative frequency):
cho biết tổng số quan sát mà giá trị của nó ít hơn
một giá trị cho sẳn nào đó

Ví dụ phân phối tần số

Stock
Exchange Freq. Percent Cum.

Ha Noi 385 58.33 58.33


Ho Chi Minh 275 41.67 100.00

Total 660 100.00

Board size Freq. Percent Cum.

3 9 1.36 1.36
4 19 2.88 4.24
5 469 71.06 75.30
6 52 7.88 83.18
7 83 12.58 95.76
8 15 2.27 98.03
9 8 1.21 99.24
10 1 0.15 99.39
11 3 0.45 99.85
13 1 0.15 100.00

Total 660 100.00


4

2
Phân tích so sánh

- So sánh hai chỉ tiêu cùng loại hay khác nhau nhưng
có liên hệ nhau để:
+ Đánh giá sự tăng lên hay giảm xuống của một chỉ
tiêu nào đó qua thời gian
+ Đánh giá mức độ hoàn thành kế hoạch của một
DN hay các nhà quản trị muốn đánh giá một vấn đề
gì đó ở hai thị trường khác nhau
- Phương pháp so sánh số tương đối:
+ Nghiên cứu cơ cấu của một hiện tượng như cơ
cấu ngành, cơ cấu doanh thu
+ Giữ bí mật cho số tuyệt đối
5

5 loại số tương đối so sánh

 Số tương đối động thái (lần, %)


 Số tương đối kế hoạch (%)
 Số tương đối kết cấu (%)
 Số tương đối cường độ
 Số tương đối so sánh (lần, %)

3
Số tương đối động thái

- Là kết quả so sánh giữa hai mức độ của cùng một chỉ tiêu
nào đó ở hai thời kỳ hay hai thời điểm khác nhau
- Tử số (y1) là mức độ cần nghiên cứu (mức độ kỳ báo cáo)
Mẫu số (y0) là mức độ kỳ gốc (mức độ dùng làm cơ sở so
sánh): kỳ gốc cố định hay kỳ gốc liên hoàn
VD: Sản lượng lúa xuất khẩu của Cần Thơ qua 2 năm như sau:
+ Năm 2014: 2500 tấn (y1)
+ Năm 2013: 2000 tấn (y0)
Vậy số tương đối động thái: 2500/2000=1,25=125%
Nhận xét: Sản lượng lúa xuất khẩu của Cần Thơ năm 2014 so
với năm 2013 bằng 125% hay tăng 25%, cụ thể là tăng 500 tấn

Số tương đối kế hoạch

Dùng để lập kế hoạch và đánh giá tình hình thực hiện kế hoạch
của doanh nghiệp
 Số tương đối nhiệm vụ kế hoạch (KH): là việc lập KH cho một
chỉ tiêu nào đó tăng hay giảm so với thực tế năm trước
y KH
KH  x100(%)
y 0

 Số tương đối hoàn thành kế hoạch (HT): đánh giá xem DN


thực tế hoàn thành KH bao nhiêu % so với KH đề ra cho chỉ
chỉ tiêu xem xét
y1
HT  x100(%)
y KH

4
Ví dụ số tương đối kế hoạch

Tình hình tổng giá trị sản lượng nông nghiệp tỉnh A như sau (Đvt: tỷ
đồng)

Mức TH Mức KH Mức TH 2009


Chỉ tiêu
2008 (y0) 2009 (yKH) (yTT)
SLNN 20 26 21

- Số tương đối nhiệm vụ KH: KH = 26/20=1,3=130% vượt 30%


- Số tương đối hoàn thành KH: HT = 21/26=0.807=80.7%
Nhận xét: Tỉnh A đặt KH tổng GTSLNN năm 2009 khá cao so với
thực tế năm 2008 là 30%. Điều này có thể vượt quá khả năng
của tỉnh nên năm 2009, tỉnh A chỉ đạt được 80,7% KH đề ra mà
thôi
9

Số tương đối kết cấu

Dùng để xác định tỷ trọng cấu thành nên một tổng thể, tổng
tỷ trọng của các bộ phận trong tổng thể bằng 100%

Sô tuyệt đối từng bộ phận


Số tương đối kết cấu = x100%
Số tuyệt đối của tổng thể

VD: + Kết cấu nam/nữ trong tổng công nhân của nhà máy,
cơ cấu doanh thu..
+ Trong công ty A có 500 công nhân, 300 nam và 200
nữ. Vậy trong tổng công nhân của công ty, nam chiếm
60% và nữ chiếm 40%
10

10

5
Số tương đối cường độ

- So sánh hai chỉ tiêu hoàn toàn khác nhau nhưng có


liên hệ nhau
- Đơn vị tính là đơn vị kép, phụ thuộc vào đvt của tử
số và mẫu số trong công thức tính
VD: + Mật độ dân số = Số dân/Diện tích
(người/km2)
+ Năng suất lao động= Tổng sản phẩm/Tổng
công nhân (Sp/người)

11

11

Số tương đối so sánh

Xác định tỉ lệ giữa các bộ phận trong tổng thể với


nhau
VD: + Tỉ lệ công nhân nam so với CN nữ =
300/200=1,5 lần =150%, nghĩa là nam nhiều hơn
nữ 50%
+ Tỉ lệ CN nữ so với CN nam = 200/300 =
0.667 lần =66.7%, nghĩa là nữ ít hơn nam 33,3%
+ Hai tỉ lệ được tính trên cùng số tuyệt đối
nhưng có số tương đối khác nhau do gốc so sánh
khác nhau
12

12

6
Các số đo độ tập trung

1. Số trung bình (Mean): chỉ tiêu trung bình đại diện cho mẫu hoặc
tổng thể. Số trung bình dùng để so sánh nhiều tổng thể/mẫu
khác nhau cùng chỉ tiêu trong trường hợp lượng biến biến động
tương đối đồng đều
2. Số trung vị (Median):
+ Lượng biến đứng ở giữa trong một dãy số đã được xếp theo
một thứ tự tăng dần hay giảm dần.
+ Chia dãy số làm hai phần có số quan sát bằng nhau
+ N lẻ, Me là quan sát thứ (N+1)/2
+ N chẳn, Me là số trung bình giản đơn của quan sát thứ (N)/2
và (N+2)/2
+ So sánh với nhiều tổng thể/mẫu khác nhau cùng chỉ tiêu trong
trường hợp lượng biến biến động không đồng đều
13

13

Các số đo độ tập trung

3. Tứ phân vị (Quartile):
+ Các lượng biến đứng ở các vị trí chia dãy số làm 4 phần bằng
nhau khi dãy số được sắp xếp theo thứ tự tăng dần hay giảm
dần (sort)
+ So sánh giữa các nhóm với nhau để có giải pháp tăng trưởng
hay phát triển (VD: nhóm thu thập thấp, trung bình, khá và giàu)
4. Mốt (Mode):
+ Lượng biến có tần số lớn nhất, nói lên tính phổ biến, nhiều
người tham gia trong tổng thể/mẫu
+ Để quyết định mô hình sản xuất phù hợp, ngành nghề phổ
biến…

14

14

7
Các số đo độ biến động
- Xét tính chất đại diện của số trung bình
- Các số đo này càng thấp, chứng tỏ độ biến động ít, vì vậy số trung
bình đại diện càng cao và ngược lại
- Tùy theo đặc điểm của dãy số, ta chọn các số đo độ biến động
cho phù hợp
1. Khoảng biến thiên R (Range):
+ Khoảng cách giữa hai lượng biến (hai quan sát) lớn nhất và
nhỏ nhất của dãy số
R=Xmax-Xmin
+ R càng nhỏ, tổng thể càng đồng đều, số trung bình đại diện
càng cao.
+ Nhiều ứng dung: khảo sát sự biến thiên về kích thước, trọng
lượng, so sánh thu nhập/mức sống hai vùng khác nhau
15
+ Nhược điểm: chỉ chú ý Xmin, Xmax

15

Các số đo độ biến động

2. Phương sai (Variance): trung bình bình phương các độ


lệch giữa các lượng biến và số trung bình học của các
lượng biến đó
3. Độ lệch chuẩn (Standard deviation): căn bậc hai phương
sai
4. Hệ số biến thiên CV (Coefficient of variations)
+ Là số tương đối bằng cách so sánh giữa độ lệch chuẩn
với trung bình số học của các lượng biến
+ Dùng để so sánh độ biến động giữa các nhóm số liệu
quan sát có đơn vị tính khác nhau

16

16

8
Thống kê suy rộng tham số mẫu
cho tổng thể

1. Phân tích bảng chéo - Cross-tabulation (Chi-square test of


independence)
+ Kiểm định của phân tích này để kiểm tra “có hay không”
mối quan hệ giữa hai yếu tố trong tổng thể
+ Phù hợp khi hai yếu tố nghiên cứu là biến định tính hay
định lượng rời rạc
+ Đặt giả thuyết:
H0: Hai biến độc lập nhau
H1: Hai biến có liên hệ nhau
+ Chỉ có thể áp dụng cho biến định tính và định lượng
tương đối rời rạc và ít nhóm hoặc giá trị. Khi có nhiều giá trị
cần phải mã hóa lại biến (phân nhóm) 17

17

VD phân tích bảng chéo

Stock CEO duality


Exchange 0 1 Total

Ha Noi 230 155 385


59.74 40.26 100.00
61.33 54.39 58.33

Ho Chi Minh 145 130 275


52.73 47.27 100.00
38.67 45.61 41.67

Total 375 285 660


56.82 43.18 100.00
100.00 100.00 100.00

Pearson chi2(1) = 3.2156 Pr = 0.073

18

18

9
Thống kê suy rộng tham số mẫu
cho tổng thể
2. Phân tích phương sai (ANOVA)
+ So sánh trung bình các tổng thể (từ 3 tổng thể trở lên)
VD: So sánh năng suất lúa trung bình của 3 huyện
So sánh giá giống trung bình ở 4 cơ sở sx giống
. oneway boardsize trans_cat, t bon sid sche

Summary of Board size


trans_cat Mean Std. Dev. Freq.

1 5.2512077 .96274587 207


2 5.3859649 .9014747 57
3 5.5 1.0324408 92
4 5.7283951 1.3697018 162

Total 5.4594595 1.1269931 518

Analysis of Variance
Source SS df MS F Prob > F

Between groups 21.1532959 3 7.05109865 5.70 0.0008


Within groups 635.495353 514 1.23637228
19
Total 656.648649 517 1.27011344

19

Thống kê suy rộng tham số mẫu


cho tổng thể
2. Phân tích phương sai (ANOVA)

Bartlett's test for equal variances: chi2(3) = 29.0881 Prob>chi2 = 0.000

Comparison of Board size by trans_cat


(Bonferroni)
Row Mean-
Col Mean 1 2 3

2 .134757
1.000

3 .248792 .114035
0.448 1.000

4 .477187 .34243 .228395


0.000 0.276 0.697

20

20

10
Phân tích hồi qui và tương quan
Regression
- Phân tích hồi qui tuyến tính (HQTT) 1 chiều: phân tích một biến
độc lập (đơn biến) ảnh hưởng đến biến phụ thuộc
Y i
   X   i
Trong đó: Y là biến độc lập, X là biến phụ thuộc và ɛ là sai số ngẫu
nhiên mà các giá trị được giả định tuân theo một phân phối xác
suất
- Phân tích HQTT nhiều chiều: phân tích ảnh hưởng của nhiều biến
độc lập (đa biến) đến biến phụ thuộc

3 X 3i ...  k X ki  i
Y   X
i 2i

1 2
VD:
+ Phân tích mức bón phân đến sản lượng lúa/năng suất lúa
(đơn biến)
+ Phân tích các nhân tố ảnh hưoowrng đến thu nhập nông 21
hộ
(đa biến)
21

Một số lưu ý khi phân tích hồi qui

- Không nên chọn biến Y và Xi có liên liên quan dưới dạng


công thức vị sẽ gây ra hiện tượng nội sinh trong mô hình
(lức này hệ số tương quan bội r gần bằng 1)
VD: Sản lượng (Y)= diện tích (X1)*năng suất (X2)
Doanh thu = Giá bán *lượng bán ra
Chi phí = Giá thành *lượng sản xuất ra
- Số quan sát mẫu trong phân tích hồi qui đa biến ít nhất phải
gấp 10 lần số biến độc lập
- Trên thực tế phân tích có thể có mô hình phi tuyến tính hoặc
mô hình phi tuyến tính nhưng có tính tuyến tính (lấy
logarithm tất cả các biến)
VD: trang 38-41 22

22

11
Non-executive Supervisory
BI BI
Location 0.00 -0.02
(0.02) (0.03)
Firm age -0.00** -0.00*
(0.00) (0.00)
Firm size 0.01*** 0.05***
(0.01) (0.01)
Adjusted ROA 0.03 -0.14
(0.09) (0.16)
Agri/Fishing 0.03 0.22***
(0.03) (0.06)
Mining/Electricity -0.01 0.08*
(0.02) (0.04)
Construction -0.04* 0.02
(0.02) (0.04)
Commerce 0.05** 0.04
(0.02) (0.04)
Other industries -0.00 -0.04
(0.03) (0.06)
Pure private 0.04** -0.04
(0.02) (0.04)
Private with FI 0.08*** 0.04
(0.03) (0.05)
SOEs with FI -0.01 0.20***
(0.04) (0.07)
Affiliates -0.05*** 0.01
(0.01) (0.03)
Early/late listing 0.01 0.04
(0.02) (0.03)
Constant 0.32*** -0.30**
(0.07) (0.13)
R2 0.10 0.11
Obs 641 641 23

23

Các mô hình dự báo

1. Dự báo theo tốc độ phát triển trung bình: sử dụng trong


trường hợp dãy số lượng biến biến động tương đối đồng
đều
2. Dự báo theo phương pháp làm phẳng số mũ
(Exponential smoothing): có thể sử dụng trong cả hai
trường hợp dãy số biến động đồng đều hoặc không đồng
đều
3. Dự báo theo phương pháp hồi qui

24

24

12

You might also like