5/12/2009

NGUYỄN DUY TÂM

5/12/2009

1

Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới

NỘI DUNG

Nhập dữ liệu vào excel
Thống kê dữ liệu dạng bảng
Thống kê dữ liệu dạng đồ thị
4. Thống kê dữ liệu bằng các đại lượng thống kê mô tả
5. Ước lượng và kiểm định giả thiết
6. Phân tích phương sai ANOVA
7. Hồi quy tương quan
8. Kiểm định phi tham số
9. Lý thuyết quyết định
1.
2.
3.

5/12/2009

Nguyễn Duy Tâm _ IDR

2

1

5/12/2009

Nhập số liệu vào Excel

OBS
1
2
3
4
5
6
7
8
9
10

Y_PT
0
1
0
0
12
0
0
7
0
0

Con người –Tầm nhìn mới

Z1_MALE Z2_AGE Z3_NOYM Z4_CHILD Z8_SATISFACTION
0
22
4
1
4
1
22
0.125
0
5
0
18
10
0
5
1
22
0.75
0
3
0
42
15
1
2
0
37
15
1
4
1
52
15
1
4
0
27
1.5
0
5
1
27
4
0
4
0
27
1.5
1
2

Sử dụng file Excel: Business Statistics/ Resources/Learning-by-Doing/ Affair.xls
OBS
= Số thứ tự của người được phỏng vấn
Y-PT
= Số lần quan hệ tình dục ngoài hôn nhân trong năm
Z1_MALE
= 1 nếu là nam, 0 nếu là nữ
Z2_AGE
= Tuổi
Z3_NOYM
= Số năm kết hôn
Z4_CHILD
= 1 nếu có con, 0 nếu chưa có con
Z8_SATISFACTION = Mức độ thỏa mãn về hôn nhân, thang Likert 1-5
Ghi chú : Biến số theo cột, quan sát ghi theo hàng
5/12/2009

Tạo biểu nhập liệu (Form)




3

Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới

Trên một trang bảng tính mới (New worksheet)
Tạo dòng tiêu đề (biến số) ở dòng 1.
Quét khối dòng tiêu đề, rồi vào
Data/ Form

5/12/2009

Nguyễn Duy Tâm _ IDR

4

2

5/12/2009

Tạo biểu nhập liệu (Form)

Vì chúng ta không định nghĩa chính xác số dòng của
bảng tính, nên Excel có hỏi như bảng giao diện ở
trên. Đơn giản là chọn OK.

5/12/2009

5

Nguyễn Duy Tâm _ IDR

Bản ghi cho ngƣời thứ nhất









Con người –Tầm nhìn mới

Con người –Tầm nhìn mới

Nhập cho người thứ nhất
Bảng số liệu điều tra của người này như sau
OBS
=1
Người thứ nhất
Y-PT
=0
Chưa ngoại tình
Z1_MALE
=0
Nữ
Z2_AGE
= 22
22 tuổi
Z3_NOYM
=4
Kết hôn được 4 năm
Z4_CHILD
=1
Đã có con
Z8_SATISFACTION = 4
Hài lòng về cuộc hôn
nhân của mình

5/12/2009

Nguyễn Duy Tâm _ IDR

6

3

5/12/2009

Bản ghi cho ngƣời thứ nhất

5/12/2009

Con người –Tầm nhìn mới

7

Nguyễn Duy Tâm _ IDR

Bản ghi cho ngƣời thứ hai

Con người –Tầm nhìn mới

Từ Form nhập liệu, click New để nhập một bản ghi (record)
hay quan sát (observation) mới.
 Bảng số liệu điều tra của người thứ hai như sau
 OBS
=2
Người thứ hai
 Y-PT
=1
Đã ngoại tình
 Z1_MALE
=1
Nam
 Z2_AGE
= 22
22 tuổi
 Z3_NOYM
= 0.125
Kết hôn được 1.5 tháng
(1.5/12)
 Z4_CHILD
=0
Chưa có con
 Z8_SATISFACTION = 5
Rất hài lòng về cuộc hôn
nhân của mình

5/12/2009

Nguyễn Duy Tâm _ IDR

8

4

5/12/2009

Bản ghi cho ngƣời thứ hai

Con người –Tầm nhìn mới

Làm tương tự cho đến người thứ 10 ở slide 3.
5/12/2009

9

Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới

Mảng thứ tự

Chọn biến Z2_AGE
Sắp xếp thành mảng thứ
tự từ nhỏ đến lớn
 Quét khối toàn bộ số
liệu, kể cả dòng tên
biến.
 Data/ Sort

5/12/2009

Nguyễn Duy Tâm _ IDR

10

5

5/12/2009

Giao diện Sort

Con người –Tầm nhìn mới

OBS


Z2_AGE
3
18
1
22
2
22
4
22
8
27
9
27
10
27
6 Kết quả37
5
42
7
52

Chọn Sort by: Z2_AGE
Chọn Asending: Sắp xếp theo thứ tự tăng dần

5/12/2009

11

Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới

1. THỐNG KÊ DỮ LiỆU DẠNG BẢNG



Yêu cầu của nội dung: Lập bảng thống kê cho các biến thuộc
tính và thuộc lượng.
Đối với biến ít biểu hiện: mỗi biểu hiện 1 phân tổ
Đối với biến nhiều biểu hiện: tiến hành phân tổ lại (Lập Bin)
Công cụ trên excel:
Dùng lệnh =FREQUENCY[ (data_array, bins_array)]

5/12/2009

Nguyễn Duy Tâm _ IDR

12

6

5/12/2009

Con người –Tầm nhìn mới

1. THỐNG KÊ DỮ LiỆU DẠNG BẢNG




Quy trình dùng lệnh FREQUENCY
Đối với biến có ít biểu hiện
B1: Lập cột các biểu hiện (cột BIN): là giá trị các biểu hiện
B2: Chọn vùng dữ liệu bảng thống kê, lập lệnh Frequency
Cú pháp: = FREQUENCY(data_array, bins_array)
 Data_array: Dữ liệu cần lập bảng
 Bins_array: các biểu hiện

Chú ý: Với các lệnh thông thường, sau khi lập lệnh, chỉ cần
ENTER, nhưng với lệnh FREQUENCY, ta cần gõ tổ hợp fím
[ctrl+shift+enter]
Ví dụ: lập bảng thống kê cho tình trạng hôn nhân [Marital]

5/12/2009

13

Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới

1. THỐNG KÊ DỮ LiỆU DẠNG BẢNG

Quy trình dùng lệnh FREQUENCY
Đối với biến có nhiều biểu hiện:
 B1: Cần lập các [giới hạn dưới] và [giới hạn trên] của mỗi
phân tổ.
 B2: Lập cột Bin chỉ gồm các số giới hạn trên của mỗi phân tổ.
Ví dụ biến [trình độ học vấn]_edu
 B3: dùng lệnh FREQUENCY để lập bảng.
 Bài tập: lập bảng tần số theo trình độ học vấn, độ tuổi và trình độ

kết hôn.
 Chú ý: phân tổ do sinh viên tự phân, có thể phân tổ đều hoặc
không đều
5/12/2009

Nguyễn Duy Tâm _ IDR

14

7

5/12/2009

Con người –Tầm nhìn mới

Biểu đồ tần số-Thủ tục Data Analysis
Dùng thủ tục Data
Analysis trong thư viện
hàm Add-Ins của Excel
 Kiểm tra xem có thủ tục
Data Analysis trong
Tools hay chưa?
 Tools/ Add-Ins/ Check
vào Analysis ToolPak/
OK

5/12/2009

15

Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới

Biểu đồ tần số-Thủ tục Data Analysis

Tools/ Data Analysis/ Histogram

5/12/2009

Nguyễn Duy Tâm _ IDR

16

8

5/12/2009

Con người –Tầm nhìn mới
Biểu đồ tần số-Thủ tục Data
Analysis





Input Range: Quét khối số liệu, nhớ có cả tên biến
Bin Range: Quét biên khối biên trên của biểu đồ tần số, nhớ có cả tên
Labels: Khai báo có dòng đầu tiên là tên biến
Chọn Output range: ô đầu tiên chứa kết quả
Khai báo các kết quả cần nhận: Pareto, Cumulative Percentage, Chart
Output

5/12/2009

17

Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới
Biểu đồ tần số-Thủ tục Data
Analysis

BIN
Frequency
20
1
30
6
40
1
50
1
60
1
More
0

5/12/2009

Cumulative
%
BIN Frequency
10.00%
30
6
70.00%
20
1
80.00%
40
1
90.00%
50
1
100.00%
60
1
100.00% More
0

Cumulative
%
60.00%
70.00%
80.00%
90.00%
100.00%
100.00%

Bảng tần số, tần suất tích lũy và phân phối Pareto

Nguyễn Duy Tâm _ IDR

18

9

5/12/2009

Con người –Tầm nhìn mới
Biểu đồ tần số-Thủ tục Data
Analysis
Histogram

7

120.00%

6

100.00%

5

Frequency

80.00%
4
60.00%

Frequency
Cumulative %

3
40.00%
2

20.00%

1

0

0.00%
30

20

40

50

60

More

BIN


5/12/2009

Biểu đồ Pareto
19

Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới

2. THỐNG KÊ DỮ LiỆU DẠNG ĐỒ THỊ

Các dạng đồ thị:
1. Hình thanh
:
2. Hình tròn, (bánh) :
3. Đường gấp khúc :
4. Phân tán
:

5/12/2009

Nguyễn Duy Tâm _ IDR

Column, Bar,
Pie
Line
Scatter

20

10

5/12/2009

Con người –Tầm nhìn mới

2. THỐNG KÊ DỮ LiỆU DẠNG ĐỒ THỊ

QUY TRÌNH VẼ ĐỒ THỊ

B1: chọn vùng dữ liệu
B2: chọn biểu tượng đồ thị
[chart wizart] hoặc
insert/chart
 B3: Chọn các hiệu chỉnh
tương ứng

ĐỒ THỊ HÌNH TRÕN


Tầnsố

Rấtkhông hài
lòng

1% 5%

12%

49%

Khônghài
lòng
Bình thường

33%
Hàilòng
Rấthài lòng

Đồ thị hình tròn
thường dùng tần
suất (%) để hiển thị
5/12/2009

21

Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới

2. THỐNG KÊ DỮ LiỆU DẠNG ĐỒ THỊ
ĐỒ THỊ HÌNH THANH
[COLUMN]

Tên thuộc
tính dài

ĐỒ THỊ HÌNH THANH
[BAR]

Tên thuộc tính ngắn
5/12/2009

Nguyễn Duy Tâm _ IDR

22

11

5/12/2009

ĐỒ THỊ ĐƯỜNG
GẤP KHÚC _ LINE
5/12/2009

Đồ thị Line: thường
dùng cho trường hợp dữ
liệu theo dõi qua thời
gian

chỉ số CPI

Jan-05

Jan-04

Jan-03

Jan-02

Jan-01

Jan-00

Jan-99

Jan-98

Jan-97

Jan-96

Jan-95

180
160
140
120
100
80
60
40
20
0

Bảng tóm tắt-Pivot Table

23

Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới

Data/ Pivot Table

5/12/2009

Nguyễn Duy Tâm _ IDR

24

12

5/12/2009

Bảng tóm tắt-Pivot Table

Quét khối dữ liệu cần tính toán, kể cả tên biến, sẽ
được xem là tên trường(Field)

5/12/2009

25

Nguyễn Duy Tâm _ IDR

Bảng tóm tắt-Pivot Table

Con người –Tầm nhìn mới

Con người –Tầm nhìn mới

Nên chọn trang bảng tính mới

5/12/2009

Nguyễn Duy Tâm _ IDR

26

13

5/12/2009

Bảng tóm tắt-Pivot Table

Kéo và nhả (Drag and Drop) Z8_SATISFACTION vào Row
Fields và Data Items

5/12/2009

27

Nguyễn Duy Tâm _ IDR

Bảng tóm tắt-Pivot Table

Con người –Tầm nhìn mới

Con người –Tầm nhìn mới

Nhấp đúp vào A3 (ô giao giữa Row Fields và Column Fields)
và chọn Count of Z8_SATISFACTION.
Ưu điểm: có thể tính Tổng, tần số và
nhiều lệnh khác

5/12/2009

Nguyễn Duy Tâm _ IDR

28

14

5/12/2009

Pivot Table với 2 biến phân loại
Count of
Z8_SATISFACTION

Z1_MALE

Z8_SATISFACTION
1
2
3
4
5
Grand Total

5/12/2009

0
11
35
46
93
130
315

1
5
31
47
101
102
286

Grand
Total
16
66
93
194
232
601

29

Nguyễn Duy Tâm _ IDR

Pivot Table với 2 biến phân loại

Con người –Tầm nhìn mới

Con người –Tầm nhìn mới

Click vào A3, kéo và thả trường Z1_MALE vào Column
Fields.
Ưu điểm: lập bảng tần số chéo cho
nhiều biến.

5/12/2009

Nguyễn Duy Tâm _ IDR

30

15

5/12/2009

Pivot Table với 3 biến phân loại

Con người –Tầm nhìn mới

Kéo và thả Z4_Child vào Page Fields

5/12/2009

31

Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới

Một số yêu cầu

Dùng công cụ Pivot table:
1.
Lập bảng tổng số con của các hộ gia đình có 1,2,…,n con cụ thể.
2.
Lập bảng tổng số anh,chị em trong nhà ứng với từng loại gia đình cụ thể.
3.
Lập bảng tần số cho biến Marital, vẽ biểu đồ và cho biết loại tình trạng
hôn nhân nào chiếm đa số
4.
Lập bảng tần số cho biến marita (column) và biến sex (row). Vẽ biểu đồ
và cho biết giới tính nào ứng với tình trạng hôn nhân nào chiếm đa số. Vẽ
biểu đồ tương ứng.
5.
Lập bảng tần số giữa hai biến marital (column) và wrkstat (row).
6.
Lập bảng tần số giữa hai biến marital (column) và wrkstat (row) <chỉ
thống kê cho giới tính nữ> và <chỉ thống kê cho giới tính nam>.

5/12/2009

Nguyễn Duy Tâm _ IDR

32

16

5/12/2009

Con người –Tầm nhìn mới

Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả

CHỈ TIÊU TẬP TRUNG

CHỈ TIÊU PHÂN TÁN

Trung bình : average
=average(data)
 Trung vị : Median
 =median(data)
 Mode
: Mode
 =mode(data)
 Tứ phân vị : quartile
 =quartile(data,số phân vị)
(1: Q1; 2:Q2; 3:Q3)



5/12/2009


Phương sai
=var(data)
Độ lệch chuẩn
=stdev(data)

: var
: stdev

33

Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới

Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả

MỘT SỐ LỆNH KHÁC



Tính tổng thoả điều kiện
=sumif(vùng ĐK, ĐK,
Vùng tính tổng)
Đếm thỏa điều kiện
=countif(vùng ĐK,ĐK)

5/12/2009

Nguyễn Duy Tâm _ IDR

MỘT SỐ LỆNH CÓ TRONG
EXCEL 2007
 Tính tổng thỏa điều kiện
nâng cao.
 =sumifs(vùng tính tổng,
vùng ĐK1, ĐK1, vùng
ĐK2, ĐK2)
 Đếm thỏa điều kiện nâng
cao.
 =countifs(vùng ĐK1,
ĐK1,vùng ĐK2, ĐK2,…)

34

17

5/12/2009

Con người –Tầm nhìn mới

Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả
MỘT SỐ LỆNH CÓ TRONG
EXCEL 2007


Trung bình thỏa điều kiện
=averageif(vùng ĐK, ĐK,
Vùng tính mean)
=averageifs(vùng tính
mean,vùng ĐK1, ĐK1,
Vùng ĐK2, ĐK2)

BÀI TẬP (AFFAIR)
1.

2.

3.

5/12/2009

Tính giá trị trung bình, trung vị,
mode, tứ phân vị, phương sai,
độ lệch chuẩn cho các biến:
Z2_age, Z4_child, Z6_edu. Nêu
ý nghĩa của các số trên.
Tính tổng số con của những
người có độ tuổi dưới 30. hoặc
của những người hài lòng về
tình trạng hôn nhân.
Đếm những người có 1 con

35

Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới

Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả
BÀI TẬP (THUC HANH
EXCEL)
1.

2.

Đếm những người làm
việc toàn thời gian trong
mẫu khảo sát
Đếm những người đã lập
gia đình, chưa lập gia đình

5/12/2009

Nguyễn Duy Tâm _ IDR

BÀI TẬP (THUC HANH
EXCEL)
1.

2.

Tính tổng số anh/chị/em
của những người lý dị, ly
thân.
Tính tổng số con của
những người là nữ giới.

36

18

5/12/2009

Con người –Tầm nhìn mới

Tính trị thống kê bằng thủ tục Data Analysis
Tools/ Data Analysis/ Descriptive Statistics

Nhập số liệu và các tùy chọn vào giao diện

5/12/2009

37

Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới

Tính trị thống kê bằng thủ tục Data Analysis
Tools/ Data Analysis/ Descriptive Statistics
Y_PT Z1_MALE Z2_AGE
Mean
1.46
Standard Error
0.13
Median
0.00
Mode
0.00
Standard Deviation 3.30
Sample Variance
10.88
Kurtosis
4.26
Skewness
2.35
Range
12
Minimum
0
Maximum
12
Sum
875
Count
601


0.48
0.02
0.00
0.00
0.50
0.25
-2.00
0.10
1
0
1
286
601

32.49
0.38
32.00
27.00
9.29
86.28
0.23
0.89
39.5
17.5
57
19525
601

Z3_NOYM Z4_CHILD Z8_SATISFACTION
Z5_RELIGIOUS Z6_EDU
8.18
0.23
7.00
15.00
5.57
31.04
-1.57
0.08
14.875
0.125
15
4914.795
601

0.72
0.02
1.00
1.00
0.45
0.20
-1.09
-0.96
1
0
1
430
601

3.93
0.04
4.00
5.00
1.10
1.22
-0.20
-0.84
4
1
5
2363
601

3.12
0.05
3.00
4.00
1.17
1.36
-1.01
-0.09
4
1
5
1873
601

Z7_OCCUPATION

16.17
0.10
16.00
14.00
2.40
5.77
-0.30
-0.25
11
9
20
9716
601

4.19
0.07
5.00
5.00
1.82
3.31
-0.78
-0.74
6
1
7
2521
601

Kết quả sau khi đã hiệu chỉnh.
Bài tập: Tính các chỉ tiêu thống kê mô tả bằng công
cụ DATA ANALYSIS cho các biến: agewed sibs
childs age educ trong bài tập thực hành excel

5/12/2009

Nguyễn Duy Tâm _ IDR

38

19

5/12/2009

Con người –Tầm nhìn mới

HỆ SỐ TƢƠNG QUAN




Đối tượng biến áp dụng: biến định lượng (scale) hoặc biến
thuộc thang đo thứ bậc (ordinal), biến thuộc thang đo khoảng
(interval).
Chú ý: Đối với thang đo định danh (norminal): những chỉ số
tính toán không có ý nghĩa thống kê.
Công thức lệnh: tính rxy =correl(data_X, data_Y)
Ý nghĩa:
Đo lường về mức độ quan hệ tuyến tính giữa hai biến X và Y
-1 < = rxy < 0 : X và Y nghịch biến
0< rxy <=1 : X và Y đồng biến

5/12/2009

Nguyễn Duy Tâm _ IDR

39

người ma
–Tầm nhìn
mới
Dùng thủ tục Data Analysis đểContính
trận
tƣơng quan

Tools/ Data Analysis/ Correlation

5/12/2009

Nguyễn Duy Tâm _ IDR

40

20

5/12/2009

Con người –Tầm nhìn mới

Dùng thủ tục Data Analysis để tính ma trận
tƣơng quan
Y_PT
Y_PT
1
Z1_MALE 0.011736
Z2_AGE
0.095237
Z3_NOYM 0.186842
Z4_CHILD 0.10401
Z8_SATISFACTION
-0.27951
Z5_RELIGIOUS
-0.1445
Z6_EDU
-0.00244
Z7_OCCUPATION
0.049612


Z1_MALE Z2_AGE Z3_NOYM Z4_CHILD
Z8_SATISFACTION
Z5_RELIGIOUS
Z6_EDU
Z7_OCCUPATION
1
0.190641
0.030283
0.069222
-0.00752
0.007679
0.397505
0.467923

1
0.777546
0.421931
-0.199
0.193777
0.134596
0.166413

1
0.572857
1
-0.24312 -0.19628
1
0.218261 0.129351 0.024296
0.040003 -0.00699 0.109303
0.044592 -0.09273 0.017422

1
-0.04257
1
-0.03972 0.533605

1

Kết quả.
BT thực hành excel: Tính matrận hệ số tương quan
cho các biến agewed sibs childs age educ và nhận
xét về mối quan hệ giữa các biến

5/12/2009

41

Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới

Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn

Chọn loại đồ thị là Scatter

5/12/2009

Nguyễn Duy Tâm _ IDR

42

21

5/12/2009

Con người –Tầm nhìn mới

Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn

Nhập số liệu

5/12/2009

43

Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới

Đồ thị phân tán:Hài lòng phụ thuộc vào học vấn

Các tùy chọn

5/12/2009

Nguyễn Duy Tâm _ IDR

44

22

5/12/2009

Con người –Tầm nhìn mới

Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn

Xuất ra trang riêng

5/12/2009

Nguyễn Duy Tâm _ IDR

45

Con người –Tầm nhìn mới
Đồ thị phân tán:
Hài lòng phụ thuộc vào học vấn

Chọn loại đồ thị là Scatter

5/12/2009

Nguyễn Duy Tâm _ IDR

46

23

5/12/2009

Con người –Tầm nhìn mới
Đồ thị phân tán:
Hài lòng phụ thuộc vào học vấn

Nhập số liệu

5/12/2009

Nguyễn Duy Tâm _ IDR

47

Con người –Tầm nhìn mới
Đồ thị phân tán:
Hài lòng phụ thuộc vào học vấn

Các tùy chọn

5/12/2009

Nguyễn Duy Tâm _ IDR

48

24

5/12/2009

Con người –Tầm nhìn mới
Đồ thị phân tán:
Hài lòng phụ thuộc vào học vấn

Xuất ra trang riêng

5/12/2009

Nguyễn Duy Tâm _ IDR

49

MÔ PHỎNG LẤY MẪU LẶP LẠI
Con người –Tầm nhìn mới
CHỌN CỠ MẪU n = 9 TỪ Z2_AGE

Số thứ tự trong tổng thể: Hàm Randbetween

5/12/2009

Nguyễn Duy Tâm _ IDR

50

25

5/12/2009

MÔ PHỎNG LẤY MẪU LẶP LẠI
Con người –Tầm nhìn mới
CHỌN CỠ MẪU n = 9 TỪ Z2_AGE

Điền kết quả lấy mẫu: Hàm Vlookup

5/12/2009

Nguyễn Duy Tâm _ IDR

51

MÔ PHỎNG LẤY MẪU LẶP LẠICon người –Tầm nhìn mới
CHỌN CỠ MẪU n = 9 TỪ Z2_AGE


MÔ PHỎNG BẰNG THỦ TỤC SAMPLING
Tools/ Data Analysis/ Sampling

5/12/2009

Nguyễn Duy Tâm _ IDR

52

26

5/12/2009

MÔ PHỎNG LẤY MẪU LẶP LẠICon người –Tầm nhìn mới
CHỌN CỠ MẪU n = 9 TỪ Z2_AGE
STT MẪU
1
2
3
4
5
6
7
8
9
TRUNG BÌNH

MẪU 1 MẪU 2 MẪU 3 MẪU 4 MẪU 5 MẪU 6 MẪU 7 MẪU 8 MẪU 9 MẪU 10
27
37
42
32
52
27
42
22
32
32
22
32
27
57
32
27
32
47
42
27
22
22
52
32
22
42
42
27
37
37
42
27
22
22
37
52
27
32
22
22
42
47
32
27
32
27
37
27
27
27
32
37
22
37
27
37
27
22
42
52
27
37
32
42
22
37
32
27
32
32
27
57
27
27
37
27
27
22
22
22
27
42
52
22
47
32
32
27
27
27
29.78 37.56 34.22 33.11 34.22 34.22 33.11 28.11 31.44
30.89

KẾT QUẢ MÔ PHỎNG BẰNG THỦ TỤC SAMPLING 10 MẪU
LƢU Ý: KẾT QUẢ NHẬN ĐƢỢC LÀ NGẪU NHIÊN
Tạo 10 mẫu theo bảng trên (dùng công cụ Sample, số quan sát mỗi mẫu là 9)

5/12/2009

53

Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới
MÔ PHỎNG LẤY MẪU LẶP
LẠI
CHỌN CỠ MẪU n = 9 TỪ Z2_AGE

TRUNG BÌNH CỦA TRUNG BÌNH MẪU
TRUNG BÌNH CỦA TỔNG THỂ

32.46
32.488

ĐỘ LỆCH CHUẨN CỦA TRUNG BÌNH MẪU
ĐỘ LỆCH CHUẨN CỦA TỔNG THỂ
ĐỘ LỆCH CHUẨN CỦA TỔNG THỂ/3

2.4237
9.2888
3.0963




TRUNG BÌNH: HÀM AVERAGE
X 
ĐỘ LỆCH CHUẨN: HÀM STDEV

X
LƢU Ý: THEO LÝ THUYẾT THÌ

CÓ THỂ ĐẠT ĐƢỢC ĐiỀU NÀY VỚI VÔ SỐ LẦN LẤY MẪU

5/12/2009

Nguyễn Duy Tâm _ IDR


n
54

27

5/12/2009

người
–Tầm
nhìn mới
ƢỚC LƢỢNG KHOẢNG TÌN CẬY CHOCon
GIÁ
TRỊ
TRUNG
BÌNH (BiẾT )

X  Za / 2




n

   X  Za / 2

Chọn a = 0.05 =>P(1-a/2)= 0.975
Tra Za/2 = 1.96
Tính trung bình = 32.49
Ƣớc lƣợng khỏang tin cậy 95%: (31.77; 33.21)

5/12/2009

n

Nguyễn Duy Tâm _ IDR

55

ngườiCHO
–Tầm nhìn mới
ƢỚC LƢỢNG KHOẢNG TÌN Con
CẬY
GIÁ TRỊ TRUNG BÌNH (CHƢA BiẾT )

X  ta / 2,n1



S
S
   X  ta / 2,n1
n
n

Chọn a = 0.05 =>P(1-a/2)= 0.975
Tra ta/2 = 1.964
Tính trung bình = 32.49 và độ lệch chuẩn mẫu =9.29
Ƣớc lƣợng khỏang tin cậy 95%: (31.74; 33.23)

5/12/2009

Nguyễn Duy Tâm _ IDR

56

28

5/12/2009

người
–Tầm
nhìn mới
ƢỚC LƢỢNG KHOẢNG TÌN CẬY CHOCon
GIÁ
TRỊ
TRUNG
BÌNH (CHƢA BiẾT )_THỦ TỤC DATA ANALYSIS


Tools/ Data Analysis/ Descriptive Statistics
Chọn Summary Statistics và Confidence Level for Mean
5/12/2009

57

Nguyễn Duy Tâm _ IDR

ƢỚC LƢỢNG KHOẢNG TÌN CẬY CHO GIÁ TRỊ TRUNG
Con người –Tầm nhìn mới
BÌNH (CHƢA BiẾT )_THỦ TỤC DATA ANALYSIS

X  ta / 2,n1



5/12/2009

S
S
   X  ta / 2,n1
n
n

Cận dƣới = Mean – Confidence Level (95%)
Cận trên = Mean + Confidence Level (95%)
Nguyễn Duy Tâm _ IDR

58

29

5/12/2009

Con người –Tầm nhìn mới

Bài tập ƣớc lƣợng

BÀI TẬP AFFAIR
1.

Ước lượng độ tuổi bình
quân (age) của những
người được khảo sát.

BÀI TẬP “THUC HANH
EXCEL
1.

2.
3.

5/12/2009

Ước lượng độ tuổi bình
quân (age) của những
người được khảo sát
Ước lượng độ tuổi bình
quân kết hôn (agewed).
Ước lượng trình độ học
vấn (educ) bình quân của
những người được khảo
sát.

59

Nguyễn Duy Tâm _ IDR

Kiểm định 1 đuôi (Biết s)

Con người –Tầm nhìn mới

Ho: Số năm học trung bình của ngƣời Mỹ tối đa là 15 năm

Nhắc lại đường dẫn hàm thống kê: fx/ Statistical/ Average…
5/12/2009

Nguyễn Duy Tâm _ IDR

60

30

5/12/2009

Kiểm định 1 đuôi (Biết s)

Con người –Tầm nhìn mới

Ho: Số năm học trung bình của ngƣời Mỹ tối đa là 15 năm


Giá trị Z = 11.44 nằm ở miền bác bỏ
=>Có bằng chứng thống kê cho thấy số năm học trung bình của
người Mỹ lớn hơn 15 năm.
5/12/2009

61

Nguyễn Duy Tâm _ IDR

Kiểm định 1 đuôi (Không biết s)

Con người –Tầm nhìn mới

Ho: Số năm học trung bình của ngƣời Mỹ tối đa là 16 năm

Lưu ý: Hàm TINV ứng với tra t hai đuôi nên khi tra t một đuôi cần tra
ứng với 2a.
5/12/2009

Nguyễn Duy Tâm _ IDR

62

31

5/12/2009

Kiểm định 1 đuôi (Không biết s)

Con người –Tầm nhìn mới

Ho: Số năm học trung bình của ngƣời Mỹ tối đa là 16 năm

Vì trị thống kê t = 1.70 nằm ở miền bác bỏ nên chúng ta bác bỏ Ho.
Vậy số năm học trung bình của người Mỹ cao hơn 16.
5/12/2009

63

Nguyễn Duy Tâm _ IDR

Kiểm định 2 đuôi (Biết s)

Con người –Tầm nhìn mới

Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm

Hàm NORMINV trả về giá trị Z ứng với xác suất tích lũy nên phải
nhập tham số là (1-a/2)
5/12/2009

Nguyễn Duy Tâm _ IDR

64

32

5/12/2009

Kiểm định 2 đuôi (Biết s)

Con người –Tầm nhìn mới

Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm

Hàm NORMINV trả về giá trị Z ứng với xác suất tích lũy nên phải
nhập tham số là (1-a/2)
Vì trị thống kê Z = 1.63 nằm trong miền chấp nhận nên ta không thể
bác bỏ Ho.
5/12/2009

65

Nguyễn Duy Tâm _ IDR

Kiểm định 2 đuôi (Chƣa biết s)

Con người –Tầm nhìn mới

Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm

Hàm TINV(a, n-1)
5/12/2009

Nguyễn Duy Tâm _ IDR

66

33

5/12/2009

Kiểm định 2 đuôi (Chƣa biết s)

Con người –Tầm nhìn mới

Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm
Z6_EDU
9
16
14
17
14
14
18
17
20
17

Trung bình
Độ lệch chuẩn =
Cỡ mẫu n=
Sai số chuẩn =
a=
t a/ 2 =

16.17
2.40
601
0.10
0.05
1.964

Ho:  =
H1  <>

16
16

Trị thống kê t=

1.70

Vì trị thống kê t = 1.70 nằm trong miền chấp nhận nên ta không thể
bác bỏ Ho.
5/12/2009

67

Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới

Bài tập kiểm định

BÀI TẬP AFFAIR
1.

2.

Có giả thiết cho rằng,
độ tuổi (age) bình quân
của những người được
khảo sát là dưới 30.
Bạn hãy kiểm định giả
thiết này với mức ý
nghĩa α=5%.
Có giả thiết cho rằng,
độ tuổi (age) bình quân
của những người được
khảo sát là 33. Theo
bạn, giả thiết này đúng
hay sai? (α=10%)

5/12/2009

BTẬP THỰC HÀNH EXCEL
1.

2.

3.

Nguyễn Duy Tâm _ IDR

Có giả thiết cho rằng, độ tuổi (age) bình
quân của những người được khảo sát là
dưới 40. Bạn hãy kiểm định giả thiết
nàyα=5%.
Có giả thiết cho rằng, độ tuổi (age) bình
quân của những người được khảo sát là
46. Theo bạn, đúng hay sai α=3%?
Có giả thiết cho rằng, độ tuổi (agewed)
bình quân của những người được khảo
sát là dưới 40. Bạn hãy kiểm định giả
thiết này α=4%.

68

34

5/12/2009

Con người
–Tầm nhìn
Kiểm định 2 đuôi (Biết và Chƣa biết
)-Giá
trịmới
p

Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm

ZTEST(Array, x, sigma) với Array: Số liệu cần kiểm định
x: Giá trị của phát biểu Ho, Sigma: Nhập  nếu biết hoặc để trống
nếu không biết.
5/12/2009

69

Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới

Kiểm định 2 đuôi (Biết và Chƣa biết )-Giá trị p
Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm

P_Value = 2*Min(ZTEST, 1-ZTEST)
P_Value = 0.09> a = 0.05 => Không thể bác bỏ Ho.

5/12/2009

Nguyễn Duy Tâm _ IDR

70

35

5/12/2009

Con người –Tầm nhìn mới

Kiểm định sự khác biệt về trung bình của hai tổng
thể-Biết độ lệch chuẩn Affair.xls trang Edu
OBS MALE
1
2
3
4
5

0
0
0
0
0

EDU(FEMALE)
9
9
9
9
12

OBS MALE
1
2
3
4
5

1
1
1
1
1

EDU(MALE)
EDU(FEMALE) EDU(MALE)
9 Trung bình
15.26
17.17
9 Độ lệch chuẩn
2.02
2.39
9 Số quan sát
315
286
12
12

Ho: Không có sự khác biệt về học vấn trung bình của
hai giới
 Kết quả khảo sát cho thấy học vấn trung bình của
nam nhỉnh hơn của nữ nhưng độ lệch chuẩn cao hơn.
 Kiểm định Ho bằng thủ tục

 Tools | Data Analysis | z-test: Two Sample for Means

5/12/2009

Nguyễn Duy Tâm _ IDR

71

người –Tầm
mới
Kiểm định sự khác biệt về trungConbình
củanhìn
hai
tổng thể-Biết độ lệch chuẩn

Tools | Data Analysis | z-test: Two Sample for Means
5/12/2009

Nguyễn Duy Tâm _ IDR

72

36

5/12/2009

Con người
–Tầm
nhìntổng
mới
Kiểm định sự khác biệt về trung bình
của
hai
thể-Biết độ lệch chuẩn

Kết quả kiểm định: Bác bỏ Ho
5/12/2009

Nguyễn Duy Tâm _ IDR

73

Con người
–Tầm
nhìntổng
mới
Kiểm định sự khác biệt về trung bình
của
hai
thể-Chƣa biết độ lệch chuẩn

Ho: Không có sự khác biệt về học vấn trung bình của hai giới
Tools | Data Analysis | t-Test: Two Sample Assuming Equal
Variances
5/12/2009

Nguyễn Duy Tâm _ IDR

74

37

5/12/2009

Con người
–Tầm
nhìntổng
mới
Kiểm định sự khác biệt về trung bình
của
hai
thể-Chƣa biết độ lệch chuẩn

Ho: Không có sự khác biệt về học vấn trung bình của hai giới
Tools | Data Analysis | t-Test: Two Sample Assuming Equal
Variances
Kết quả: Bác bỏ Ho
5/12/2009

75

Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới

Bài tập kiểm định mức lƣơng trung bình theo giới tính

1.

2.

Có ý kiến cho rằng mức lương trung bình theo giới tính giữa
nam và nữ là như nhau. Với số liệu của bài tập Tien luong
khoi diem theo gioi tinh nam - nu.xls, bạn hãy kiểm định giả
thiết trên.
Có giả thiết cho rằng, việc cải tiến phần mềm làm việc hiện
tại không có hiệu quả. Bằng dữ liệu bài tập hieu qua
software.xls, bạn hãy kiểm định hiệu quả của phần mềm mới
và cũ.

5/12/2009

Nguyễn Duy Tâm _ IDR

76

38

5/12/2009

Con người –Tầm
mới
Kiểm định F cho sự khác biệt về phƣơng
sainhìn
của
hai tổng thể

Ho: Không có sự khác biệt về phương sai của học vấn trên hai giới
Tools | Data Analysis | F-Test: Two-Sample for Variances
5/12/2009

Nguyễn Duy Tâm _ IDR

77

Con người –Tầm
mới
Kiểm định F cho sự khác biệt về phƣơng
sainhìn
của
hai tổng thể

Ho: Không có sự khác biệt về phương sai của học vấn trên hai giới
Kết quả: Bác bỏ Ho
5/12/2009

Nguyễn Duy Tâm _ IDR

78

39

5/12/2009

Con người –Tầm nhìn mới
Kiểm định mẫu cặp: Vợ và chồng có cảm
nhận khác biệt
về hạnh phúc không? Affair.xls/ Satisfaction

Ho: Vợ và chồng thỏa mãn về hôn nhân như nhau.
 Tools | Data Analysis… | t-test: Paired Two Sample for Means
5/12/2009

Nguyễn Duy Tâm _ IDR

79

nhìn mới
Kiểm định mẫu cặp: Vợ và chồng Con
cóngười
cảm–Tầm
nhận
khác biệt về hạnh phúc không?

Ho: Vợ và chồng thỏa mãn về hôn nhân như nhau.
 Kết quả: Chấp nhận Ho.
5/12/2009

Nguyễn Duy Tâm _ IDR

80

40

5/12/2009

Con người –Tầm nhìn mới

Bài tập kiểm định cặp

Có giả định cho rằng, hiệu quả của một phương pháp quảng
cáo được tiến hành cho nhiều công ty khác nhau hiện tại
không có hiệu quả. Bằng số liệu của bài tập truoc - sau quang
cao ve doanh thu.xls, anh chị hãy kiểm định giả thiết trên

5/12/2009

Nguyễn Duy Tâm _ IDR

81

người –Tầm
nhìn mới
HÀM TTEST-Kiểm định sựConkhác
biệt


fx/ Statistical/ TTEST
Type: 1 cho mẫu cặp, 2 cho phƣơng sai bằng nhau, 3 cho
phƣơng sai khác nhau

5/12/2009

Nguyễn Duy Tâm _ IDR

82

41

5/12/2009

Conhài
ngườilòng
–Tầm nhìn
ANOVA: Vợ và chồng có có mức độ
vềmới
hôn
nhân trung bình khác nhau không?

Ho: Vợ và chồng thỏa mãn về hôn nhân như nhau.
 Tools/ Data Analysis/ ANOVA-Single Factor
5/12/2009

83

Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới
ANOVA: Nam và nữ có có mức
độ hài
lòng về hôn nhân khác nhau không?
Anova: Single Factor
SUMMARY
Groups
WIFE
HUSBAND

Count Sum Average Variance
250 999
4.00
1.30
250 984
3.94
1.06

ANOVA
Source of Variation
Between Groups
Within Groups
Total

SS
0.45
586

df
1.00
498

586

499

MS
0.45
1.18

F
0.38

P-value F crit
0.54 3.86

Ho: Hai giới thỏa mãn về hôn nhân trung bình như nhau.
 Kết quả: Chấp nhận Ho

5/12/2009

Nguyễn Duy Tâm _ IDR

84

42

5/12/2009

Con người –Tầmin
nhìn mới
ANOVA một nhân tố-Ví dụ chƣơng 8 Worksheet
Chapter8(V)


So sánh năng suất của 3 máy
Ho: Năng suất của 3 máy là như nhau

5/12/2009

85

Nguyễn Duy Tâm _ IDR

người –Tầm nhìn
ANOVA
một nhân tố-Ví dụConchƣơng
8mới
Anova: Single Factor

SUMMARY
Groups
Machine 1
Machine 2
Machine 3

Count
5
5
5

ANOVA
Source of Variation
Between Groups
Within Groups

SS
47.16
11.05

Total

58.22

Sum Average Variance
124.65
24.93
1.06
113.05
22.61
0.78
102.95
20.59
0.92

df
2
12

MS
23.58
0.92

F
P-value F crit
25.60
0.00 3.89

14

Ho: Năng suất của 3 máy là như nhau
Kết quả kiểm định: Bác bỏ Ho
5/12/2009

Nguyễn Duy Tâm _ IDR

86

43

5/12/2009

Thủ tục Tukey-Kramer


Con người –Tầm nhìn mới

Tools/ Lumenaut Statistics/ Tukey-Kramer Test
Lumenaut là một phần mềm Add-Ins miễn phí, chạy trên nền Excel.
5/12/2009

87

Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới

Thủ tục Tukey-Kramer

Tools/ Lumenaut Statistics/ Tukey-Kramer Test

5/12/2009

Nguyễn Duy Tâm _ IDR

88

44

5/12/2009

Thủ tục Tukey-Kramer

Con người –Tầm nhìn mới

Tukey-Kramer Test

v
9

k
3

Critical
Value Q
3.948

Machine 3
1.695
1.695

Meani-Meanj

MSD Values
Stack Machine 1 Machine 2
Machine 1
1.695
Machine 2
2.320
Machine 3
4.340
2.020

MS within
0.921

If Meani-Meanj > MSD value then pair is significantly different at the 5% level (1 Tailed)
Significant pair values are in bold and underlined in above Table

Tools/ Lumenaut Statistics/ Tukey-Kramer Test

5/12/2009

Tìm hệ số chặn và độ dốc


89

Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới

Hệ số chặn: fx/ Statistical/ INTERCEPT
Độ dốc: fx/ Statistical/ SLOPE

5/12/2009

Nguyễn Duy Tâm _ IDR

90

45

5/12/2009

Tìm hệ số chặn và độ dốc


Hệ số chặn: fx/ Statistical/ INTERCEPT
Độ dốc: fx/ Statistical/ SLOPE

5/12/2009

91

Nguyễn Duy Tâm _ IDR

Vẽ đƣờng xu hƣớng trong Chart

Con người –Tầm nhìn mới

Con người –Tầm nhìn mới

Click phải/ Add Trendline/

5/12/2009

Nguyễn Duy Tâm _ IDR

92

46

5/12/2009

Vẽ đƣờng xu hƣớng trong Chart


Con người –Tầm nhìn mới

Type: Linear
Options: Display Equation on chart

5/12/2009

93

Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới

Vẽ đƣờng xu hƣớng trong Chart
12,000

y = 1.5x + 1636.4
R2 = 0.9

10,000

Sales

8,000

Sales
Linear (Sales)

6,000

4,000

2,000

0
0

1,000

2,000

3,000

4,000

5,000

6,000

Footage

Kết quả

5/12/2009

Nguyễn Duy Tâm _ IDR

94

47

5/12/2009

Thủ tục REGRESSION

Con người –Tầm nhìn mới

Tools/ Data Analysis/ REGRESSION

5/12/2009

95

Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới

KẾT QUẢ
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.97
R Square
0.94
Adjusted R Square
0.93
Standard Error
611.75
Observations
7
ANOVA
df
Regression
Residual
Total

Intercept
Footage

5/12/2009

1
5
6

SS
30,380,456
1,871,200
32,251,656

Coefficients Standard Error
1,636.41
451.50
1.49
0.16

Nguyễn Duy Tâm _ IDR

MS
30380456
374240

F
Significance F
81.18
0.00

t Stat
P-value
3.62
0.02
9.01
0.00

Lower 95% Upper 95%
475.81 2,797.02
1.06
1.91

96

48

5/12/2009

Từ bảng kết xuất của Excel

Con người –Tầm nhìn mới

Residuals

Predicted Sales and Residuals

12000
10000
8000
6000

Predicted Sales
Residuals

4000
2000
0
-2000

0

2

4

6

8

Observations

5/12/2009

97

Nguyễn Duy Tâm _ IDR

Phần dƣ theo biến độc lập

Con người –Tầm nhìn mới

Footage Residual Plot
1000
800

Residuals

600
400
200
0
-200 0

1,000

2,000

3,000

4,000

5,000

6,000

-400
-600
-800
Footage

5/12/2009

Nguyễn Duy Tâm _ IDR

98

49

5/12/2009

Con người –Tầm nhìn mới

Real and Fitted Values
Footage Line Fit Plot
12,000
y = 1.4866x + 1636.4
10,000

2

R =1

Sales

8,000
6,000

Sales

4,000

Predicted Sales

2,000

Linear (Predicted
Sales)

0
0

1,000

2,000

3,000

4,000

5,000

6,000

Footage
5/12/2009

Nguyễn Duy Tâm _ IDR

99

Con người –Tầm nhìn mới
Tools/ Data Analysis/ Regression

Hồi quy đơn: Oil theo Temp

5/12/2009

Lê Tấn Luật

100

50

5/12/2009

Con người –Tầm nhìn mới

Hồi quy đơn: Oil theo Temp
SUMMARY OUTPUT
Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error
Observations

0.87
0.76
0.74
66.51
15

ANOVA
df
Regression
Residual
Total

Intercept
Temp

SS
178624
57511
236135

1
13
14

MS
178624
4424

F

Significance F
40
0.00

Coefficients Standard Error
t Stat
P-value Lower 95% Upper 95%
436.43823
38.63970893 11.29507 4.3E-08 352.962214 519.914246
-5.4622077
0.859608768
-6.3543 2.52E-05 -7.3192795 -3.6051359

5/12/2009

101

Lê Tấn Luật

Hồi quy đơn: Oil theo Insulation

Con người –Tầm nhìn mới

SUMMARY OUTPUT
Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error
Observations

0.47
0.22
0.16
119
15

ANOVA
df
Regression
Residual
Total

Intercept
Insulation

5/12/2009

1
13
14

SS
51,076
185,059
236,135

Coefficients Standard Error
345.38
74.69
-20.35
10.74

Lê Tấn Luật

MS
51,076
14,235

F

Significance F
3.59
0.08

t Stat
P-value Lower 95% Upper 95%
4.62
0.00
184.02
506.74
-1.89
0.08
-43.56
2.86

102

51

5/12/2009

Con người –Tầm nhìn mới

Hồi quy bội: Oil theo Temp và Insulation
Quét Known’s X: cả Temp và Insulation
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.98
R Square
0.97
Adjusted R Square
0.96
Standard Error
26.01
Observations
15
ANOVA
df
Regression
Residual
Total

Intercept
Temp
Insulation

5/12/2009

2
12
14

SS
228015
8121
236135

Coefficients Standard Error
562.15
21.09
-5.44
0.34
-20.01
2.34

MS
114007
677

F

Significance F
168
0.00

t Stat
P-value Lower 95% Upper 95%
26.65
0.00
516.19
608.11
-16.17
0.00
-6.17
-4.70
-8.54
0.00
-25.12
-14.91

103

Lê Tấn Luật

Con người –Tầm nhìn mới

Biến Insulation có cải thiện mô hình từ Oil
= f(Temp) không?

Kết quả tính toán cho Fc = 73

5/12/2009

Lê Tấn Luật

104

52

5/12/2009

Tra giá trị tới hạn của F: FINV


Con người –Tầm nhìn mới

Kết quả tính toán F* = 4.75
F =73 > F*: 4.75 Kết luận: Insulation làm
tăng mức độ giải thích của mô hình.
5/12/2009

Lê Tấn Luật

105

Hồi quy bậc hai: Chuẩn bị số
Con liệu
người –Tầm nhìn mới
Temp2=Tem^2
Oil (Gal) Temp
Temp2
275.30
40
1600
363.80
27
729
164.30
40
1600
40.80
73
5329
94.30
64
4096
230.90
34
1156
366.70
9
81
300.60
8
64
237.80
23
529
121.40
63
3969
31.40
65
4225
203.50
41
1681
441.10
21
441
323.00
38
1444
52.50
58
3364

5/12/2009

Lê Tấn Luật

106

53

5/12/2009

Kết quả hồi quy

Con người –Tầm nhìn mới

SUMMARY OUTPUT
Regression Statistics
Multiple R
0.88
R Square
0.78
Adjusted R Square
0.74
Standard Error
65.71
Observations
15
ANOVA
df
Regression
Residual
Total

2
12
14

Coefficients Standard Error
372.33
67.60
-1.26
3.75
-0.05
0.05

Intercept
Temp
Temp2

5/12/2009



MS
92,162
4,318

F
21

t Stat
P-value
5.51
0.00
-0.34
0.74
-1.15
0.27

Significance F
0.00

Lower 95% Upper 95%
225.04
519.62
-9.44
6.91
-0.15
0.05

107

Lê Tấn Luật

Hồi quy với biến giả

SS
184,324
51,811
236,135

Con người –Tầm nhìn mới

TC = Tổng chi phí sản xuất
Q = Tổng sản lượng
CN = 1 cho các quý đã thay đổi công nghệ, 0 cho các quý
trước khi thay đổi công nghệ.
TCN = 0 cho các quý đã thay đổi công nghệ, 1 cho các quý
trước khi thay đổi công nghệ.

5/12/2009

Lê Tấn Luật

108

54

5/12/2009

Sai lầm -> Đa cộng tuyếnConhoàn
hảo
người –Tầm
nhìn mới
SUMMARY OUTPUT
Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error
Observations

0.94
0.87
0.78
56.65
16

ANOVA
df
Regression
Residual
Total

Intercept
Q
CN
TCN

3
13
16

SS
291,681
41,727
333,408

MS
97,227
3,210

F
45

Significance F
0.00

Coefficients Standard Error
t Stat
P-value
521.80
122.46
4.26
0.00
0.81
0.10
8.04
0.00
0.00
0.00 65,535.00 #NUM!
210.63
52.80
3.99
0.00

5/12/2009

Lower 95%
Upper 95%
257.24
786.35
0.59
1.03
0.00
0.00
96.55
324.70

109

Lê Tấn Luật

Hồi quy với biến giả

Con người –Tầm nhìn mới

SUMMARY OUTPUT
Regression Statistics
Multiple R
0.94
R Square
0.87
Adjusted R Square
0.86
Standard Error
56.65
Observations
16
ANOVA
df
Regression
Residual
Total

Intercept
Q
CN

5/12/2009

2
13
15

SS
291,681
41,727
333,408

Coefficients Standard Error
732.42
79.51
0.81
0.10
-210.63
52.80

Lê Tấn Luật

MS
145,841
3,210

F
Significance F
45.44
1.36E-06

t Stat
P-value
9.21
0.00
8.04
0.00
-3.99
0.00

Lower 95% Upper 95%
560.65
904.20
0.59
1.03
-324.70
-96.55

110

55

5/12/2009

Hồi quy với biến tƣơng tác
SUMMARY OUTPUT
CNQ = CN*Q

Con người –Tầm nhìn mới

Regression Statistics
Multiple R
0.98
R Square
0.96
Adjusted R Square0.95
Standard Error 33.19
Observations
16
ANOVA
df
Regression
Residual
Total

Intercept
Q
CN
CNQ

5/12/2009

3
12
15

SS
320190
13218
333408

Coefficients Standard Error
401.52
80.00
1.24
0.10
368.96
118.05
-0.64
0.13

MS
106730
1102

F
Significance F
96.90
1.11913E-08

t Stat
P-value
5.02
0.00
11.98
0.00
3.13
0.01
-5.09
0.00

Lower 95%
Upper 95%
227.21
575.83
1.02
1.47
111.75
626.17
-0.92
-0.37

Lê Tấn Luật

111

người –Tầm nhìn
mới
Ý nghĩa của biến giả và biếnContƣơng
tác

TC = 401 + 1.24*Q + 368*CN – 0.64CNQ
P (0.00) (0.00) (0.01)
(0.00)
2
R = 0.96
Adjusted R2= 0.95
n= 16
Trước thay đổi công nghệ: CN=CNQ=0
TC = 401 + 1.24*Q
Sau thay đổi công nghệ: CN=1, CNQ=Q
TC = (401+368) + (1.24-0.68)*Q
TC = 769 + 0.56*Q
Vậy thay đổi công nghệ làm định phí tăng nhưng biến
phí đơn vị giảm.

5/12/2009

Lê Tấn Luật

112

56

5/12/2009

Con người
–Tầm nhìn mới
Hồi quy với biến chuyển dạng
log-log
Mô hình tuyến tính: Q=b1+b2*L+b3*K
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.99
R Square
0.99
Adjusted R Square
0.99
Standard Error
1,570.36
Observations
15
ANOVA
df
Regression
Residual
Total

Intercept
L
K

5/12/2009

2
12
14

SS
MS
2686989117 1.34E+09
29592539.09 2466045
2716581656

Coefficients Standard Error
-32,375.93
3,140.85
2.62
6.43
344.47
40.87

F
545

Significance F
1.67092E-12

t Stat
P-value
Lower 95% Upper 95%
-10.31
0.00
-39,219.24 -25,532.61
0.41
0.69
-11.39
16.62
8.43
0.00
255.43
433.51

113

Lê Tấn Luật

Chuyển dạng log-log

Con người –Tầm nhìn mới

Hàm sản xuất Cobb-Douglas
Q = A*La*Kb (1)
Không thể ước lượng trực tiếp hàm (1)
ln(Q) = ln(A) + a*ln(L) + b*ln(K)
Y = b0 + b1*X1 + b2*X2
Với b0 = ln(A); b1= a; b2=b; X1= ln(L); X2=ln(K)
Chúng ta đã chuyển về dạng mô hình hồi quy tuyến tính thông
thường

5/12/2009

Lê Tấn Luật

114

57

5/12/2009

người –Tầm nhìn mới
Chuẩn bị số liệu log-log: Hàm Con
ln(Number)

lnQ
9.10
9.29
9.32
9.31
9.45
9.70
9.88
9.96
10.05
10.17
10.29
10.42
10.55
10.76
10.90
5/12/2009

lnL
5.64
5.65
5.67
5.93
5.93
6.00
6.17
6.32
6.42
6.54
6.67
6.70
6.74
6.77
6.91

lnK
4.79
4.81
4.83
4.86
4.88
4.90
4.93
4.99
5.04
5.10
5.18
5.24
5.33
5.40
5.48
115

Lê Tấn Luật

Kết quả hồi quy

Con người –Tầm nhìn mới

SUMMARY OUTPUT
Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error
Observations

0.99
0.98
0.97
0.09
15

ANOVA
df
Regression
Residual
Total

Intercept
lnL
lnK

5/12/2009

SS
2
12
14

MS
4
0
5

Coefficients Standard Error
-0.38
0.78
0.67
0.17
1.22
0.34

Lê Tấn Luật

F
2
0

267

t Stat
P-value
-0.49
0.63
3.85
0.00
3.56
0.00

Significance F
1.13248E-10

Lower 95% Upper 95%
-2.07
1.31
0.29
1.04
0.47
1.96

116

58

Sign up to vote on this title
UsefulNot useful