Professional Documents
Culture Documents
SỬ DỤNG STATA
1
des
su biendinhluong
tab biendinhtinh biendinhtinh, su(biendinhluong)
gen tenbienmoi= bieu thuc
gen tenbienmoi= số
gen chitieubq= HHEXP/ HHSIZE
gen ngheo =1 if chitieubq < 1700
2
replace tenbien=giatrimoi [if dieukien]
replace ngheo=2 if ngheo >=.
drop chitieugao
gen vung= REG8
recode vung 1/3=1 4/6= 2 7/8=3
local biendinhluong HHEXP AGE EDU
RICEXPD HHSIZE
su `biendinhluong'
3
tab URB, sum( HHEXP)
4
NỘI DUNG
1. CÚ PHÁP LỆNH
2. THỐNG KÊ MÔ TẢ
3. PHÂN TÍCH SỐ LiỆU
4. VẼ BiỂU ĐỒ
File thực hành: HHEXPE98.DTA
5
CÚ PHÁP LỆNH
Stata sẽ thực hiện câu lệnh với theo từng giá trị
được chỉ ra bởi danh sách biến.
Ví dụ
sort sex
by sex: sum rlpcex1
Biến được chỉ ra bởi danh sách biến được yêu cầu
sắp xếp trước khi thực hiện lệnh.
VÍ DỤ
. sort sex
. by sex: sum rlpcex1
-> sex = 1
Variable | Obs Mean Std. Dev. Min Max
-------------+-----------------------------------------------------
rlpcex1 | 4375 2980.906 2430.648 357.318
45801.71
.
Danh sách biến (varlist)
Chỉ ra danh sách các biến chịu tác động của câu
lệnh. Nếu như không có biến nào được chỉ ra thì
lệnh Stata sẽ có tác dụng lên tất cả các biến (all
variables)
Ví dụ
sum hhsize sex reg7
sum
Điều kiện (if exp)
Stata chỉ thực hiện câu lệnh đối với các quan sát
mà giá trị của nó cho kết quả của biểu thức là đúng.
Ví dụ
sum hhsize sex reg7
sum
Điều kiện (if exp)
Stata chỉ thực hiện câu lệnh đối với các quan sát
mà giá trị của nó cho kết quả của biểu thức là đúng.
Ví dụ
sum poor if reg7==1
Lệnh này chỉ có tác dụng đối với các quan sát mà biến
reg7 có giá trị bằng 1.
Phạm vi (in range)
Chỉ ra phạm vi các quan sát chịu tác động của câu
lệnh. Range (phạm vi) có thể có các dạng sau:
sum poor in 10
Tính giá trị trung bình của biến poor cho quan sát 10
(chính bằng giá trị của biến poor tại quan sát thứ 10)
sum poor in 10/100
Tính giá trị trung bình của biến poor cho quan sát từ
10 đến 100
Phạm vi (in range)
Nhiều câu lệnh Stata cho phép các tuỳ chọn riêng.
Các tuỳ chọn này được chỉ ra sau dấu phẩy.
Ví dụ:
Lệnh sum có tuỳ chọn là detail, cho phép tính toán
thêm một số thống kê khác ngoài giá trị trung bình
và độ lệnh chuẩn.
sum rlpcex1, detail
Toán tử và hàm số (Operators and functions)
Ký hiệu ý nghĩa
Số học
+ Cộng
- Trừ
* Nhân
/ Chia
^ Luỹ thừa
Quan hệ
> Lớn hơn
< Nhỏ hơn
>= Lớn hơn hoặc bằng
<= Nhỏ hơn hoặc bằng
== Bằng
~= Không bằng (khác)
!= Không bằng (khác)
Toán tử và hàm số (Operators and functions)
Quan hệ
== Bằng
~= Không bằng (khác)
!= Không bằng (khác)
Lôgíc
~ Không
| Hoặc
& Và
Các hàm số (function)
Matrix functions
Các lệnh cho biết thông tin về biến và dữ liệu
keep <danh sách biến> Lệnh này giữ lại các biến
được chỉ ra bởi danh sách biến, các biến không
được chỉ ra sẽ bị xoá đi
keep <điều kiện> Lệnh này giữ lại các quan
sát thoả mãn điều kiện biểu thức, các quan sát
khác sẽ bị xoá đi
keep <phạm vi> [điều kiện] Lệnh này giữ lại các
quan sát được chỉ ra bởi phạm vi (và có thể thoả
mãn điều kiện biểu thức), các quan sát khác sẽ bị
xoá đi.
Lệnh xoá biến, xoá quan sát
sort reg7
by reg7: ci poor, total
sort URB
sort REG8
Chi tiêu ở thành thị nông thôn và theo giới tính chủ
hộ như thế nào?
Kiểm định tỷ lệ của 1 mẫu
sdtest rlpcex1=2700
Phân tích tương quan
Anh chị nhập dòng sau vào Stata và thực hiện lệnh
use
http://www.ats.ucla.edu/stat/stata/dae/binary.dta,
clear
Mô tả biến
GRE (Graduate Record Exam scores)
GPA (grade point average)
rank: xếp hạng danh tiếng của trường đại học thí
sinh đã tốt nghiệp
admit: 1 được nhận vào học sau đại hoc, 0 không
được
Thực hành phân tích dữ liệu từ xa
70
VẼ BiỂU ĐỒ
graph bar HHSIZE, over(URB)
graph hbar HHSIZE, over(URB)
graph bar HHSIZE HHEXP EDU RICEXPD, over(URB)
> legend(lab(1 “quy mo ho") lab(2 “chi tieu ho") lab(3
“van hoa") lab(4 “chi tieu gao"))
>ytitle("thong ke cac chi tieu binh quan")
71
VẼ BiỂU ĐỒ
Twoway option gồm
added_line_options draw lines at specified y or x values
added_text_options display text at specified (y,x) value
axis_options labels, ticks, grids, log scales
title_options titles, subtitles, notes, captions
legend_options legend explaining what means what
scale(#) resize text, markers, and line widths
region_options outlining, shading, graph size
aspect_option constrain aspect ratio of plot region
scheme(schemename) overall look
play(recordingname) play edits from recordingname
by(varlist, ...) repeat for subgroups
nodraw suppress display of graph
name(name, ...) specify name for graph
saving(filename, ...) save graph in file
advanced_options difficult to explain
72
VẼ BiỂU ĐỒ
Ví dụ
twoway scatter hhexp1 agegroup
73
CÂU HỎI, THẢO LUẬN
Phamphuongloan.hcmc@gmail.com
0907073334
74
CÂU HỎI, THẢO LUẬN
gen hn=( chitieu<1500)
drop hn
drop if hn==0
75
So sánh bình quân 2 nhóm
ttest biendinhluong, by(biendinhtinh)
Đọc kết quả: Pr(T < t)
Nếu nhỏ hơn 5% (1%, 10%): bình quân 2
nhóm khác nhau
Ngược lại: bình quân 2 nhóm giống nhau
ttest HHEXP, by( URB)
ttest Gialuathuong, by( vu)
76
So sánh bình quân 3 nhóm
anova biendinhluong biendinhtinh
Đọc kết quả: Prob > F
Nếu nhỏ hơn 5% (1%, 10%): bình quân 3
nhóm khác nhau
Ngược lại: bình quân 3 nhóm giống nhau
anova HHEXP REG8
anova Gialuathuong A
gen vu=1
77
Phân tích nhân quả
reg bienketqua cacbiennguyen nhan
Đọc kết quả:
1. Mô hình: Prob > F
2. P>|t|
3. Coef.
78
Phân tích nhân quả
1. Mô hình: Prob > F
Nếu nhỏ hơn 5%: mô hình tốt
2. P>|t|
Nếu nhỏ hơn 5%, nguyên nhân có ảnh
hưởng kết quả
2. Coef.
Dấu + ảnh hưởng cùng chiều
Dấu - ảnh hưởng ngược chiều
79
Phân tích nhân quả
reg Gialuathuong Dintichthuhoach
Sluongthuonglai SluongColua
80