Chuong Stata

Chương
SỬ DỤNG STATA
1
des
su biendinhluong
tab biendinhtinh biendinhtinh, su(biendinhluong)
gen tenbienmoi= bieu thuc
gen tenbienmoi= số
gen chitieubq= HHEXP/ HHSIZE
gen ngheo =1 if chitieubq < 1700
2
replace tenbien=giatrimoi [if dieukien]
replace ngheo=2 if ngheo >=.
drop chitieugao
gen vung= REG8
recode vung 1/3=1 4/6= 2 7/8=3
local biendinhluong HHEXP AGE EDU
RICEXPD HHSIZE
su `biendinhluong'
3
tab URB, sum( HHEXP)
4
NỘI DUNG
1. CÚ PHÁP LỆNH
2. THỐNG KÊ MÔ TẢ
3. PHÂN TÍCH SỐ LiỆU
4. VẼ BiỂU ĐỒ
File thực hành: HHEXPE98.DTA
5
CÚ PHÁP LỆNH
[by danh sách biến:] Cú pháp lệnh [danh sách

biến] [biểu thức] [điều kiện] [phạm vi] [quyền số] [,
tuỳ chọn]
[by varlist:] command [varlist] [=exp] [if exp] [in
range] [weight] [, options]
LƯU Ý
1. Các câu lệnh Stata được viết bằng chữ thường.

2. Đối với tên biến, Stata phân biệt chữ viết thường
với chữ viết hoa. Ví dụ, trong cùng một tệp số
liệu, biến “Ho_ten” và biến “ho_ten” là 2 biến
khác nhau.
3. Các tuỳ chọn được ký hiệu trong dấu ngoặc
vuông [ ]. Các tuỳ chọn này có thể có hoặc
không trong câu lệnh. Các tham số bắt buộc (tên
biến) được đặt trong dấu ngoặc < >. Các câu
lệnh sẽ không thực hiện được nếu các tham số
bắt buộc này không được khai báo.
LƯU Ý
Một số lệnh Stata cho phép viết tắt. Ví dụ lệnh

summarize có thể viết tắt là sum. Phần gạch chân
dưới cú pháp của câu lệnh là cú pháp “viết tắt” của
câu lệnh đó.
Ví dụ như lệnh use có thể được viết tắt bởi u.
by danh sách biến (by varlist)
Stata sẽ thực hiện câu lệnh với theo từng giá trị
được chỉ ra bởi danh sách biến.
Ví dụ
sort sex
by sex: sum rlpcex1
Biến được chỉ ra bởi danh sách biến được yêu cầu
sắp xếp trước khi thực hiện lệnh.
VÍ DỤ
. sort sex

. by sex: sum rlpcex1

-> sex = 1

Variable | Obs Mean Std. Dev. Min Max
-------------+-----------------------------------------------------
rlpcex1 | 4375 2980.906 2430.648 357.318
45801.71
.
Danh sách biến (varlist)
Chỉ ra danh sách các biến chịu tác động của câu
lệnh. Nếu như không có biến nào được chỉ ra thì
lệnh Stata sẽ có tác dụng lên tất cả các biến (all
variables)
Ví dụ
sum hhsize sex reg7
sum
Điều kiện (if exp)
Stata chỉ thực hiện câu lệnh đối với các quan sát
mà giá trị của nó cho kết quả của biểu thức là đúng.
Ví dụ
sum hhsize sex reg7
sum
Điều kiện (if exp)
Stata chỉ thực hiện câu lệnh đối với các quan sát
mà giá trị của nó cho kết quả của biểu thức là đúng.
Ví dụ
sum poor if reg7==1
Lệnh này chỉ có tác dụng đối với các quan sát mà biến
reg7 có giá trị bằng 1.
Phạm vi (in range)
Chỉ ra phạm vi các quan sát chịu tác động của câu
lệnh. Range (phạm vi) có thể có các dạng sau:
sum poor in 10
Tính giá trị trung bình của biến poor cho quan sát 10
(chính bằng giá trị của biến poor tại quan sát thứ 10)
sum poor in 10/100
Tính giá trị trung bình của biến poor cho quan sát từ
10 đến 100
Phạm vi (in range)
sum poor in f/100

đầu tiên đến 100
sum poor in 100/l
thứ 100 đến quan sát cuối cùng
Các tuỳ chọn (Options)
Nhiều câu lệnh Stata cho phép các tuỳ chọn riêng.
Các tuỳ chọn này được chỉ ra sau dấu phẩy.
Ví dụ:
Lệnh sum có tuỳ chọn là detail, cho phép tính toán
thêm một số thống kê khác ngoài giá trị trung bình
và độ lệnh chuẩn.
sum rlpcex1, detail
Toán tử và hàm số (Operators and functions)
Ký hiệu ý nghĩa
Số học
+ Cộng
- Trừ
* Nhân
/ Chia
^ Luỹ thừa
Quan hệ
> Lớn hơn
< Nhỏ hơn
>= Lớn hơn hoặc bằng
<= Nhỏ hơn hoặc bằng
== Bằng
~= Không bằng (khác)
!= Không bằng (khác)
Toán tử và hàm số (Operators and functions)
Quan hệ
== Bằng
~= Không bằng (khác)
!= Không bằng (khác)
Lôgíc
~ Không
| Hoặc
& Và
Các hàm số (function)
Cú pháp chung hàm số Y=f(X1, X2,…Xm)

VD: gen absx=abs(x)
gen log_exp=log(rlpcex1)
Các hàm số (function)
Mathematical functions Các hàm toán học

Statistical functions Hàm thống kê
Random numbers Hàm cho số ngẫu nhiên
String functions Hàm liên quan đến dãy ký tự
Special functions Hàm đặc biệt
Date functions Hàm ngày tháng
Time-series functions Hàm chuỗi thời gian
Hàm ma trận
Matrix functions
Các lệnh cho biết thông tin về biến và dữ liệu
1. describe [danh sách biến]

2. list [danh sách biến] [điều kiện] [phạm vi] [, nolabel]
3. count [điều kiện] [phạm vi]
4. edit [danh sách biến] [điều kiện] [phạm vi] [,
nolabel]
5. browse [danh sách biến] [điều kiện] [phạm vi] [,
nolabel]
Thống kê cơ bản
summarize [danh sách biến] [quyền số] [điều kiện]

[phạm vi] [, detail]
Lệnh này tính toán và hiển thị những thống kê cơ
bản của các biến được chỉ ra bởi danh sách biến.
Tuỳ chọn detail cho phép hiển thị thêm một số
thống kê như độ nhọn, độ lệch và các giá trị của
thập vị phân.
VD: sum poor
Tạo bảng tần suất
Tạo bảng tần suất 1 chiều

tabulate <tên biến> [quyền số] [điều kiện] [phạm vi]
[, missing nolabel]
tab1 <danh sách biến> [quyền số] [điều kiện] [phạm
vi] [, missing nolabel]
VD: tab urban98
Tạo bảng tần suất
Tạo bảng tần suất 2 chiều

Cú pháp:
tabulate <tên biến 1> <tên biến 2> [quyền số] [điều
kiện] [phạm vi] [, chi2 missing nofreq cell column
row]
tab2 <danh sách biến> [quyền số] [điều kiện] [phạm
vi] [, chi2 missing nofreq cell column row]
Ví dụ: tab farm urban98
Tạo bảng thống kê tổng hợp
tabulate <tên biến 1> <tên biến 2> [quyền số]

[điều kiện] [phạm vi] , summarize(tên biến 3)
[means standard freq missing ]
Lệnh này tạo bảng một hoặc hai chiều định nghĩa
bởi biến 1 hoặc biến 2 và mỗi ô cho giá trị thống kê
trung bình, độ lệch chuẩn và tần suất của biến 3.
Ví dụ: tab farm urban98, sum(poor)
Tạo bảng thống kê tổng hợp bằng lệnh tabstat
tabstat <danh sách biến> [quyền số] [điều kiện]

[phạm vi] [, statistics(cú pháp tkê [...]) by (tên biến)
missing format[(%fmt)]]
Lệnh này tính toán các thống kê của các biến được
chỉ ra bởi danh sách biến cho từng giá trị của biến
phân loại (categorical) được chỉ ra bởi by(tên biến).
Cũng có thể dùng cửa sổ lệnh bằng menu bar:
Tables of summary statistics (tabstat)
Tạo bảng thống kê tổng hợp bằng lệnh table
table <biến dòng> [biến cột [biến cột trên cùng]]

[điều kiện] [phạm vi] [quyền số] [, contents(nội
dung) row col format(%fmt) missing]
Lệnh này cho phép tính các thống kê của các biến
được chỉ ra trong contents theo dạng bảng, trong
đó các hàng được định nghĩa bởi biến dòng, còn
các cột được định nghĩa bởi biến cột (và biến cột
trên cùng). Các biến hàng và cột này là các biến
phân loại (categorical).
Tạo biến mới
generate <biến mới> = biểu thức [điều kiện]

[phạm vi]
Lệnh này cho phép tạo biến mới có giá trị bằng giá
trị của biểu thức được chỉ ra.
Ví dụ:
gen poor = 1 if rlpcex1 < 1790
gen region1=(reg7==1)
Lệnh tạo biến giả tabulate và generate
tabulate <biến phân loại>, generate(biến mới)

Lệnh generate có thể kết hợp với tab để tạo các
biến giả . Biến mới tạo ra sẽ có dạng là “biến mới
1”, “biến mới 2”, “biến mới 3”, v..v. Biến này chính là
các biến giả được tạo ra trên cơ sở của biến phân
loại.
VD: tab reg7, gen(region)
Tạo biến bằng lệnh egen
egen <biến mới> = fcn(tham số) [điều kiện]

[phạm vi] [, by(biến)]
Lệnh này cho phép tạo biến mới theo giá trị của
hàm số được chỉ ra bởi fcn. Biến mới này sẽ nhận
giá trị cố định cho mọi quan sát. Hàm số ở đây có
thể là:
count(exp) Đếm số quan sát của biểu thức

mean(exp) Cho giá trị trung bình của biểu thức
median(exp) Cho giá trị trung vị của biểu thức
sd(exp) Cho giá trị độ lệch chuẩn của biểu thức
Tạo biến bằng lệnh egen
VD: egen g=mean( food+ nonfood1)

sum g
Thay thế giá trị của biến
replace <biến> = biểu thức [điều kiện] [phạm vi]

Lệnh này thay thế giá trị của biến hiện có bằng giá
trị mới xác định bởi biểu thức exp.
Ví dụ:
replace poor=poor*100
replace pcexp = hhexp/hhsize
Tạo biến phân loại bằng lệnh encode
encode <biến> [điều kiện] [phạm vi],

generate(biến mới)
Lệnh này cho phép tạo biến phân loại mới
(categorical) kiểu số tương ứng với các giá trị của
biến kiểu chữ chỉ ra bởi tên biến (được xếp theo
vần chữ cái).
Tạo biến phân loại bằng lệnh encode
gen str15(mucsong)="Rat ngheo"

replace mucsong="Ngheo" if rlpcex1<1790 &
rlpcex1>1290
replace mucsong="Khong ngheo" if rlpcex1>=1790
tab mucsong
encode mucsong, gen(ma_ms)
tab ma_ms
Tạo biến bằng lệnh xtile
xtile <biến mới> = biểu thức [quyền số] [điều

kiện] [phạm vi] [, nquantiles(#)]
Lệnh này tạo biến phân nhóm cho biểu thức theo
phân vị. Trong đó nquantiles(#) chỉ ra số lượng
phân vị.
Tạo biến bằng lệnh xtile
Ví dụ: Tạo biến ngũ vị phân theo chi tiêu

xtile quinexp= rlpcex1, nq(5)
tab quinexp
tab quinexp, sum( rlpcex1)
Đổi tên biến
rename <tên biến cũ> <tên biến mới>

Lệnh này thực hiện việc đổi tên cũ của một biến
sang tên mới.
Ví dụ:
rename poor nguoingheo
rename rpcexp1 chitieu
Lệnh xoá biến, xoá quan sát
drop <danh sách biến> Lệnh này xoá biến được

chỉ ra bởi danh sách biến
drop <điều kiện> Lệnh này xoá quan sát thoả
mãn điều kiện biểu thức
drop <phạm vi> [điều kiện] Lệnh này xoá quan sát
được chỉ ra bởi phạm vi (và có thể phải thoả mãn
điều kiện biểu thức)
keep <danh sách biến> Lệnh này giữ lại các biến
được chỉ ra bởi danh sách biến, các biến không
được chỉ ra sẽ bị xoá đi
keep <điều kiện> Lệnh này giữ lại các quan
sát thoả mãn điều kiện biểu thức, các quan sát
khác sẽ bị xoá đi
keep <phạm vi> [điều kiện] Lệnh này giữ lại các
quan sát được chỉ ra bởi phạm vi (và có thể thoả
mãn điều kiện biểu thức), các quan sát khác sẽ bị
xoá đi.
drop poor urban98 Xoá 2 biến poor và urban98

drop if sex==1 Xoá các quan sát có biến sex
nhận giá trị bằng 1
drop in 1/20 Xoá quan sát từ 1 đến 20
keep househol Chỉ giữ lại biến househol, các
biến khác bị xoá đi
keep in f/50 Giữ lại quan sát từ đầu tiên đến
50, các quan sát khác bị xoá đi
Lệnh đổi giá trị của biến phân loại
recode <tên biến> giá trị cũ = giá trị mới [điều

kiện] [phạm vi]
recode sex 0=1
recode sex . = 0
recode hhsize 1/5=1 6/10 = 2 . = 3
recode ld 1/9= 1 10/49=2 else=3
gen chitieugao= RICEXPD
Gán nhãn cho biến
label variable <tên biến> Nhãn của biến

Lệnh này gán nhãn là một dãy ký tự cho biến.
gen ngheo=poor
label var ngheo "Nguoi ngheo"
Gán giá trị cho biến phân loại
label variable <tên biến> Nhãn của biến

Ví dụ:
Tạo nhãn có tên là nngheo với giá trị 1 có nghĩa là
người nghèo, còn 0 có nghĩa là người không
nghèo.
label define nngheo 0 "Ngheo" 1 "Khong ngheo“
label dir
label list nngheo
label drop _all
label dir
Lệnh label values sẽ gán các nhãn của 1 bộ nhãn

cho các giá trị số của 1 biến phân loại.
tab ngheo
list ngheo in 1/5
label values ngheo nngheo
tab ngheo
list ngheo in 1/5
Lệnh label values sẽ gán các nhãn của 1 bộ nhãn

cho các giá trị số của 1 biến phân loại.
tab ngheo
list ngheo in 1/5
label values ngheo nngheo
tab ngheo
list ngheo in 1/5
Ước lượng giá trị trung bình bằng khoảng tin
cậy
ci [danh sách biến] [quyền số] [điều kiện] [phạm vi]
[, level(#) binomial poisson exposure(tên biến) total]
ci các biến [điều kiện], [total]

ci poor
sort reg7
by reg7: ci poor, total
ci HHEXP RICEXPD, level(99)

cậy
sort reg7
by reg7: ci poor, total
sort URB
by URB: ci HHEXP RICEXPD HHSIZE

by URB: ci HHEXP RICEXPD HHSIZE, total
cậy
Chi tiêu mỗi vùng dao động trong khoảng nào?
sort REG8
. by REG8: ci HHEXP, total
Chi tiêu ở thành thị nông thôn và theo giới tính chủ
hộ như thế nào?
Kiểm định tỷ lệ của 1 mẫu
prtest <biến>= # [điều kiện] [phạm vi] [, level(#)]

Lệnh này thực hiện kiểm định giả thuyết về tỷ lệ giá
trị của biến phân phối theo quy luật không một (Ho:
p = p0).
prtest poor=0.44 if reg7==1 kiểm định tỷ lệ nghèo là
0.44
prtest <biến 1> = <tên biến2> [điều kiện] [phạm vi] [,

level(#)]
Lệnh này thực hiện kiểm định giả thuyết về sự bằng
nhau của tỷ lệ của hai giá trị biến được chỉ ra bởi
tên biến (Ho: pX = pY).
Ví dụ: Kiểm định xem tỷ lệ nghèo đói giữa vùng 2

và vùng 4 có khác nhau không
gen poor2=poor if reg7==2
gen poor4=poor if reg7==4
prtest poor2 = poor4
Kiểm định tỷ lệ của mẫu
prtest <biến> [điều kiện] [phạm vi], by(biến phân

nhóm) [level(#)]
nhau của tỷ lệ của hai nhóm được chỉ ra bởi biến
phân nhóm (Ho: pX1 = pX2).
prtest poor, by(sex)
Kiểm định trung bình của 1 mẫu
ttest <biến> = # [điều kiện] [phạm vi] [, level(#) ]

Lệnh này kiểm định giả thuyết về giá trị của tham số
trung bình của biến ngẫu nhiên tuân theo quy luật
chuẩn được chỉ ra bởi tên biến (Ho:  = 0)
ttest rlpcex1=3200
Kiểm định trung bình của 2 mẫu
ttest <biến 1> = <biến 2> [điều kiện] [phạm vi] [,

unpaired unequal level(#) ]
Lệnh này thực hiện kiểm định giả thuyết rằng hai
biến có giá trị trung bình bằng nhau. (Ho: X = Y).
Các tuỳ chọn:
unpaired Số liệu của hai biến không cùng cặp
unequal Phuơng sai của hai biến không bằng nhau
ttest poor2=poor4, unpaired unequal
Kiểm định trung bình của mẫu
ttest <biến> [điều kiện] [phạm vi], by(biến phân

nhóm) [ unequal level(#) ]
nhau của giá trị trung bình của hai nhóm được chỉ
ra bởi biến phân nhóm (Ho: X1 = X2).
ttest rlpcex1, by(sex)
Kiểm định giá trị độ lệch chuẩn
sdtest <biến> = # [điều kiện] [phạm vi] [, level(#)

]
sdtest <biến 1> = <biến 2> [điều kiện] [phạm vi]
[, level(#) ]
sdtest <biến> [điều kiện] [phạm vi] , by(biến
phân nhóm) [ level(#) ]
Lệnh này kiểm dịnh tham số độ lệch chuẩn của biến
ngẫu nhiên tuân theo quy luật chuẩn được chỉ ra
bởi tên biến. Cú pháp của lệnh này tương tự với cú
pháp của lệnh ttest
sdtest <biến> = # [điều kiện] [phạm vi] [, level(#)

]
sdtest <biến 1> = <biến 2> [điều kiện] [phạm vi]
[, level(#) ]
sdtest <biến> [điều kiện] [phạm vi] , by(biến
phân nhóm) [ level(#) ]
Lệnh này kiểm dịnh tham số độ lệch chuẩn của biến
ngẫu nhiên tuân theo quy luật chuẩn được chỉ ra
bởi tên biến. Cú pháp của lệnh này tương tự với cú
pháp của lệnh ttest
sdtest rlpcex1=2700
Phân tích tương quan
correlate [danh sách biến] [quyền số] [điều kiện]

[phạm vi] [, means covariance _coef wrap]
corr hhsize poor rlpcex1 sex
pwcorr [danh sách biến] [quyền số] [điều kiện]

[phạm vi] [, obs sig print(#) star(#)]
Lệnh này tính hệ số tương quan cho từng cặp biến
được chỉ ra bởi danh sách biến.
Obs Hiển thị số quan sát dùng để tính hệ số tương
quan
Sig Hiển thị mức ý nghĩa của các hệ số tương quan
print(#) Chỉ ra mức ý nghĩa theo đó chỉ các hệ số tương
quan có mức ý nghĩa nhỏ hơn mức này mới
được hiển thị
star(#) Đánh dấu sao đối với các hệ số tương quan có
mức ý nghĩ nhỏ hơn mức được chỉ ra bởi star
pwcorr hhsize poor rlpcex1 sex, obs sig star(5)

pcorr <biến> <danh sách biến> [quyền số] [điều
kiện] [phạm vi]
Lệnh này tính hệ số tương quan của biến được chỉ
ra bởi tên biến với các biến được trong danh sách
biến
pcorr poor hhsize rlpcex1 sex
Phân tích hồi quy
regress <biến phụ thuộc> [danh sách biến]

[quyền số] [điều kiện] [phạm vi] [, option]
reg rlhhex1 sex hhsize, beta
Phân tích hồi quy
Các tuỳ chọn:

level(#) Chỉ ra mức tin cậy cho ước lượng
khoảng tin cậy của hệ số
noconstant Không có hệ số (intercept) trong hàm
hồi quy
noheader Chỉ hiển thị kết quả phân tích về các
hệ số
beta Hiển thị hệ số được chuẩn hoá, dùng để so
sánh mức độ ảnh hưởng của các hệ số với nhau
Phân tích ANOVA
anova varname [termlist] [if] [in] [weight] [,

options]
Vd: anova rlhhex1 urban98
chương trình do-file
Dùng để soạn thảo các lệnh

doedit
doedit (tên do-file)
do filename [, nostop]
run filename [, nostop]
Source SS df MS Number of obs = 5999
F( 6, 5992) = 716.74
Model 4.2484e+11 6 7.0807e+10 Prob > F = 0.0000
Residual 5.9195e+11 5992 98790004.9 R-squared = 0.4178
Adj R-squared = 0.4172
Total 1.0168e+12 5998 169521637 Root MSE = 9939.3
HHEXP Coef. Std. Err. t P>|t| [95% Conf. Interval]
AGE 64.92979 10.27418 6.32 0.000 44.7887 85.07088

EDU 470.2673 33.80265 13.91 0.000 404.002 536.5327
HHSIZE 1554.705 75.06898 20.71 0.000 1407.542 1701.867
SEX 968.2364 314.4101 3.08 0.002 351.8793 1584.593
URB 8931.482 320.3181 27.88 0.000 8303.543 9559.421
POOR -8512.118 306.8384 -27.74 0.000 -9113.632 -7910.605
_cons 1995.086 843.4363 2.37 0.018 341.6475 3648.525
66
Thực hành phân tích dữ liệu từ xa
Anh chị nhập dòng sau vào Stata và thực hiện lệnh
use
http://www.ats.ucla.edu/stat/stata/dae/binary.dta,
clear
Mô tả biến
GRE (Graduate Record Exam scores)
GPA (grade point average)
rank: xếp hạng danh tiếng của trường đại học thí
sinh đã tốt nghiệp
admit: 1 được nhận vào học sau đại hoc, 0 không
được
summarize gre gpa

tab rank
tab admit
tab admit rank
use “http://www.ats.ucla.edu/stat/stata/dae/crime”, clear
state id (sid)
state name (state),
violent crimes per 100,000 people (crime),
murders per 1,000,000 (murder),
the percent of the population living in metropolitan areas
(pctmetro),
the percent of the population that is white (pctwhite),
percent of population with a high school education or above
(pcths),
percent of population living under poverty line (poverty), and
percent of population that are single parents (single).
It has 51 observations. We are going to use poverty and
single to predict crime.
VẼ BiỂU ĐỒ
[graph] twoway plot danh sách biến [if] [in] [,
twoway_options]
Plot gồm
scatter
line
connected
area
bar
spike
dropline
dot
70
VẼ BiỂU ĐỒ
graph bar HHSIZE, over(URB)
graph hbar HHSIZE, over(URB)
graph bar HHSIZE HHEXP EDU RICEXPD, over(URB)
> legend(lab(1 “quy mo ho") lab(2 “chi tieu ho") lab(3
“van hoa") lab(4 “chi tieu gao"))
>ytitle("thong ke cac chi tieu binh quan")
71
VẼ BiỂU ĐỒ
Twoway option gồm
added_line_options draw lines at specified y or x values
added_text_options display text at specified (y,x) value
axis_options labels, ticks, grids, log scales
title_options titles, subtitles, notes, captions
legend_options legend explaining what means what
scale(#) resize text, markers, and line widths
region_options outlining, shading, graph size
aspect_option constrain aspect ratio of plot region
scheme(schemename) overall look
play(recordingname) play edits from recordingname
by(varlist, ...) repeat for subgroups
nodraw suppress display of graph
name(name, ...) specify name for graph
saving(filename, ...) save graph in file
advanced_options difficult to explain
72
VẼ BiỂU ĐỒ
Ví dụ
twoway scatter hhexp1 agegroup
73
CÂU HỎI, THẢO LUẬN
Phamphuongloan.hcmc@gmail.com
0907073334
74
CÂU HỎI, THẢO LUẬN
gen hn=( chitieu<1500)
drop hn
drop if hn==0
75
So sánh bình quân 2 nhóm
ttest biendinhluong, by(biendinhtinh)
Đọc kết quả: Pr(T < t)
Nếu nhỏ hơn 5% (1%, 10%): bình quân 2
nhóm khác nhau
Ngược lại: bình quân 2 nhóm giống nhau
ttest HHEXP, by( URB)
ttest Gialuathuong, by( vu)
76
So sánh bình quân 3 nhóm
anova biendinhluong biendinhtinh
Đọc kết quả: Prob > F
Nếu nhỏ hơn 5% (1%, 10%): bình quân 3
nhóm khác nhau
Ngược lại: bình quân 3 nhóm giống nhau
anova HHEXP REG8
anova Gialuathuong A
gen vu=1
77
Phân tích nhân quả
reg bienketqua cacbiennguyen nhan
Đọc kết quả:
1. Mô hình: Prob > F
2. P>|t|
3. Coef.
78
1. Mô hình: Prob > F
Nếu nhỏ hơn 5%: mô hình tốt
2. P>|t|
Nếu nhỏ hơn 5%, nguyên nhân có ảnh
hưởng kết quả
2. Coef.
Dấu + ảnh hưởng cùng chiều
Dấu - ảnh hưởng ngược chiều
79
reg Gialuathuong Dintichthuhoach
Sluongthuonglai SluongColua
80

Chuong Stata

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Chuong Stata

Uploaded by

Copyright:

Available Formats

Chương

[by danh sách biến:] Cú pháp lệnh [danh sách

1. Các câu lệnh Stata được viết bằng chữ thường.

Một số lệnh Stata cho phép viết tắt. Ví dụ lệnh

sum poor in f/100

Cú pháp chung hàm số Y=f(X1, X2,…Xm)

Mathematical functions Các hàm toán học

1. describe [danh sách biến]

summarize [danh sách biến] [quyền số] [điều kiện]

Tạo bảng tần suất 1 chiều

Tạo bảng tần suất 2 chiều

tabulate <tên biến 1> <tên biến 2> [quyền số]

tabstat <danh sách biến> [quyền số] [điều kiện]

table <biến dòng> [biến cột [biến cột trên cùng]]

generate <biến mới> = biểu thức [điều kiện]

tabulate <biến phân loại>, generate(biến mới)

egen <biến mới> = fcn(tham số) [điều kiện]

count(exp) Đếm số quan sát của biểu thức

VD: egen g=mean( food+ nonfood1)

replace <biến> = biểu thức [điều kiện] [phạm vi]

encode <biến> [điều kiện] [phạm vi],

gen str15(mucsong)="Rat ngheo"

xtile <biến mới> = biểu thức [quyền số] [điều

Ví dụ: Tạo biến ngũ vị phân theo chi tiêu

rename <tên biến cũ> <tên biến mới>

drop <danh sách biến> Lệnh này xoá biến được

drop poor urban98 Xoá 2 biến poor và urban98

recode <tên biến> giá trị cũ = giá trị mới [điều

label variable <tên biến> Nhãn của biến

label variable <tên biến> Nhãn của biến

Lệnh label values sẽ gán các nhãn của 1 bộ nhãn

Lệnh label values sẽ gán các nhãn của 1 bộ nhãn

ci các biến [điều kiện], [total]

ci HHEXP RICEXPD, level(99)

by URB: ci HHEXP RICEXPD HHSIZE

Chi tiêu mỗi vùng dao động trong khoảng nào?

. by REG8: ci HHEXP, total

prtest <biến>= # [điều kiện] [phạm vi] [, level(#)]

prtest <biến 1> = <tên biến2> [điều kiện] [phạm vi] [,

Ví dụ: Kiểm định xem tỷ lệ nghèo đói giữa vùng 2

prtest <biến> [điều kiện] [phạm vi], by(biến phân

ttest <biến> = # [điều kiện] [phạm vi] [, level(#) ]

ttest <biến 1> = <biến 2> [điều kiện] [phạm vi] [,

ttest <biến> [điều kiện] [phạm vi], by(biến phân

sdtest <biến> = # [điều kiện] [phạm vi] [, level(#)

sdtest <biến> = # [điều kiện] [phạm vi] [, level(#)

correlate [danh sách biến] [quyền số] [điều kiện]

pwcorr [danh sách biến] [quyền số] [điều kiện]

pwcorr hhsize poor rlpcex1 sex, obs sig star(5)

regress <biến phụ thuộc> [danh sách biến]

Các tuỳ chọn:

anova varname [termlist] [if] [in] [weight] [,

Dùng để soạn thảo các lệnh

HHEXP Coef. Std. Err. t P>|t| [95% Conf. Interval]

AGE 64.92979 10.27418 6.32 0.000 44.7887 85.07088

summarize gre gpa

You might also like