Professional Documents
Culture Documents
Gii Thiu PHN MM X Ly S Liu Stata
Gii Thiu PHN MM X Ly S Liu Stata
LÝ SỐ LIỆU STATA
– Logfile chứa các câu lệnh và bảng kết quả, không chứa biểu đồ, đồ
thị.
• Để mở một log file: Từ menu vào File – Log – Begin
hoặc gõ trực tiếp log using ten_log tại dòng lệnh.
log using filename [, append replace [text|smcl]]
• Đuôi mở rộng của log file: .log; .smcl; .doc
• Đóng logfile sử dụng câu lệnh
log close
Quản lý số liệu trong Stata
Tạo dataset
• Một vài câu lệnh trong phần này: use, browse, edit, format,
generate, list, merge, append, replace, save, set, sort, tabulate,
label, keep, drop.
• Tạo một dataset:
set obs #: tạo một dataset mới với số # quan sát và chưa có bất kỳ biến nào.
dùng lệnh tạo biến generate.
Tạo mới: gõ edit tại dòng lệnh (ctrl + 7) hoặc Window data editor. Cú
pháp: edit [varlist] [if] [in] [, nolabel]
• Mở dataset:
– Mở một data hệ thống: sysuse Ten_data_hethong
– File đã có sẵn (File Open) hoặc dùng lệnh (use, clear)
– Sử dụng dataset trên mạng: webuse
• Lưu dataset với save và saveold (dùng cho các version 8,9)
save [filename] [, save_options]
Để biế
t được loại file dữ liệu định dạng theo cách nào
gõ type “tên_file”
Ví dụ:
type “đường_dẫn_fem.dat” Xem dữ liệu theo định dạng loại gì
insheet using "E:\ebook\stata\Lecture\Data example\Handbook of
Stata\fem.dat“, tab
Từ menu: File Import ASCII data created by a
sheet
Quản lý số liệu trong Stata
odbc
Bây giờ, khi đã định nghĩa một tên nhãn giá trị
(yesno), chúng ta phải gán cho một biến nào đó?
(q1)
Vào Data Labels Label Values Assign value
label to variable
Quản lý số liệu trong Stata (tiếp)
Biến( giao diện dòng lệnh)
Chúng ta muốn tính toán, hiển thị kết quả như một máy
tính: display
Các hàm toán học: mod(x,y), sign(x), max(x1,x2, …
x3)
Ví dụ: Muố n lấy phần dư của 5 chia cho 2
display mod(5,2) kết quả bằng 1
Kết hợp lệnh gen với các hàm toán học
ví dụ: gen phandu = mod(5,2)
Quản lý số liệu trong Stata (tiếp)
Hàm toán học và Toán tử
Toán tử Ý nghĩa
== So sánh bằng
!= (~=) So sánh không bằng
> Lớn hơn
< Nhỏ hơn
>= Lớn hơn hoặc bằng
<= Nhỏ hơn hoặc bằng
& And
| Or
!(~) not
Quản lý số liệu trong Stata (tiếp)
if và in
Chúng ta cầ
n mã hóa lại biến. Ví dụ biế
n q1 được gán
với nhãn giá trị là yesno (recode).
recode q1 (1=0) (2=1)
Tương với lệnh replace kế t hợp với if
replace q1=0 if q1==1
replace q1 = 1 if q1 == 2
Chúng ta muố n tạo ra một biế n mới new và nhãn giá
trị new_q1.
recode q1 (1=0 “yes”) (2=1 “no”), pre(new)
label(new_q1)
Quản lý số liệu trong Stata (tiếp)
Mã hóa lại biến
Cú pháp:
append using filename [, options]
options:
keep(varlist) Chúng ta có thể chỉ nối một sốbiến cụ thể từ sốliệu
using được xác định trong varlist, nếu không có xác định keep thì mặc
định là tấ
t cả các biến sẽ được nối.
Sử dụng 2 sốliệu even.dta và odd.dta
use Đường_dẫn_đến sốliệu odd.dta
append using Đường_dẫn_đến_số_liệu even.dta
list Hiển thị kết quả sau khi nối.
Quản lý số liệu trong Stata (tiếp)
Nối số liệu
Trong stata còn cho phép hiển thị dữ liệu của một ô
cụ thể trong dữ liệu.
Biế n hệ thống _n còn có ứng dụng trong dữ liệu
dạng series. Nế u chúng ta có dữ liệu hàng ngày về
giá của một cổ phiếu cụ thể trên thị trường chứng
khoán với tên biế n là open. Như vậy, chúng ta
muố n tính giao động giá của ngày hôm sau so với
hôm trước:
sysuse sp500
gen difopen = open – open[_n-1]
Bài tập
Nếu bạn muốn tính thống kê với giá trị missing của biến điều kiện (q34) thì ta
chỉ cần gõ thêm lựa chọn missing như sau
tabstat m4ac11, sta(mean sd median variance n) by ( m4ac10b) missing
Chúng ta có thể định dạng lại số liệu bằng lựa chọn format
tabstat m4ac11, sta(mean sd median variance n) by ( m4ac10b) format(%9.1f)
Xử lý các giá trị missing và ví dụ
sum price if rep78>3 & rep78 <. Kết quả bảng 1.2
Bảng 1.1
Variable Obs Mean Std. Dev. Min Max
price 34 6073 2315.435 3748 12990