You are on page 1of 49

STATA хэрэглээний програм:

Үндсэн ойлголт, Өгөгдлийг


боловсруулах нь
Д.Амаржаргал
МУИС, ШУС, Эдийн засгийн
тэнхимийн Ахлах багш,
Магистр
НЭГдүгээр хэсэг
Үндсэн Ойлголт
Үндсэн цэс

Командын
бичлэгийн Хувьсагчдийн цонх
түүх

Үр дүнгийн цонх

Хувьсагчдийн
мэдээллийн
цонх

Файлын
Командын мөр
байрлал
Stata програм хувилбар
• about Ашиглаж буй хувилбарыг харуулна
• Stata Гарчгийн мөрөнд Stata нэрийн ард
харагддаг
• SE Special Edition IC- ээсээ ихээхэн санах ой бүхий
• MP* Paralel Edition илүү олон тооны хувьсагч,
ажиглалтын утга, командын өргөн
• IC
• Small Stata 1200 ажиглалтын утга, 99 хувьсагчаар хязгаарлагдана.
Эхлэн суралцагчид, оюутнуудад зориулагдсан

• 13.0
• 14.2
Зарим Stata файлууд Ажиллах зарчим
*.scml *.log Програмд уншуулсан үр дүнгүүд.
“Лог” файл: Results цонхонд гарч буй үр дүнг • Menu буюу цэс ашиглан
хадгалсан файл. ажиллах: Цаг их авна,
командыг шууд санахгүй
*.do Командуудаас бүрдсэн текст бөгөөд үед формат, бүтцийг
“Дү” файл : шууд өгөгдлийн файл дээр харах боломжтой.
уншуулдаг. • Командын мөр ашиглан
*.ado автоматаар ачаалсан “дү” файл ажиллах
• “Дү” файл уншуулж
*.dta Өгөгдөл болон хувьсагчид, ажиллах
“Дата” файл: хувьсагчдын тайлбарыг хадгалсан
файл • Өөрт хэрэгцээтэй
Програм
*.gph График файл бичих/хөгжүүлэх, бусдын
*.grec График файлын эдитор дэхь хөгжүүлсэнийг ашиглах
бичлэг файл
Файлын нэр
Курсорын байрлал
Stata файл шинээр үүсгэх Нүдэн дэх утга
• Stata дээр файлаа үүсгэх
• Эксел дээрээс импортлох
Хувьсагчийн харагдах байдал
• Улаан нь String/текст хэлбэртэй
• Хар нь Numeric/тоо хэлбэртэй:
• Float Тасралтгүй утгууд,
• Double таслалаас хойш олон
оронгийн нарийвчлалтай

• Long Бүхэл, тасралттай


• Integer буюу дискрет утгууд
• Byte
• Хөх нь Label: “1” Эрэгтэй “2” Эмэгтэй
Хэрэглэгчийн интерфэйс: Хэрэгслийн мөр

• Өгөгдлийн файлыг нээх


• Өгөгдлийн файлыг санах ойд хадгалах
• Цонхны жагсаалтаас сонгож, хэвлэх
• Шинээр лог файлыг нээх, хаах, үргэлжлүүлэх
• Viewer цонхыг нээх, бусад цонхнуудын хамгийн урд харуулна
• Графикийн цонхыг бусад цонхнуудын урд байрлуулна
• “Дү” файл эдитор/editor-ыг нээх
Хэрэглэгчийн интерфэйс: Хэрэгслийн мөр

• Data editor(Edit) нээх


• Data editor(Browse) нээх
• Variable Manager/Хувьсагчдыг зохион байгуулах
• Дэлгэцэнд багтахгүй үед үр дүнг үргэлжлүүлэх
• Цааш харах шаардлагагүй бол үр дүнг дундаас тасалж зогсоох
Зарим товчууд
PgUp Програмд уншуулсан
командуудыг нэг нэгээр
урагшлуулж командын
мөрөнд дуудна.
PgDn Командуудыг нэг нэгээр
арагшлуулж командын
мөрөнд дуудна.
Esc Командын мөрийг
цэвэрлэнэ.
#review команд нь Сүүлийн 5 командыг Үр
дүнгийн цонхонд харуулна
Tab Хувьсагчийн эхний цөөн
үсгийн араас дарахад нэр
бүтэн гарна
Q Үр дүнгийн цонхонд цааш үргэлжлүүлэх
харах шаардлагагүй бол гарах товчийг дарна
Review цонхон дахь нийтлэг үйлдлүүд
• Filter Товч дарахад гарч ирэх зурваст хайх
командаа бичих
• Do Selected сонгосон ком-ыг командын
мөрөнд дуудаж гүйцэтгэх
• Send to Dofile Editor Шинээр “Дү” файлын
эдитор цонхонд хуулна
• Save All... Бүх командыг хуул-
сан “Дү” файл шинээр хадга-
лах Харилцах Цонх гарч ирэх
• Font... Энэ цонхон дахь фонт
тохиргоог хийх
• Шураг - Хайлтын тохиргоо
Variables цонхон дахь нийтлэг үйлдлүүд
• Filter Товч дарахад гарч ирэх зурваст хайх
хувьсагчийн нэрийг бичих
• Хувьсагчийн нэрэн дээр 2 дарахад командын
мөрөнд хуулагдах эсвэл зүүн талын баганаас
хулганы тусламжтай чирэх
• Баганы гарчиг дээр дарахад Цагаан толгойн
өсөх, буурах дарааллаар эрэмбэлж харуулах,
Дахин дарахад анхны дарааллаар харуулах
• Keep Only Selected Variables Зөвхөн
сонгосон хувьсагчдыг үлдээх
• Font... Энэ цонхон дахь фонт
тохиргоог хийх
• Шураг - Хайлтын тохиргоо
Stata командын бүтэц, дэс дараалал
команд [хувьсагчид] [нөхцөл] [өгөгдлийн хүрээ] [жин] [, сонголт]

• Хэрэв хувьсагчид нэр бичихгүй бол бүх хувьсагчийг гэж


ойлгоно
• Алгебр илэрхийллийг “=“ ийн араас, хэрэв нөхцлийг “if”ийн
араас бичнэ
• Өгөгдлийн хүрээг “in ../..” гэж бичнэ
• Шинжилгээнд жингийн тооцоолол хэрэгтэй үед ашиглана
• Командыг гүйцэтгэхэд шаардлагатай нэмэлт сонголт
Stata командын бүтэц, дэс дараалал
Stata командын бүтэц, дэс дараалал
Stata командын бүтэц, дэс дараалал
summarize [хувьсагчид] [хэрэв] [өгөгдлийн хүрээ] [, сонголт]
• Энэ команд дундаж, стандарт хазайлт гэх мэт статистикүүдыг
харуулна.
• Сонголт Тодорхойлолт
detail нэмэлт статистикүүдийг харуулна
meanonly зөвхөн дунджийг тооцох ч зөвхөн санах ойд
хадгална
format форматын дагуу хувьсагчийн статистикийг
харуулна
separator(#) тусгаарлах шугамыг # бүхий хувьсагчийн доор
гаргана, зааж өгөхгүй бол эхний 5 хувьсагчийг
тусгаарлах шугамтай гаргана
Stata командын бүтэц, дэс дараалал
• Зарим командын хувьд сонголт байдаггүй. Ж нь: устгах команд
drop [хувьсагчид]
by varlist:
• Өгөгдлийн дэд олонлог бүрт нэг ижил командыг дахин давтан
гүйцэтгэх
• Командыг өгөхөөс өмнө өгөгдлийн багцыг varlist бүхий
хувьсагчдаар сортлосон/эрэмбэлсэн байх ёстой
• Хувьсагч нь Numeric, String аль нь ч байж болно
• Эсвэл if нөхцөл өгч болно
• Stata 13 болон түүнээс хойшхи хувилбарт Монгол фонтыг дэмждэг
Stata командын бүтэц, дэс дараалал
Stata командын бүтэц, дэс дараалал
Stata командын бүтэц, дэс дараалал
• Weight: ажиглалтын утга бүрт дагалдах жинг илэрхийлнэ.
• Командын ард дөрвөлжин хаалтанд [] бичиж өгдөг
• Команд бүрт жингийн төрөл бүрийг бас дэмждэггүй
• Stata 4 төрлийн жинг дараах байдлаар ойлгодог:
• fweight Энэ бол давталтын жин буюу ижил утга хэд давтагдаж байгааг
заана
• pweight энэ бол түүврийн жин, түүвэрлэлтийн онолоор ажиглалтын утга
түүвэрт сонгогдох магадлалын урвуу хэмжигдэхүүн, тухайлбал 100 гэвэл
эх олонлог дахь 100 ажиглалтын утгыг төлөөлж байгаа гэсэн үг
• aweight энэ бол аналитик жин буюу дундажыг агуулсан өгөгдөл дээр
шинжилгээ хийх үед хэрэглэгддэг
• iweight энэ бол тодорхой тооцоолол хийхээр програм хөгжүүлэхэд
хэрэглэгддэг
Stata командын бүтэц, дэс дараалал
• Stata програмд хувьсагчдыг нэрлэхдээ үсэг, цифр, доогуур зураас
ашигладаг
• Том жижиг үсгийг ялгаатай уншдаг: myvar, Myvar,MYVAR нь
ялгаатай нэрс
Хувьсагчийн тайлбар, код
• label define “лэбэл нэр” #код “текст” #код “текст”
• label define gndr 1 “эрэгтэй” 2 ”эмэгтэй”

Лэбэлийг тодорхойлсны дараа хувьсагчтайгаа холбож харгалзуулна


• label values “хувьсагч” “лэбэл нэр”
• label values gender gndr

“хувьсагч” болон “лэбэл нэр” ижилхэн байж болно


Хувьсагчийн тайлбар, код
• Var4 нь string хэлбэртэй харагдаж байна.
• Тэгвэл УБ, Дархан, Орхон аймгууд буюу байршлаар
оюутнуудын нас(var1) ялгаатай эсэхийг Нэг хүчин
зүйлийн дисперсийн шинжилгээ хийж харъя гэвэл
var4 заавал тоон хувьсагч байх ёстой
• Ө/х 1- Дархан, 2-Орхон, 3- УБ гэж кодлох ёстой.
Үүнийг encode командаар хийнэ

• decode командаар numeric төрлийн
хувьсагчийг string төрлийн шинэ
хувьсагч болгон нэмдэг.
Өгөгдлийг гараас оруулах
• edit командаар “Data Editor/Өгөгдлийн самбар” нээгдэнэ.
• Самбарын нүдэнд шууд гараас өгөгдлийг оруулна. Энэ нь оновчтой биш, учир нь
өгөгдлийг оруулах болгонд хувьсагчийн санах ой дахь тохиргоо өөрчлөгдөж болно.
• Тиймээс input команд ашигладаг.
• input [varlist] [, automatic label]
• a нь хувьсагчийн дэлгэцэнд харуулах уртын хэмжээг гараас оруулж буй өгөгдөлд
тохируулан автоматаар өөрчлөхөөс гадна nonnumeric төрлийн хувьсагчид label өгч
хадгалдаг.
• l нь өмнө тодорхойлж өгсөн “лэбэл” буюу хувьсагчид харгалзах кодыг шууд нэмдэг.
• “лэбэл” буюу харгалзах кодыг уншуулснаар дараа дараагийн шинжилгээнд Жнь:
Давталтын хүснэгт зэрэгт “лэбэл” дахин уншуулахгүйгээр шууд дэлгэцэнд гарна.
Өгөгдлийг гараас оруулах
• Хэрэв текстэн өгөгдөл бол уртыг зааж өгнө
input str20 name age str6 sex
• Stata хувьсагчдын нэр бүхий хүснэгтийн гарчгийг Үр дүнгийн
цонхонд харуулна
• input командын араас бичсэн дарааллаар өгөгдлийг хооронд нь
зай авч бичнэ, текстэн өгөгдөл нь зай болон тусгай тэмдэгт
агуулсан бол “”-д хийж бичнэ.
• Өгөгдлийг оруулж дууссан бол end команд өгч дуусгана.
• Өгөгдлийг зөв оруулсан эсэхийг list командаар харна.
Өгөгдлийг гараас оруулах
Өгөгдлийг гараас оруулах
Өгөгдлийг гараас оруулах
• Хэрэв numeric хувьсагчийн төрөл, уртыг зааж өгөхгүй бол float
төрлөөр санах ойд хадгалдаг.
• Float нь санах ойг ихээр гарзаддаг.
• Хэрэв бүхэл тасралттай [-32767; 32740] бол integer төрөл
тохиромжтой. Энэ үед float гэж хадгалахаас 2 дахин бага санах ой
эзэлнэ.
• Хэрэв бүхэл тасралттай [-127; 100] бол byte төрөл тохиромжтой.
Энэ үед integer гэж хадгалахаас 2 дахин бага санах ой эзэлнэ.
• input int(a b) c input a long b double(c d) e
• input int a b c input int(v1-v4)
Өгөгдлийг гараас оруулах
EXCEL файл импортлох
Бусад програм дээрх файл импортлох
• Stat/Transfer програм ашиглан олон төрлийн (Microsoft Access,
Excel, MATLAB, Minitab, SAS, SPSS, Statistica) програм дээр
бэлтгэсэн файлыг хөрвүүлж импортлоно.
• ODBC(Open Database Connectivity) эх үүсвэрээс сүлжээнд
байрласан өгөгдлийг импортлодог.
ХОЁРдугаар хэсэг
Өгөгдлийг зохион байгуулах нь
Data Management
Дата менежмент

• Хамгийн нийтлэг: use describe save codebook count list edit rename …
• Хувьсагч үүсгэх, устгах, хувьсагчид дээрх үйлдлүүд
• Өгөгдлийг экспортлох
• Хувьсагчид эсвэл ажиглалтын утгуудыг эрэмбэлэх
• Өгөгдлийг дахин зохион байгуулах эсвэл нэгтгэх
• Санамсаргүйгээр түүвэрлэх
• Файлыг эмхэлж цэгцлэх
Дата менежмент:
Хувьсагч үүсгэх, устгах, хувьсагчид дээрх үйлдлүүд

• clear санах ой дахь өгөгдөл, лэбэл зэргийг арчина: drop _all гэсэн команд мөн
ижил
• drop Хувьсагчид эсвэл өгөгдлийг устгана
• keep Төсөөтэй гэхдээ хувьсагч эсвэл өгөгдлийг хадгалж үлдэнэ
• egen функц fcn() ашиглан шинэ хувьсагч үүсгэнэ Жнь:
egen newv2=rowmin(v1 v2 v3)
• gen шинэ хувьсагч үүсгэх ба “=“ тэмдгийн араас агуулга буюу
шинээр үүсгэх эсвэл өөрчлөх утгыг илэрхийлж бичнэ Жнь:
gen int age2=age^2 if age>30
• separate Хувьсагчын хүлээн авч буй утгуудаас бүрдсэн шинэ хувьсагч үүсгэнэ
• split Текстэн хувьсагчийн агуулгыг хэсгүүдэд хуваана
• varmanage хувьсагчдын лэбэл, формат, болон бусад тохиргоог удирдана
Дата менежмент: Өгөгдлийг экспортлох
• export excel .xls болон .xlsx файлыг үүсгэнэ Экселийн sheet,
эсвэл сонгогдсон нүднүүдийн хүрээг ашиглаж
болно
• export delimited таслал эсвэл хоосон зайгаар тусгаарлагдсан
файлуудыг үүсгэнэ
• putexcel Stata дээрх үр дүнг Эксэл файл рүү экспортлоно
Дата менежмент:
Хувьсагчид эсвэл ажиглалтын утгуудыг эрэмбэлэх
• order Хувьсагчдыг дахин дараалалд оруулна, [, сонголт] хэсэгт
last before(v4) after(v2) г.м ээр дараалуулж байршуулна
мөн [, сонголт] хэсэгт alphabetic гэж өгвөл зааж өгсөн
хувьсагчдыг үсгийн дарааллаар эрэмбэлснийг бусад
хувьсагчдын эхэнд шилжүүлнэ
• sort ажиглалтын утгуудыг эрэмбэлнэ Ингэхдээ зааж өгсөн
хувьсагчдын хүлээн авч буй утгуудыг өсөх дарааллаар
эрэмбэлнэ [, сонголт] хэсэгт stable гэж өгвөл ижил утгууд
бүхий ажиглалтуудыг өмнө нь байсан дарааллаар нь
үлдээнэ
Дата менежмент: Өгөгдлийг дахин зохион байгуулах
Файлуудыг нэгтгэх 2 арга байдаг:
• Ижил хувьсагч бүхий файлд ажиглалтын утгуудыг нэмж нэгтгэх
• Энэ нь өмнө нь хадгалагдчихсан байгаа файл дахь өгөгдлийг одоо
програмд нээгдсэн файлын ажиглалтын утгуудын араас нэмж нэгтгэнэ.
• Файлууд нэг ижил хавтсанд байх ёстой
• Ижил өгөгдөл бүхий хувьсагчдын нэр нь ижил байх ёстой
• МУ-ын хангай, төвийн бүсийн ижил мэдээлэл бүхий файл дээр УБ, баруун,
зүүн бүсийн ижил мэдээлэл бүхий файлыг нэгтгэж болно.
• Хэрэв файлуудад ижил нэртэй хувьсагч байхгүй бол “missing value”(.)
үүсдэг.
• Ижил обьектууд дээр хэмжилт хийсэн шинэ хувьсагчдийг нэмж
нэгтгэх
Дата менежмент: Өгөгдлийг дахин зохион байгуулах
• append using “файлын нэр” [файлын нэр] [, сонголт]
[сонголт]
generate(шинэ хувьсагч) нэмэгдсэн ажиглалтын утгуудын эх
үүсвэрийг агуулсан шинэ хувьсагч үүснэ
keep(хувьсагч нэр) ажиглалтын утгууд шинээр нэмэгдэж байгаа
файлаас хаалтанд нэрлэсэн хувьсагчдын
хувьд л өгөгдөл шинээр нэмэгдэнэ.
nolabel ажиглалтын утгууд шинээр нэмэгдэж байгаа
файлаас хувьсагчийн тайлбар код буюу
“лэбэл”-ийг хуулж авахгүй
Дата менежмент: Өгөгдлийг дахин зохион байгуулах
Файлуудыг нэгтгэх 2 арга байдаг:
• Ижил хувьсагч бүхий файлд ажиглалтын утгуудыг нэмж нэгтгэх
• Ижил обьектууд дээр хэмжилт хийсэн шинэ хувьсагчдийг нэмж
нэгтгэх
• хоёр файл ядаж нэг ижил(түлхүүр) хувьсагч агуулсан байх ёстой. Учир нь
match буюу зөв ажиглалтын утгад харгалзан шинэ хувьсагч нэмж
нэгтгэгдэнэ. Хэрэв обьект нь хүмүүс бол ID гэсэн хувьсагч нь ижил байна.
Хэрэв обьект нь сургуулиуд бол Сургууль ID болно.
• Өгөгдсөн түлхүүр хувьсагчаар 1:1, m:1, 1:m, m:m харьцаагаар нэгтгэж
болно.
Дата менежмент: Өгөгдлийг дахин зохион байгуулах
• merge 1:1 “түлхүүр хувьсагчийн нэр” using “файлын нэр” [, сонголт]
[сонголт]
generate(шинэ хувьсагч) нэгтгэсэн үр дүнг тэмдэглэж харуулах
шинэ хувьсагч үүснэ
keepusing(хувьсагч нэрс) нэмж нэгтгэгдэж байгаа файлаас
хаалтанд нэрлэсэн хувьсагчид л шинээр
нэмэгдэнэ.
nolabel шинээр хувьсагч нэмэгдэж байгаа файлаас
хувьсагчийн тайлбар код буюу “лэбэл”-ийг
хуулж авахгүй
Дата менежмент: Санамсаргүйгээр түүвэрлэх
• sample санах ой дахь өгөгдлөөс санамсаргүй түүвэр хийдэг. Команд
өгснөөр зөвхөн түүвэрт багтсан ажиглалтууд үлддэг. Энд буцаалтгүй
түүвэрлэлт хийнэ
• Түүвэрлэлт хийх хувийг эсвэл тоог зааж өгнө, тоог зааж өгөх бол
[,сонголт] хэсэгт count гэж бичнэ
• Страта бүрээс түүвэрлэх бол [, сонголт] хэсэгт by(“групп хувьсагчид”)
ийг бичиж өгнө, count гэж өгөөгүй бол страта бүрээс зааж өгсөн хувийг
түүвэрлэнэ
Дата менежмент: Файлыг цэгцлэх
• Copy команд нь файлыг хуулдаг.
• Copy “Файлын нэр1” “Файлын нэр2” [, сонголт]
• “файлын нэр1” нь файл эсвэл линк байж болно
• “файлын нэр2” нь файл эсвэл директор байж болно
• [, сонголт]
public “файлын нэр2” ийг нээлттэй үүсгэнэ
replace “файлын нэр2” хуучныг устгаад дахин үүсгэнэ
text “файлын нэр1” ийг текст файл гэж үзэж текстэн
форматад хувиргана
• copy orig.dta newcopy.dta
• Copy http://www.stata.com/examples/simple.dta simple.dta
Дата менежмент: Файлыг цэгцлэх
• cd “директор нэр” эсвэл cd “драйв: директор_нэр”
• одоогийн ажиллаж буй директорыг командад зааж буй драйв болон директор
руу өөрчлөнө.
• Stata дээр ажиллах явцад одоогийн ажиллаж байгаагаас өөр файл нээж
ажиллах үед шинээр нээх файл байрлаж байгаа директор руу аваачна.

• cd .. Директорын бүтцийг нэг түвшин ахиулдаг


• cd … эсвэл cd ..\.. Директорын бүтцийг үргэлжлүүлэн нэг түвшин
ахиулдаг
• pwd Oдоогийн ажиллаж буй директорыг харуулна
• dir одоогийн ажиллаж буй директор дээрх бүх төрлийн
бүх файлын нэрсийг харуулна
• dir *.dta одоогийн ажиллаж буй директор дээрх өгөгдлийн
Stata файлын нэрсийг харуулна
• dir C:\*.dta
Дата менежмент: Файлыг цэгцлэх
• mkdir команд нь одоогийн ажиллаж буй директорт
шинэ директор/фолдер үүсгэнэ
• mkdir c:\директор_нэр
• mkdir c:\директор_нэр\фолдер_нэр
• [, сонголт]
[, public] дээрх командуудад зааж буй драйв болон директорыг
нээлттэй хэлбэрээр үүсгэнэ
• rmdir команд нь хоосон байгаа директор/фолдерыг устгана
• rmdir c:\директор_нэр
• rmdir c:\директор_нэр\фолдер_нэр

• erase хадгалагдсан байгаа файлыг нэгмөсөн устгана, Recycle Bin д


зөөхгүй
• erase amar.scml
• erase amar.dta
• erase amar.xlsx
Дата менежмент: Файлыг цэгцлэх
• type команд нь файлын доторх агуулгыг харуулна:
хувьсагчдын нэр, лэбэл г.м
• zipfile, unzipfile Зааж өгсөн директор болон файлуудыг шахаж WinZip зэрэг
програмтай нийцэх хэлбэрт оруулна
• cf хоёр өгөгдлийн багцыг харьцуулдаг. Одоо ажиллаж
байгаа файлын зааж өгсөн хувьсагчдыг өмнө хадгалсан
байгаа өөр файл дээрх ижил нэртэй хувьсагчидтай
харьцуулж, ялгаатай зүйлсийг мэдээлнэ
• checksum зааж өгсөн нэр бүхий *.sum файлыг Stata үүсгэх ба
цаашид сүлжээгээр нээгдэх файл вирустсан байхад
илрүүлж чадахгүй байхаас сэргийлдэг.
• set checksum on сүлжээнээс татаж ажилласан файлууд ямар нэг алдаагүй
эсэхийг шалгах тохиргоог өгч байна
• erase хадгалагдсан файлыг устгана, байршлыг зааж өгнө
Анхаарал тавьсанд баярлалаа

You might also like