Professional Documents
Culture Documents
통계분석 소프트웨어
1
1. 서론
2. REx 란?
3. REx 그래픽스
4. REx 시계열분석
2
1. 서론
2. REx 란?
3. REx 그래픽스
4. REx 시계열분석
3
Statistical Software (SAS & R)
Features STATA SPSS SAS R
Learning curve Steep/gradual Gradual/flat Pretty steep Pretty steep
Use interface Programming/ Mostly point- Programming Programming
point-and-click and-click
Data Very strong Moderate Very strong Very strong
manipulation
Data analysis Powerful Powerful Powerful / Powerful /
versatile versatile
Graphics Very Good Very Good Good Excellent
Cost Affordable Expensive(but Expensive Open source
(perpetual not need to (yearly
licenses, renew until renewal)
renew only upgrade, long
when upgrade) term licenses)
4
Why R?
R vs SAS or SPSS
2-3 년?
0-1 년?
6
R의 한계 및 전망
R의 한계?
R의 최대 수혜자는 통계/전산 전공자
생물, 의학 등 비전공자는?
0-1 년?
?
7
RExcel
RExcel: R과 엑셀의 결합한 첫 번째 소프트웨어
MS word 2010, 2013 버전 지원
8
RExcel
RExcel의 장점
엑셀을 활용하여 쉽게 통계 분석이 가능함.
RExcel의 단점
설치가 매우 어려움
메뉴의 구성이 직관적이지 않음
유료
9
1. 서론
2. REx 란?
3. REx 그래픽스
4. REx 시계열분석
10
REx 란?
http://healthstat.snu.ac.kr/rex/
12
REx 개발
Microsoft Visual Studio 2015
Microsoft Visual Basic .NET
Microsoft Visual Studio Tools for Office
13
REx 설치하기
System requirement
Windows 기반의 운영체제
(32bit & 64bit, Windows 7 이상)
Microsoft Office 2013 이상
R 3.3.0 이상
14
REx 설치하기
Required R packages
직접적으로 필요한 패키지 (51): markdown, ggplot2, ggExtra, moments, AER, AICcmodavg, FactoMineR, devtools,
factoextra, MASS, survival, R2HTML, VIM, randomForest, psy, psych, cluster, fpc, R2HTML, car, GPArotation, dbscan, KMsurv, e1071, tree,
party, rpart, caret, partykit, party, philentropy, ade4, klaR, MASS, lme4, VGAM, car, AICcmodavg, rms, caret, pscl, ResourceSelection, MKmisc,
lmtest, VGAM, vcd, oii, coin, vcdExtra, plsdepot, ggfortify
의존하는 패키지 (85): mime, digest, gtable, plyr, reshape2, scales, tibble, lazyeval, colourpicker, miniUI, shiny, shinyjs, car,
lmtest, sandwich, zoo, Formula, nlme, unmarked, VGAM, xtable, cluster, ellipse, flashClust, leaps, scatterplot3d, httr, memoise, whisker,
rstudioapi, jsonlite, git2r, withr, abind, dendextend, ggpubr, ggrepel, tidyr, colorspace, data.table, robustbase, sp, vcd, nnet, e1071, Rcpp,
laeken, mnormt, foreign, mclust, flexmix, prabclus, class, diptest, mvtnorm, kernlab, trimcluster, mgcv, pbkrtest, quantreg, modeltools,
strucchange, coin, foreach, ModelMetrics, recipes, dplyr, KernSmooth, combinat, minqa, nloptr, Hmisc, SparseM, polspline, multcomp,
htmlTable, htmltools, pbapply, RColorBrewer, rapportools, gmodels, Deducer, gnm, ca, gridExtra
의존하는 패키지가 의존하는 패키지 (67): Rcpp, stringr, RColorBrewer, dichromat, munsell, labeling, R6,
viridisLite, rlang, htmltools, htmlwidgets, jsonlite, miniUI, shiny, shinyjs, httpuv, xtable, sourcetools, zoo, reshape, raster, curl, openssl, magrittr,
viridis, ggrepel, ggsci, tidyr, purrr, dplyr, cowplot, ggsignif, gridExtra, glue, stringi, tidyselect, DEoptimR, boot, modeltools, SparseM,
MatrixModels, codetools, iterators, ipred, dimRed, lubridate, timeDate, ddalpha, gower, RcppRoll, assertthat, bindrcpp, pkgconfig, latticeExtra,
acepack, htmlTable, base64enc, TH.data, knitr, checkmate, pander, gdata, JGR, rJava, effects, qvcalc, relimp
15
REx 설치하기
설치 순서
R 설치하기
R 패키지 설치하기
REx 설치하기
16
REx 활성화
REx 시작하기 전에!
REx 활성화 하기
17
REx 실행하기
REx 메뉴 구성
그래픽스
분포함수
통계분석
18
REx 데이터 준비하기
데이터의 구성
19
REx 데이터 준비하기
데이터의 구성
20
REx 데이터 준비하기
데이터의 구성
21
1. 서론
2. REx 란?
3. REx 그래픽스
4. REx 시계열분석
22
REx 그래픽스 구현
ggplot2 + extension packages
ggextra (scatter plot의 marginal 영역)
GGally (scatter matrix)
ggfortify (확률분포 및 diagnostic plot 등)
ggplot2의 문법을 활용
ggplot(data, aes(…), …) + …
경우에 따라 excel에서 읽은 data를 함수 내에서
수정/변환하여 적절한 plot을 구현
23
REx 그래픽스 메뉴
25
REx 그래픽스 예제
산점도 그리기
①
②
26
REx 그래픽스 예제
산점도 그리기
①
27
REx 그래픽스 예제
①
⑤
②
③
⑥
④ ⑦
⑧
28
REx 그래픽스 예제
마우스오른쪽클릭 가능
29
1. 서론
2. REx 란?
3. REx 그래픽스
4. REx 시계열분석
30
REx 통계 분석 메뉴
분석메뉴
기술 범주형 차원 시계열
그룹 비교 회귀분석 상관분석 분류 분석 생존분석
통계 자료 분석 축소 분석
데이터 선형회귀 이변량 분할표 K-평균 시계열
일표본 T 검정 요인분석 생명표
요약 분석 상관 분석 군집 자료 탐색
독립표본 T 가중선형 로그선형 대응일치
편상관 계층적 군집 지수평활법 Kaplan-Meier
검정 회귀분석 분석 비지도 분석
평균 대응표본 T 학습 주성분 Cox
편최소제곱 거리측도 DBSCAN ARIMA모형
비교 검정 분석 비례위험모형
일원배치 이분형 GARCH
PAM 군집
분산분석 로지스틱 모형
다변량 다항 의사결정
분산분석 로지스틱 나무
일표본 포아송
판별분석
비율 비율검정 회귀분석 지도
비교 이표본 2-단계 학습 K최근접
비율검정 최소제곱 이웃기법
분산 반복측정
등분산검정 SVM
비교 회귀분석
다변량
회귀분석
31
REx 시계열분석 메뉴
시계열자료 탐색
지수평활법
ARIMA 모형
GARCH 모형
32
REx 시계열분석 메뉴 – 시계열자료 탐색
시계열자료 탐색
시계열 모형화 이전에 자료를 탐색하는 절차
예(다양한 시계열 Plots):
시계열 도표, ACF, PACF, 계절별 도표, 지연 시차 도표 등
예(각종 검정):
Box-Cox 변환, 백색잡음 검정, 단위근 검정 등
주요 함수 구현: “forecast” package 사용
33
REx 시계열분석 메뉴 – 시계열자료 탐색
[시계열자료 탐색] 대화상자 구성
34
REx 시계열분석 메뉴 – 시계열자료 탐색
[시계열자료 탐색] 실행 결과 예
35
REx 시계열분석 메뉴 – 지수평활법
지수평활법(Exponential Smoothing Method)
단변량 시계열을 수준(level), 추세(trend), 계절(seasonality)
성분의 조합으로 모형화 및 예측
주요 모형:
단순, 이중 지수평활법(single or double ESM)
Holt-Winters 계절 지수평활법 등
주요 제공 옵션:
모수 자동 추정
분해 도표 및 각종 도표 출력, 예측 신뢰구간 제공
주요 함수 구현: “forecast” package 사용
36
REx 시계열분석 메뉴 – 지수평활법
[지수평활법] 대화상자 구성
37
REx 시계열분석 메뉴 – 지수평활법
[지수평활법] 실행 결과 예
38
REx 시계열분석 메뉴 – ARIMA 모형
ARIMA 모형
자기회귀 누적 이동평균(autoregressive integrated moving-
average) 모형
단변량 시계열을 ARIMA(p,d,q)(P,D,Q)s로 모형화 및 예측
주요 제공 옵션:
독립변수(외생변수) 도입 가능
ARIMA 차수 자동 선택
잔차진단 도표 제공
주요 함수 구현: “forecast” package 사용
39
REx 시계열분석 메뉴 – ARIMA 모형
[ARIMA 모형] 대화상자 구성
40
REx 시계열분석 메뉴 – ARIMA 모형
[ARIMA 모형] 실행 결과 예
41
REx 시계열분석 메뉴 – GARCH 모형
GARCH 모형
일반화 자기회귀 조건부 이분산 모형(generalized
autoregressive conditional heteroscedastic model)
단변량 시계열의 조건부 이분산을 모형화 및 예측
주요 모형:
standard GARCH, integrated GARCH,
exponential GARCH, GJR GARCH, Threshold GARCH 등
주요 제공 옵션:
다양한 오차 분포 결합 가능: normal, t, GED 등
조건부 평균을 위한 ARMA 모형 및 분수 차분 도입 가능
독립변수(외생변수) 도입 가능
조건부 이분산의 예측도표 제공
주요 함수 구현: “rugarch” package 사용 42
REx 시계열분석 메뉴 – GARCH 모형
[GARCH 모형] 대화상자 구성
43
REx 시계열분석 메뉴 – GARCH 모형
[GARCH 모형] 실행 결과 예
44
REx 향후 일정 (계획)
2017.12.01: v1.0 배포
2019.01.01: v2.0 배포
메타 분석 모듈
유전체/전사체 데이터 분석 모듈
벌점화 회귀분석 모듈
Causal Inference
45
REx 개발팀
서울대학교
보건통계 연구실 I (김호교수)
보건통계/생물정보 연구실 II (원성호교수)
김원지
안재훈
중앙대학교 응용통계학과
시계열 연구실 (성병찬교수)
46
Questions??
47