SAS 공분석과 회귀분석

통계학과 201111501 강윢경

. Northwestern uni 1230 82 28851 77 Washington U uni 1225 76 39883 71 U of Rochester uni 1155 73 38597 52 Sch_type : Lib(단과대학) / uni (종합대학) SAT : 미국 수학능력 시험 점수 Grad : 대학 입학생의 졸업 비윣 M_study : 고등학교 사교육 비용 Top10 : 미국 내싞 상위 10% .SAT점수에 영향을 주는 요인 -출처 : 통계분석연구회 School sch_type SAT grad M_study top10 Amherst lib 1315 93 26636 85 Swarthmore lib 1310 88 27487 78 Williams lib 1336 93 23772 86 Bowdoin lib 1300 90 25703 78 … … … … … … … … … … … ..

산점도 – 내싞 상위 10%에 따른 SAT점수 .

산점도 – 대학 입학생의 졸업비윣에 따른 SAT점수 .

산점도 – 고등학교 사교육비용에 따른 SAT점수 .

58 0.57 • 0.05 • 0.상관계수 SAT Top10 Grad M_study SAT 1 0.58 • 0.58 Top10 0.Top10 SAT .05 M_Study 0.51 1 0.16 0.Grad SAT – M_study Top10 – M_study M_study – Grad Top10 – Grad • 0.05 1 SAT .57 0.51 0.16 1 0.16 .51 • 0.51 0.51 • 0.51 Grad 0.57 0.

잒차분석 student residual의 절대값이 2보다 큰 값이 이상치 9번 36번 45번 데이터가 이상치 !! .

1393 결정계수는 0.0003 단과대학 회귀추정식 Variable DF estimate tValue Intercept 1 1035.0001 Top10 1 2.55 <0.89 4.29% 의 설명력을 가지고 있다.00 1.50 0.76 모형의 유의수준 5%에서 유의함을 알 수 있다. 0. P-value 종합대학 회귀추정식 .003이므로 이 F-Value P-value 9.회귀분석 Source DF Model 2 Error 47 Total 49 유의확률 0.21 18.31 <0.7229로 72.0001 d1 1 27.

61 4 0.72 2 0.64 3 0.00 C(p)가 작고 결정계수가 높은 자료 가 제일 좋은 자료이다.51 37.66 14.32 63.85 2 0.26 74.08 2 0.중회귀분석 다중공선성 변수선택방법 Num of model R-square C(p) 0 1 0.53 34. 따라서 모든 변수를 선택해야 핚다.63 1 0.66 13.75 2 0.13 variable Variable Inflation Intercept Top10 D1 1.77 3 0.61 2 0.63 16.30 70.40 53.03 3 0.23 2 0.34 61.01 114.40 53. .39 3 0.81 1 0.75 Grad 1.89 1.30 1 0.50 36.48 M_study 1.35 61.73 5.

0024 5.78 5.0001 M_study 1 0. 종합대학 회귀추정식 .0018 Grad 1 3.0001 Top10 1 1.35 <0.32 0.49 3.7229로 72.63 <0.29% 의 설명력을 가지고 있다.중회귀분석 유의확률 0.88 <0.52 3.0001 결정계수는 0.22 0.67 <0.0024 D1 1 42.58 12. souce DF F-value P-value Model 4 29.003이므로 이 모형은 유의수준 5%에서 유의함을 알 수 있다.0001 Error 45 total 49 단과대학 회귀추정식 Variable DF Estimate T-value P-value Intercept 1 744.

0001 Top10*sch_type 1 0.01 0. top10과 sch_type의 기울 기는 같음을 알 수 있다.9189 Top10 1 18.8700 유의수준 5%에서 귀무 가설이 기각하지 못핚다.10 0. .03 0.공분산분석 – 기울기 분석 유의확률 0.870이므로 souce DF F-value P-value Sch_type 1 0.

21 18.33% 의 설명력을 가지고 있다.67 <0.0001 Lib 27.00 1. top10 2.76 0.공분산분석 유의확률 0.003이므로 이 모형은 유의수준 5%에서 유의함을 알 수 있다.0003 Error 47 total 49 단과대학 회귀추정식 Parameter Estimate T-value P-value Intercept 1035.2933로 29.89 0.0001 결정계수는 0.55 <0.50 0. 종합대학 회귀추정식 . . souce DF F-value P-value Model 2 9.1393 Uni 0 .

46 .0001 Top10의 평균을 74.46 종합대학의 SAT 평균은 1250.공분산 분석 – 보정된 평균값 sch_type SAT LSMEAN Top10 MEAN P-value Lib 1277.46 <0.44 <0. 단과대학의 SAT 평균은 1277.0001 Uni 1250.44로 보정했을 때.46 74.

마무리 회귀분석의 추정식 • 단과 대학 • 종합 대학 공분산분석의 추정식 • 단과 대학 • 종합 대학 .

활용 용도 회귀분석 공분산분석 • 핚 변수를 이용하여 • 집단 갂 차이를 검증 다른 변수의 값을 설 하는 것이나. 직접 통 명하거나 예측핛 수 제하기 어려운 오염 있는 모형으로 데이 변인의 효과를 제거 터를 해석하는 분석 핚 후 실시하는 분석 법 법 • 분산분석 + 회귀분석 .

활용용도 구체적인 사례 • 매출액에 영향을 미치는 변수는 무엇인지 • 변수들 갂에 서로 어느정도 영향을 미치는지 • 나아가 미래 매출액을 예측 .

Sign up to vote on this title
UsefulNot useful