You are on page 1of 4

4. 사건 A1과 사건 A2의 사전확률은       ,       이다. 그리고    ∩      이다.

경제통계분석 기말고사(2022.12.8)
       이고        라고 가정하자. (i) A1과 A2는 상호 배타적인가? (ii) 베이즈 정리
(Bayes' theorem)를 이용한      ,       각각에 대해 옳은 것은?
학과: 학번: 성명:        
(1) Yes,  ,  (2) Yes,  ,  (3) No,  ,  (4) No,  , 
       

I. 다음의 보기 중 5개를 선택하여 약술하라. (5문항x2점=10점)


5. 표본공간 S = {                    }이 있다. 여기에서                    는 표본점이며, 다음과
<보기> 같은 확률이 부여되어 있다.       ,       ,       ,       ,
교차제표(crosstabulation)와 심슨의 역설(Simpson's paradox), 체비셰프의 정리(Chebyshev's
      ,       ,       ,   E E E  ,   E E E  ,   E E E E 
theorem)와 경험법칙(empirical rule), 무작위표본(random
무 sample)과 중심 극한정리(central limit
theorem), 오차의 한계(margin of error)와 구간추정치(interval estimate), 유의수준(level of 이다. (i)    (ii)   ∪   (iii)    각각에 대해 옳은 것은?

significance)과 유의성 검정(significance tests), 상호 배타적 사건(mutually exclusive events)과 (1) 0.50, 0.25, 0.50 (2) 0.60, 0.65, 0.40 (3) 0.40, 0.65, 0.50 (4) 0.50, 0.65, 0.40

독립사건(independent events), 최소자승법원리(Least squares method principle)와 기본가정, t-


검정과 F-검정의 차이점, 다중공선성(multicollinearity)과 범주형 독립변수(qualitative independent 6.      ,      ,   ∩     인 사건 A와 B가 있다. (i)     (ii)    

variable) (iii) A와 B는 독립인가? 각각에 대해 옳은 것은?


       
(1)  ,  , No (2)  ,  , No (3)  ,  , Yes (4)  ,  , Yes
       
II. 다음의 물음에 답하라. (20문항×2점=40점, 풀이과정을 명기할 것)

7. 대학생의 평균 학점은 가중평균에 기초하여 계산된다. 대부분의 대학에서 학점은 다음과 같이 부여


1. 다음은 두 범주형 변수 x와 y를 포함하는 20개 관찰 값에 대한 교차제표이다. 범주 x는 A, B, C를
된다. A(4), B(3), C(2), D(1), F(0), 50시간의 수업을 들은 후 5시간에 A학점, 10시간에 B학점, 15
포함하고 범주 y는 1과 2를 가진다. x와 y의 관계식에 대한 다음의 서술 중 옳은 것은?
시간 C학점, 그리고 20시간에 D학점이 부여되었다. (i) 이 학생의 평균 학점 (ii) 대학원 진학하기 위
y 해서는 학부과정의 첫 50시간의 평균학점을 2.5로 유지하여야만 한다고 하면 이 학생은 대학원에
1 2 총계 진학할 수 있는가? 각각에 대하여 적합한 것은?
A 4 1 5
(1) 3.0, 진학할 수 있음 (2) 2.5, 진학할 수 있음 (3) 2.0, 진학할 수 없음 (4) 1.5, 진학할 수 없음
B 8 2 10
x
C 2 3 5
총계 14 6 20 8.              ⋯⋯  ∼     라고 할 때, 다음 서술 중 예측오차(f, forecast
error)를 가장 작게 하는 것은?
(a) y의 1값은 대부분 x의 B값에 연계되어 있다. (b) y의 2값은 대부분 x의 C값에 연계되어 있다.
   
(c) x의 C값은 y의 2에 대부분 연계되어 있다. (d) x의 B값은 y의 1에 대부분 연계되어 있다. [hint:      
                    ,  ∼          ]
(1) a, b, c (2) a, c, d (3) b, c, d (4) a, b, c, d
  
  
 
(1)     (2)    
 (3)    
 (4)   
   

2. 세금환급비용에 대한 20개 자료(x)가 다음과 같이 주어져 있다고 하자.


95 105 110 110 115 115 120 120 120 135 135 150 155 160 180 200 225 235 255 360 9. 100명의 단순무작위 표본으로부터 50개의“예”란 답을 얻었다.
 (a)“예”라고 대답한 모집단의 비율( ) (b) 에
 대한 표준오차 추정치(   ) (c) 90% 신뢰구간


 
   이다. 평균값, 중앙값(median), 최빈값(mode), 그리고 제3분위수에 각각 옳은 것은?
위의 물음에 대해 다음 중 옳은 것은? (hint:     혹은     이용)
(1) 160, 130, 115, 180 (2) 160, 135, 120, 190 (3) 160, 140, 135, 195 (4) 160, 140, 135, 170 (1) 1/2, 1/20, 1/2 ± 1.960 × (1/20) (2) 1/2, 1/19, 1/2 ± 1.960 × (1/10)
(3) 1/2, 1/20, 1/2 ± 1.645 × (1/20) (4) 1/2, 1/19, 1/2 ± 1.645 × (1/10)
3. 전국적인 조사를 한 결과 성인의 하루 평균 수면시간은 8시간이었다, 표준편차가 1시간이라고 가정
하자. (i) 체비세프의 정리(Chebyshev's theorem)를 이용하여 적어도 평균 수면시간이 6시간에서 10. 다음 가설검정을 살펴보자.       ,     ≠ 
10시간 사이에 있는 사람들의 비율을 구하고, (ii) 이 자료가 종형분포를 한다고 가정하고, 경험법칙 표본평균이 14.25인 100개의 표본을 대상으로 한다. 모집단의 표준편차는 3이다.
(empirical rule)을 사용하여 평균 수면시간이 6시간에서 10시간 사이에 있는 사람들의 비율을 (a) 검정통계량은? (b) p값은? (c)    에서 귀무가설 검정 결과
구하라. 다음 중 경험법칙과 체비세프의 정리에 의한 비율로 적합한 것은? 위의 물음에 대해 다음 중 옳은 것은? (hint:   ≦  =0.0227 혹은   ≦  =0.0062 이용)
(1) 95%, 75% (2) 75%, 99% (3) 75%, 95% (4) 99%, 75% (1) -2.0, 0.0227, 기각 (2) -2.5, 0.0062, 기각 (3) -2.0, 0.0454, 수용 (4) -2.5, 0.0124, 수용

- 1 - - 2 -
11. 자동차 타이어 마모상태를 조사하기 위한 일환으로 타이어의 공기압과 운행지역을 다르게 하여 타 14. 완전 무작위 실험이 7개의 실험단위에 대해 5개의 요인수준을 대상으로 실시되었다.
이어 마모율을 분석한다. 동일한 타이어를 사용하되, 공기압을 높음(A1), 보통(A2), 낮음(A3)으로 나 분산분석표를 완성하라. 그리고 유의수준 0.05에서 처리간 유의한 차이가 있다고 볼 수 있는가?
누고, 운행지역을 B1, B2, B3, B4의 4유형으로 구분한 실험을 통하여 다음 표와 같은 결과를 얻었다. 변동의 원인 제곱합 자유도 평균제곱합 p값
F
(Source of Variation) (Sum of Squares) (Degree of Freedom) (Mean Square) (p-value)
인자B처리
B1 B2 B3 B4 평균 처리(Treatments)
400 ( a ) ( d )
인자A처리 오차(Error) 150 ( b ) ( e ) ( f ) -
A1 10 12 8 10 10 계(Total) 550 ( c )
A2 8 12 10 10 14 위의 물음에 대해 다음 중 옳은 것은? (hint: 분자와 분모의 자유도가 4와 30이고 F값이 20과 1/20인
A3 18 16 14 20 17 p-value는 각각 4.09E-08, 0.9950. 분자와 분모의 자유도가 5와 30이고 F값이 16과 1/16인
평균 12 13.3 10.7 13.3 전채평균  =12.3
p-value는 각각 1.08E-07, 0.9971 이용)
(1) 4, 30, 34, 100, 5, 20, 있음 (2) 4, 30, 34, 100, 5, 1/20, 없음
이원분산분석결과, 인자A의 제곱합(SSA)=130.6, 인자B의 제곱합(SSB)=14.7, 총변동(SST)=166.6, 인자
(3) 5, 30, 35, 80, 5, 16, 있음 (4) 5, 30, 35, 80, 5, 1/16, 없음
A, 인자B의 검정통계량에 대한 F 기각치는 유의수준 0.05에서 각각 5.14, 4.75로 나타났다. 이와
관련 다음의 서술 중 옳은 것은?
15. 부동산회사 사업부는 아파트의 연간 총임대료 x(단위: 천 달러)와 판매가격 y(단위: 천 달러)의
(a) 잔차항의 자유도는 11이다. (b) 잔차항의 제곱합(SSE)은 21.3이다. (c) 인자B의 검정통계량은
관계에 대한 회귀분석 수행결과, 컴퓨터 분석결과는 다음과 같다.
1.375이다. (d) 유의수준 0.05에서 평균마모율(%)이 공기압에 따라 차이가 있다고 보인다.
회귀식 : 
    <분산분석표>
(1) a, b, c (2) a, c, d (3) b, c, d (4) a, b, c, d 분산의 원인 자유도 제곱합 F
변수 계수 표준오차 t값
회귀 1 400
상수 20.0 3.22 6.21
12. Employment & Training Administration의 보고에 의하면, 미국 평균 실업보험 급여수준(  )은 오차 8
x 7.21 1.36 5.29
주당 238달러라고 한다. 뉴욕주 관계자는 뉴욕 평균 실업보험 급여 수준이 미국 전체보다 낮은지 총계 9 1200
(a) 표본은 몇 채의 아파트로 구성되어 있는가? (b) 오차제곱합(SSE)과 F통계량 (c)    에서 관계
파악하기 위해 표본조사를 실행하고자 한다.
의 유의성 검정결과
(a) 귀무가설을 기각함으로써 관계자의 주장을 검정하기 위한 가설 (b) 25명의 개인을 표본으로 선정
위의 물음에 대해 다음 중 옳은 것은? (hint: 아래의 F 분포표 이용)
한 이후 평균값이 230달러이고 표준편차가 40달러라고 한다면 검정통계량 (c)    에서 임계치
를 이용한 귀무가설 검정결과 분자자유도
위의 물음에 대해 다음 중 옳은 것은? (hint: 아래의 t 분포표 이용) 분모자유도 우측꼬리면적 1 2 3 4 5 6 7
8 0.10 3.46 3.11 2.92 2.81 2.73 2.67 2.62
우측꼬리 면적
자유도 0.20 0.10 0.05 0.025 0.01 0.005 0.05 5.32 4.46 4.07 3.84 3.69 3.58 3.50
23 0.858 1.319 1.714 2.069 2.500 2.807 0.025 7.57 6.06 5.42 5.05 4.82 4.65 4.53
24 0.857 1.318 1.711 2.064 2.492 2.797 0.01 11.26 8.65 7.59 7.01 6.63 6.37 6.18
25 0.856 1.316 1.708 2.060 2.485 2.787
9 0.10 3.36 3.01 2.81 2.69 2.61 2.55 2.51
(1) H0:  ≧ 238 vs. Ha:   238, -1.0, 수용 (2) H0:  ≧ 238 vs. Ha:   238, -1.0, 기각 0.05 5.12 4.26 3.86 3.63 3.48 3.37 3.29
(3) H0:  ≦ 238 vs. Ha:   238, -2.0, 수용 (4) H0:  ≦ 238 vs. Ha:   238, -2.0, 기각 0.025 7.21 5.71 5.08 4.72 4.48 4.32 4.20
0.01 10.56 8.02 6.99 6.42 6.06 5.80 5.61
(1) 10, 800, 4, 유의함 (2) 10, 800, 4, 유의하지 않음
13. 시장조사기관은 제품에 대한 광고를 보기 전과 보고 난 다음의 구매 가능성의 차이를 분석하고자
(3) 9, 800, 1/4, 유의함 (4) 9, 800, 1/4, 유의하지 않음
고객들의 쌍별 자료를 활용하였다. 구매 가능성은 0에서 10까지로 표기되었으며 높은 수치일수록
구매 가능성이 높은 것으로 반영하였다.
16. 기업의 총수익(  )과 TV광고비(  )와 신문광고비(  )의 과거 8주간의 자료를 이용하여 다중회귀분석
구매 가능성 구매 가능성
고객 고객 을 수행한 결과, 추정회귀식이 다음과 같다고 하자. 
이전 이후  (이후-이전 차이) 이전 이후 d(이후-이전 차이)        , 컴퓨터 분석결과
1 6 5 -1 3 3 5 2 SST=40, SSE=20가 출력되었다.
2 6 7 1 4 8 10 2
귀무가설(  )은 광고를 보고 난 다음의 구매 가능성이 광고를 보기 전보다 낮거나 같을 것이라고 (a) 결정계수   및 수정결정계수  (b) TV광고비(   )가 유일한 독립변수일 때   =0.65,  =0.59

보고 수립되었다. (a) 귀무가설 vs. 대립가설 (b) 검정통계량 (c)  =0.05에서 귀무가설 검정결과 라면, 단순회귀가 선호되는가 혹은 다중회귀가 선호되는가?
위의 물음에 대해 다음 중 옳은 것은? (hint: 
   , 자유도가 3인    ,    )  
위의 물음에 대해 다음 중 옳은 것은? (hint:   1-(1-R2)  이용)
  
(1) H0:  ≦ 0 vs. Ha:   0, 1/
 , 기각 (2) H0:  ≧ 0 vs. Ha:   0, 
 , 기각
(1) 0.80, 0.72, 단순회귀 선호 (2) 0.80, 0.72, 다중회귀 선호
(3) H0:  ≧ 0 vs. Ha:   0, 1/
 , 수용 (4) H0:  ≦ 0 vs. Ha:   0, 
 , 수용
(3) 0.50, 0.30, 다중회귀 선호 (4) 0.50, 0.30, 단순회귀 선호

- 3 - - 4 -
17. 다음 중 표본분포이론과 관련된 서술 중 옳은 것은 ? 20. 한 기업의 주당 총수익(y)은 TV 광고비(x1)와 신문광고비(x2)의 선형함수로 다음과 같이 추정되었다
 
고 하자. 다음 물음에 적합한 것은?
 )의 평균과 분산은 각각   
(a) 복원추출의 경우 표본평균(      , Var( 
 )   (단  ,  는 각각 
 <분산분석>
모집단의 평균과 분산,  =표본 크기) (b) 비복원추출의 경우 표본평균의 평균과 분산은 각각
 자유도 제곱합 제곱평균 F 비 유의한 F
 
    , Var( 
 )      (단  =모집단 크기) (c) 복원추출 및 비복원 추출의 경우 표본분산 회귀 2 23.43 11.72 83.71 7.28E-09


(
  

  )은 불편추정치,

     
즉      (d) 통계량  ∼      즉, 자유도가 (n-1)
잔차 15 2.06 0.14
   계 17 25.50
인  -분포
계수 표준오차 t통계량 p-값
(1) a, b, c (2) a, b, d (3) b, c, d (4) a, b, c, d
절편 83.2 1.5738 52.9 4.57E-08
x1 2.30 0.3040 7.53 0.0006
18. Business Week사의 구독자 조사에서 지난 12개월 동안 사업자 여행 중에서 무슨 등급의 항공권
x2 1.30 0.3207 4.05 0.0097
을 가장 많이 구입하였는지에 대한 조사결과는 다음의 표와 같다. (a) 모형         , H0 :      vs. Ha :  과  중 하나 이상의 모수가 모두 0이
비행 유형 아님. =0.01에서 가설 검정한 결과는? (b) =0.05에서 x1과 x2는 모형에서 제거되어야만 하는가?
항공권 종류
국내선 국제선 (c) x1과 x2 사이의 표본상관계수(r)가 -0.80이라고 할 때, 독립변수 간에 다중공선성 문제가 존재
일등석 29 22
하는가? (hint:     )
비즈니스석 95 121
(1) 귀무가설 기각, 제거되면 안 됨, 존재하지 않음 (2) 귀무가설 수용, 제거되어야 함, 존재함
이코노미석 518 135
항공권 등급과 비행 유형간의 독립성 검정을 수행한 결과 검정통계량은   =100.43으로 나타났다. 이 (3) 귀무가설 수용, 제거되어야 함, 존재하지 않음 (4) 귀무가설 기각, 제거되면 안 됨, 존재함

와 관련된 다음의 서술 중 옳은 것은?


(a)   -검정통계량의 자유도는 6이다. (b) 1행(일등석) 및 1열(국내선)의 합은 각각 51과 642, 그리
고 총관찰수는 920이다. (c) 국내선 일등석의 기대빈도는 35.59이다. (d) 유의수준 0.05에서 항공권
구입과 비행 유형간은 독립적인 것으로 보이지 않는다. (hint: 아래의   분포표 이용)

우측꼬리면적
자유도
0.975 0.95 0.90 0.10 0.05 0.025
1 0.001 0.004 0.016 2.706 3.841 5.024
2 0.051 0.103 0.211 4.608 5.991 7.378
3 0.216 0.352 0.584 6.251 7.815 9.348
4 0.484 0.711 1.064 7.779 9.488 11.143
5 0.831 1.145 1.610 9.236 11.070 12.832
6 1.237 1.635 2.204 10.645 12.592 14.449

(1) a, b, c (2) b, c, d (3) a, c, d (4) a, b, c, d

19. 다음 가설검정에 대하여 주어진 물음에 기장 적합한 것은? H0 : p1-p2=0 vs. Ha : p1-p2≠0
다음 결과는 두 모집단으로부터 추출된 독립무작위추출 결과이다.
표본 1 표본 2
n1=100 n2=400
 =0.50
  =0.50

 

(a) p에 대한 공동추정량은 얼마인가? (b) 검정통계량은? (c) p-value? (d) 유의수준 0.05에서 통계적
결론은?

(1) 0.5, 0, 0.5, H0 수용 (2) 0.5, 0, 1.0, H0 수용 (3) 0.25, 0, 0.5, H0 기각 (4) 0.25, 0, 1.0, H0 기각

- 5 - - 6 -
III. 다음의 물음에 답하라. (2문항×5점=10점)

1. 북미지역의 B&B(Bed & Breakfast) 숙소 웹사이트는 1분에 대략 7명의 손님을 받는다고 한다. 1분
당 웹사이트 방문자 수는 포아송 확률분포를 한다고 할 때, 다음 물음에 답하라. (5점)
(1) 포아송 실험에 대한 두 가지 속성을 설명하라. (2점)
(2) 웹사이트 방문자 간의 평균시간 및 확률밀도함수는? (1점)
(3) 1분 동안에 웹사이트 방문자가 없을 확률은 얼마인가? (1점)
(4) 12초 동안 웹사이트 방문자가 없을 확률은 얼마인가? (1점)

2. 패스트푸드 경영자는 매출액(  , 천 달러)을 예측하기 위해 다음과 같은 회귀모형을 제안했다. (5점)


                
단,   =1km 내에 있는 경쟁업체 수,  =1km 내에 있는 인구 수(천 명),

    차량서비스창구가 있는 경우
차량서비스창구가 없는 경우
20개의 점포를 조사한 결과 다음과 같은 추정회귀식을 도출하였다. 
         

회귀분석
통계량
다중 상관계수 0.9202
결정계수 0.8467
조정된 결정계수 0.8180
표준 오차 2.3964
관측수 20

분산분석
자유도 제곱합 제곱평균 F 비 유의한 F
회귀 3 507.89 169.29 29.47 9.42E-07
잔차 16 91.88 5.74
계 19 599.78
추정회귀식
계수 표준오차 t 통계량 P-값 하위 95% 상위 95%
절편 8.0 7.3807 1.0764 0.2977 -7.7017 23.591
x1 -1.0 0.2976 -3.8561 0.0013 0.5166 1.7784
x2 0.2 0.0899 2.1905 0.0436 0.0063 0.3875
x3 2.2 1.9866 1.1478 0.2678 -1.9310 6.4918

(1) 추정계수들의 개별적 및 전반적인 통계적 유의성, 그리고 추정모형의 통계적 적합도에 대하여 설명
하라. (2점) [[hint: Excel에 의한 위의 회귀분석 output 이용]
(2) 모수 β3의 의미를 설명하라. (1점)
(3) 차량서비스창구로 인해 발생하는 기대매출액은? (1점)
(4) 1km 내에 경쟁업체가 두 군데 있고 인구가 10,000이며, 차량서비스 창구가 없는 점포의 매출액 그
리고 1km 내에 경쟁업체가 한 군데 있고 인구가 10,000이며, 차량서비스 창구가 있는 점포의 매출
액은? (1점)

- 7 -

You might also like