You are on page 1of 21

2 01

통계적 추정

통계학은 과학의 역할을 보충하고 있는데,


기근과 전염병, 무지와 범죄, 질병과 죽음과 같은
모집단과 표본
어두운 문제에 대해 밝은 빛을 비춰 준다.
02
(출처: Ridpath, J. C., 『The Life and Work of James A. Garfield』)
모평균의 추정

가필드(Garfield, J. A., 1831~1881)


미국의 제20대 대통령

이 글은 피타고라스 정리의 독창적인 증명으로도 유명한 가필드가, 총인구 조사 실시


에 대한 법안의 결의를 요청하는 1867년의 미국 하원 연설에서 통계의 예측 기능을
강조하면서 했던 말이다.

2. 통계적 추정 109

미래엔(1차수정)_확통(109-129)3-2단원.indd 109 2018-05-17 오후 2:06:55


모집단과 표본

학습 목표 모집단과 표본
•
  모집단과 표본의 뜻을 알고, 표본추출
의 원리를 이해한다.
•
  표본평균과 모평균의 관계를 이해하고 생각 열기 어느 회사에서 10대가
설명할 수 있다.
선호하는 운동화 색상을 다음 두 가
지 방법 중 하나를 택하여 조사하려
준비 하기
고 한다.
다음 자료의 평균과 표준편차를 구하시오.

1,  4,  13,  15,  27


[방법 1] 10대인 모든 사람을 대 [방법 2] 10대 중에서 임의로 택한
상으로 조사한다. 1000명을 대상으로 조사한다.

어떤 방법을 택하는 것이 좋을지 생각해 보고, 그 이유를 말해 보자.

통계 조사에서 조사의 대상이 되는 집단 전체를 조사하는 것을 전수조사


라고 한다. 그런데 전수조사는 많은 시간과 비용이 필요할 뿐만 아니라
자동차 충돌 실험, 전구의 수명 조사 등과 같이 전수조사 자체가 불가능
한 경우도 있다.
다가 서기 이와 같은 경우에 조사의 대상이 되 모집단
어느 회사에서 생산되는 건전지의 추출 표본
는 집단 전체에서 일부분만을 뽑아서
평균 수명을 알기 위해 모든 건전지
의 수명을 조사하면 사용할 수 있는
조사하는 것을 표본조사 라고 한다.
건전지가 없게 된다. 그래서 일부만
을 조사하여 모든 건전지의 수명을 통계 조사에서 조사의 대상이 되는
추측하는 방법이 필요하다. 집단 전체를 모집단이라 하고, 조사하기 위하여 뽑은 모집단의 일부분을
여기서는 일부 자료로부터 전체 자 표본이라고 한다. 또한, 표본에 포함되어 있는 자료의 개수를 표본의 크기
료의 특성을 추측하는 방법에 대하
라 하고, 모집단에서 표본을 뽑는 것을 추출이라고 한다.
여 알아본다.

문제 1 다음 조사는 전수조사와 표본조사 중 어느 것이 적합한지 말하시오.

⑴ 타이어 수명 조사 ⑵ 병역 판정 검사
⑶ 과일 당도 검사 ⑷ 우리나라 총인구 조사

110 Ⅲ. 통계

미래엔(1차수정)_확통(109-129)3-2단원.indd 110 2018-05-17 오후 2:06:57


표본추출의 원리
표본조사의 목적은 모집단 전체를 조사하지 않고도 모집단에서 추출한 표본을 바탕
으로 그 표본으로만 모집단의 특성, 즉 평균 또는 표준편차 등을 추측하는 데 있다.
예를 들어 우리나라 전체 국민의 하루 평균 수면 시간을 알아보기 위하여 특정한
연령대에서만 표본을 추출한다면, 이 표본은 모집단인 우리나라 전체 인구의 하루 평
균 수면 시간을 잘 나타낸다고 할 수 없다.
따라서 표본은 모집단의 특성을 잘 나타낼 수 있도록 추출해야 한다.

모집단에서 표본을 추출하는 방법은 여러 가지가 있다. 그중에서 특히 모집단에 속


하는 각 대상이 같은 확률로 추출되도록 하는 방법을 임의추출이라 하고, 임의추출된
표본을 임의표본이라고 한다.
난수 주사위는 정이십면체 모집단에서 표본을 임의추출할 때 제비뽑기, 난수 주사위, 난수표 등이 사용되었으
의 각 면에 0부터 9까지의 숫자
를 각각 두 번씩 새긴 것이다. 나 최근에는 컴퓨터의 난수 프로그램을 주로 이용한다.

어느 농구장에 입장한 3000명의 관중 중에서 행운권 당첨자 10명


을 컴퓨터 프로그램을 이용하여 다음과 같은 방법으로 임의추출할
수 있다.
‘=RANDBETWEEN 1 ‌셀 A1에 ‘=RANDBETWEEN(1,3000)’을 입력한다.
(a,b)’는 양 끝 점을 포함한
2 ‌셀 A1에서 ‘채우기 핸들’을 이용하여 셀 A10까지 드래그한다.
a와 b 사이의 정숫값 난수를
변환하는 프로그램의 함수식
이다.
또, ‘채우기 핸들’은 연속된
데이터를 드래그하면 자동으
로 입력해 주는 도구이다. 문제 2 컴퓨터 프로그램을 이용하여 우리 반에서 5명의 학생을 임의추출하는 방법을 말하시오.

한편, 어느 모집단에서 표본을 추출할 때, 한 번 추출된 자료를 되돌려 놓은 후 다시


추출하는 것을 복원추출, 추출된 자료를 되돌려 놓지 않고 다시 추출하는 것을 비복
원추출이라고 한다.
모집단의 크기가 충분히 큰 경우에는 비복원추출도 복원추출로 볼 수 있다.

문제 3 1부터 5까지의 자연수가 각각 하나씩 적힌 5개의 공이 들어 있는 주머니에서 2개의


공을 다음과 같이 임의추출할 때, 그 경우의 수를 구하시오.

⑴ 한 개씩 복원추출 ⑵ 한 개씩 비복원추출 ⑶ 동시에 2개를 추출

2. 통계적 추정 111

미래엔(1차수정)_확통(109-129)3-2단원.indd 111 2018-05-25 오후 3:27:49


모평균과 표본평균

오존 농도 생각 열기 대기 중 오존(O3) 농도가 높을 때는 오존의 살균력이 건강에 해를 끼칠 수 있어


(단위: ppm)
외출을 삼가는 것이 좋다고 한다. 다음은 어느 지역의 8월 8일부터 8월 12일까지의 오후 2시에
단계 기준값
좋음 0~0.030 측정한 오존 농도를 나타낸 것이다.
보통 0.031~0.090
나쁨 0.091~0.150
매우
0.151~
나쁨

0.024 ppm 0.046 ppm 0.091 ppm 0.045 ppm 0.034 ppm

1 5일 동안 오존 농도의 평균을 구해 보자.

2 2일을 임의추출하여 평균을 구하고 1  의 결과와 비교해 보자.

3 2  에서 구한 평균을 다른 사람이 구한 평균과 비교해 보자.

어느 모집단에서 조사하고자 하는 특성을 나타내는 확률변수를 X라 할 때, X의


평균, 분산, 표준편차를 각각 모평균, 모분산, 모표준편차 라 하며, 이것을 각각 기호로
m, r2, r
와 같이 나타낸다.

특별한 언급이 없으면 임의 한편, 모집단에서 임의추출한 크기가 n인 표본을 X1, X2, y, X n이라 할 때,
추출은 복원추출로 생각한다.
이들의 평균, 분산, 표준편차를 각각 표본평균, 표본분산, 표본표준편차 라 하며, 이것을
각각 기호로
XÕ, S2, S
와 같이 나타낸다.

이때 표본평균 XÕ, 표본분산 S2, 표본표준편차 S는 다음과 같이 구한다.


1
XÕ= (X1+X2+ y +Xn)
n
1
표본분산은 분산과 달리 S2= {(X1-XÕ)2+(X2-XÕ)2+ y +(Xn-XÕ)2}
편차의 제곱의 합을 n-1로
n-1
나눈 것으로 정의하는데, 이 S=!$S2
는 표본분산과 모분산의 차
이를 줄이기 위한 것이다.
모평균 m은 상수이지만, 표본평균 XÕ는 추출한 표본에 따라 다른 값을 가질 수 있
는 확률변수이다. 따라서 XÕ의 확률분포, 평균, 표준편차 등을 구할 수 있다.

112 Ⅲ. 통계

미래엔(1차수정)_확통(109-129)3-2단원.indd 112 2018-05-17 오후 2:06:58


예를 들어 2, 4, 6, 8의 숫자가 각각 하나씩 적힌 4장의 카드가 들어 있는 상자에서
한 장의 카드를 임의추출할 때, 카드에 적힌 숫자를 확률변수 X라 하자.
이때 X의 확률분포, 즉 모집단의 확률분포를 표로 나타내면 다음과 같다.

X 2 4 6 8 합계

P(X=x) ;4!; ;4!; ;4!; ;4!; 1

따라서 모평균과 모분산 및 모표준편차는


m=5,  r2=5,  r=15
이다.

이 모집단에서 크기가 2인 표본 X1, X2를 복원추출하고, 그 표본평균


X1+X2
XÕ는 확률변수이고, xÕ는 XÕ= 의 분포를 표로 나타내면 다음과 같다.
XÕ를 측정하여 얻은 값이다. 2
X1+X2
다음은
2
 를 구한 표 XÕ 2 3 4 5 6 7 8 합계

;1Á6; ;1ª6; ;1£6; ;1¢6; ;1£6; ;1ª6; ;1Á6;


이다.
P(XÕ=xÕ) 1
X2
2 4 6 8
X1
2 2 3 4 5 X1+X2
따라서 XÕ= 의 평균과 분산은 다음과 같다.
4 3 4 5 6 2
6 4 5 6 7
1 2 3 1
8 5 6 7 8 E(XÕ)=2_ +3_ +4_ + y +8_ =5
16 16 16 16
1 2 3 1 5
1 9•Y
• V(XÕ)=22_ +32_ +42_ + y +82_ -52=
_
16 16 16 16 2

` 5
여기서 표본평균 XÕ의 평균 5는 모평균 5와 같고, 표본평균 XÕ의 분산  는 모분산
2
d
5를 표본의 크기 2로 나눈 것과 같으므로 다음이 성립한다.
m 5 r2
E(XÕ)=5=m,  V(XÕ)= =
2 n
0       Y
•

위의 모집단에서 크기가 3인 표본 X1, X2, X3을 복원추출하고, 그 표본평균


X1+X2+X3
XÕ= 의 분포를 표로 나타내면 다음과 같다.
3
XÕ의 값이 ;3*; 인 경우는
XÕ 2 ;3*; ;;Á3¼;; 4 ;;Á3¢;; ;;Á3¤;; 6 ;;ª3¼;; ;;ª3ª;; 8 합계
(X1, X2, X3)의 값이

;6Á4; ;6£4; ;6¤4; ;6!4); ;6!4@; ;6!4@; ;6!4); ;6¤4; ;6£4; ;6Á4;
(2, 2, 4), (2, 4, 2),
P(XÕ=xÕ) 1
(4, 2, 2)의 3가지이다.

2. 통계적 추정 113

미래엔(1차수정)_확통(109-129)3-2단원.indd 113 2018-05-17 오후 2:06:59


X1+X2+X3
따라서 XÕ= 의 평균과 분산은 다음과 같다.
3
1 8 3 10 6 1
   E(XÕ)=2_ + _ + _ + y +8_ =5
64 3 64 3 64 64
1 8 2 3 10 2 6 1 5
   V(XÕ)=22_ +{ } _ +{ } _ + y +82_ -52=
1 9•Y
• 64 3 64 3 64 64 3
Æ
Æ
5
여기서 표본평균 XÕ의 평균 5는 모평균 5와 같고, 표본평균 XÕ의 분산  는 모분산
3
a
5를 표본의 크기 3으로 나눈 것과 같으므로 다음이 성립한다.
`
5 r2
m E(XÕ)=5=m,  V(XÕ)= =
3 n
0    Y
•
  mk m_ ma dk dd

일반적으로 표본평균 XÕ의 평균과 분산 및 표준편차에 대하여 다음이 성립한다.

표본평균의 평균, 분산, 표준편차


모평균이 m이고 모표준편차가 r인 모집단에서 크기가 n인 표본을 임의추출할 때, 표본평
균 XÕ에 대하여
r2 r
E(XÕ)=m,  V(XÕ)= ,  r(XÕ)=
n 13n

모평균이 10이고 모표준편차가 3인 모집단에서 임의추출한 크기가 25인 표본의 표본


평균 XÕ의 평균과 분산 및 표준편차는
9 3 3
E(XÕ)=10,  V(XÕ)= ,  r(XÕ)= =
25 1425 5

문제 4 어느 아파트에서 가구당 하루에 배출하는 음식물 쓰레기양은 평균이 860 g이고 표준


편차가 60 g이라고 한다. 이 아파트에서 36가구를 임의추출할 때, 가구당 하루에 배출하는 음식
물 쓰레기양의 표본평균의 평균과 표준편차를 구하시오.

한편, 모집단이 정규분포 N(m, r2)을 따르면, 이 모집단에서 임의추출한 크기가


r2
n인 표본의 표본평균 XÕ는 정규분포 N{m, }을 따름이 알려져 있다.
n

114 Ⅲ. 통계

미래엔(1차수정)_확통(109-129)3-2단원.indd 114 2018-05-17 오후 2:07:00


일반적으로 다음이 성립한다.

표본평균의 분포
모평균이 m이고 모표준편차가 r인 모집단에서 크기가 n인 표본을 임의추출할 때, 표본평
균 XÕ에 대하여
r2
1 ‌모집단이 정규분포 N(m, r )을 따르면 XÕ는 정규분포 N{m,
2
}을 따른다.
n
2 ‌모집단의 분포가 정규분포가 아닐 때도 n이 충분히 크면 XÕ는 근사적으로 정규분포
표본의 크기 n이 충분히 r2
N{m, }을 따른다.
크다는 것은 n¾30을 만족 n
할 때이다.


예제 1 어느 고등학교 학생들이 등교할 때 걸리는 시간은 평균이 20분이고 표준편차가
5분인 정규분포를 따른다고 한다. 이 학교 학생 중에서 36명을 임의추출할 때, 등교할 때 걸
리는 시간의 평균이 18분 이상일 확률을 구하시오.

풀이 등교할 때 걸리는 시간이 정규분포 N(20, 52)을 따르므로 36명이 등교할 때 걸리는
52
시간의 평균 XÕ는 정규분포 N{20, }을 따른다.
36
XÕ-20
따라서 확률변수 Z=  은 표준정규분포 N(0, 1)을 따르므로, 구하는 확률은
5
1436

{ }
18-20
P(XÕ¾18)=P Z¾
5
1436
GA [

=P(Z¾-2.4)
=0.5+P(0ÉZÉ2.4)
=0.5+0.4918
 0 [
=0.9918
답 0.9918

문제 5 어느 비행기 탑승객의 짐의 무게는 평균이 18 kg이고 표준편


차가 4 kg인 정규분포를 따른다고 한다. 이 비행기 탑승객 중에서 16명을
임의추출할 때, 짐의 평균 무게가 17 kg 이상 20 kg 이하일 확률을 구하
시오.

2. 통계적 추정 115

미래엔(1차수정)_확통(109-129)3-2단원.indd 115 2018-05-17 오후 2:07:02


모평균의 추정

학습 목표 모평균의 추정
모평균을 추정하고, 그 결과를 해석할
수 있다.
생각 열기 어느 제과점에서 만든 과자 10개

준비 하기
를 임의추출하여 1 개당 당류 함유량을 조사하

표준정규분포표를 이용하여 다음 확률을 였더니 과자 1 개당 당류 함유량의 표본평균이


구하시오. 10 g이고 표본표준편차가 0.3 g이었다고 한다.
⑴ P(-1ÉZÉ3)
1 과자 1개당 당류 함유량의 모평균을 추측
⑵ P(ZÉ-2)
해 보자.

2 1  에서 추측한 값이 모평균과 같다고 할 수 있는지 말해 보자.

위의 생각 열기에서 표본 10개의 표본평균이 10 g이므로 모평균은 10 g


일 것으로 추측할 수 있다.

다가 서기 표본의 평균이나 표준편차와 같이 표본으 모집단


추출
표본
각종 선거에서 유권자들의 생각을 로부터 얻은 자료를 이용하여 모집단의 평균 9„
구체적으로 파악하는 것이 중요한 9m
이나 표준편차와 같이 알지 못하는 값을 추

U
데, 여론 조사 기관에서는 그 수단으
측하는 것을 추정이라고 한다. 9‰
로 유권자 전체의 모집단에서 표본
N N™ 9• 4™
을 추출하여 분석하는 조사 방법을 추정
많이 사용한다. 예를 들어 출구 조사
를 통하여 투표 종료 시각과 동시에
당선자를 비교적 정확하게 예측하기
도 한다. 이제 표본평균 XÕ를 이용하여 모평균 m을 추정하는 방법을 알아보자.
이와 같이 모집단에서 추출한 표본
으로부터 얻은 정보를 이용하여 모 정규분포 N(m, r2)을 따르는 모집단에서 크기가 n인 표본을 임의추
집단의 특성을 예측할 수 있다. r2
출하였을 때, 표본평균 XÕ는 정규분포 N{m, }을 따른다.
n
따라서 XÕ를 표준화한 확률변수
XÕ-m
Z=
r
13n
은 표준정규분포 N(0, 1)을 따른다.

116 Ⅲ. 통계

미래엔(1차수정)_확통(109-129)3-2단원.indd 116 2018-07-23 오후 4:40:26


한편, 표준정규분포표에서 GA [

P(-1.96ÉZÉ1.96)=0.95
이므로

{ }
XÕ-m
P -1.96É É1.96 =0.95  0  [
r
13n
이다. 이 식을 변형하면 다음과 같다.
r r
P{XÕ-1.96  ÉmÉXÕ+1.96  }=0.95
13n 13n
r r
이것은 모평균 m이 XÕ-1.96  이상 XÕ+1.96  이하인 범위에 포함될 확률
13n 13n
이 0.95임을 나타낸다.

여기서 표본평균 XÕ의 값을 xÕ라 할 때,


r r
x Õ-1.96  ÉmÉx Õ+1.96 
13n 13n
를 모평균 m의 신뢰도 95 %의 신뢰구간이라고 한다.

네이만(Neyman, J., 마찬가지로


1894~1981)
미국의 수리 통계학자로 신 P(-2.58ÉZÉ2.58)=0.99
뢰구간에 따른 추정법을 완
이므로, 모평균 m의 신뢰도 99 %의 신뢰구간은 다음과 같다.
성하였다.
r r
x Õ-2.58  ÉmÉx Õ+2.58 
13n 13n

표본평균 X Õ는 확률변수이므로 추출되는 표본에 모평균 N의 신뢰도 A의 신뢰구간

따라 표본평균의 값 x Õ가 달라지고, 이에 따라 신뢰 A

구간도 달라진다.
오른쪽 그림에서 표본평 이렇게 구한 신뢰구간 중에는 오른쪽 그림과 같이
균 XÕ의 값을 x1Õ, x2Õ, x4Õ 로 N
모평균 m을 포함하는 것과 포함하지 않는 것이 있 Y•
계산한 신뢰구간은 m 을 포
Y„•
함하고, x3Õ, x5Õ 로 계산한 신 을 수 있다.
뢰구간은 m 을 포함하지 않 Ym•
는다. 즉, ‘모평균 m의 신뢰도 95 %의 신뢰구간’의 뜻은 Yf•

모집단으로부터 크기가 n인 표본을 여러 번 추출하 Ye•


Ys•
여 신뢰구간을 만드는 일을 반복할 때, 구한 신뢰구간
U

중에서 약 95 %는 모평균 m을 포함한다는 뜻이다. Y²•

2. 통계적 추정 117

미래엔(1차수정)_확통(109-129)3-2단원.indd 117 2018-05-17 오후 2:07:09


이상을 정리하면 다음과 같다.

모평균의 신뢰구간
정규분포 N(m, r2)을 따르는 모집단에서 크기가 n인 표본을 임의추출할 때, 표본평균
XÕ의 값이 xÕ이면 모평균 m의 신뢰구간은 다음과 같다.
r r
1 신뢰도 95 %의 신뢰구간   xÕ-1.96  ÉmÉxÕ+1.96 
13n 13n
r r
2 신뢰도 99 %의 신뢰구간   xÕ-2.58  ÉmÉxÕ+2.58 
13n 13n


예제 1 어느 고등학교 남학생들의 하루 운동 시간은 모평균이 m분이고 모표준편차가 10
분인 정규분포를 따른다고 한다. 이 학교 남학생 중에서 25명을 임의추출하여 하루 운동 시간
을 조사하였더니, 평균이 42분이었다. 이 학교 남학생들의 하루 운동 시간의 모평균 m을 신
뢰도 95 %로 추정하시오.

풀이 n=25, xÕ=42, r=10이므로 모평균 m의 신뢰도 95 %의 신뢰구간은


10 10
42-1.96_ ÉmÉ42+1.96_
1425 1425
38.08ÉmÉ45.92
답 38.08ÉmÉ45.92(단위: 분)

문제 1 어느 회사에서 생산되는 두루마리 휴지의 길이는 모평균이 m m이고 모표준편차가


0.2 m인 정규분포를 따른다고 한다. 이 회사에서 생산된 두루마리 휴지 중에서 36개를 임의추
출하여 그 길이를 측정하였더니, 평균이 100.7 m이었다. 이 회사에서 생산된 두루마리 휴지의
길이의 모평균 m을 신뢰도 99 %로 추정하시오.

일반적으로 모평균의 신뢰구간을 구할 때, 모표준편차 r를 모르는 경우가 많다. 이


때 표본의 크기 n이 충분히 크면 표본표준편차의 값 s는 모표준편차 r와 큰 차이가
없음이 알려져 있다.
따라서 n이 충분히 크면 모표준편차 r 대신에 표본표준편차의 값 s를 이용하여 신
뢰구간을 구할 수 있다.

118 Ⅲ. 통계

미래엔(1차수정)_확통(109-129)3-2단원.indd 118 2018-05-29 오전 9:42:17



예제 2 어느 회사에서 생산되는 휴대 전화의 배터리 사용 시간은 정규분포를 따른다고 한
다. 이 회사에서 생산된 휴대 전화 64대를 임의추출하여 배터리 사용 시간을 조사하였더니 평
균이 8시간이고 표준편차가 1시간이었다. 이 휴대 전화의 배터리 사용 시간의 모평균 m을 신
뢰도 95 %로 추정하시오.

풀이 Õ 8, s=1이고 표본의 크기 n이 충분히 크므로 모평균 m의 신뢰도 95 %


n=64, x=
의 신뢰구간은
1 1
8-1.96_ ÉmÉ8+1.96_
1464 1464
7.755ÉmÉ8.245
답 7.755ÉmÉ8.245 (단위: 시간)

문제 2 어느 자동차 회사에서 생산되는 자동차의 연료 1 L당 주행


거리인 연비는 정규분포를 따른다고 한다. 이 회사에서 생산된
자동차 100 대를 임의추출하여 연비를 조사하였더니 평균이
15.6 km이고 표준편차가 4.5 km이었다. 이 자동차의 연비
의 모평균 m을 신뢰도 99 %로 추정하시오.

생각 문제 해결 | 추론 | 창의·융합 | 의사소통 | 정보 처리 | 태도 및 실천

넓히기
모표준편차가 r인 정규분포를 따르는 어느 모집단에서 표본을 임의추출하여 모평균 m을 추정하였
더니, 모평균 m의 신뢰도 a %의 신뢰구간이 aÉmÉb이었다.
이때 다음 명제의 참, 거짓을 판별하시오.

㈎ 표본의 크기가 일정할 때, 신뢰도를 높게 하면 b-a의 값은 커진다.


㈏ 신뢰도가 일정할 때, 표본의 크기를 크게 하면 b-a의 값은 작아진다.

㈐ 신뢰도가 일정할 때, 표본의 크기를 2배로 늘리면 b-a의 값은 ;2!;배가 된다.

2. 통계적 추정 119

미래엔(1차수정)_확통(109-129)3-2단원.indd 119 2018-05-17 오후 2:07:11


탐구
융합
생활 속의 통계적 추정
창의·융합 | 태도 및 실천

다음은 생활 속에서 자료를 수집하고 정리하여 통계적 추정을 통해 결과를 분석하는 과정이다.

1 ⑴ 조사 내용 선정
‌우리 학교 학생들의 스마트폰 사용 실태를
조사 내용과
알아보기 위하여, 전체 학생들의
대상 선정
- 한 달 동안의 스마트폰 데이터 사용량 조사
- 하루 동안의 스마트폰 사용 시간 조사
⑵ 조사 대상 선정
2 ‌우리 학교의 전체 학생 중에서 임의추출한 30명의
설문 조사지 학생을 대상으로 조사한다.
작성 및 조사
실시

3 조사 대상 학생들의 설문 조사지를 분석하여 다


음의 표본평균과 표본표준편차를 구한다.
자료 분석
- 한 달 동안의 스마트폰 데이터 사용량
- 하루 동안의 스마트폰 사용 시간

4 조사 대상 학생들에 대한 자료 분석을 이용
하여 다음의 모평균을 신뢰도 95 %의 신뢰
통계적 추정을
구간으로 추정한다.
이용한
모평균의 추정 - ‌우리 학교 전체 학생들의 한 달 동안의
스마트폰 데이터 사용량
- ‌우리 학교 전체 학생들의 하루 동안의
스마트폰 사용 시간

탐 구 위와 같이 생활 속에서 표본평균을 이용하여 모평균을 추정할 수


있는 예를 찾아 설문 조사를 실시하고, ‘생활 속의 통계적 추정’
이란 주제로 발표해 보자.

120 Ⅲ. 통계

미래엔(1차수정)_확통(109-129)3-2단원.indd 120 2018-05-17 오후 2:07:13


III -2. 통계적 추정 기 본

중단원 마무리하기
01 다음 조사는 전수조사와 표본조사 중 어느 것이 적
합한지 말하시오.
 모집단과 표본
⑴ 전수조사:
‌ 조사의 대상이 되는 집단 전체를 조사하는 것 ⑴ 형광등 수명 조사
⑵ 표본조사:
‌ 조사의 대상이 되는 집단 전체에서 일부분만
⑵ ‌어느 고등학교 학생들의 『확률과 통계』 시험의
을 뽑아서 조사하는 것
⑶ 모집단:
‌ 조사의 대상이 되는 집단 전체 평균 점수
⑷ 표본:
‌ 조사하기 위하여 뽑은 모집단의 일부분
⑸ 임의추출:
‌ 모집단에 속하는 각 대상이 같은 확률로 추
출되도록 하는 방법
⑹ ‌모평균이 m이고 모표준편차가 r인 모집단에서 크기가
n인 표본을 임의추출할 때, 표본평균 XÕ에 대하여
r2 r
1 ‌E(XÕ)=m,  V(XÕ)= ,  r(XÕ)=
n 13n
‌모집단이 정규분포 N(m, r )을 따르면 XÕ는 정규
02 모평균이 56이고 모분산이 9인 모집단에서 임의추
2
2

r 2
분포 N{m, }을 따른다. 출한 크기가 36인 표본의 표본평균 XÕ의 평균과 분
n
3 ‌모집단의 분포가 정규분포가 아닐 때도 n이 충분히 산 및 표준편차를 구하시오.
r2
크면 XÕ는 근사적으로 정규분포 N{m, }을 따
n
른다.

 모평균의 추정
⑴ 추정:
‌ 표본으로부터 얻은 자료를 이용하여 모집단의 평 03 정규분포 N(12, 52)을 따르는 모집단에서 크기가
25인 표본을 임의추출할 때, 표본평균 XÕ가 10 이상
균이나 표준편차와 같이 알지 못하는 값을 추측하는 것
⑵ ‌정규분포 N(m, r )을 따르는 모집단에서 임의추출한
2
14 이하일 확률을 구하시오.
크기가 n인 표본의 표본평균 XÕ의 값이 x Õ 일 때, 모평
균 m의 신뢰구간은 다음과 같다.
1 ‌신뢰도 95 %의 신뢰구간:
r r
   x -
Õ 1.96  ÉmÉx +
Õ 1.96 
13n 13n
2 ‌신뢰도 99 %의 신뢰구간:
r r
   x Õ-2.58  ÉmÉx Õ+2.58 
13n 13n
⑶ ‌모평균의 신뢰구간을 구할 때, n이 충분히 크면 모표준 04 정규분포 N(m, 42)을 따르는 모집단에서 크기가

편차 r 대신에 표본표준편차의 값 s를 사용할 수 있다. 64인 표본을 임의추출하였더니 표본평균이 15이었


다. 모평균 m을 신뢰도 95 %로 추정하시오.

2. 통계적 추정 121

미래엔(1차수정)_확통(109-129)3-2단원.indd 121 2018-05-17 오후 2:07:13


표 준

05 표준편차가 4인 모집단에서 크기가 n인 표본을 임의추출할 때, 표본평균의 표준편차


가 0.1 이하가 되도록 하는 n의 최솟값을 구하시오.

06 1부터 5까지의 자연수가 각각 하나씩 적힌 5장의 카드 중에서 3장의 카드를 임의추출


할 때, 꺼낸 카드에 적힌 숫자의 평균을 XÕ라 하자. 이때 V(2XÕ)를 구하시오.

|서 술 형|

07 정규분포 N(m, 5 )을 따르는 모집단에서 크기가 n인 표본을 임의추출할 때, 표본평


2

균과 모평균의 차가 0.2 이하일 확률이 0.9544이다. 이때 n의 값을 구하는 풀이 과정


과 답을 쓰시오.

08 어느 공장에서 생산되는 음료수 캔 한 개의 용량은 평균이 500 mL이고 표준편차가


2 mL인 정규분포를 따른다고 한다. 이 공장에서 생산된 음료수 캔 중에서 n개를 임
의추출할 때, 표본평균 XÕ가 499 mL 이상 501 mL 이하일 확률이 0.9974이다. 이때
n의 값을 구하시오.

09 어느 농장에서 키우는 돼지의 무게는 표준편차가 5 kg인 정규분포를 따른다고 한다.


이 농장에서 돼지 100마리를 임의추출하여 무게를 조사하였더니 평균이 150 kg이었
다. 이 농장에서 키우는 돼지의 무게의 모평균 m을 신뢰도 95 %로 추정하시오.

122 Ⅲ. 통계

미래엔(1차수정)_확통(109-129)3-2단원.indd 122 2018-05-17 오후 2:07:14


|서 술 형|

10 모평균 m의 신뢰구간이 aÉmÉb일 때, b-a를 신뢰구간의 길이라고 한다. 정규분


포 N(m, r2)을 따르는 모집단에서 임의추출한 크기가 n인 표본의 표본평균을 XÕ라

하자. 모평균 m에 대한 신뢰도 95 %의 신뢰구간의 길이가 ;2!;r 이하일 때, n의 최솟

값을 구하는 풀이 과정과 답을 쓰시오.

발 전

11 4, 5, 6, 7의 숫자가 각각 하나씩 적힌 공이 각각  80개, 60개, 40개, 20개가 들어 있는


주머니에서 100개의 공을 임의추출할 때, 공에 적힌 숫자의 평균을 XÕ라 하자.
이때  P(XÕ¾k)=0.0228을 만족시키는 상수 k의 값을 구하시오.

12 정규분포 N(m, 42)을 따르는 모집단에서 임의추출한 크기가 m2인 표본의 표본평균
을 XÕ라 하자. 이때  P(m-1ÉXÕÉm+1)=0.9544를 만족시키는 m의 값을 구하
시오. (단, m은 자연수이다.)

13 어느 초콜릿 공장에서 만드는 초콜릿 한 개의 무게


는 평균이 30 g이고 표준편차가 4 g인 정규분포
를 따른다고 한다. 이 초콜릿 공장에서는 초콜
릿을 4개씩 한 상자에 담아서 판매하는데, 4개
의 초콜릿을 담은 상자의 무게가 109.76 g 이하이면
불량품인 상자로 판정된다고 한다. 이 초콜릿 공장에서 출하한 초콜릿 상자 400개 중
에서 불량품인 상자가 28개 이하일 확률을 구하시오. (단, 상자의 무게는 무시하고,
P(0ÉZÉ1.28)=0.40, P(0ÉZÉ2)=0.48로 계산한다.)

2. 통계적 추정 123

미래엔(1차수정)_확통(109-129)3-2단원.indd 123 2018-05-17 오후 2:07:14


III 대단원 평가하기
하 중 상

01 04
흰 공 4개와 검은 공 6개가 들어 있는 주머니에서 임의로 확률변수 X의 확률분포가 다음 표와 같을 때,
3개의 공을 꺼낼 때, 꺼낸 검은 공의 개수를 확률변수 X E(aX+b)의 값은? (단, a, b는 상수이다.)
라 하자. 이때 P(XÉ2)의 값은?
X 0 1 2 합계

① ;6!; ② ;3!; ③ ;2!; P(X=x) ;4!; ;2!; a b

④ ;3@; ⑤ ;6%;
① ;4#; ② 1 ③ ;4%;

④ ;2#; ⑤ ;4&;

02
각 면에 1, 1, 2, 2, 2, 3의 숫자가 각각 하나씩 적힌 정육 05
면체 모양의 주사위가 있다. 이 주사위를 던져서 나온 눈 각 면에 1, 2, 3, 4의 숫자가 각각 하나씩 적힌 정사면체

의 수를 확률변수 X라 할 때, E(X)의 값은? 가 있다. 이 정사면체를 던져서 바닥에 놓인 면에 적힌 숫


자를 확률변수 X라 할 때, V(2X+1)의 값은?
① ;3$; ② ;2#; ③ ;3%;
① 3 ② 4 ③5
④ ;;Á6Á;; ⑤2 ④ 6 ⑤7

06
03 어느 농구 선수가 자유투를 성공할 확률은 0.9라고 한다.
확률변수 X에 대하여 E(X)=4, E(X2)=25일 때, 이 선수가 100번의 자유투를 던질 때, 성공한 횟수를 확
r(X)의 값은? 률변수 X라 하자. E(X)+r(X)의 값은?

① 3 ② 4 ③5 ① 90 ② 93 ③ 96
④ 6 ⑤7 ④ 99 ⑤ 102

124 Ⅲ. 통계

미래엔(1차수정)_확통(109-129)3-2단원.indd 124 2018-05-17 오후 2:07:15


07 10
이항분포 B(n, p)를 따르는 확률변수 X에 대하여 X의 어느 공장에서 생산되는 이온 음료 한 병의 용량은 평균이
n 250 mL이고 표준편차가 0.5 mL인 정규분포를 따른다고
평균이 5이고 분산이 4일 때, 의 값을 구하시오.
p
한다.
이온 음료 한 병의 용량이 248.5 mL 이상 251.5 mL 이하
일 때 합격품으로 처리한다. 이 공장에서 생산된 이온 음
료 10000병 중에서 합격품의 개수의 기댓값을 구하시오.

08 11
두 확률변수 X와 Y는 각각 정규분포 N(10, 32)과
어느 자격증 시험에서 70점 이상을 받으면 합격이라고 한
2
N(m, 3 )을 따른다. 이때 각각의 확률밀도함수 f (x)와
다. 10000명이 응시한 이 자격증 시험 점수가 평균이 55
g(x)가 다음 조건을 만족시킨다고 한다.
점이고 표준편차가 r점인 정규분포를 따를 때, 합격자 수
가 668명이었다. r의 값을 구하시오.
㈎ P(XÉ10)ÉP(Y¾25)
㈏ ‌f (15)=g(25)

P(YÉ36)의 값을 구하시오.

12
어느 공장에서 생산되는 A 타이어의 수명은 평균이
40000 km이고 표준편차가 2000 km인 정규분포를 따르
고, B 타이어의 수명은 평균이 45000 km이고 표준편차
가 4000 km인 정규분포를 따른다고 한다.
이 공장에서 생산된 A 타이어와 B 타이어 중에서 임의로

09 제품을 각각 1 개씩 택할 때, 택한 A 타이어의 수명이


43000 km 이상일 확률과 B 타이어의 수명이 a km 이
어느 고등학교 학생들의 봉사 시간은 평균이 48시간이고
하일 확률이 같다. 상수 a의 값은?
표준편차가 10시간인 정규분포를 따른다고 한다. 이 고등
학교 학생 중에서 임의로 1명을 택할 때, 이 학생의 봉사 ① 39000 ② 41000 ③ 43000
시간이 58시간 이상일 확률을 구하시오. ④ 45000 ⑤ 47000

대단원 평가하기 125

미래엔(1차수정)_확통(109-129)3-2단원.indd 125 2018-05-17 오후 2:07:15


III 대단원 평가하기

13 16
어느 지역의 청소년 음악 콩쿠르 지원자 1000명의 평가 어느 공장에서 생산되는 A 제품의 무게는 정규분포
점수가 평균이 63점이고 표준편차가 20점인 정규분포를 N(m, 22)을 따르고, B 제품의 무게는 정규분포
따른다고 한다. 이 콩쿠르의 예선을 통과한 인원이 242명 N(3m, 42)을 따른다고 한다. 이 공장에서 생산된 A 제
이라 할 때, 예선을 통과할 수 있는 최저 점수를 구하시오. 품과 B 제품 중에서 임의로 4개씩 택할 때, 택한 A 제품
4개의 평균 무게가 k 이상일 확률과 B 제품 4개의 평균
m
무게가 k 이하일 확률이 같다. 의 값은?
k

① ;5!; ② ;5@; ③ ;5#;

④ ;5$; ⑤1

14
어느 고속 도로의 하이 패스를 이용하는 차량의 80 %가
승용차라고 한다. 이 고속 도로의 하이 패스를 이용한 차 17
량 400 대 중에서 승용차가 336 대 이상일 확률을 구하 정규분포 N(m, r2)을 따르는 모집단에서 크기가 n인

시오. 표본을 임의추출하여 그 표본평균을 X Õ라 하자. 모평균


m의 신뢰도 95 %의 신뢰구간이 aÉmÉb라 할 때
b-a=11.76이다. P(XÕ¾m+5.88)의 값을 구하시오.

18
어느 고등학교 학생들의 일 년 독서량은 표준편차가 5권인

15 정규분포를 따른다고 한다. 이 고등학교 학생 중에서 n명


어느 세차장에서 자동차 한 대를 세차하는 데 걸리는 시 을 임의추출하여 일 년 독서량을 조사하였더니 평균이 10권
간은 평균이 8분이고 표준편차가 2분인 정규분포를 따른 이었다.
다고 한다. 이 세차장에서 세차를 한 자동자 중에서 16대 이 고등학교 학생들의 일 년 독서량의 평균 m의 신뢰도
를 임의추출할 때, 이 16대의 총 세차 시간의 합이 2시간 99 %의 신뢰구간이 8.71ÉmÉ11.29일 때, n의 값을
이하일 확률을 구하시오. 구하시오.

126 Ⅲ. 통계

미래엔(1차수정)_확통(109-129)3-2단원.indd 126 2018-05-17 오후 2:07:16


19번부터 22번까지 서술형입니다.
21
확률변수 X가 정규분포 N(7, 32)을 따를 때, 확률
19 P(2a-5ÉXÉ4a+1)이 최대가 되도록 하는 상수 a
1부터 12까지의 자연수가 각각 하나씩 적힌 12개의 공이
의 값을 구하시오.
들어 있는 주머니에서 임의로 한 개의 공을 꺼내는 시행
을 반복한다. 꺼낸 공에 적힌 수를 모두 더하여 그 합이 4
의 배수가 되면 이 시행을 멈추기로 할 때, 시행을 멈출
때까지 꺼낸 공의 개수를 확률변수 X라 하자. P(X¾3)
의 값을 구하시오. (단, 꺼낸 공은 다시 넣지 않는다.)

22
어느 지역의 버스 정류장 사이의 거리는 표준편차가
80 m인 정규분포를 따른다. 모평균을 신뢰도 95 %로 추
20 정할 때, 모평균과 표본평균의 차가 39.2 m 이하가 되기
확률변수 X가 이항분포 B(10, p)를 따르고,
위한 표본의 크기의 최솟값을 구하시오.
4
   P(X=3)=  P(X=4)
5
일 때, E(6X)의 값을 구하시오. (단, p+0)

기평

정답을 맞힌 문항에 ○표 하여 학습 성취도를 표시하고, 부족한 부분은 교과서의 해당 쪽을 확인하여 복습하자.

문항 번호 성취 기준 성취도 복습
01 19 확률변수와 확률분포의 뜻을 안다. 79 ~ 84쪽
02 03 04 05 이산확률변수의 기댓값(평균)과 표준편차를 구할 수 있다. 86 ~ 91쪽
06 07 20 이항분포의 뜻을 알고, 평균과 표준편차를 구할 수 있다. 92 ~ 96쪽
08 09 10 11 12 13 14 21 정규분포의 뜻을 알고, 그 성질을 이해한다. 97 ~ 104쪽
15 16 표본평균과 모평균의 관계를 이해하고 설명할 수 있다. 110 ~ 115쪽
17 18 22 모평균을 추정하고, 그 결과를 해석할 수 있다. 116 ~ 119쪽

성취도 만족, 보통, 미흡

대단원 평가하기 127

미래엔(1차수정)_확통(109-129)3-2단원.indd 127 2018-05-17 오후 2:07:16


수학
이야기 여러 가지 표본추출 방법

모집단에서 표본을 추출하는 경우에 유의해야 할 점 중에서 중요한 것은 표본의 크기뿐 아니라 표
본의 질(質)일 것이다. 이론적으로는 무작위 표본추출 방법이 표본의 질을 보증하는 가장 좋은 방법
이지만 현실에 적용하기에는 어려움이 있다.
따라서 실용적인 표본추출 방법으로 다음과 같은 것들이 사용된다.

1 층화추출법(層化抽出法, stratified sampling)

남자 사원이 900명, 여자 사원이 100명인 회사에서 50명을 표


본추출하여 의견을 조사한다고 할 때, 남자 사원 중에서만 무작
위로 50명을 추출할 경우 사실상 모집단
전체의 의견을 조사했다고 보기 어렵다.
이를 보완하기 위해서 남녀의 비율이
9 : 1이므로 남자 사원에서 45명, 여자 사
원에서 5명을 무작위로 추출하여 의견을
조사하는 방법이다.

2 집락추출법(集落抽出法, cluster sampling)

회사에서 사원을 남녀로 구별하여 추출할 수도 있지만, 여러 부서 중에


서 한 곳만 선택하여 표본을 추출한다면, 그 속에 남자 사원과 여자 사
원이 모두 포함되어 있을 것이다. 즉, 회사의 여러 부서 중에서 임의로 한 개의 부서에 속하는 남
녀 사원을 모두 추출하여 조사하는 방법이다.

3 체계적 추출법(体系的 抽出法, systematic sampling)

어느 지역의 고등학교 학생들의 의견을 조사할 때, 모든 학생들을 모두 조사할 수 없으므로 그


지역 모든 학교의 각 학년의 1반 학생들을 표본으로 추출하여 조사하는 방법이다.

이외에도 여러 가지 표본추출 방법이 있으며, 조사 분석의 목적, 모집단의 특성,


조사의 효율성 등을 고려하여 몇 가지 방법을 혼합해서 사용할 수도 있다. 예를 들어
어느 회사 사원들의 의견을 조사하는 경우, 1차적으로는 집락추출법, 2차적으로는
층화추출법을 적용할 수도 있다.
(출처: 배득종, 정성호, 『통계학 헤드스타트』)

128 Ⅲ. 통계

미래엔(1차수정)_확통(109-129)3-2단원.indd 128 2018-05-17 오후 2:07:18


뿌리가
되는
임상 심리와 통계 수학

임상 심리사(clinical psychologist)는 병원이나 학교 또는 다양한 심리 상담 기관에서 심리학적 지식을


바탕으로 정신적, 감정적 또는 행동적 장애를 겪는 사람들을 대상으로 심리 평가, 심리 상담, 심리 교육, 연구,
자문 등의 일을 한다. 임상 심리사는 심리학적인 치료를 주로 하는 데 비해, 정신과 의사는 약물을 통한 치료를
주로 하는 것이 차이점이다.

임상 심리사는 대상자의 심리적 문제를 파악하기 위


해 종종 심리 검사를 활용해서 객관적인 판단을 하는데,
이때 확률과 통계 등의 수학적 지식을 활용한다.

예를 들어 어떤 사람의 우울증 검사 점수가 20점이 나


왔을 때, 이 점수의 의미가 무엇인지 판단하기 위해서는
이 검사 점수의 평균과 표준편차를 알아야만 한다.

이 검사 점수의 평균이 10점이고 표준편차가 4점이라 한다면, 이 사람의 점수는 정규분포


20-10
N(10, 42)을 따르므로 표준화하면 Z= =2.5이다. 이때 표준정규분포표에서
4
P(Z¾2.5)=0.0062임을 알 수 있으며, 이는 이 검사에서 이 사람보다 더 높은 점수를 받는 사람
이 100명 중에 1명 미만임을 나타낸다. 즉, 이 사람을 우울증으로 판단했을 때, 잘못 판단할 확률이
1 % 미만임을 나타낸다.

아래 그림은 우울증의 원인이 되는 스트레스 자가 진단법의 하나로서, 그림의 무늬들의 움직임이


빠를수록 스트레스를 많이 받고 있다는 뜻이라고 한다.
(출처: Durand, V. M., Barlow, D. H., 『Essentials of Abnormal Psychology』)

뿌리가 되는 수학 129

미래엔(1차수정)_확통(109-129)3-2단원.indd 129 2018-05-17 오후 2:07:20

You might also like