Professional Documents
Culture Documents
심화수학2 - 6단원 통계 - 인쇄용 - 19-12-28
심화수학2 - 6단원 통계 - 인쇄용 - 19-12-28
통계
1 확률분포
2 통계적 추정
단원 열기
센서스의 어원이 된 고대 로마의 켄수스, 신라의 민정문서, 잉글랜드의 둠즈데이 북, 몽골제국의 호구 조사, 고려와
조선의 호구 조사 등 아주 오래전부터 사용된 통계학은 여러 목적으로 활용되어 왔다. 근대 통계학의 아버지라 불리
는 케틀레는 1835년에 인구 통계와 범죄통계로부터 도덕 현상이나 범죄 현상 같은 무질서해 보이는 사회 현상에 있
어서도 일종의 규칙성이 존재한다는 것을 증명하는 연구를 발표하였다. 기존에는 천문학 등 자연 과학에 이용되던
통계학이 사회에도 적용이 가능하다는 사실이 밝혀지면서 근대 통계학이 성립되었다.
현재에는 여론 조사 등과 같은 다양한 정치·사회 현상을 분석하는 데도 통계가 이용되고 있고, 모든 국가에서 각종
산업에서 국민 생활에 이르는 다양한 통계 자료를 조사하고 분석하여 국가 정책은 물론 기업의 사업 방향이나 학자
들의 사회 연구, 우리 사회의 변화와 전망에 이르기까지 폭넓게 활용되고 있다.
236 Ⅵ 통계
Ⅵ 통계 237
1
확률분포
01 확률변수와 확률분포
02 이산확률변수와 확률질량함수
03 이산확률변수의 기댓값(평균), 분산, 표준편차
04 이항분포
05 큰수의 법칙
06 연속확률변수와 확률밀도함수
07 정규분포
08 이항분포와 정규분포의 관계
생각 열기
세 개의 동전을 던지는 시행에서 다음 물음에 답하라.
(1) 표본공간 S 를 집합으로 나타내라.
(2) 표본공간의 각 원소에 대하여 앞면이 나오는 횟수를 대응시키는 X 는 S 에서 실수 전체의
집합으로의 함수인가?
(3) 아래 표를 완성하라.
X 0 1 2 3 합계
P ]X = xg
1
1
8
238 Ⅵ 통계
확률변수와 확률분포
01 학습 목표
• 확률변수와 확률분포를 이해한다.
X|S " R
로 생각할 수 있다.
확률변수는 보통 알파벳 대문자 X , Y , Z 등으로 나타내고 확률변수가 가지는
값은 숫자 또는 소문자 x , y , z 등으로 나타낸다.
확률변수가 가질 수 있는 값들을 유한수열 x 1 , x 2 , g , x n 또는 무한수열 x 1 ,
x 2 , g 로 표현할 수 있을 때, 그 확률변수를 이산확률변수라 하고, 확률변수가 어
떤 구간 ]a, bg 안의 모든 실수 값을 가질 수 있을 때는 연속확률변수라고 한다.
1. 확률분포 239
문제 2 어느 정류장에 버스가 15 분 간격으로 도착한다. 이때 승객이 기다리는 시간을 확
또, 모든 실수 x 에 대하여
F ]xg = P ]X # xg
로 정의된 함수 F ]xg 을 확률변수 X 의 분포함수라고 한다.
예를 들어, 표본공간 S = "H, T, 에 대하여 X ]"H,g = 0 , X ]"T,g = 1 인 확
률변수 X 에 대한 확률분포가 P ]"H,g = 1 - p , P ]"T,g = p 로 주어졌을 때,
그 분포함수는 다음과 같다.
0 ]x < 0g
F ]xg = *1 - p ]0 # x < 1g
1 ]x $ 1g
풀이 확률변수 X 가 가지는 값과
앞면의 수( X ) 0 1 2 합계
그 확률을 표로 나타내면 오른쪽과 같고,
P ]X = xg
1 1 1
1
확률변수 X 가 이산확률변수임을 알 수 4 2 4
240 Ⅵ 통계
이산확률변수와 확률질량함수
02 학습 목표
• 이산확률변수를 이해한다.
• 확률질량함수의 뜻을 알고 이를 활용할 수 있다.
앞면의 개수( X ) 0 1 2 3 합계
P ]X = xg
1 3 3 1
1
8 8 8 8
일반적으로 이산확률변수 X 의 각 값 x 1 , x 2 , g , x n 과 X 가 그 값을 취할
확률 p 1 , p 2 , g , p n 사이의 대응 관계를 확률변수 X 의 확률분포라고 하고, 다
음 표와 같이 나타낼 수 있다.
X x1 x2 x3 g xn 합계
P ]X = x ig p1 p2 p3 g pn 1
서 X 가 이산확률변수이면
P ]x i # X # x jg =
j
{ Pp
= ii
kk
kk =
1. 확률분포 241
이다. 그리고 이 확률분포를 나타내는 함수 P ]X = x ig = p i , ]i = 1, 2, g, ng 를 이
산확률변수 X 의 확률질량함수라고 한다.
확률변수 X 가 가질 수 있는 값들이 x 1 , x 2 , g 이고, X 가 그 값을 취할 확률
p 1 , p 2 , g 인 경우도 생각할 수 있는데 이때, 확률변수 X 의 확률분포표는 다음과
같다.
X x1 x2 x3 g 합계
P ]X = x ig p1 p2 p3 g 1
확률질량함수의 성질
❶ 0 # P ]X = x ig # 1 , (i = 1, 2, 3, …)
{ P ]X = x g = 1
3
❷ i
i=1
X 1 2 3 4 합계
P ]X = xg
1 a 1 a 1
3 6
{ P ]X = ig = 1 이므로
4
1 1
+a+ +a = 1
3 6
1
이다. 따라서 a = 이고
4
P](2
P 2#≤gX ≤ 4 = P ]X = 2g + P ]X = 3g + P ]X = 4g
# 4)
1 1 1 2
= + + =
4 6 4 3
이다.
1 1 1 2
= + + 답=
4 6 4 3
P ]X = xg 를 구하라.
242 Ⅵ 통계
또한, 이산확률변수 X 의 확률질량함수 P ]X = x ig 와 분포함수 F (x)에는 다
음과 같은 관계가 있음을 알 수 있다.
확률질량함수와 분포함수의 관계
이산확률변수 X 에 대하여
❷ P ]X = x ig = F ]x ig - F ]x i - 1g 이다.
P ]X = 1g = P ]X = 2g = P ]X = 3g =
1 1 1
2, 3, 6
X 의 분포함수 F (x)를 구하고, 그래프로 나타내라.
풀이 X 의 분포함수 F(x)는
F ]1g = P ]X # 1g = P ]X = 1g =
1
,
2
F ]2g = P ]X # 2g = P ]X = 1g + P ]X = 2g =
5
,
6
F ]3g = P ]X # 3g = P ]X = 1g + P ]X = 2g + P ]X = 3g = 1
이므로, 분포함수 F(x)는 다음과 같이 주어진다.
1
5
6
1
2
O 1 2 3 x
답 풀이 참조
1. 확률분포 243
이산확률변수의 기댓값
03 (평균), 분산, 표준편차
학습 목표
• 이산확률변수의 기댓값, 분산, 표준편차의 뜻을 이해하고 이를 구할 수 있다.
X x1 x2 x3 g xn 합계
P ]X = x ig p1 p2 p3 g pn 1
이때,
n
x1 p1 + x2 p2 + g + xn pn = {x p i i
i=1
이산확률변수 X 의 기댓값(평균)
이산확률변수 X 의 확률질량함수가 P ]X = x ig = p i ]i = 1, 2, g, ng
일 때, X 의 기댓값(평균)은
E ]X g = x 1 p 1 + x 2 p 2 + g + x n p n =
n
{x p i i 이다.
i=1
P ]X = xg
5 C3 10 3 C1 : 5 C2 30 3 C2 : 5 C1 15 3 C3 1
= = = = 1
8 C3
56 8 C3
56 8 C3
56 8 C3 56
244 Ⅵ 통계
따라서 X 의 기댓값은
E ]X g = 0 :
10 30 15 1 9
+1: +2: +3: =
56 56 56 56 8
답 풀이 참조
문제 1 이산확률변수 X 의 확률질량함수가
P ]X = xg = kx , ]x = 1, 2, 3, 4, 5g
일 때, X 의 기댓값을 구하라.
이산확률변수 X 의 확률질량함수를
P ]X = x ig = p i ]i = 1, 2, g, ng
라고 하고, X 의 기댓값(평균)을 E ]X g = m 이라고 하면 ]X - mg2 의 평균, 즉
E "]X -
E[(X -m g22,]= ]x 1 - mg2 p 1 + ]x 2 - mg2 p 2 + g + ]x n - mg2 p n
m)
{ ]x - mg2 p i
n
= i
i=1
P ]X = x ig = p i ]i = 1, 2, g, ng
이고 E ]X g = m 일 때,
X 의 분산은
i
i=1
이고, X 의 표준편차는
v ]X g = V ]X g
이다.
1. 확률분포 245
이산확률변수 X 의 확률질량함수가
P ]X = x ig = p i ]i = 1, 2, g, ng
이고 E ]X g = m 일 때, X 의 분산을 다음과 같이 구하면 편리하다.
V ]X g = { ]x - mg2 p i
n
i
i=1
n n n
= {x 2
i p i - 2m
{ xi pi + m 2
{p i
i=1 i=1 i=1
= {x 2
i p i - 2m + m
2 2
i=1
= E ]X g - 6E ]X g@2
2
즉,
V ]X g = E ]X g - 6E ]X g@2
2
이다.
댓값 E ]X g 와 V ]X g 을 구하라.
2
풀이 E ]X g 를 구하면
E ]X g = 0 # 0.2 + 1 # 0.5 + 2 # 0.3 = 1.1
이고, E ]X g = 0 # 0.2 + 1 # 0.5 + 4 # 0.3 = 1.7 이다.
2
246 Ⅵ 통계
풀이 확률변수 X 의 기댓값은
E ]X g = { x : P ]X = xg = { x : p ]1 - pg
3 3
x-1
x=1 x=1
{ x : p ]1 - pg
n
x-1
Sn =
x=1
]1 - pg S n = { x : p ]1 - pg
n
x
x=1
-np ]1 - pgn
이고, 이다.
이므로
1
E (X) = nlim
"3
SSn = p
1
S답= p
X x1 x2 x3 g xn 합계
P ]X = x ig p1 p2 p3 g pn 1
Y ax 1 + b ax 2 + b ax 3 + b g ax n + b 합계
P ]Y = y ig p1 p2 p3 g pn 1
E ]Y g = aE]]ax
X gi + bg p i = a { x i p i + b { p i
n n n n
{y p i i ={
=
i=1 i=1 i=1 i=1
1. 확률분포 247
V ]Y g = { 6y - E ]Y g@2 p i
n
i
i=1
= i
i=1
= a 2 { 6x i - E ]X g@2 p i
n
i=1
= a V ]X g
2
v ]Y g = V ]Y g = a V ]X g = a v ]X g
2
❷ V ]aX + bg = a V ]X g
2
❸ v ]aX + bg = a v ]X g
-2X + 5
풀이
E ]-2X + 5g = -2 E ]X g + 5 = -5
V ]-2X + 5g = ]-2g2 V ]X g = 80
답 평균 -5, 분산 80
MEMO
248 Ⅵ 통계
이항분포
04 학습 목표
• 이항분포를 이해하고, 이를 활용할 수 있다.
이항분포
한 번의 시행에서 사건 A 가 일어날 확률이 p 로 일정할 때, n 번의 독립시행에
서 사건 A 가 일어나는 횟수를 X 라고 하면 X 는 0 , 1 , 2 , g , n 의 값을 가지
는 이산확률변수이다.이때 독립시행의 정리에 의하여 확률변수 X 의 확률질량함
수는
P ]X = xg = n C x p ]1 - pgn - x (단, x = 0, 1, 2, g, n )
x
고 할 때, 다음을 구하라.
(1) 확률변수 X 의 확률질량함수 (2) P ]X = 2g
풀이
1
(1) 한 개의 주사위를 4 번 던져서 1 또는 3 의 눈이 나올 확률은 이므로 확률변수 X
3
는 이항분포 B b 4,
1l
을 따른다. 따라서 확률변수 X 의 확률질량함수는
3
1 x 2 4-x ]
P ]X = xg = 4 C x b l b l x = 0, 1, 2, 3, 4g
3 3
(2) P ]X = 2g = 4 C 2 b 1 l b 2 l 8
2 4-2
=
3 3 27
-]X
답 (1) P ]X = xg = n C x p ]1 P pgn= 2]gx= 0,21b, 2,l3b, 4gl
-xx 1 2
2 4-2
8
=4 C =
(2)
3 3 27
3 명일 확률을 구하라.
1. 확률분포 249
이제 확률변수 X 가 이항분포 B ]n, pg 를 따를 때, 평균과 분산을 구해 보자.
확률변수 X 가 이항분포 B ]n, pg 를 따를 때,
P ]X = xg = n C x p ]1 - pgn - x (단, x = 0, 1, 2, g, n )
x
E ]X g = C x p ]1 - pgn - x
n
{ x: n
x
x=1
여기서
n! ]n - 1g !
x! ]n - xg ! ]x - 1g ! ]n - xg !
x : n Cx = x : = n:
]n - 1g !
]x - 1g ! "]n - 1g - ]x - 1g, !
= n:
= n : n-1 Cx-1
이므로
E ]X g = C x - 1 p ]1 - pgn - x
n
{ n: n-1
x
x=1
]1 - pg]n - 1g-]x - 1g
n
= np : { n-1 Cx-1 p
x-1
x=1
=np{ p + (1 - p)}n-1 = np
또한
E ]X g = : n C x p ]1 - pgn - x
n
2
{x 2 x
x=1
{ "x ]x - 1g + x, : C x p x ]1 - pgn - x
n
= n
x=1
2
{ x ]x - 1g : C x p x ]1 - pgn - x + C x p x ]1 - pgn - x
n n
= n { x: n
x=2 x=1
{ x ]x - 1g : C x p x ]1 - pgn - x + E ]X g
n
= n
x=2
여기서
x ]x - 1g : n C x p ]1 - pgn - x = n ]n - 1g p : n - 2 C x - 2 p ]1 - pgn - x
x 2 x-2
이므로
{ x ]x - 1g : C x p ]1 - pgn - x
n
x
n
2
x=1
= n ]n - 1g p : ]1 - pg
n n-x
2
{ n-2 Cx-2 p
x-2
x=2
250 Ⅵ 통계
이항분포의 평균, 분산, 표준편차
확률변수 X 가 이항분포 B ]n, pg 를 따를 때,
❶ E ]X g = np
❷ V ]X g = np ]1 - pg
❸ v ]X g = np ]1 - pg
{ ]x - 2xg : 20 C x b l
20
2 1 20
x=0 2
의 값을 구하라.
P ]X = xg = 20 C x b l b l = 20 C x b l
1 x 1 20 - x 1 20
2 2 2
이고, X 의 평균과 분산은 각각
E ]X g = np = 20 :
1
= 10
2 ,
V ]X g = np ]1 - pg = 20 :
1 1
: =5
2 2
이다. 또한
E ]X g = V ]X g + 6E ]X g@2 = 105
2
이다. 이제
{ ]x - 2xg : 20 C x b l = : 20 C x b l - 2 { x : 20 C x b l
20 20 20
1 20 1 20 1 20
2
2
{x 2
2 2
x=0 x=0 x=0
= E ]X g - 2 E ]X g
2
= 105 - 2·10 = 85
답 85
1. 확률분포 251
이항분포 B ]n, pg 에서 n 의 값이 커지면 확률분 n 10 30 50
P(X=0) 0.1615 0.0042 0.0001
포의 그래프는 어떤 모양이 되는지 알아보자.
P(X=1) 0.3230 0.0253 0.0011
한 개의 주사위를 n 번 던질 때, 2 의 눈이 나오 P(X=2) 0.2907 0.0733 0.0054
P(X=3) 0.1550 0.1368 0.0172
는 횟수를 X 라고 하자. 확률변수 X 는 이항분포 P(X=4) 0.0543 0.1847 0.0405
P ]X # 3g = P ]X = 0g + P ]X = 1g + P ]X = 2g + P ]X = 3g
= 0.0001 + 0.0011 + 0.0054 + 0.0172
= 0.0238
이다.
답 0.0238
이용하여 구하라.
252 Ⅵ 통계
큰수의 법칙
05 학습 목표
• 큰수의 법칙을 이해하고 이를 활용할 수 있다.
P ]X = xg = nnnC xxx b l b l ]x = 0, 1, 2, 3, g, ng
x n-x
1 xx 5 nn--xx
6 6
위의 표에서 n = 10, 30, 50 일 때, P ]X = xg 의 근삿값을 알 수 있다.
이때, 시행의 횟수 n 이 커짐에 따라 1 의 눈이 나오는 상대도수 X 와 수학적 확
n
의 차가 0.1 보다 작을 확률 P d n - < 0.1 n 이 시행 횟수 n 이 커질 때
1 X 1
률
6 6
어떻게 변화하는지 알아보자.
Pd n - < 0.1 n = P b -
X 1 1 X 1 1 l
< n - <
6 10 6 10
= Pb
n 4n l
<X<
15 15
이므로, 위의 표에 의해 다음이 성립한다.
(ⅰ) n = 10 일 때,
= 0.7835
(ⅲ) n = 50 일 때,
Pd < 0.1 n = P b = { P ]X -
= kkgg
X 1 10 40 l 7
13
- <X<
n = 10
50 6 3 3 k=3 4
= 0.9455
1. 확률분포 253
수록 확실해진다. 이 사실로부터 충분히 많은 시행을 하게 되면 0.1 뿐만이 아니고
0.01 , 0.001 , g 로 바뀌어도 성립하리라는 예측이 가능하다.
큰수의 법칙
매회의 시행에서 A 가 일어날 확률이 p 일 때, n 번의 독립 시행에서 사건 A 가 일
어나는 횟수를 X 라고 하면, 임의의 양수 h 에 대하여
limP c n - p < h m = 1
X
n"3
이다.
큰수의 법칙에 의하여 상대도수의 극한값인 통계적 확률은 수학적 확률과 같음을
알 수 있다. 또한 수학적 확률을 구하기 곤란할 때, 충분히 큰 자연수 n 에 대하여
상대도수 X 를 그 사건의 확률로 사용할 수 있다.
n
풀이 n = 30 이면
문제 1 앞의 표를 이용하여 n = 50 일 때,
Pd n - < 0.05 n
X 1
6
의 값을 구하고, 예제 1의 결과와 비교하라.
254 Ⅵ 통계
연속확률변수와 확률밀도함수
06 학습 목표
• 연속확률변수를 이해한다.
• 확률밀도함수의 뜻을 알고 이를 활용할 수 있다.
확률밀도함수의 성질
연속확률변수 X 가 구간 6a, b@ 에 속하는 모든 실수 값 P (a # X # b)
❶ f ]xg $ 0
f ]xg dx = 1
aa bb x
#
b
❷
a
❸ a # a # b # b & P ]a # X # bg = # f ]xg dx
b
P ]X = ag = # f ]xg dx = 0
a
이다. 따라서
P ]a # X # bg = P ]a # X < bg + P ]X = bg = P ]a # X < bg
이고, 마찬가지로
P ]a # X # bg = P ]a # X < bg =
= PP]]aa <
<X < bg = P ]a < X < bg
X#
이 성립한다.
1. 확률분포 255
예제 1 연속확률변수 X 의 확률밀도함수가 f ]xg = kx ]1 # x # 3g 일 때,
P ]1 # X # 2g 을 구하라.
f ]xg dx = kxdx = : x D = 4k
k 23
# #
3 3
1=
1 1 2 1
1
이므로 k =
4
따라서 P ]1 # X # 2g = # x 3
2
dx = 이다.
1 4 8
P ]1 # X # 2g =
x 답 3
#
2
dx =
1 4 8
❶ E ]X g = # xf ]xg dx
b
v]X g =
❸a V ]X g 이다.
256 Ⅵ 통계
# ]x 2 - 2mx + m 2g f ]xg dx
b
=
a
= E ]X g - 2m + m
2 2 2
= E ]X g - 6E ]X g@2
2
답 풀이 참조
풀이 연속확률변수 X 의 평균은
E ]X g = xf ]xg dx = x dx = : x D
1 2 1 41
# #
b 1
x:
a -2 3 12 -2
5
=-
4
이고,
E ]X g = x dx = : x D
1 2 1 51
#
2 1 2
x :
-2 3 15 -2
1 + 32 11
=
15 5
이므로 연속확률변수 X 의 분산은
V ]X g = E ]X g - 6E ]X g@2 = - b- l
2 11 5 2
5 4
51
=
80
이다.
답 풀이 참조
MEMO
1. 확률분포 257
정규분포
07 학습 목표
• 정규분포를 이해하고 이를 활용할 수 있다.
2r v
N _ m, v i
2
]x - mg
f ]xg =
1 -
2
2r v
e 2v 2
2r v
258 Ⅵ 통계
f(x) f(x)
1 m=0
3 2 2
m=2 v= 3
2rv m=5 2 2r 3
1
2r
1 v=1
2 2r v=2
O 2 5 x O 2 4 6 8 10 x
[그림 1] [그림 2]
1
(2) x = m 일 때 최댓값 을 갖는다.
2r v
(3) 이 곡선과 x 축 사이의 넓이는 1 이다. 즉,
# f ]xg dx = 1 이다.
3
-3
F ]xgF=
](2)
g P(2
xP ]X P#]X
= xg# 7)
X xg m + 1.5v 0.4332
풀이
(1) P ]X $ 3g = P b X $ 4 - : 2l
1
2
= P ]X $ m - 0.5 : vg
= 0.5 + P ]m # X # m + 0.5 : vg
= 0.5 + 0.1915 = 0.6915
F ]xg = ]xPgP(2
F(2) ]=
X# P ]X
xg # 7)=
xg P(4 - 2 ≤ X ≤ 4 + 1.5•2)
= P ]m - v # X # m + 1.5•v)
2 : vg
= P ]m # X # m + vg + P ]m # X # m + 1.5•v)
2 : vg
= 0.3413 + 0.4332 = 0.7745
1. 확률분포 259
확률변수 X 가 정규분포 N _m, v 2i 을 따르
P ]m # X # ag
문제
1
a
고, P ]X $ 55g = P ]X # 65g , m + 0.5v 0.1915
E ]X g = 3616 을 만족한다. 오른쪽 표를 이용하여
2
m+v 0.3413
X-m
Z= v
는 표준정규분포 N ]0, 1g 을 따른다.
확률변수의 표준화
확률변수 X 가 정규분포 N _m, v 2i 을 따를 때,
N ]0, 1g 을 따른다.
❶ 확률변수 Z =
X - m 은 표준정규분포
v
❷ P ]a # X # bg = P b
a-m b-ml
v #Z# v
P ]0 # Z # ag 는
P ]0 # Z # ag =
2
1 - z2
#
a
e dz
0 2r
O a z
이고 오른쪽 그림에서 색칠된 부분의 넓이와 같다.
260 Ⅵ 통계
확률변수 Z 가 표준정규분포 N ]0, 1g 을 따를 z 0.00 … 0.06 …
때, 확률 P ]0 # Z # ag 는 부록에 있는 표준정
…
규분포표를 이용하여 구할 수 있다. 예를 들어, 1.4 0.4279
확률 P ]0 # Z # 1.46g 은 표준정규분포표의 왼
…
쪽에 있는 수의 열에서 1.4 를 찾은 다음 위쪽에
있는 수의 행에서 0.06 을 찾아 행과 열이 만나는 곳의 수를 찾으면 된다. 즉,
P ]0 # Z # 1.46g = 0.4279
이다.
E ]Z g = E b = v E ]X g - v = 0
풀이
X-ml 1 m
v
답 풀이 참조
풀이 f(z)
= P ]-1.65 # Z # 0g + P ]0 # Z # 1.24g
= P ]0 # Z # 1.65g + P ]0 # Z # 1.24g
= 0.8430
-1.65 O 1.24 z
답 풀이 참조
을 구하라.
1. 확률분포 261
확률변수 X 가 정규분포 N _m, v i 을 따를 때,
2
X - m 은 표준정규분포 N ]0, 1g 을 따르
Z= v
f(x)
므로 다음을 알 수 있다.
P ]m - v # X # m + vg = P ]-1 # Z # 1g
m-2v m m+2v x
= 2 P ]0 # Z # 1g = 2 # 0.3413 m-3v m-v m+v m+3v
= 0.6826 ]] 68.3%g
68.3%
95.4%
99.7%
같은 방법으로
P ]m - 2v # X # m + 2vg = 0.9544 ]] 95.4%g
P ]m - 3v # X # m + 3vg = 0.9974 ]] 99.7%g
임을 알 수 있다.
풀이 X - m 라고 하면
Z= v
P ]m - kv # X # m + kvg = 0.9902 에서
답 풀이 참조
MEMO
262 Ⅵ 통계
이항분포와 정규분포의 관계
08 학습 목표
• 이항분포와 정규분포의 관계를 이해하고 이를 활용할 수 있다.
O 5 10 15 20 x O x
[그림 3] [그림 4]
이항분포와 정규분포의 관계
확률변수 X 가 이항분포 B ]n, pg 를 따르고 n 이 충분히 클 때, X 는 근사적으로
2.5 0.4938
1. 확률분포 263
풀이 450 회의 시행에서 3 의 배수의 눈이 나오는 횟수를 확률변수 X 라고 하면
X 는 이항분포 B b 450,
1 l 을 따른다.
3
따라서 평균 m 과 표준편차 v 는
1 1 2
m = 450 # = 150 , v = 450 # # = 10
3 3 3
n 이 충분히 크므로 X 는 정규분포 N _150, 10 2i 을 따른다. 따라서 구하는 확률은
P ]130 # X # 170g = P b
130 - 150 170 - 150 l
#Z#
10 10
= P ]-2 # Z # 2g = 2 P ]0 # Z # 2g
= 2 # 0.4772 = 0.9544
답 0.9544
문제
1 어떤 회사의 제품 가운데 10% 가 불량품이라고 한다. 이 제품 10000 개 가운데
N b 180 # , 180 # # l
1 1 5
6 6 6
을 따른다. 즉, X 는 정규분포 N _30, 5 i 을 따르므로,
2
P ]X # 20g = P b = P ]Z # -2g
X - 30 20 - 30 l
#
5 5
= 0.5 - P ]0 # Z # 2g = 0.0228
답 풀이 참조
264 Ⅵ 통계
중단원 평가
P ]X = 0g =
1 ]
P X = 1g
5
일 때, E ]7X + 1g 와 V ]-5X - 2g 의 값을 구하라. (단, 0 < p < 1 )
P ]X = xg
같을 때, 다음을 구하라. a
a a
2
1
2
(1) E ]X g
2n
(2) V ]X g
Cx b l b l
170 450 -x
1x
2 k
{ 450 3 3
0.75 0.2734
x = 140 1.00 0.3413
의 값을 구하라. 1.25 0.3944
1.50 0.4332
2.00 0.4772
1. 확률분포 265
7 P ]0 # Z # zg
한 개의 주사위를 180 번 던질 때, 5 가 나온 횟수를 확률변수 z
X 라 하자. 오른쪽 표준정규분포표를 이용하여 1 0.3413
P ]X # kg = 0.0228 를 만족시키는 상수 k 의 값을 구하라. 2 0.4772
3 0.4987
(1) 이
시행을 1 회 할 때, 꺼낸 구슬 중에서 붉은 구슬의 수
를 X 라 하자. X 의 확률질량함수를 구하고 평균과 분
산을 구하라.
(2) 이
시행을 독립적으로 5 회 반복할 때, 붉은 구슬이 2 개 미만 포함된 경우가 일어난 횟수
를 Y 라 하자. Y 의 확률분포와 평균 E ]Y g 를 구하라.
266 Ⅵ 통계
2
통계적 추정
01 모집단과 표본
02 모평균과 표본평균
03 모평균의 추정
04 모비율과 표본비율
05 모비율의 구간추정
06 가설검정
생각 열기
한 개의 주사위를 180 번 던져서 4 의 배수의 눈이 나오는 횟수를 확률변수 X 라 하자. 다음에
답하라.
(1) X 의 평균과 표준편차를 구하라.
구하라.
(3) 한 개의 주사위를 180 번 던져서 4 의 배수의 눈이 나오는 횟수가 37 회였다면 이 주사위에
서 4 의 배수의 눈이 나올 확률이 1 이라고 할 수 있는지 생각해 보라.
6
2. 통계적 추정 267
모집단과 표본
01 학습 목표
• 모집단과 표본의 뜻을 안다.
268 Ⅵ 통계
모집단의 평균, 분산, 표준편차를 각각 모평균, 모분산, 모표준편차라 부르고,
이와 같이 모집단의 특징을 나타내는 값을 모수라고 한다.
모수의 참값은 전수조사를 하지 않는 한 알 수 없는 값이다. 따라서, 우리는 이러
한 값을 표본 자료를 이용하여 추정하고자 한다. 이때, 표본의 값을 사용하여 계산
될 수 있는 값을 통계량이라 하고, 통계량의 확률분포를 표본분포라고 한다.
x 0 1 2 합계
X2 X1 0 1 2 합계
X1 + X2 0 1 2 3 4 합계
답 풀이 참조
X1 + X2
대하여 의 확률분포를 구하라.
2
x 1 2 3 합계
2. 통계적 추정 269
모평균과 표본평균
02 학습 목표
• 모평균과 표본평균의 관계를 이해할 수 있다.
X = n ]X 1 + X 2 + g + X ng
1
1 #
_X 1 - X i + _X 2 - X i + g + _X n - X i -
2 2 2 2
S =
n-1
을 각각 표본평균, 표본분산이라 하고, S ]$ 0g 를 표본표준편차라고 한다.
X 1 2 3 합계
P ]X = xg
1 1 1
1
3 3 3
2
이때, X 의 모평균 m 과 모분산 v 을 구하면 P(X=x)
1 1 1 1
m = 1# +2# +3# = 2 3
3 3 3
2 2 1 2 1 2 1 2 2
v =1 # +2 # +3 # -2 =
3 3 3 3
이다. O 1 2 3 x
270 Ⅵ 통계
X 1 1.5 2 2.5 3
]1, 3g
]1, 2g ]2, 3g
]1, 1g ]2, 2g ]3, 3g
]2, 1g ]3, 2g
경우
]3, 1g
X 1 1.5 2 2.5 3 합계
P ]X = x g
1 2 3 2 1
9 1
9 9 9 9
V ]X g = 1 #
2 1 2 2 2 1 2 1
+ 1.5 # + g + 3 # - 2 =
9 9 9 3
1
따라서 표본평균 X 의 평균은 2 로 모평균 2 와 같고, 표본평균 X 의 분산
3
2
은 모분산 를 표본의 크기 2 로 나눈 것과 같다.
3
일반적으로 다음과 같은 성질이 성립한다.
표본평균의 성질과 분포
모평균 m , 모표준편차 v 인 모집단에서 크기가 n 인 표본을 임의추출할 때,
❶ E ]X g = m , V ]X g = , v ]X g =
2
v v
n n
n
따른다.
정규분포 N c m,
v m 에 가까워진다.
2
2. 통계적 추정 271
이 이론을 중심극한정리(Central Limit Theorem)이라고 한다.
이를 표준화시키면
X-m
v
n
(2) P ]X $ 51g
풀이
E ]X g = 50 , V ]X g = =b l
4 2 2
25 5
P ]X $ 51g = P Z $ ] g
51 - 50
f 2 p = P Z $ 2.5
5
272 Ⅵ 통계
모평균의 추정
03 학습 목표
• 구간추정의 뜻을 알고 모평균에 대한 구간추정을 할 수 있다.
1 n
X = n { Xi
i=1
X-m
Z= v
n
2. 통계적 추정 273
이므로
가 된다. 이를 정리하면
P c X - 1.96 m = 0.95
v v
# m # X + 1.96
n n
;X - 1.96 E
v v
, X + 1.96
n n
를 모평균 m 에 대한 신뢰도 95% 의 신뢰구간이라고 한다.
마찬가지로, P ]-2.58 # Z # 2.58g = 0.99 이므로 모평균에 대한 신뢰도 99%
의 신뢰구간은 다음과 같다.
;X - 2.58 E
v v
, X + 2.58
n n
모평균 m 의 신뢰구간
_X
x -Xi
1 n
S2 = {
n - 1 i = 1 ii
2
를 사용할 수 있다.
274 Ⅵ 통계
3
예제 1 하천의 오염도 조사를 위해 하천 밑바닥에서 각각 1000 cm 의 침전물 25
표본을 채취하여 납의 밀도를 조사하였더니 평균과 표준편차가 각각 0.38, 0.06 으로 나
타났다. 납의 평균 밀도에 대한 99% 신뢰구간을 추정하라.
v 0.06
풀이 X = 0.38 , = = 0.03 이므로
n 5
신뢰도 99% 의 모평균에 대한 신뢰구간은
MEMO
2. 통계적 추정 275
모비율과 표본비율
04 학습 목표
• 모비율과 표본비율의 관계를 이해할 수 있다.
tp = X
n
과 같이 나타내고, 이 표본비율을 모비율의 점추정량으로 사용한다.
X
표본비율 tp = n 에서 확률변수 X 는 크기가 n 인 표본에서 어떤 특성을 가진
것이 추출된 횟수이므로 확률변수 X 가 가질 수 있는 값은 0 , 1 , 2 , g , n 이고,
E ]tpg = E a n k = n E ]X g = n : np = p
X 1 1
p ]1 - pg
V ]tpg = V a n k = 2 V ]X g = 2 : np ]1 - pg =
X 1 1
n n n
p ]1 - pg
v ]tpg = V ]tpg = n
일반적으로 표본의 크기 n 이 충분히 클 때, tp 의 분포는 근사적으로 정규분포
p ]1 - pg m
N c p, n 를 따르는 것으로 알려져 있으므로, 표준화된 확률변수
276 Ⅵ 통계
tp - p
p ]1 - pg
Z=
n
는 근사적으로 표준정규본포 N ]0, 1g 을 따른다.
따라서 표본비율 tp 의 분포를 정리하면 다음과 같다.
표본비율 tp 의 분포
표본의 크기 n 이 충분히 클 때, 표본비율 t
p 은 근사적으로 정규분포
p ]1 - pg m
N c p,
tp - p
p ]1 - pg
를 따르고 Z = 는 근사적으로 표준정규분포
n
n
N ]0, 1g 을 따른다.
p ]1 - pg m
풀이 p = 0.9, n = 100 이고, tp 는 근사적으로 정규분포 N c p, n
을 따른다.
주어진 조건으로부터
p ]1 - pg 0p.]09
1 - pg
V ]tpg = n ]pg = V ]tpg = , v ]t g=
t =00.9.9, : 0.1 0.90.:
3 0.1 0.09
E p= = 0=.03
100 100n 100
10 100
이다.
그러므로
tp - p
P b tp $
85 l
= P f pq $
0.03 p
0.85 - 0.9
100
n
= P ]Z $ -1.67g = 1 - P ]Z $ 1.67g = 1 - ]0.5 - 0.4525g = 0.9525
이다.
95.85
따라서 씨앗 100 개를 땅에 심을 때, 25% (또는 개) 이상 발아할 확률은 95.25% 이다.
답 풀이 참조
2. 통계적 추정 277
모비율의 구간추정
05 학습 목표
• 구간추정의 뜻을 알고 모비율에 대한 구간추정을 할 수 있다.
p ]1 - pg p ]1 - pg n
= P d tp - 1.96 n # p # tp + 1.96 n = 0.95
따라서 모비율 p 가 구간
<tp - 1.96 p ]1 - pg p ]1 - pg F
n , tp + 1.96 n
에 속할 확률은 0.95 이다.
이때, 큰수의 법칙에 의하여 표본의 크기 n 이 커지면서 표본비율 tp 은 모비율 p
에 가까워지므로, 모르는 p 의 값 대신 모집단으로부터 실제로 얻은 표본비율의 값
을 택하면 다음과 같은 구간으로 근사할 수 있다.
tp ]1 - tpg tp ]1 - tpg
;tp - 1.96 , tp + 1.96 E
n n
이 구간을 모비율 p 에 대한 신뢰도 95% 의 신뢰구간이라고 한다.
마찬가지로 P ]-2.58 # Z # 2.58g = 0.99 이므로, 모비율 p 에 대한 신뢰도
99% 의 신뢰구간은 다음과 같다.
tp ]1 - tpg tp ]1 - tpg
;tp - 2.58 , tp + 2.58 E
n n
모집단에서 크기가 n 인 표본을 임의추출하면 추출되는 표본에 따라 표본비율의
278 Ⅵ 통계
값이 달라지고 그에 따라 신뢰구간도 달라진다. 이렇게 해 p1
p2
서 구한 신뢰구간 중에는 오른쪽 그림과 같이 모비율을 포함
p3
하는 것과 포함하지 않는 것이 있을 수 있다. p4
모비율 p 에 대한 신뢰도 95% 의 신뢰구간이라는 말은
.
.
크기가 n 인 표본의 추출을 되풀이하여 신뢰구간을 구하는 .
.
.
모비율의 신뢰구간
모집단에서 크기 n 인 표본으로부터 구한 표본비율의 값이 t
p 일 때, n 이 크면
모비율 p 에 대한 신뢰도 95% , 99% 의 신뢰구간은 각각 다음과 같다.
❶ 신뢰도 95% : ;t
tp ]1 - tpg tp ]1 - tpg
p - 1.96 , tp + 1.96 E
n n
tp ]1 - tpg tp ]1 - tpg
❷ 신뢰도 99% : ;t
p - 2.58 , tp + 2.58 E
n n
95% 의 신뢰구간은
답 풀이 참조
2. 통계적 추정 279
가설검정
06 학습 목표
• 가설검정의 뜻과 절차를 알고 이를 활용할 수 있다.
가설검정의 원리
통계적 추론 중에는 앞에서 다룬 모수의 추정 이외에 어떤 추측이나 가설의 타당
성을 조사하는 가설검정의 문제가 있다.
어떤 수학적인 추측이나 주장을 검정하기 위하여 이를 수학적으로 증명하든지 또
는 반례를 들어 부정하면 된다. 이때, 얻어진 결론은 100% 의 확신도를 가진다.
한편, 모수에 대한 예상이나 주장 또는 단순한 추측 등을 통계적 가설이라고 한
다. 통계적 가설은 항상 오류의 가능성을 가지고 있으며, 이들의 옳고 그름을 판정
하는 과정을 통계적 가설검정 또는 간단히 검정이라고 한다.
280 Ⅵ 통계
가설검정의 절차는 모집단으로부터 표본을 뽑아 H 0 와 H 1 중 어느 것이 참인지
를 판정하는 과정이다. 여기서 표본의 결과를 보고 특정 가설이 참이라고 판정하는
것을 그 가설을 채택한다고 하며, 거짓이라고 판정하는 것을 그 가설을 기각한다고
한다.
가설검정은 입증하고자하는 가설을 뒷받침할 만한 뚜렷한 증거가 표본에서 나타
나는지를 보는 것으로, 뚜렷한 증거가 나타나지 않으면 기존의 이론 또는 주장이 그
대로 통용되게 되므로 귀무가설을 위주로 하여 ‘ H 0 을 채택한다’ 또는 ‘ H 0 를 기각한
다’라는 방식으로 표현하는 것이 일반적이다.
가설검정의 방법
[단계1] 검정하고자 하는 목적에 따라서 귀무가설 H 0 과 대립가설 H 1 을 설정한다.
설 H 0 을 채택한다.
MEMO
2. 통계적 추정 281
모평균에 대한 가설검정
정규분포 N _m, v 2i 을 따르는 모집단에서 크기 n 인 표본을 임의추출하면 표본
X-m
Z= v
n
은 표준정규분포 N ]0, 1g 을 따른다. 모표준편차 v 의 값을 안다고 할 때, 모평균
m 의 가설검정 방법을 알아보자.
1. 양측검정
귀무가설과 대립가설이
H0 | m = m0
Y m0
H1 | m =
과 같은 가설검정을 양측검정이라고 부른다. 0.025 0.025
출한 크기 n 인 표본의 표본평균을 X 라 할 때,
f p
X - m0
P -1.96 # v # 1.96 = 0.95
n
이다. 이 식을 변형하면
이므로
X - m0
Z = v $ 1.96
n
282 Ⅵ 통계
인 영역을 유의수준 5% 의 양측검정의 기각역이라고 한다. 즉, 양측검정은 기각역
이 양쪽으로 주어진다.
2. 단측검정
귀무가설과 대립가설이
H0 | m = m0
H1 | m < m0
또는
H0 | m = m0
H1 | m > m0
균을 X 라 할 때, 표준정규분포표에 의해
또는
즉,
P(Z ≥ 1.645) = 0.05 또는 P(Z ≤ -1.645) = 0.05
이고, 이 영역을 유의수준 5% 의 단측검정의 기각역이라고 한다. 즉, 단측검정은
기각역이 한쪽으로만 주어진다.
0.05 0.05
-1.645 1.645
기각역 기각역
2. 통계적 추정 283
모평균의 가설검정 방법
정규분포 N _m, v i 을 따르는 모집단에서 크기 n 인 표본을 임의추출하여 구한
2
X - m0
❷ Z = 의 값을 구한다.
v/ n
❸ ⒤ 유의수준 5% 에서는 다음의 경우 H 0 를 기각한다.
284 Ⅵ 통계
조건에서 m 0 = 100 , n = 100 , x = 100.64 , v = 5 이므로
100.64 - 100
Z = = 1.28
5
100
우에 해당된다. 따라서
답 풀이 참조
지 유의수준 5% 로 가설검정하라.
모비율에 대한 가설검정
모비율이 p 인 모집단에서 크기 n 인 표본을 임의추출한다고 하자. 이때 표본의
크기 n 이 크면, 표본비율 tp 은 근사적으로 정규분포
p ]1 - pg m
N c p, n
를 따르므로
tp - p
p ]1 - pg
Z=
n
는 근사적으로 표준정규분포 N ]0, 1g 을 따른다.
2. 통계적 추정 285
모비율의 가설검정
표본의 크기를 n , 표본비율을 t
p , 모비율을 p 라 하면, 모비율 p 의 가설검정 방
법은 다음과 같다.
n
❸ (i) 유의수준 5% 에서는 다음의 경우 H 0 를 기각한다.
모비율의 양측검정은
H0 | p = p0
Y p0
H1 | p =
와 같이 가설을 세우고 모비율의 단측검정은
H0 | p = p0
H1 | p < p0
또는
H0 | p = p0
H1 | p > p0
와 같이 가설을 세운다.
286 Ⅵ 통계
예제 3 어떤 동전을 네 번 던져서 네 번 모두 앞면이 나왔다고 할 때 이 동전은 앞면이
많이 나오는 동전이라고 볼 수 있는가? 유의수준 5% , 10% 로 각각 검정하라.
풀이
동전의 앞면이 나올 확률을 p 라 하면, 일반적인 동전의 앞면이 나올 확률은 0.5 이므로
H 0 | p = 0.5
H 1 | p > 0.5
와 같이 나타낼 수 있다.
확률은 b l =
1 4 1
즉, 6.25% 이다.
2 16
유의수준 5% 에서는 6.25% > 5% 이므로 H 0 를 채택하고 이 동전은 앞면이 많이
나오는 동전이라고 볼 수 없다.
한편, 유의수준 10% 에서는 6.25% < 10% 이므로 H 0 를 기각하고 이 동전은 앞면이
많이 나오는 동전이라고 볼 수 있다.
답 풀이 참조
MEMO
2. 통계적 추정 287
중단원 평가
288 Ⅵ 통계
4 어느 대학교 수험생 중에서 100 명의 답안지를 임의추출하여 채점하였더니 평균 58 점, 표준
편차 10 점이었다. 다음 물음에 답하라.
(1) 수험생 전체의 평균에 대한 신뢰도 95% 의 신뢰구간을 구하라.
뢰도 95% 로 수험생 전체의 평균과 표본평균과의 차를 1 점 이하로 추정할 때 필요한 표
(2) 신
본의 최소 크기를 구하라.
2. 통계적 추정 289
대단원 평가
과 분산을 구하라.
290 Ⅵ 통계
6 숫자 1, 1, 2, 3에서 크기가 2인 표본을 임의추출할 때 뽑힌 숫자의 표본평균 X 의 평균과 분
산을 구하라.
Ⅵ 통계 291