Professional Documents
Culture Documents
Ridpath J C The Life and Work of James A Garfield
Ridpath J C The Life and Work of James A Garfield
통계적 추정
2. 통계적 추정 109
학습 목표 모집단과 표본
•
모집단과 표본의 뜻을 알고, 표본추출
의 원리를 이해한다.
•
표본평균과 모평균의 관계를 이해하고 생각 열기 어느 회사에서 10대가
설명할 수 있다.
선호하는 운동화 색상을 다음 두 가
지 방법 중 하나를 택하여 조사하려
준비 하기
고 한다.
다음 자료의 평균과 표준편차를 구하시오.
⑴ 타이어 수명 조사 ⑵ 병역 판정 검사
⑶ 과일 당도 검사 ⑷ 우리나라 총인구 조사
110 Ⅲ. 통계
2. 통계적 추정 111
0.024 ppm 0.046 ppm 0.091 ppm 0.045 ppm 0.034 ppm
특별한 언급이 없으면 임의 한편, 모집단에서 임의추출한 크기가 n인 표본을 X1, X2, y, X n이라 할 때,
추출은 복원추출로 생각한다.
이들의 평균, 분산, 표준편차를 각각 표본평균, 표본분산, 표본표준편차 라 하며, 이것을
각각 기호로
XÕ, S2, S
와 같이 나타낸다.
112 Ⅲ. 통계
X 2 4 6 8 합계
` 5
여기서 표본평균 XÕ의 평균 5는 모평균 5와 같고, 표본평균 XÕ의 분산 는 모분산
2
d
5를 표본의 크기 2로 나눈 것과 같으므로 다음이 성립한다.
m 5 r2
E(XÕ)=5=m, V(XÕ)= =
2 n
0 Y
;6Á4; ;6£4; ;6¤4; ;6!4); ;6!4@; ;6!4@; ;6!4); ;6¤4; ;6£4; ;6Á4;
(2, 2, 4), (2, 4, 2),
P(XÕ=xÕ) 1
(4, 2, 2)의 3가지이다.
2. 통계적 추정 113
114 Ⅲ. 통계
표본평균의 분포
모평균이 m이고 모표준편차가 r인 모집단에서 크기가 n인 표본을 임의추출할 때, 표본평
균 XÕ에 대하여
r2
1 모집단이 정규분포 N(m, r )을 따르면 XÕ는 정규분포 N{m,
2
}을 따른다.
n
2 모집단의 분포가 정규분포가 아닐 때도 n이 충분히 크면 XÕ는 근사적으로 정규분포
표본의 크기 n이 충분히 r2
N{m, }을 따른다.
크다는 것은 n¾30을 만족 n
할 때이다.
예제 1 어느 고등학교 학생들이 등교할 때 걸리는 시간은 평균이 20분이고 표준편차가
5분인 정규분포를 따른다고 한다. 이 학교 학생 중에서 36명을 임의추출할 때, 등교할 때 걸
리는 시간의 평균이 18분 이상일 확률을 구하시오.
풀이 등교할 때 걸리는 시간이 정규분포 N(20, 52)을 따르므로 36명이 등교할 때 걸리는
52
시간의 평균 XÕ는 정규분포 N{20, }을 따른다.
36
XÕ-20
따라서 확률변수 Z= 은 표준정규분포 N(0, 1)을 따르므로, 구하는 확률은
5
1436
{ }
18-20
P(XÕ¾18)=P Z¾
5
1436
GA [
=P(Z¾-2.4)
=0.5+P(0ÉZÉ2.4)
=0.5+0.4918
0 [
=0.9918
답 0.9918
2. 통계적 추정 115
학습 목표 모평균의 추정
모평균을 추정하고, 그 결과를 해석할
수 있다.
생각 열기 어느 제과점에서 만든 과자 10개
준비 하기
를 임의추출하여 1 개당 당류 함유량을 조사하
U
데, 여론 조사 기관에서는 그 수단으
측하는 것을 추정이라고 한다. 9
로 유권자 전체의 모집단에서 표본
N
N 9
4
을 추출하여 분석하는 조사 방법을 추정
많이 사용한다. 예를 들어 출구 조사
를 통하여 투표 종료 시각과 동시에
당선자를 비교적 정확하게 예측하기
도 한다. 이제 표본평균 XÕ를 이용하여 모평균 m을 추정하는 방법을 알아보자.
이와 같이 모집단에서 추출한 표본
으로부터 얻은 정보를 이용하여 모 정규분포 N(m, r2)을 따르는 모집단에서 크기가 n인 표본을 임의추
집단의 특성을 예측할 수 있다. r2
출하였을 때, 표본평균 XÕ는 정규분포 N{m, }을 따른다.
n
따라서 XÕ를 표준화한 확률변수
XÕ-m
Z=
r
13n
은 표준정규분포 N(0, 1)을 따른다.
116 Ⅲ. 통계
P(-1.96ÉZÉ1.96)=0.95
이므로
{ }
XÕ-m
P -1.96É É1.96 =0.95 0 [
r
13n
이다. 이 식을 변형하면 다음과 같다.
r r
P{XÕ-1.96 ÉmÉXÕ+1.96 }=0.95
13n 13n
r r
이것은 모평균 m이 XÕ-1.96 이상 XÕ+1.96 이하인 범위에 포함될 확률
13n 13n
이 0.95임을 나타낸다.
구간도 달라진다.
오른쪽 그림에서 표본평 이렇게 구한 신뢰구간 중에는 오른쪽 그림과 같이
균 XÕ의 값을 x1Õ, x2Õ, x4Õ 로 N
모평균 m을 포함하는 것과 포함하지 않는 것이 있 Y
계산한 신뢰구간은 m 을 포
Y
함하고, x3Õ, x5Õ 로 계산한 신 을 수 있다.
뢰구간은 m 을 포함하지 않 Ym
는다. 즉, ‘모평균 m의 신뢰도 95 %의 신뢰구간’의 뜻은 Yf
2. 통계적 추정 117
모평균의 신뢰구간
정규분포 N(m, r2)을 따르는 모집단에서 크기가 n인 표본을 임의추출할 때, 표본평균
XÕ의 값이 xÕ이면 모평균 m의 신뢰구간은 다음과 같다.
r r
1 신뢰도 95 %의 신뢰구간 xÕ-1.96 ÉmÉxÕ+1.96
13n 13n
r r
2 신뢰도 99 %의 신뢰구간 xÕ-2.58 ÉmÉxÕ+2.58
13n 13n
예제 1 어느 고등학교 남학생들의 하루 운동 시간은 모평균이 m분이고 모표준편차가 10
분인 정규분포를 따른다고 한다. 이 학교 남학생 중에서 25명을 임의추출하여 하루 운동 시간
을 조사하였더니, 평균이 42분이었다. 이 학교 남학생들의 하루 운동 시간의 모평균 m을 신
뢰도 95 %로 추정하시오.
118 Ⅲ. 통계
생각 문제 해결 | 추론 | 창의·융합 | 의사소통 | 정보 처리 | 태도 및 실천
넓히기
모표준편차가 r인 정규분포를 따르는 어느 모집단에서 표본을 임의추출하여 모평균 m을 추정하였
더니, 모평균 m의 신뢰도 a %의 신뢰구간이 aÉmÉb이었다.
이때 다음 명제의 참, 거짓을 판별하시오.
2. 통계적 추정 119
다음은 생활 속에서 자료를 수집하고 정리하여 통계적 추정을 통해 결과를 분석하는 과정이다.
1 ⑴ 조사 내용 선정
우리 학교 학생들의 스마트폰 사용 실태를
조사 내용과
알아보기 위하여, 전체 학생들의
대상 선정
- 한 달 동안의 스마트폰 데이터 사용량 조사
- 하루 동안의 스마트폰 사용 시간 조사
⑵ 조사 대상 선정
2 우리 학교의 전체 학생 중에서 임의추출한 30명의
설문 조사지 학생을 대상으로 조사한다.
작성 및 조사
실시
4 조사 대상 학생들에 대한 자료 분석을 이용
하여 다음의 모평균을 신뢰도 95 %의 신뢰
통계적 추정을
구간으로 추정한다.
이용한
모평균의 추정 - 우리 학교 전체 학생들의 한 달 동안의
스마트폰 데이터 사용량
- 우리 학교 전체 학생들의 하루 동안의
스마트폰 사용 시간
120 Ⅲ. 통계
중단원 마무리하기
01 다음 조사는 전수조사와 표본조사 중 어느 것이 적
합한지 말하시오.
모집단과 표본
⑴ 전수조사:
조사의 대상이 되는 집단 전체를 조사하는 것 ⑴ 형광등 수명 조사
⑵ 표본조사:
조사의 대상이 되는 집단 전체에서 일부분만
⑵ 어느 고등학교 학생들의 『확률과 통계』 시험의
을 뽑아서 조사하는 것
⑶ 모집단:
조사의 대상이 되는 집단 전체 평균 점수
⑷ 표본:
조사하기 위하여 뽑은 모집단의 일부분
⑸ 임의추출:
모집단에 속하는 각 대상이 같은 확률로 추
출되도록 하는 방법
⑹ 모평균이 m이고 모표준편차가 r인 모집단에서 크기가
n인 표본을 임의추출할 때, 표본평균 XÕ에 대하여
r2 r
1 E(XÕ)=m, V(XÕ)= , r(XÕ)=
n 13n
모집단이 정규분포 N(m, r )을 따르면 XÕ는 정규
02 모평균이 56이고 모분산이 9인 모집단에서 임의추
2
2
r 2
분포 N{m, }을 따른다. 출한 크기가 36인 표본의 표본평균 XÕ의 평균과 분
n
3 모집단의 분포가 정규분포가 아닐 때도 n이 충분히 산 및 표준편차를 구하시오.
r2
크면 XÕ는 근사적으로 정규분포 N{m, }을 따
n
른다.
모평균의 추정
⑴ 추정:
표본으로부터 얻은 자료를 이용하여 모집단의 평 03 정규분포 N(12, 52)을 따르는 모집단에서 크기가
25인 표본을 임의추출할 때, 표본평균 XÕ가 10 이상
균이나 표준편차와 같이 알지 못하는 값을 추측하는 것
⑵ 정규분포 N(m, r )을 따르는 모집단에서 임의추출한
2
14 이하일 확률을 구하시오.
크기가 n인 표본의 표본평균 XÕ의 값이 x Õ 일 때, 모평
균 m의 신뢰구간은 다음과 같다.
1 신뢰도 95 %의 신뢰구간:
r r
x -
Õ 1.96 ÉmÉx +
Õ 1.96
13n 13n
2 신뢰도 99 %의 신뢰구간:
r r
x Õ-2.58 ÉmÉx Õ+2.58
13n 13n
⑶ 모평균의 신뢰구간을 구할 때, n이 충분히 크면 모표준 04 정규분포 N(m, 42)을 따르는 모집단에서 크기가
2. 통계적 추정 121
|서 술 형|
122 Ⅲ. 통계
발 전
12 정규분포 N(m, 42)을 따르는 모집단에서 임의추출한 크기가 m2인 표본의 표본평균
을 XÕ라 하자. 이때 P(m-1ÉXÕÉm+1)=0.9544를 만족시키는 m의 값을 구하
시오. (단, m은 자연수이다.)
2. 통계적 추정 123
01 04
흰 공 4개와 검은 공 6개가 들어 있는 주머니에서 임의로 확률변수 X의 확률분포가 다음 표와 같을 때,
3개의 공을 꺼낼 때, 꺼낸 검은 공의 개수를 확률변수 X E(aX+b)의 값은? (단, a, b는 상수이다.)
라 하자. 이때 P(XÉ2)의 값은?
X 0 1 2 합계
④ ;3@; ⑤ ;6%;
① ;4#; ② 1 ③ ;4%;
④ ;2#; ⑤ ;4&;
02
각 면에 1, 1, 2, 2, 2, 3의 숫자가 각각 하나씩 적힌 정육 05
면체 모양의 주사위가 있다. 이 주사위를 던져서 나온 눈 각 면에 1, 2, 3, 4의 숫자가 각각 하나씩 적힌 정사면체
06
03 어느 농구 선수가 자유투를 성공할 확률은 0.9라고 한다.
확률변수 X에 대하여 E(X)=4, E(X2)=25일 때, 이 선수가 100번의 자유투를 던질 때, 성공한 횟수를 확
r(X)의 값은? 률변수 X라 하자. E(X)+r(X)의 값은?
① 3 ② 4 ③5 ① 90 ② 93 ③ 96
④ 6 ⑤7 ④ 99 ⑤ 102
124 Ⅲ. 통계
08 11
두 확률변수 X와 Y는 각각 정규분포 N(10, 32)과
어느 자격증 시험에서 70점 이상을 받으면 합격이라고 한
2
N(m, 3 )을 따른다. 이때 각각의 확률밀도함수 f (x)와
다. 10000명이 응시한 이 자격증 시험 점수가 평균이 55
g(x)가 다음 조건을 만족시킨다고 한다.
점이고 표준편차가 r점인 정규분포를 따를 때, 합격자 수
가 668명이었다. r의 값을 구하시오.
㈎ P(XÉ10)ÉP(Y¾25)
㈏ f (15)=g(25)
P(YÉ36)의 값을 구하시오.
12
어느 공장에서 생산되는 A 타이어의 수명은 평균이
40000 km이고 표준편차가 2000 km인 정규분포를 따르
고, B 타이어의 수명은 평균이 45000 km이고 표준편차
가 4000 km인 정규분포를 따른다고 한다.
이 공장에서 생산된 A 타이어와 B 타이어 중에서 임의로
13 16
어느 지역의 청소년 음악 콩쿠르 지원자 1000명의 평가 어느 공장에서 생산되는 A 제품의 무게는 정규분포
점수가 평균이 63점이고 표준편차가 20점인 정규분포를 N(m, 22)을 따르고, B 제품의 무게는 정규분포
따른다고 한다. 이 콩쿠르의 예선을 통과한 인원이 242명 N(3m, 42)을 따른다고 한다. 이 공장에서 생산된 A 제
이라 할 때, 예선을 통과할 수 있는 최저 점수를 구하시오. 품과 B 제품 중에서 임의로 4개씩 택할 때, 택한 A 제품
4개의 평균 무게가 k 이상일 확률과 B 제품 4개의 평균
m
무게가 k 이하일 확률이 같다. 의 값은?
k
④ ;5$; ⑤1
14
어느 고속 도로의 하이 패스를 이용하는 차량의 80 %가
승용차라고 한다. 이 고속 도로의 하이 패스를 이용한 차 17
량 400 대 중에서 승용차가 336 대 이상일 확률을 구하 정규분포 N(m, r2)을 따르는 모집단에서 크기가 n인
18
어느 고등학교 학생들의 일 년 독서량은 표준편차가 5권인
126 Ⅲ. 통계
22
어느 지역의 버스 정류장 사이의 거리는 표준편차가
80 m인 정규분포를 따른다. 모평균을 신뢰도 95 %로 추
20 정할 때, 모평균과 표본평균의 차가 39.2 m 이하가 되기
확률변수 X가 이항분포 B(10, p)를 따르고,
위한 표본의 크기의 최솟값을 구하시오.
4
P(X=3)= P(X=4)
5
일 때, E(6X)의 값을 구하시오. (단, p+0)
기평
가
자
문항 번호 성취 기준 성취도 복습
01 19 확률변수와 확률분포의 뜻을 안다. 79 ~ 84쪽
02 03 04 05 이산확률변수의 기댓값(평균)과 표준편차를 구할 수 있다. 86 ~ 91쪽
06 07 20 이항분포의 뜻을 알고, 평균과 표준편차를 구할 수 있다. 92 ~ 96쪽
08 09 10 11 12 13 14 21 정규분포의 뜻을 알고, 그 성질을 이해한다. 97 ~ 104쪽
15 16 표본평균과 모평균의 관계를 이해하고 설명할 수 있다. 110 ~ 115쪽
17 18 22 모평균을 추정하고, 그 결과를 해석할 수 있다. 116 ~ 119쪽
모집단에서 표본을 추출하는 경우에 유의해야 할 점 중에서 중요한 것은 표본의 크기뿐 아니라 표
본의 질(質)일 것이다. 이론적으로는 무작위 표본추출 방법이 표본의 질을 보증하는 가장 좋은 방법
이지만 현실에 적용하기에는 어려움이 있다.
따라서 실용적인 표본추출 방법으로 다음과 같은 것들이 사용된다.
128 Ⅲ. 통계
뿌리가 되는 수학 129