Professional Documents
Culture Documents
chapter2 강의자료
chapter2 강의자료
Chapter02. 생물통계 기본 + R 기초
1
P-value
공이 10 개가 있을 때 , 흰 공과 검은 공의 비율은 ?
내가 주머니에서 뽑은 거
? ? ? 공을 4 개씩 뽑는다고 가정
?
? ?
? ? ? ?
모집단 표본
귀무가설 : 흰공과 검은공의 비율이 5 대 5 다
대립가설 : 흰공과 검은공의 비율이 다르다
2
유의수준
귀무가설 : 대한민국 전체 여성의 평균키는 165 다 .
대립가설 : 대한민국 전체 여성의 평균키는 165 보다 작다
모집단 표본
𝑃 − 𝑣𝑎𝑙𝑢𝑒=𝑃𝑟 ( 𝑋 ≥ ¿ 𝑋 𝐶 ∨¿ 𝐻 0 =𝑇 )
: 내가 얻어낸 통계치 , 변수
: 특정한 값 (155)
: 영가설 5%
유의수준
유의수준 = 내가 정하는 값 ( 보통 5% 로
잡음 )
귀무가설의 기각 여부를 정함
5% 의 유의수준이라는 뜻 = 넓이가 0.05 155 165
155 보다 더 낮게 나올 수 있는 확률을 더한 것 = P-value
3
유의수준
귀무가설 : A 라는 유전자는 알츠하이머라는 질병에 영향을 주지 않는다 .
대립가설 : A 라는 유전자는 알츠하이머라는 질병에 영향을 준다 .
95% 신뢰구간
모집단 표본
5%
유의수준
5%
넓이 = 0.025 유의수준
-1.96 0 1.96
유의수준 = 내가 정하는 값 ( 보통 5% 로 잡음 )
귀무가설의 기각 여부를 정함
5% 의 유의수준이라는 뜻 = 넓이가 0.05
양측검정일 경우 , 각각의 넓이는 0.025 더하면 0.05
4
모집단의 평균
평균
5
모집단의 분산
= =
6
모집단의 분산
7
정규분포
• 특성
• 평균 확률밀도함수의 최빈값과 일치한다 .
• 평균 를 중심으로 좌우 대칭을 이루며 , 평균과 중앙값이 일치한다 .
= 평균 ( 분포의 중심을 나타냄 )
= 분산 ( 평균으로부터 퍼져 있는 정도를 나타냄 )
8
정규분포 (Normal distribution)
X ~ N(, )
68.3%
, 인 정규분포 표준 정규분포
95%
Z~N(0,1)
-2 -1 0 1 2
9
표본
• 자유도 자유가 없음
10
표본
따라서 로 계산할 수 있다 .
11
중심경향 (central tendancy)
? ?
• 최빈값
• 평균
• 중앙값
12
최빈값
• 가장 많이 관찰되는 값
• 히스토그램을 그려보면 최빈값을 찾을 수 있다 .
13
평균
• 데이터 값을 모두 더한 것을 데이터 수 n 으로 나눈 값
ȳ =
14
중앙값
88 74 91 86 72 의 중앙값은 ?
72 74 86 88 91 중 가운데에 있는 86 이 중앙값
56 68 52 64 67 50 의 중앙값은 ?
15
분산
분 =
16
신뢰구간
17
R
18
실습