You are on page 1of 28

사회조사분석사 2급 필기 시험 핵심 요약 사항

본 자료는 사회조사분석사 2급 1차 필기 시험 준비생분들을 위해 사경환 이 무료


로 제공하며, 사경환 이 제작한 도서에서 발생하는 오탈자가 발생할 수 있으니
Naver S&Y 사회조사분석(https://cafe.naver.com/statclub/51795)를 통해 정오표 확
인 부탁드립니다.
본 자료는 핵심 요약 자료로, 본 자료만으로 필기 준비는 어려으므로, 상세한 이론
선행 공부와 반복적인 기출문제 풀이가 필요합니다.
사경환 의 기출문제 풀이, 필답형, 작업형 도서는 이미 존재하며, 필기 이론도서는
2021년 대비부터 준비하도록 하겠습니다.

사경환 이 최대한 합격을 위해 도와 드리고 있으나, 사회조사분석사는 조사방법론


과 통계의 이론 학습이 필요하며, 특히 사회통계는 일정 기간 공부가 필요합니다.
정말 많은 분들이 독학으로 자격증 취득하셨고, 제가 일부 무료 동영상을 제공해
드리고 있으나, 모든 부분을 설명드리기 어려운점이 있사오니, 보다 체계적이고 맞춤
형 강의를 위해서는 유료 동영상 수강이 필요할 수 있습니다.
특히, 사경환 이 집필하지 않은 수험서의 경우, 사경환 이 답변해 드리기 곤란하므
로(저 역시 잘못 집필한 경우가 많아서), 해당 출판사나 저자에게 문의해 주시기 바
랍니다.
사회조사분석사 2급 자격증 시험 참조 사항

시 행 처 : 한국산업인력공단

시험과목
필기 : 1. 조사방법론 (30문제)
2. 조사방법론 (30문제)
3. 사회통계 (40문제)
실기 : 사회조사실무(설문작성, 단순통계처리 및 분석)

검정방법
필기 : 객관식 4지 택일형 100문제(150분)
실기 : 복합형 [작업형 2시간 정도  필답형 2시간]
실기의 작업형은 통계패키지를 사용하므로, 초보자들에게는 SPSS를 선택하는 것을
권장함 (SPSS 선택 비율은 약 85% 이상임)
사회조사분석사 2급은 누구나 응시 가능하므로, 실기 응시할 때, 별도의 추가 서류
를 제출할 필요가 없음
필기 합격 후 2년간 필기 시험을 면제하고, 실기 시험 응시가 가능함

합격기준
필기 : 매과목 최소 40점 이상, 전체 과목 평균 60점 이상
(1과목이라도 40점 미만이면 과락)
실기 : 필답형 + 작업형 총 합계 60점 이상 (과락 없음)

사회조사분석사 2급의 경우, 필기 시험 합격 후, 실기 응시 때 별도의 응시자격 서류


필요 없으므로, 실기 원서 접수만 하면 된다. (1년에 최대 3번 응시 가능)

응시 시험 수수료(2020년 기준) 필기 : 19,400원, 실기 : 33,900원

2017년 3회부터 기존 기출문제보다 다소 어려운 문제가 출제되고 있으니, 다소 어려운


문제도 충실하게 준비해야 한다.

무료 동영상 및 그 외 합격을 위한 보충 설명
https://cafe.naver.com/statclub/51795 참고 요망
공학용 계산기 활용법
(일부) 기출문제 풀이 무료 동영상
(일부) 이론 동영상, 요약 동영상
2 (일부) 과년도 작업형 기출 풀이 동영상
반드시 참조해야 할 필기 합격 가이드

실기의 필답형과 작업형을 준비하기 위해서는 단순하게 문제와 답만 외우는 방식에서 벗어나, 필
기 시험 준비부터 기초 이론의 주요 핵심 단어를 기반으로 연상 학습을 반복하여, 수험생이 직접 정
리, 서술할 수 있는 능력을 초기부터 준비해야 한다.
조사방법론 를 분리하지 말고, 조사방법론 1개 과정으로 공부하는 것이 좋고, 단순한 자격증
취득을 위한 공부보다는 개인 역량 강화를 위해 이론에 충실하여, 쉬운 Part를 중심으로 차츰 어려운
Part로 확장하는 학습 방법이 필요하다.
기출문제의 경우 문제은행 식이므로, 이론에 충실  과년도 기출 문제 풀이(최소 10회분 정도)가
선행되어야 한다.
국가공인자격증 시험의 합격 기준은 과락 40점, 전체 과목 평균 60점 이상이므로, 조사방법론에서
각각 70점 이상 고득점, 사회통계에서 최소 50점 취득 전략이 필요하다.
합격 정답의 수
구분 출제 문제의 수
안정권 최소 합격
조사방법론 1 30 24 22
조사방법론 2 30 24 22
사회통계 40 20 16
계 100 68 60

절대 다수 수험생들이 사회통계의 어려움을 느끼는바, 조사방법론에서는 고득점, 사회통계에서 40


문제 중 20문제 취득을 목표로 설정하는 것을 권장한다.
조사방법론은 다양한 학습이 필요하고, 사회통계는 통계의 기초, 척도와 통계 분석기법, 가설설정
및 가설검정에 집중하여 공부하면, 필답형, 작업형 준비할 때 큰 도움이 된다.
사회통계는 풀 수 있는 문제는 무조건 맞추고, 어려운 확률 문제는 최대한 풀어보고, 그래도 이해
가 어려운 수학 포기자들은 오답 노트 작성을 통해 문제와 답만이라도 외우도록 한다.
사회통계는 단기간에 고득점 취득이 어려우므로, 특히, 벡터, 비복원 확률은 초보자들에게 매우 어
려운 문제이므로, 쉬운 문제를 중심으로 어려운 문제는 포기하는 전략도 병행하는 것이 좋다.
하지만, 사회통계는 확률분포의 기댓값과 분산의 성질, 이항분포의 평균과 분산, 조건부 확률에서
만이라도 집중적인 공부가 필요하다.
본 해설서에서는 이해 증진을 위해, 반복 풀이와 저자만의 쉬운 풀이방법이 수록하였으니, 포기하
지 말고 반복 반복 학습이 필요하다.
자격증은 고득점이 목표가 아니라, 학습 투입 시간 대비 효율적인 점수 획득이 필요하며, 자격증
시험은 합격이 1순위이므로, 응답 보기 1번부터 4번까지의 모든 의미를 살펴보는 것이 아니라, 가장
적합한 보기를 선택하는 센스가 필요하다.
가장 적합한 답안 1개 선택.(답이 1개로 결정되어 있는 경우.)
답안이 아닌 응답 보기 중 불필요한 보기 제거 후 나머지 보기 중 우선 순위로 선택.
( 번이 90% 정답이고, 번이 80% 정답이라면, 번을 선택.)
하지만, 사회조사분석사 자격증은 개인의 능력 배양에도 도움이 되는 자격증이므로, 문제와 답만
외우려고 하지 말고, 지속적으로 반복 연습을 실시한다면, 실무에서도 적용할 수 있다.

3
조사방법론 핵심 요약 정리
[무료] 조사방법론 핵심 요약 정리 동영상 (http://cafe.naver.com/statclub/59975)

1단계 연구 문제의 정립(설정)

과학적 조사 타당도 : 참값에 가깝게 측정했는가? 타당성, 정확도


전제조건 신뢰도 : 반복 측정하여 동일한 결과 도출 가능성, 신뢰성, 정밀도
타인에게 자신의 주장(대립가설)을 설득 시켜야 함
체계적[체계성, 논리성, 객관성], 통계적[통제성, 재현가능성, 간주관성, 간결
과학적 조사 성, 실증성], 비판적[변화 가능성]
특징 연역적 방법(연역법) : 원인 결과(일반적 가설 검정)
귀납적 방법(귀납법) : 결과 원인(일반적 탐색적 조사 적용)
연역적 방법과 귀납적 방법은 상호 보완적 적용 필요
정의 : 다수 변수간의 관계 조사를 위한 의문문
연구문제
창의성(독창성), 검증가능성, 윤리적 배려
분석단위 자료 수집의 최소 단위로 개인, 집단, 지역, 국가, 프로그램 등

분석단위의 생태학적 오류 : 집단의 결과를 개인에게 적용


오류 개인주의적 오류 : 개인의 결과를 집단에게 적용

2단계 가설 설정

2개 이상의 속성을 가진 다수의 변수 간 잠정적인 결론


가설 귀무가설 : 연구가설의 논리적 반대 입장(차이가 없다)
대립가설 : 연구자가 주장하는 잠정적인 해답(차이가 있다)
독립변수 : 종속변수의 규칙적인 변화에 원인이 되는 변수
변수
종속변수 : 독립변수의 변화로 규칙적으로 변화되는 결과 변수
매개변수 : 독립/종속변수의 매개체 역할
선행변수 : 독립/종속변수 보다 먼저 행해지며(선행), 독립변수에만 영향
구성변수 : 포괄적 개념을 구성
제3의 변수
허위변수 : 관계가 없는데 있는 것처럼
억제변수 : 관계가 있는데 없는 것처럼
왜곡변수 : 독립/종속변수 간 상쇄, 역할 변화
개념적 정의 사전적 정의, 옳고 그름 없음, 추상화 정도

조작적 정의 측정이 가능한 구체적 지표로 표현(추상적인 내용을 계량적으로)

4
3단계 조사 설계

가설 구체화 위해 선행되며 귀납적 방법 활용


예비조사 : 가설에 대한 확신을 가지기 위한 자료 수집
사전검사 : 설문지의 리허설, 반드시 대표성 확보 필요는 없음
탐색적 조사설계 방법

문헌조사 : 2차 자료 수집 및 조사
탐색적
경험자 조사 : 경험자 대상으로 정보 수집
조사설계
사례조사 : 유사한 사례의 집중 조사
탐색적 조사설계 기법

브레인 스토밍 : 아이디어 회의


FGI : 소수 경험자, 전문가 대상의 사회자 배석(가장 많이 사용) 조사
델파이 : 타인 영향 최대한 배제, 익명성과 피드백

현재 상황을 조사하여 요약, 기록, 묘사


종단조사 : 동일한 대상을 장기간, 동일한 내용 조사 실시

기술적 패널연구 : 미리 고정 응답자를 선정하여 지속적인 반복 조사


조사설계 추세조사 : 모집단으로부터 표본 추출, 동일한 내용 조사
코호트조사 : 동일한 시점의 동일한 경험자 반복 조사
횡단조사 : 대규모 응답자를 단일 시점 조사 = 단면조사

탐색, 기술 자료를 기반으로 인과관계 규명


인과관계 : 독립변수의 변화에 따른, 종속변수의 일정한 변화
추론 3조건

시간적 선후성 : 원인이 먼저, 결과 나중


공동변화 : 원인 변화로 인하여, 결과가 변화
허위관계 배제 : 연구목적과 무관한 변수 통제

진실험설계 : 시간적 선후성, 공동변화, 외생변수 통제


설명적 실험집단(R) :  
통제집단사후
조사설계 통제집단(R) : 
실험집단(R) :   
통제집단사전사후
통제집단(R) :  
[집단1]실험집단(R) :   
[집단2]통제집단(R) :  
솔로몬 4집단
[집단3]실험집단(R) :  
[집단4]통제집단(R) : 

5
준실험설계 : 시간적 선후성, 공동변화 충족
실험집단 :   
비동일 통제집단
통제집단 :  

단순시계열

다중시계열

일정한 구분점(기준점) 설정 후 그 이상이면 실험집단,


설명적 그 미만이면 통제집단
회귀불연속설계
조사설계 자료의 평균을 구하여, 평균 이상 집단은 실험집단, 평
균 미만 집단은 통제집단으로 분류

사전실험설계(원시실험설계) : 시간적 선후성만 충족


단일집단 사후  
단일집단 사전사후   

(정태적) 실험집단 :  
집단비교 설계 통제집단 : 

사후실험설계 : 시간적 선후성, 공동변화, 허위관계 통제가 어려운 탐색적 실험


에 적용

4단계 자료의 수집

1차자료 : 자신이 직접 조사, 최신성 확보, 조사 대상자 통제 가능하지만, 비용,


시간 과다 투입 가능성 존재
자료의 구분
2차자료 : 이미 발표된 내/외부 자료로 비용, 시간의 높은 효율성, 최신성 부족,
조사 대상의 통제 한계성, 기존 자료의 신뢰도/타당도 검증 어려움
수치를 부여하는 과정(값을 얻는 과정)
측정
 급 측정(실제 측정값),  급 측정( 급 측정 결과 활용, 계수 )
숫자들의 체계
4가지 측정 수준별(매우 중요) 분류
구분 정의 예시 통계기법
척도 명목척도 확인 목적, 등가성(=, ) 성별, 종교 빈도, 최빈수
서열척도 서열 존재, (=, , >, <) 선호도, 순위 중위수, 백분위수
등간척도 등간격이지만, 절대 0점 없음 섭씨온도, 지능지수 평균, 표준편차
비율척도 절대적 크기 비교 가능 중량, 키(신장) 모든 통계 기법

6
리커트 척도 : 일반적 5점, 7점 척도로 응답자의 태도 측정 후 태도 점수로 산출
(총화평정척도)
서스톤 척도 : 100~200개 문항으로 평가자들의 선호도로 기반으로 11개 간격화
(등현간격척도, 유사등간법)
보가더스 척도 : 집단 간 거리 측정 (누적 척도의 하위 종류)
거트만 척도 : 보가더스 척도의 발전 척도 (누적 척도의 하위 종류)
척도 오차수
재생 계수    
문항수 × 대상자수
소시오메트리(사회적 측정법) : 집단 내 구성원간 거리 측정
평정척도 : 응답자에게 가장 긍정부터 가장 부정을 배치 후, 몇 개 간격을 규정하
고, 응답자들이 주어진 응답보기를 선택(일반적으로 4점 척도)
의미분화척도 : 양극단에 형용사 배치
스타펠척도 : 중립에 0 , 부정은 음수로, 긍정은 양수로 배치
표본추출 비용, 시간적 효율을 고려하여 모집단에서 조사 대상을 일부 추출하여 조사
표본오차
표본 추출 과정에서 발생하는 오차
모집단과 표본의 차이로 무조건 발생
비표본오차(오류)
측정오차

체계적 오차 : 일정한 방향으로 발생하는 오차(타당도와 반비례 관계)


비체계적 오차 : 무작위로 발생하는 오차(신뢰도와 반비례 관계)
조사 설계상 오류(오차) : 불포함의 오차, 부적합 연구 설계의 오류
조사 현장 오류(오차) : 조사자와 응답자 특성에서 발생하는 오류
조사 처리상 오류(오차) : 조사 결과의 입력, 부호화, 실수 입력 등의 오류
무응답의 오류(오차) : 응답거부, 회피 등의 응답 안하려는 오류
오차 측정오차 발생 원인

측정 대상자(대표성 낮은 표본 선정, 응답자의 기분, 심리, 피로 등)


측정자(조사원의 성별, 옷차림, 말투 등 후광효과)
측정 환경(장소, 시간 등)
측정 도구(조사문항, 응답보기, 용어 등)
불명확한 연구 범위(불현실적인 연구 범위 포함)
부정확한 인용 정보(타당도, 신뢰도 낮은 인용 정보, 소수점 등)

오차 감소 방안

표본 오차 : 표본 크기는 증대, 철저한 표본 설계 방법 적용


비표본오차 : 응답자 수준의 조사표 구성, 조사원 교육, 입력상 오류 검증
전수조사를 하면, 표본오차는 없으나, 비표본오차는 증대

7
모집단 결정 표본 리스트 표본추출 방법 표본 크기 실제 조사
모집단 결정 : 우리가 알고자 하는 조사 대상의 범위 결정
표본프레임(표집틀) 결정 : 조사 대상자에 대한 최신 리스트 확보
표본추출 설계 준수 요건 : 포괄성, 효율성, 추출확률, 일반화
표본추출 방법 : 어떠한 방법으로 표본을 추출할 것인가?
표본의 크기 : 적절한 크기
실제 조사 : 선정된 표본 대상으로 실제 조사 실시

확률표본 : 모집단으로부터 표본이 추출될 확률이 알려져 있는 경우

단순무작위 : 선택될 확률이 모두 동일하게


계통추출(체계적) : 첫번째만 무작위, 일정 간격으로 추출

표본추출 층화추출 : 집단 내 동질, 집단 간 이질

(=표집) 집락추출 : 집단 내 이질, 집단 간 동질


방법 비확률표본 : 표본 선정이 어려울 경우, 낮은 비용
(매우 중요)
편의 추출 : 조사자 마음대로 작위적으로 표본 추출
판단 추출 : 일부러 편중된 것이 표본 추출
할당 추출 : 층내 동질, 층간 이질적으로 분류 뒤, 작위로 표본 추출(=표집)
스노우볼 : 초기 작위적으로 선정된 응답자의 추천을 받아 표본을 확대
표본의 크기가 커질수록 표본오차는 감소, 비표본오차는 증가
고려사항
모집단이 성향이 집중되어 있으면, 소수 추출
표본추출방법 : 층화(적은 수 가능) 단순무작위 집락(많은 수 필요)
표본의 크기에 영향을 미치는 요인(통계적 요인) :

(허용오차, 신뢰수준, 분산)


 ×

   
신뢰수준( )이 높아질수록 표본 수는 증가함
표본의 크기
모집단의 성향이 다양하다면, 즉 평균으로부터 자료의 분포가 넓다면(분산 
이 크다면), 표본 수는 증가해야 성향 파악 가능
허용오차   가 작아진다면, 보다 정밀한 결과를 도출해야 하므로, 표본의 수는
증가해야 함
표본의 크기에 영향을 미치는 요인(비통계적 요인) :
자료 수집, 추출 방법, 비용, 시간, 인력, 모집단의 동질성 등을 고려해야 함
질문 문항과 응답 보기가 많다면, 분석 범주가 증가되므로, 많은 표본 수 필요
표본의 크기가 클수록 시간 및 비용이 증가함
집단조사 : 응답자를 한곳에 모아 놓고 소수의 조사원이 조사, 설문지 완성된 상
태임
배포조사 : 응답자에게 충분한 생각 배려
전화조사 : 신속, 간단한 조사, 시간적 한계
질문지법
우편조사 : 접근하기 어려운 대상에게 가능, 익명성 보장, 낮은 응답률
인터넷조사
시간, 장소 큰 구애 없음, 대표성 문제
대표성을 어떻게 확보했는지, 동일인 다수 응답자 처리 과정 확인 필요
8
표준화 면접
조사지 그대로 조사, 집단 비교 가능, 새로운 의견 반영 어려움
비표준화 면접
자유로운 조사로 다양한 의견 수집, 대표성, 부호화(탤리작업) 어려움
준표준화 면접
유동적인 협력
면접법
면접 조사원들의 라포(친근감 형성), 프로빙(캐어묻기) 필요
면접법 방법
심층면접 : 1:1 자유로운 비체계적인 개인 면접
집중면접 : 경험 집단을 대상
임상면접 : 개인의 생활사 조사
표적집단면접법( ) : 소수 경험자 대상으로 사회자 배석조사
관찰 대상자를 통제하지 않고, 시각과 청각으로 기록, 자료 수집
관찰자의 능력, 편견, 시각에 따라 큰 차이 발생
객관적 관찰 : 제3자 입장에서 관찰(관찰자임을 밝히지 않아도 무방)
관찰법
참여자적 관찰 : 관찰자임을 밝히고, 참여는 하되, 관찰이 우선
(4가지 종류)
관찰자적 참여 : 관찰자임을 밝히고, 참여가 높은 관찰
완전참여 관찰 : 관찰 대상자와 생활, 활동 등을 통해 직접 참여하는 관찰(관찰자
임을 밝히지 않아도 되지만, 이 경우 윤리적 문제 발생 우려)

의사소통을 통해 간접적으로 자료 수집
언어적 기법
단어연상법 : 유사한 단어를 보여주고 떠오르는 이미지
문장완성법 : 문장중 괄호를 채우기, 문장완성하기

투사법 논쟁완성법 : 주제를 가지고 의견 조율

회화적 기법
통각시험법 : 모호한 그림
만화완성법 : 만화를 통해
역할행동법 : 역할극을 통해

오류선택법 틀린 답을 다수 보여주고 응답자의 선택(오진선택법)

정보검사법 자격증 시험와 같은 평가

토의완성법 서로 비판적인 의견 교환

Call-in
방송, 라디오 청취자 의견 전화 인터뷰
그 외 참조 대표성, 심도 있는 조사 어려움
사항 출구조사
투표를 마친 유권자들에게 후보 선택을 조사
응답 회피, 조사원의 교육, 출구조사 대상 지역의 대표성 문제

9
최신의 리스트 확보
조사지의 문구, 글씨체, 배열의 구성
응답률 상승 조사 중요성 강조, 비밀보호
방안 조사원의 교육
적절한 보상
지속적인 추적과 관심, 전화 독려
연구 목적, 주제 결정, 수집 방법(관찰, 설문지, 면접 등)
질문의 내용 결정(성별, 연령 등)
질문 형태 결정(주관식, 객관식 등)
구체적인 질문 문항 작성(귀하의 성별을 선택해 주세요)
질문지 설계
응답 항목 구성(포괄성, 상호배타성 고려)
문항의 배열(깔때기 형태 등)
설문지 초안, 표지 작성 후 사전 검사(예비 조사와 차이점 필수)
최종 설문지
개방형 : 주관식, 자유로운 의견 수렴, 부호화 어렵고, 높은 응답 거부
폐쇄형 : 객관식, 응답 용이, 포괄성, 상호배타성 고려, 응답자간 비교 가능
종류 : 비교척도(서열식, 순위형, 고정총합형, 쌍대비교법)
질문의 형태 비비교 척도(양자 택일형, 선다형, 체크리스트, 평정식, 매트릭스, 어의
차이척도, 스타펠 척도 등)
일반적으로 탐색적 조사에서는 개방형으로, 기술적 조사에서는 폐쇄형을 많이 적
용함
깔때기 형태로 응답자의 초점/시점을 좁혀 나가는 형태
쉬운 질문부터 어려운 질문
질문의 배열 논리적은 순서로 배열
하나의 목적 달성을 위한 질문은 집중하여 배치, 하지만, 이전 효과(앞의 문항으
로 뒤의 문항 응답에 영향을 미침)로 인해 왜곡되는 경우에는 멀리 배치
응답자가 응답할 수 있는 수준의 질문 내용과 문장, 응답 보기로 구성
간결성, 명확성, 이중 질문 금지
상호배타성, 포괄성 고려
가치 중립성, 균형성 유지
질문의 원칙
유도 질문 삼가
지나친 세부 문항 삼가
와 , 과 등 접속 부사 사용 유의
오탈자 발생하지 않도록
응답자의 자발적인 참여 독려를 위해 표지 작성 필요
표지 구성 내용
조사제목/목적
조사대상의 선정 과정
질문지 표지 조사기관의 신뢰성
조사의 중요성
비밀보장
소요시간/조사기간
담당자 연락처
10
5단계 자료의 분석

조사 설계 상의 계획과 실사의 차이를 줄이기 위해 비표본오차를 줄이는 역할


코딩(부호화) : 응답 결과를 숫자화, 번호화
조사
펀칭 : 조사 결과를 숫자/문자 형태로 입력
관리
정제화(클린징) : 오류 검사, 처리
에디팅 : 실제 분석에 사용 여부 판단
정보 누락의 최소화 과정
결측치 처리 : 해당하는 분석에서만 제외
무응답
평균치 삽입 : 변수의 평균치, 최빈값으로 대체
처리
보삽법 : 추세 활용
평가치 추정법 : 행렬식 자료 고려
양적변수, 질적변수를 고려하여 통계적 자료 분석 결정
독립변수 종속변수 분석법 비고
질적 질적 교차분석  , %, 독립여부

속성 2개 양적 독립 표본   검정 평균 차이
질적
자료의 (1개) 속성 3개
양적 일원배치분산분석 평균 차이
분석 이상

질적(2개) 양적 이원배치분산분석 평균 차이

양적 양적 상관분석 1차 선형 관계

양적 양적 회귀분석 함수 관계

동일인의 양적 변수의 사전, 사후 효과 분석은 대응표본   검정

6단계 보고서 작성

연구목적에 합당하고, 보고 대상에 적합하도록 작성


유의사항
간략, 명료, 간결성 유지
표지 : 연구 제목, 수행일자, 수행기관, 발주기관
목차 : 목차, 표목차, 그림목차
요약문 : 전체 보고서의 요약 정리
서론 : 조사의 목적, 필요성, 설계, 연구방법
기본구조
분석결과 : 통계적 분석과 기술
요약 및 제언 : 조사분석을 통한 간략 요약과 결론 및 제언
참고문헌 : 보고서 집필에 인용한 논문, 문헌 명시
부록 : 설문지 및 부록

조사방법론을 효율적으로 학습하는 방법


큰 나무 줄기를 이해
줄기에 해당하는 가지의 암기 이해
유사한 내용은 서로 연상을 통해 이해력을 높임 11
정의, 장점, 단점 이해
질문지법, 질문지 작성, 보고서 작성 등은 실제 조사자, 분석자, 응답자의 입장에서 고
려함

코호트 조사와 추세 조사의 차이


코호트 조사 : 동일한 시점의 동일한 경험자. 부분이 가장 핵심입니다.
10년마다, 새롭게 추출하더라도, 동일한 시점의 동일한 경험자 라면 코호트 조사라고 보
시면 됩니다.
예를 들어, 베이비부머시대, 황금돼지띠, 1990년생, 17학번, 일부 추적조사 등이 그 예시
가 되겠습니다.
베이비부머의 정치성향 변화를 파악하기 위해 성년 뒤 10년마다 500명씩 새롭게 표집하
여 조사라고 하더라도, 베이비부머 라는 공통경험이 있으므로, 코호트로 해석

추세조사 : 저자 사견에 한정하여, 추세조사는 표본의 성향 측면에서 종단조사라고 보기


에도 어렵고, 횡단조사하고도 명확한 구분하기가 어려운 부분이 있습니다.
하지만, 핵심만 말씀드리면, 측정도구의 큰 변화 없으나, 조사 대상이 변화되면서 장기간
의 그 흐름을 보는 것이 추세조사 라고 이해하시면 됩니다.

코호트 조사와 달리, 지속적인 추적조사가 현실적으로 힘든 경우로, 조사 시점에 해당되


는 조사대상자를 선정하여 조사하되, 그 결과는 현재 시점의 해석보다는 중장기적인 흐
름, 추세를 보는 것이 목적입니다.
사례로는 한국에 여행오는 외국인 대상의 설문조사입니다.

코호트 조사 처럼 한국 방문 외국인을 지속적으로 추적조사를 하기에는 현실적으로 힘든


경우 적용합니다.
상세 설명으로, 2018년도 한국 방문한 외국인들을 대상 선정하여, 추적 조사, 반복 조사
하면 코호트 조사가 됩니다.(특정 경험과 방문이라는 부분이 우선 목적으로 합니다.)
이에 비해 추세조사는 조사 시점에 한국 방문 외국인을 대상으로 조사하는 것입니다.
(조사 시점이 우선하고, 그 다음 방문 외국인이므로, 그 표적 순서가 다릅니다.)

다시 말해, 동일한 시점의 동일한 경험자를 우선 선정하면, 코호트가 되고, 조사 시점에


해당자를 선정하되 동일한 대상자를 대상으로 반복 조사가 어려운 경우에는 추세조사가
됩니다.
실제로 코호트 조사는 많은 사례가 있으나, 추세조사는 그 사례가 많지 않고, 횡단조사하
고 분류하기도 어렵습니다.
하지만, 추세조사는 현재 시점보다는 중장기적인 그 흐름을 파악하는 것이 목적이 되겠
습니다.

12
타당도(매우 중요함)

타당도의 정의 : 측정하고자 하는 대상을 제대로 측정했는가?


내적타당도(인과관계 추론) 저해요인

역사적(우연의) 요인 : 우연하게 나타남


성숙요인 : 시간이 흐름으로 집단 자체 속성 변화
주시험효과(검사 요인) : 반복된 측정으로 인해 친숙도로 응답 왜곡
측정수단요인 : 사전측정과 사후측정간 측정도구의 상이
통계적 회귀 : 극단치는 평균으로 회귀
선발요인 : 실험, 통제집단 구성차이(표본 선정의 차이)
조사설계의
타당도 상실요인 : 조사 대상이 없어짐

외적타당도(일반화 정도) 저해 요인

호손효과 : 조사대상자가 관찰 받는 것을 인지하여 효율/반응의 왜곡


검사에 대한 반작용 : 기억하지 말아야 하는데, 기억할 때
표본 대표성 : 표본이 모집단을 대표할 수 있는가?
반응효과의 대표성 : 실험/반응효과가 일반화할 수 있는가?
상호작용 : 독립변수들간의 상호 변화 작용
간섭효과 : 반복 측정으로 모집단과 상이한 결과

내용타당도 : 측정도구 자체가 타당한가? (액면, 표면, 안면, 논리 타당도)


검증 기법 : 전문가의 주관적 평가 (통계적 분석 불가)
기준경험타당도 : 검증된 기준과 비교

동시적 타당도 : 유사 시점에서의 비교


예측적 타당도 : 미래 시점과의 비교
통계 기법 : 상관 분석

측정의 구성개념타당도 : 실제로 무엇을 측정했는가?


타당도
이해 타당도 : 예상대로 이뤄졌는가? (확증적 요인분석)
판별(분류) 타당도 : 측정도구를 통해 구분될 수 있는가? (탐색적 요인분석)
수렴(집중) 타당도 : 하나로 집중될 수 있는가? (탐색적 요인분석)
통계 기법 : 상관분석, 다속성 다측정 행렬분석, 요인분석
확증적 요인 분석 : 연구자의 가설에 의한 독립변수 투입 순서에 따른 분석
탐색적 요인 분석 : 연구자의 가설에 의하지 않고, 통계적으로 유의한 변수들
에 한정한 검정 분석

13
신뢰도(매우 중요)

신뢰도 정의 : 반복적으로 측정했을 때 동일한 결과를 얻어 냈는가?


검사-재검사
동일한 도구로 동일한 대상에게 일정한 시간 흐름 뒤 1차와 2차 측정 결과의
상관분석
복수양식법
동일한 개념의 다수 측정도구 개발, 상관분석 기법 적용
반분법
신뢰도 작위적으로 반으로(홀짝) 분할하여 홀수 질문과 짝수 질문 응답 비교, 상관분
석, 스피어만-브라운 기법 적용
내적일관성 분석
Cronbach s α계수, 0부터 1까지 값을 가지며, 0.6 이상이면, 신뢰도가 높다고
판단
신뢰도란, 동일인에게 동일한 질문을 실시한다면, 동일한 결과를 얻는 것을 의
미하는 것으로, 응답자가 적합한가? 응답을 믿을수 있는가?는 확인하기 어려우
므로 다른 측정도구를 활용함
이미 검증된 측정도구 사용
애매하거나 모르는 측정도구 제거
신뢰도
목적에 맞는 측정도구의 증가
제고 방안
조사원의 철저한 교육
편견 삽입되지 않게 구성

일반적으로
신뢰도, 타당도 높으면, 신뢰도 높음
타당도 관계 신뢰도 낮으면, 타당도 낮음
나머지는 알 수 없음

14
사회통계 핵심 요약 정리

수집된 자료를 직관적으로 인식할 수 있는 값, 자료의 위치값


대표값 평균(산술평균, 조화평균, 기하평균, 절사평균, 가중평균), 중앙값, 최빈값, 백
분위수, 사분위수
대표값으로부터 떨어진 정도(밀집정도)
범위, 사분위 편차, 분산, 표준편차, 변동계수, 표준오차, 평균편차
산포도
분산 =  ,  




   
     

분산은  (편차제곱합)을 자유도로 나누는 것이다. (분산 ≠  )

표준편차
두 자료의 산포도 비교할 때     

변동계수 
 평균
(변이계수)
변동계수 95% 신뢰구간   (2017년 2회 88번 출제)
  
×  ±  × 
  
분포의 비대칭도를 측정하는 통계량 (매우 자주 출제됨)
왜도=0이면, 좌우대칭 분포
왜도>0이면, 양의 왜도, 우측 왜도, 오른쪽 꼬리 분포, 최빈값 < 중앙값 < 평균
왜도<0이면, 음의 왜도, 좌측 왜도, 왼쪽 꼬리 분포, 평균 < 중앙값 < 최빈값

왜도

분포가 중심 근처에서 퍼져있는 정도, 즉, 분포의 중심이 얼마나 뾰족한가를 나타


내는 통계량
첨도=3이면, 표준정규분포(중첨)
첨도 첨도>3이면, 표준정규분포보다 뾰족한 모양
첨도<3이면, 표준정규분포보다 무딘 모양
표준정규분포의 첨도를 0으로 만들기 위해, -3을 하는 경우 있음
따라서, 표준정규분포라면, 첨도가 0 또는 3임
상자 수염 상자 수염 그림은 하나의 자료 표현뿐만 아니라, 다수의 자료를 비교할 때, 매
그림의 우 유리한 그림
장점과 단점 사분위수, 최소값, 최대값, 이상점을 찾을 수 있음

15
자료의 분포와 다수 집단의 분포 비교가 가능
분산이 크다면, 사분위수 값이 커지게 되므로, 상자 수염 그림이 넓게 퍼짐
하지만, 평균과 분산을 상자수염 그래프만 가지고 쉽게 구하기 어렵다는 단점
보다 자세한 설명은 2017년 2회 65번 풀이 참고
사분위수 산출 공식은 다양하므로, 사회조사분석사 시험 기준이라면, 우선 중
앙값을 구하고, 최소값과 중앙값의 절반 , 중앙값과 최대값의 절반 으로 구함

표준오차   , 표준오차의 크기는  과 반비례, 동일한 조건 하에서 표본




크기를 변화시키면, 신뢰구간은  배만큼 증감되므로,  을  로 줄이면, 신뢰
 
 
구간은     배만큼 늘어나며, 크기와 신뢰구간은 반비례의 관계.
 
 
표준오차 
 


참고 : 신뢰수준(포함될 가능성)과 신뢰구간(넓이)은 다른 의미로, 신뢰수준이
증가될수록 표본의 크기는 증가되어야 하며, 모두 동일한 조건이라면, 표본의 크
기가 증가될수록, 신뢰구간은 좁아지게 된다. (즉, 표본의 크기가 증가되면, 그
만큼 오차가 감소되므로, 신뢰구간이 더 좁아져 신빙성이 증가된다.)

기댓값의 성질
               
                         

분산의 성질
              
                  
                  
          
[독립일 경우 성질]

                
확률분포의                            
성질
         
        
예:           →                  ×  
예:     라면,           ×    (분산은 상수 제
거됨)

이항분포[성공 또는 실패,           ]


포아송 분포[주어진 시간내의 발생건수,          ]
초기하 분포
비복원 추출 : 성공할 확률 일정하지 않는(양품, 불량품)
복원 추출의 경우에는 이항분포 또는 음이항분포
기하분포(단 한번의 성공을 위해 실패를 거듭해야 하는 경우)

16
정규분포의 개요

정규분포의 모양은 와  에 의해서 결정됨


분포의 위치는 평균 에 의하여 결정되며, 평균 을 중심으로 대칭
확률변수  가 평균  , 분산  인 정규분포를 따를 때  ∼     로

표기
            
            
            

표준화    , 평균 0이고, 분산 1(표준편차 = 1)




          
          
          

 
독립표본   검정의 검정 통계량    , 를 모를 경우 로 대체


검정통계량 
표준화와 검정통계량 차이점과 적용 방법은
무료 동영상 https://cafe.naver.com/statclub/109597 참고 요망
사경환의 조건부 확률 방법 활용
(유사한 무료 동영상 : https://cafe.naver.com/statclub/108035)
 생산량은 30%, 불량률 3%,  생산량은 70%, 불량률 5%이며, 1개의 불량
품이  에서 생산될 확률이라면
구분 확률
 생산량 30%
 생산량 70%

각 생산량의 불량률을 산출
조건부 확률
구분 확률 양품 불량품
 생산량 30% 3%
 생산량 70% 5%

각 생산량의 양품률을 산출
구분 확률 양품 불량품
 생산량 30% 97% 3%
 생산량 70% 95% 5%

17
문제에서 요구하는 내용은 불량품일 때,  생산량 일 가능성이므로,
구분 확률 양품 불량품
 생산량 30% 97% 3%
 생산량 70% 95% 5%

생산 확률 × 불량확률
을 구함
생산 확률 × 불량확률  생산 확률 × 불량확률

 ×  
   
 ×    ×    
신뢰구간은 구하기 위해서는 양측검정을 적용
신뢰수준이 지정되어 있는 경우
주어진 지문에서 신뢰수준이 95%, 최소한 이라는 문구가 없을 경우

신뢰구간 식은 ±   임


는 모집단의 성향(정규분포, 모분산)을 알고 있거나 대표본이라면,  

이며, 모집단 성향 모르고, 소표본이라면  분포   을 적용함


    

예로 평균 110 , 신뢰수준 95%, 표본의 수 25 , 분산 25 라면, 유의수준


 =0.05 이므로,      을 적용함


  





 
   





 
 
신뢰구간
 
    ×      × 




 
구하는 방법   ±    

쳬비셰프 부등식
체비셰프 부등식의 경우, 문제에서 최소한 , 신뢰구간이 정해지지 않은 경
우 에 한정하여 풀이함

체비셰프 부등식은  ±  , 확률은    임



문제) 1000명의  을 조사했더니, 평균이 105, 표준편차 15임,  가 75


에서 135 사이에 있는 학생은 최소한 몇 명인가?
 ± 에 의거,  ± 로 최소값이 75, 최대값이 135임
          라는 의미로 해석됨
     →      →    →   

   의 확률을 적용하여,     


 
 
 ×   명

18
귀무가설에 대한 판정
구분
채택 기각
가설검정의
옳은 결정 잘못된 결정
오류 참
귀무가설의 신뢰수준(  ) 제1종 오류()
상태 잘못된 결정 옳은 결정
거짓
제2종 오류() 검정력(  )

초보자가
[양측 검정, 신뢰 구간을 구할 경우의 신뢰수준과 임계치]
반드시
암기해야 할 신뢰수준   90% 95% 99%

신뢰수준과   임계치 1.645 1.96 2.576


임계치

  신뢰수준 표준화값   표준편차     허용오차


 ×  ×
 
 

   ×    ×    , 모비율을 모를 경우 0.5 대입(0.5 0.5가 가장 큼)




연구 목적을 위한 표본에 대한 현황 파악
표본크기 이론 수집, 추출 방법 선정
공식 표본크기 결정 요인 : 내적요인(신뢰도, 모집단 크기, 모집단의 분산), 외적요
인(모집단의 동질성, 시간, 비용, 분석되는 범주의 수 등)
모집단의 이질성이 크고, 분산이 크고, 변수내의 범주 수가 많을수록, 변수의
수가 많을수록, 신뢰수준이 높아질수록, 표본의 수는 증가되어야 함
층화표본추출법 < 단순무작위 표본추출법 < 집락표본추출법(집락은 오차가
가장 크므로, 많은 표본수가 필요)

바람직한 통계 추정량의 결정기준(초보자들은 그냥 외우자. 이해는 어렵다.)


불편성:편의(모수와 표본집단 간 성향차이 차이)가 없는 것, 즉, 추정량의 기대
치가 추정할 모수의 실제값과 같은 것
효율성(유효성):모수를 기준으로 하여 추정량의 분산이 작은 것
일치성:표본의 크기가 증가할수록 추정량이 모수에 일치하게 되는 것
바람직한
충분성(충족성):추정량이 모수에 대하여 모든 정보를 제공하는 것
통계 추정량
(2017년
      
 
                      
3회부터 많이
    

출제됨)
      
 
                       
    
     이므로 둘 다 불편성 만족
    

    
 
       ×   
  
      
    
             
   

19
   
      
    
                 
     
  이므로 
    이 
 보다 효율성(유효성)이 더 충족됨

즉
 이 
 에 비해 분산이 더 작으므로, 효율성(유효성)이 더 좋음
초보자를 위해 가장 효율성(유효성)측면에서 좋은 추정량부터 살펴보면

가장 좋음      가장 나쁨
              
  

즉, 불편성 측면에서는      모두
              
  
불편성을 충족함

효율성(유효성)측면에서는 분산이 가장 작은  이 가장 우수함


    

1)교차분석(카이제곱 분석)
2개의 질적 척도와 질적 척도로 구성된 변수간의 관련성 (독립변수, 종속변수
의 구분 없음)
적합성 : 이미 알려져 있는 확률과 관측의 확률이 동일할까? (멘델의 법칙이
맞는가?)
독립성 :  와 간에는 관련이 있을까? (성별과 지역간에는 관련이 있을까?)
동질성 :  의 속성별 의 비율이 동등할까? (남자, 여자들의 정당의 지지 비
율은 동일할까?)
자유도 : (행 1)×(열 1)
관측도수  기대도수
기대도수
  
2)  검정(2개 집단의 평균 차이 검정)
독립변수가 질적 척도로 구성된 변수가 1개이면서 속성 2개
종속변수가 양적 척도로 구성된 변수
통계 분석 기본 가정 : 독립성, 정규성
요약 3)분산분석(3개 이상 집단의 평균 차이 검정)
독립변수가 질적 척도로 구성된 변수가 1개이면서 속성 3개 이상
종속변수가 양적 척도로 구성된 변수
오차항의 기본 가정 : 독립성, 정규성, 등분산성
처리(인자) : 집단(그룹)의 수 (예 : 3개의 집단)
수준 : 각 집단 내의 응답자 수(아래표는, A=5, B=5, C=5 으로 총 15)
   
1 10 18 19
2 15 20 24
3 14 25 28
4 15 24 24
5 18 21 20
인자(처리) :    의 집단이므로, 인자는 3
수준 : A=5, B=5, C=5 으로 각 수준은 동일한 5 , 총 수준은 15

20
변동요인 제곱합 자유도 평균제곱 F

처리(급간)  (그룹 G oup)



    
 


잔차(급내)  (내부차이 rror)   

  

합계  (전체 otal)  
 의 자유도   은                 로 동일

4)상관계수
 
   

  
   


    


     
         


   

     
  
              
      
 표준편차 × 표준편차  × 
   
             

 




     ×      ×    × × 

 
 


일반적으로 양적척도로 구성된 2개의 변수들 간의 1차 선형 관계(직선) 추정
  ∼  사이 값을 가지며  이면 양,  이면 음, 0이면 상관관계가 없음
절대값 크기가 클수록 상관관계 강도도 높음(절대값 0.6)
인과관계 도출이 불가능함
상관분석은 부호만 동일하다면, 변수에  , , 을 하더라도 상관계수의 값은
변화하지 않음 (음수의 경우에는 상황에 따라 부호가 변경될 수 있음)
상관분석의 추세선은 원점(0,0)을 통과하지 않음
두 변수가 독립이면 상관계수는 반드시 0이 되나, 상관관계가 0이라고 해서 반
드시 독립은 아님

  는  의 편차의 합으로  의 공분산은 이며,


 



 는  의 편차제곱합의 제곱근으로,  의 표준편차는 임


 
 


  



     

        이므로, 분
   
 

 
  ×     ×    × 
 × 
  
    

   ×   
모, 분자의    이 서로 상쇄되므로, 상관분석에서는 공분산과 표준편차로 적
용해도 동일한 결과 산출가능
자료를 표준화하면, 평균은 0, 분산이 1이 되므로,       이 됨

5)회귀분석
종속변수와 독립변수들 사이의 함수관계를 추정
독립변수들의 종속변수에 대한 효과 검정
추정된 함수관계를 이용하여 미래의 값 예측

21
회귀모형의 분산분석표(회귀모형의 적합도 검정에 활용)
변동요인 제곱합 자유도 평균제곱 F
회귀
 (그룹 G oup)

   
   
잔차  (내부차이



rror)
     
    
합계  (전체 otal)  
 =독립변수의 수,  =응답자의 수
분산분석의 처리  의자유도는   이지만, 회귀분석에서의 회귀식
  자유도는 인 이유는 회귀분석에서는 독립변수 외에 오차변수를 포
함(독립변수 1)하므로 회귀분석의 자유도는 가 됨. 즉, 회귀분석에서 처
리의 자유도는 독립변수의 수가 됨
결정계수 : 값의 영역은 0~1까지, 추정된 회귀직선이 종속변수의 변동을 얼마
나 잘 설명해 주는지 나타냄 (회귀모형의 적합도 검정에 활용)
 
             
 
단순회귀분석의 경우상관계수  결정계수
회귀분석에서 관찰값과 예측값의 차이 = 잔차
더미 변수(가변수) : 변수 속성의 수 1

6)회귀계수 추정하기와 문제 풀이
  
   
 
   
 
     
 


 
 

         


 
 
 


 

 

   
의 평균      , 의 평균 
     
     임
   

 회귀직선의 기울기    
  
       
   

 
      
참고적으로
   

         ×        


 
 
 
 

 

 
 

    
      
       
  ×   

   
 

 회귀직선의 절편  
   

     × 
 
 
 
  
    ×         
  
 ,  이므로 최종 회귀식은    
  

22
위 문제는 많이 출제되므로 반드시 풀이할 수 있어야 함

7)회귀식을 활용한 상관계수

 의  에 대한 회귀직선식이 
    이라 한다.  의 표준편차는 5,  의
표준편차가 3이라 할 때,  와  의 상관계수는?


  
  
  
또는   

   
  
→    ×  를 의 분산이라고 생각하면   


→    ×   
  
      
 ×    × 

원칙적으로    이지만, 회귀계수와 상관계수는 모두 분자, 분모의




   이 서로 상쇄되므로, 표준편차 또는 분산을 적용해도 동일한 값으로 산
     

출된다.       
  
 
 

  ×     ×   ×  
 × 
 
   

  ×  

중심극한 정리(CLT)에 대한 문제가 많이 출제되고 있는바


서로 독립적이고

각각 유한한 평균 , 분산  을 가지며
표본수가 충분히 크다면 (대략  ≥  이면 대표본으로 간주)

모집단의 분포와 관계없이 표본평균 
 의 분포는 기대값이 모평균  이고, 분산이  인 정규


 
분포로 분포 수렴한다. (분산이  이므로, 표준편차는  )
 
중심극한정리의 중요점은 모분포에 대해 특정한 꼴(형태)을 필요로 하지 않는다.

중심극한 정리(CLT)에 의한 표본평균의 검정통계량 분포를 살펴보면,


모집단의 분포(비율, 분산 등)를 알고 있다면, 표본의 분포는 정규분포로 수렴
모집단의 분포를 알고 있다면, 표본의 크기가 작아도 정규분포로 수렴
모집단의 분포를 모른다고 하더라도, 표본의 크기가 크다면, 정규분포로 수렴
분산에 대한 가설검정은 집단과 집단 간 분산의 동질성 여부를 판단하는 것으로, 분산의 정규성 여
부를 검정하지 않음

수험생 분들을 위해, 네이버 카페 https://cafe.naver.com/statclub 와 유튜브 “[사파] 사경환”에서


관련한 Q&A와 동영상을 일부 제공드리고 있습니다. (상세한 이론이나 공식 설명은 퀘스천랩 참고)
조사방법론 이론과 통계 이론을 중심으로 기출문제 풀이 병행이 필요하며, 특히, 통계 이론은 단기
간에 습득하기 어려운 부분이므로 공부하셔야 합니다.

23
중급자 이상의 암기 사항

신뢰수준과 임계치 (임계치의 음영 부분은 암기 필요)


유의확률 0.1585 0.1 0.05 0.025 0.023 0.01 0.005 0.0015

신뢰 단측검정 90.0% 95.0% 99.0%


수준 양측검정 68.3% 90.0% 95.0% 95.4% 99.0% 99.7%

 임계치 1 1.282 1.645 1.96 2 2.326 2.576 3

  이라면, 양측검정의 신뢰수준이 68.3%(0.683)이며,      이


됨. 이를 단측 검정으로 환산하기 위해  ÷   의 유의확률 값을 얻을
수 있음.
동일한 방법으로   이라면, 양측검정의 신뢰수준이 99.7%(0.997)이므로,
     이므로,  ÷   의 유의확률 값을 얻을 수 있음.
양측검정 기준의 95% 신뢰수준이란, 표준정규분포의 왼쪽과 오른쪽의 총합의 면적
이 5%(=0.05)가 된다는 의미로, 단측은 절반이 되어야 하므로,  ÷   
의 유의확률 값을 가짐
중급자 이상이라면, 단측검정 90%(1.282), 95%(1.645), 99%(2.326)를 암기하는
것이 좋음 (공무원 준비생이라면 위 식은 무조건 암기해야 함)

독립표본   검정통계량

 
(등분산) 검정통계량 :    , (    )
             


           
  
 

(이분산) 검정통계량 :   
  


 
  
 
  

만약, 표본의 수가 동일하다면, 이분산, 등분산에 상관 없이   


  


 
  
 

 
모비율 검정통계량 :  
      
 
  
   
 
  
 
   
   
대응표본   검정통계량



  

대응표본 검정통계량 :     
 
 

 
     
 



24 관련 무료 동영상 http://cafe.naver.com/statclub/69177 참고
회귀분석
수정된 결정계수 : 다중회귀분석의 경우, 독립변수의 수가 증가하면 결정계수는 증
가하는 경향이 높음. 이를 보정하기 위한 수정된 결정계수 적용
 
          
  
회귀분석에서의 잔차에 대한 성질 (초보자는 이해하려 하지 말고, 그냥 암기
하자.)
   


 
   
 
    
 
    
 
 


단     
 
 

하지만, 원점을 지나는 회귀모형(독립변수가 0 이면, 종속변수가 0 이 되는


회귀모형)의 경우     이지만, 잔차들의 평균은 0 은 아님

신뢰구간과 검정통계량

모평균에 대한 신뢰구간   , 대표본은 분포, 소표본은 분포



 ±× 

 
 
모비율에 대한 신뢰구간  

±  × 



×  



 

모평균에 대한 검정통계량 
 



비율에 대한 검정통계량 

 

 ×  
  

독립표본인 두 모평균 차 검정 
  
 ±  ×


  
 
  



×  
 ×  
두 모비율 차 

 
±  ×   


 
비율의 경우,
신뢰구간은  (표본의 결과)과   
을 적용
검정통계량은 (귀무가설)과  (표본의 결과)를 적용
25
사회조사분석사 2급 수준에서의 통계 표기법
초보자를 위한 통계학 기호 읽기와 이해하기 무료 동영상
https://cafe.naver.com/statclub/107484

표기법 영어 발음 적용 예시
표본의 크기
 n 엔
(=표본의 수)

 summation 써메이션 이산형 자료의 합

 integral 인테그랄 연속형 자료의 합

확률변수의
   ex 이엑스
기댓값(=평균)
확률변수의
   ex square 이엑스의 제곱
기댓값(=평균)의 제곱
확률변수 제곱의
   x square e 엑스의 제곱의 이
기대값

   v x 브이 엑스 분산

 alpha 알파 유의수준
제2종 오류,
 beta 베타
회귀분석 기울기

 epsilon 입실론 회귀분석 잔차

 theta 쎄타 모비율

 lambda 람다 포아송 분포
자연로그의 밑지수
 e 이 2.7182818…
포아송 분포 활용

 pi 파이 3.14…

모집단 발음 표본집단 발음 적용 예시

 뮤 
 엑스바 평균

 로우  로우 피어슨 상관계수

 시그마 제곱  에스 제곱 표준편차

 시그마  에스 표준편차

 카이 제곱  카이 교차분석


 와이 햇 
 와이 햇 의 추정값

26
기호 발음 적용 예시

 루트 제곱근

 엑스 팩토리얼 계승이라고 하며,    ×  ×   


조합으로 팩토리얼을 활용함
  엔 컨비네이션 엑스 
       
 ×

 ×      ×  ×
이엑스
   (기대값 엑스)
확률변수의 기댓값(=평균)

이엑스의 제곱
   (기대값 엑스의 확률변수의 기댓값(=평균)의 제곱
제곱)
엑스 제곱의 이
   (엑스 제곱의 확률변수 제곱의 기대값
기대값)

   브이 엑스 분산           

 에스 엑스 엑스 의 편차 제곱합

 에스 엑스 의 편차 제곱합의 제곱근

코베리언스
     엑스, 와이
  의 공분산

 에스 엑스 와이   의 편차 제곱합

엑스 아이의
  써메이션
관찰값 의 총합

엑스 제곱의
 
써메이션
관찰값 의 제곱의 총합

써메이션 엑스의
  
제곱
관찰값 의 총합의 제곱

엑스 와이의
 써메이션
관찰값 와  의 곱의 총합

엑스 제곱 와이의
  
관찰값 의 제곱과 간 곱의 총합

27
써메이션
본 도서 참고 사항

본 도서는 어려운 통계 풀이의 경우, 초보자 준비생을 위한 쉬운 풀이기법과 중급자 준비


생을 위한 풀이기법을 수록하였다.
통계수식과 알파벳 간 발생할 수 있는 혼란의 최소화 위해, 곱하기는 ×로, 변수는  로
표기하여,    는  ×   와 같이, 마이너스 역시  와 같이 수식으로 표기하였다.
 
 

나누기의 경우, / 표기인    보다는    로 표기하였고, 부득이한 경



  
 

 


우에는 ÷ 로 적용하여, 통계적 나누기에서는 가급적 / 표기를 사용하지 않았다.


특히, 나누기의 경우    , 임계치   와 같이 을 기준으로 분모와 분자로 명확



  

 
 
 
히 구분하고자 노력하였다.

28

You might also like