You are on page 1of 31

Chapter 1.

R 언어

김남형 응용통계학과
가천대학교
nhkim@gachon.ac.kr

1
R 의 소개

 R 은 뉴질랜드 오클랜드 (Auckland) 대학의 로스 이하카 (Ross Ihaka) 와


로버트 젠틀맨 (Robert Gentleman) 교수의 주도로 개발
 Freeware 로 OS 에 구애받지 않고 설치 가능
 팩키지 + 언어 -> 새롭게 표현할 수 있고 새로운 것을 개발할 수 있음
 오픈소스 (Open source) 소프트웨어 -> 전세계 연구자들이 개발한 각종
알고리즘을 쉽게 구할 수 있음

2
Install R
◦ http://www.r-project.org
◦ Download ‘R base’ file

(2) Click

(1) Click

(3) Click

3
작업 디렉토리 변경
 실습데이터 .zip 을 C 드라이브에 다운받아서 압축을 푼다 .
 데이터가 있는 곳으로 작업 디렉토리를 변경한다 .
◦ C:\ 실습데이터 \1 장

4
콘솔창
 명령문이 바로 실행이 되어 결과를 보여줌
 코드 저장이 안됨

5
R 편집기 (Editor)
 명령문 (script) 파일을 저장해둘 필요가 있을 때 파일 메뉴에서
저장
 확장자는 .R
 실행할 줄을 선택하여 Ctrl+R 로 명령문 실행
 결과는 콘솔창에 보여짐

6
텍스트 자료 읽기

 데이터 프레임 (data frame)


 메타정보 (meta data)
 오브젝트 (object)

7
변수와 변수 값 , 벡터 , 행렬 그리고
배열

8
9
10
11
연산과 논리

12
13
논리연산

14
결측값 (missing value)
 R 에서 결측값은 NA (not available) 로 표기
 수치가 아닌 것을 뜻하는 NaN(not a number) 도 결측값과 같이
취급

15
요인 (factors)

16
자료변환
 자료를 변환하여 변수를 추가하는 등 의 일은 빈번하게
일어남

17
순서정렬과 순위

18
apply 류
 데이터 리스트의 행 또는 열에 통계 함수를 적용

19
루프 (loop)
 반복문

20
임의 수 생성 (random number genera-
tion)

21
R 그래픽스 (graphics): 산점도

22
R 그래픽스 : 다중 프레임
 다중프레임 (multiple frame) 을 제공

23
그래프를 겹쳐 그리기
 한 그래프에 다른 그래프를 겹쳐 비교의 효과를 거둘
수 있음

24
사용자 정의 함수
 왜도 (skewness) 첨도 (kurtosis) 구하기
◦ x 를 연속형 변수라고 했을 때

25
사용자 정의 함수

 사용자 정의 함수 작성 규칙
◦ function() 으로 정의되어야 함
◦ 왼쪽 중괄호와 오른쪽 중괄호로 묶여야 함
◦ 최종 넘겨져야 (return) 할 변수를 지정해야 함

26
데이터 세트 병합하기
 2 개의 데이터를 merge 함수를 사용하여 병합

27
데이터 세트 분할하기

28
외부 데이터 파일 읽기

29
R 작업 관리

30
과제
 자신의 PC 에 R 프로그램을 설치하고 실행하시오 .
 교재에 있는 R 코드를 모두 입력하여 " 본인이름 _1 장 .R"
로 저장하고 , 실행하여 나온 결과를 살펴보고 주석을
추가하시오 .(ppt 코드 중 오류가 발생하는 부분도 존재함 )
 작성한 R 파일을 사이버 캠퍼스에 제출하시오 .
◦ 파일명 : 본인이름 _1 장 .R

31

You might also like