You are on page 1of 22

8/10/2022

The “Rcmdr” package and its environment

Install Rcmdr
Cài đặt R
B1: www.r-project.org
B2: https://cran.r-project.org/mirrors.html
B3: Chọn 0-cloud (https://cloud.r-project.org)
B4: https://cloud.r-project.org/bin/windows/base/R-4.2.1-win.exe

Cài đặt Rcmdr


http://sensominer.free.fr/
http://sebastien.ledien.free.fr

1
8/10/2022

Install Rcmdr, SensoMineR, FactoMineR


1. Cài đặt Rcmdr, SensoMineR, FactoMineR
-Sau khi cài đặt R (xuất hiện màn hình làm việc) thì gõ
code lệnh sau :
source("http://sensominer.free.fr/install-senso.r")
Nguồn: http://sensominer.free.fr
- Cài đặt FactoMineR: install.packages(“RcmdrPlugin.FactoMineR”)
2. Khởi động Rcmdr
library(Rcmdr)
3. Bài tập 1: Cài đặt R và Rcmdr, SensoMineR, FactoMineR

Giới thiệu về R và Rcmdr package 3

Install Rcmdr

Giới thiệu về R và Rcmdr package 4

2
8/10/2022

Cài đặt R studio

Giới thiệu về R và Rcmdr package 5

R là gì
R là
Một ngôn ngữ lập trình
Một phần mềm thống kê (a statistical package)
Một thông dịch viên (an interpreter)
Nguồn mở Open Source
R không phải là
Một cơ sở dữ liệu (a database)
Một bộ sưu tập các “hộp đen” (a collection of “black boxes” )
Một gói phần mềm tính toán (a spreadsheet software
package)
hỗ trợ thương mại (commercially supported)

Giới thiệu về R và Rcmdr package 6

3
8/10/2022

Cách cài đặt và sử dụng R

• Tính toán đơn giản, toán học giải trí (recreational


mathematics), tính toán ma trận (matrix).
• Được phát triển thành các phần mềm chuyên môn
cho một vấn đề tính toán cá biệt: các packages.
• R là một phần mềm sử dụng cho phân tích thống
kê và vẽ biểu đồ.

Cách cài đặt và sử dụng R

0.0 0.0
04 02
8

0.01
6

0.01
6

0.012

0.02

0.026
0.0
3
2
0.03
4

4
0.03 0.02
densi

0.028
ty

0.022 0.024

0.018 0.016
2

0.014
0.0
02

0.008
Y

d 0.01

0.008
04
0.006 0.0

02
-2

0.004 0.0

-2 0 2 4

4
8/10/2022

Cách cài đặt và sử dụng R

Code lệnh

Kết quả

2. Cài đặt và một số ứng dụng đơn giản

Prompt : >

Getting help: ?t.test or help(t.test)

5
8/10/2022

2. Cài đặt và một số ứng dụng đơn giản

Giới thiệu về R và Rcmdr package 11

2. Cài đặt và một số ứng dụng đơn giản

Giới thiệu về R và Rcmdr package 12

6
8/10/2022

Cú pháp trong R
object <- function(arguments)
Ví dụ: reg <- lm(y ~ x)

Cú pháp trong R
Phân biệt HOA và THƯỜNG
a <- 5
A <- 7
B <- a+A

Tên biến KHÔNG có khoảng trắng


var a <- 5

Nhưng có thể gán thêm bằng cách thêm dấu “.”


var.a <- 5
var.b <- 10
var.c <- var.a + var.b

7
8/10/2022

Ứng dụng- ma trận

a <- c (1,2,3,4,5,6,7,8,9)
A <- matrix (a,nrow=3)
A

a <- c (1,2,3,4,5,6,7,8,9)
A <- matrix (a,nrow=3, byrow=TRUE)
A
Đọc thêm trong quyển” Phân tích số liệu và biểu đồ bằng R
Tác giả Nguyễn Văn Tuấn

3. Đọc dữ liệu
1. Cài đặt R
2. Một số phép tính đơn giản trên R.

Doing exercise 1

8
8/10/2022

3. Đọc dữ liệu- ví dụ
age <- c(50,62,60,40,48,47,57,70,48,67)
bmi <- c(17,18,18,18,18,18,19,19,19,19)
thanh <- data.frame(age,bmi)
attach(thanh)

3. Đọc dữ liệu
Một số hàm cơ bản khi nhập và biên tập dữ liệu
setwd("D:/Xu ly so lieu thuc nghiem/DHTP6/Data")
igfnew <- read.table("igf.txt", header=TRUE)
attach(igf )
names(igf): Xác định tên biến (cột)
head(igf ): Xem định dạng dữ liệu vắn tắt
summary(igf ): Tóm tắt dữ liệu (định tính, định lượng)
Ví dụ tạo các dữ liệu con, dữ liệu trích
igfnew1: chi lay 5 cot dau, cac hang
igfnew2: chi lay tat ca cot , 10 hang dau
igfnew3: chi lay 5 cot dau , 10 hang dau
igfnew4: chi lay 2 cot dau va 3 cot cuoi , hàng 11-20
Ví dụ: # igfnew1<-igf[, c(1:5)]
Giới thiệu về R và Rcmdr package 18

9
8/10/2022

3. Đọc dữ liệu
Ví dụ tạo các dữ liệu con, dữ liệu trích
igfnam: Chỉ lấy dữ liệu có giới tính là Male
igfnu: Chỉ lấy dữ liệu có giới tính là Female
igfage20: Chỉ lấy dữ liệu có tuổi lớn hơn 20

Ví dụ:
igfnam<-subset(igf,sex==“Male”)
igfnusubset(igf,sex==“Female”)
igfage20<-subset(igf, age>20)

Giới thiệu về R và Rcmdr package 19

3. Đọc dữ liệu

Giới thiệu về R và Rcmdr package 20

10
8/10/2022

3. Đọc dữ liệu

3. Đọc dữ liệu

Nguyễn Bá Thanh
22

11
8/10/2022

3. Đọc dữ liệu

Nguyễn Bá Thanh
23

3. Đọc dữ liệu

Nguyễn Bá Thanh 24

12
8/10/2022

3. Đọc dữ liệu

Bài tập 2
1. Read file: igf, insulin
2. Edit & attach <data file>.

Doing exercise 2 Nguồn: www.ykhoanet.com/r

Plot số liệu age-bmi


19.0
18.5
18.0
bmi
17.5
17.0

40 45 50 55 60 65 70
age

Giới thiệu về R và Rcmdr package 26

13
8/10/2022

Mã hóa mẫu-trật tự mẫu


Mã hóa mẫu
sample(0:999,10,replace=FALSE)
[1] 667 926 888 511 475 889 404 184 713 770
Trật tự mẫu
Load packages (crossdes)
williams(4)
[,1] [,2] [,3] [,4]
[1,] 1 2 4 3
[2,] 2 3 1 4
[3,] 3 4 2 1
[4,] 4 1 3 2

Mã hóa mẫu-trật tự mẫu


Mã hóa mẫu
sample(0:999,10,replace=FALSE)
[1] 667 926 888 511 475 889 404 184 713 770
Trật tự mẫu
Load packages (crossdes)
williams(4)
[,1] [,2] [,3] [,4]
[1,] 1 2 4 3
[2,] 2 3 1 4
[3,] 3 4 2 1
[4,] 4 1 3 2

14
8/10/2022

R – Máy tính (calculator)


R có thể được dùng như một máy tính tay:
> 5 + (6 + 7) * pi^2
[1] 133.3049
> log(exp(1))
[1] 1
> log(1000, 10)
[1] 3
> sin(pi/3)^2 + cos(pi/3)^2
[1] 1
> Sin(pi/3)^2 + cos(pi/3)^2
Lỗi: không thể tìm được chức năng “Sin”
(Error: couldn't find function "Sin“)
Giới thiệu về R và Rcmdr package 29

Các dạng số liệu cơ bản


Lôgic (Logical) Ký tự (Character)
> x <- T; y <- F > a <- "1"; b <- 1
> x; y > a; b
[1] TRUE [1] "1"
[1] FALSE [1] 1
Số (Numerical) > a <- "character"
> a <- 5; b <- sqrt(2) > b <- "a"; c <- a
> a; b > a; b; c
[1] 5 [1] "character"
[1] 1.414214 [1] "a"
[1] "character"

Giới thiệu về R và Rcmdr package 30

15
8/10/2022

Vectơ, Ma trận, Chuỗi


Vectơ
Ordered collection of data of the same data type
Ví dụ:
họ của tất cả sinh viên trong lớp
Các điểm số do một người thử đưa ra cho một tập hợp sản phẩm
Trong R, một chữ số là một vectơ có chiều dài bằng 1
Ma trận
Bảng số liệu hình chữ nhật của các số liệu cùng loại (Rectangular
table of data of the same type)
Ví dụ:
Các điểm số do tất cả thành viên hội đồng đưa ra cho một tập hợp sản
phẩm (sản phẩm = hàng, thành viên = cột)
Chuỗi
Ma trận có nhiều chiều hơn (nghĩa là “đa chiều - Multiway”)

Giới thiệu về R và Rcmdr package 31

Vectơ
Vectơ: tập các số liệu đồng dạng có thứ tự (Ordered collection of data
of the same data type)
> x <- c(5.2, 1.7, 6.3)
> log(x)
[1] 1.6486586 0.5306283 1.8405496
> y <- 1:5
> z <- seq(1, 1.4, by = 0.1)
> y + z
[1] 2.0 3.1 4.2 5.3 6.4
> length(y)
[1] 5
> mean(y + z)
[1] 4.2

Giới thiệu về R và Rcmdr package 32

16
8/10/2022

Ma trận
Ma trận: Bảng số liệu dạng chữ nhật của số liệu cùng loại
> m <- matrix(1:12, 4, byrow = T); m
[,1] [,2] [,3]
[1,] 1 2 3
[2,] 4 5 6
[3,] 7 8 9
[4,] 10 11 12
> y <- -1:2
> m.new <- m + y
> t(m.new)
[,1] [,2] [,3] [,4]
[1,] 0 4 8 12
[2,] 1 5 9 13
[3,] 2 6 10 14
> dim(m)
[1] 4 3
> dim(t(m.new))
[1] 3 4
Giới thiệu về R và Rcmdr package 33

Giá trị vắng mặt (Missing values)


R được thiết kế để xử lý các số liệu thống kê (handle statistical
data) và do đó cũng được xác định là phải đề cập đến các giá trị
vắng mặt (deal with missing values)
Các số không “sẵn có”
> x <- c(1, 2, 3, NA)
> x + 3
[1] 4 5 6 NA
“không phải số” “Not a number”
> log(c(0, 1, 2))
[1] -Inf 0.0000000 0.6931472
> 0/0
[1] NaN

Giới thiệu về R và Rcmdr package 34

17
8/10/2022

Tập con - Subsetting


Việc trích lấy một tập con từ một vectơ hoặc ma trận thường là cần
thiết
R cung cấp một số các phương pháp hay để làm việc đó

> x <- c("a", "b", "c", "d", "e", "f", "g", "h")
> x[1]
> x[3:5]
> x[-(3:5)]
> x[c(T, F, T, F, T, F, T, F)]
> x[x <= "d"]
> m[,2]
> m[3,]

Giới thiệu về R và Rcmdr package 35

Những dạng đối tượng và số liệu khác


Other Objects and Data Types
Các hàm - Functions
Các yếu tố - Factors
Các danh sách - Lists
Data frames

Chúng ta sẽ nói về những vấn đề này sau

Giới thiệu về R và Rcmdr package 36

18
8/10/2022

Nhập/Xuất số liệu
Nhập số liệu
R có thể nhập số liệu từ các phần mềm ứng dụng khác
Cách dễ nhất là nhập file.txt dạng “tab delimited”
> myData<-read.table("file",sep=",")
> myData <- read.table(file = "C:/myFile.txt",
header = TRUE, quote = "", sep = "\t",
comment.char="")

Xuất số liệu
R cũng có thể xuất số liệu dưới những định dạng khác
nhau
Tab delimited là dạng phổ biến nhất
> write.table(x, "filename")

Giới thiệu về R và Rcmdr package 37

Phân tích/Tóm tắt số liệu

Trước hết, xem qua một chút …


> SimpleData[1:10,]
Trung bình, phương sai, độ lệch chuẩn, v.v…
> mean(SimpleData[,3])
> mean(log(SimpleData[,3]))
> var(SimpleData[,4])
> sd(SimpleData[,3])
> cor(SimpleData[,3:4])
> colMeans(SimpleData[3:14])

Giới thiệu về R và Rcmdr package 38

19
8/10/2022

Biểu diễn bằng biểu đồ


Scatter plot
> plot(log(SimpleData[,"C1"]),
log(SimpleData[,"W1"]), xlab = "channel 1", ylab =
"channel 2")
Histogram
> hist(log(SimpleData[,7]))
> hist(log(SimpleData[,7]),nclass = 50, main =
"Histogram of W3 (on log scale)")
Boxplot
> boxplot(log(SimpleData[,3:14]))
> boxplot(log(SimpleData[,3:14]), outline = F,
boxwex = 0.5, col = 3, main = "Boxplot of
SimpleData")

Giới thiệu về R và Rcmdr package 39

Trợ giúp … và thoát


Kiếm thông tin về một lệnh cụ thể
> help(rnorm)
> ?rnorm
Tìm các hàm liên quan đến một từ khoá
> help.search("boxplot")
Khởi động những trang trợ giúp cài đặt R
> help.start()
Thoát khỏi R
> q()

Giới thiệu về R và Rcmdr package 40

20
8/10/2022

Bài tập
-import dữ liệu igf.txt từ Rcmdr
- Tóm tắt dữ liệu: summary()
Biến định tính
Biến định lượng
Tạo tập dữ liệu con (đọc tài liệu của Thầy Tuấn)

Giới thiệu về R và Rcmdr package 41

The Rcmdr package


Tải “Rcmdr package”
> library(Rcmdr)
Tips for R
https://www.r-bloggers.com/15-page-tutorial-for-r

Giới thiệu về R và Rcmdr package 42

21
8/10/2022

Tham khảo

http://www.r-project.org
http://sebastien.ledien.free.fr
http://ykhoanet.com/r/index.htm
www.statistics.vn
www.r-bloggers.com
https://www.youtube.com/user/drnguyenvtuan

Giới thiệu về R và Rcmdr package 43

22

You might also like