Professional Documents
Culture Documents
Data Wrangling Cheatsheet Vietnamese
Data Wrangling Cheatsheet Vietnamese
x1 x2 x3 dplyr::inner_join(a, b, by = "x1")
A 1 T
B 2 F Giữ các giá trị có cả ở a & b
x1 x2 x3
dplyr::full_join(a, b, by = "x1")
Summarise sử dụng các hàm tính toán một véc-tơ Sử dụng “window function”, các hàm này tính toán 1 A
B
1
2
T
F Giữ tất cả các giá trị ở a & b
các giá trị và trả về giá trị, ví dụ: véc-tơ & trả ra giá trị là 1 véc-tơ, ví dụ: C 3 NA
D NA T
Giá trị cuối cùng của Giá trị lớn nhất của véc-tơ Véc-tơ giá trị logic tích lũy
Copy & tạo 1 véc-tơ có giá trị của theo điều kiên cho trước (tất x1 x2 dplyr::anti_join(a, b, by = "x1")
véc-tơ. mean biến chậm hơn 1 đơn vị cả các giá trị phải thỏa mãn) C 3
dplyr::nth dplyr::cumany Giư lại các dòng không có trong b
Giá trị thứ n của véc- Giá trị trung bình của véc- dplyr::dense_rank
Véc-tơ giá trị logic theo điều
tơ. tơ Thứ tự giá trị của biến (không tính kiện cho trước (có ít nhất 1 y z
dplyr::n trùng giá trị) giá trị thỏa mãn)
median dplyr::cummean x1 x2 x1 x2
Số lượng các quan sát dplyr::min_rank
trong véc-tơ Trung vị của véc-tơ Véc-tơ giá trị trung bình tích A 1 B 2
dplyr::n_distinct
Số lượng các giá trị
var
Phương sai của véc-tơ
Thứ tự giá trị của biến (tính trùng
giá trị)
lũy của x
Cumsum
Véc-tơ giá trị tổng tích lũy của Set Operations
B
C
2
3 + C
D
3
4 =
khác nhau trong véc- dplyr::percent_rank x
tơ sd Thứ tự giá trị trong khoảng [0, 1]. Cummax x1 x2
IQR Độ lệch tiêu chuẩn của Véc-tơ chứa các giá trị lớn B 2 dplyr::intersect(y, z)
IQR của một véc-tơ. dplyr::row_number nhất của x theo thứ tự
véc-tơ
Thứ tự giá trị của biến (tính trùng
C 3
Các dòng có ở cả y & z
cummin
giá trị - các giá trị trùng nhau được Véc-tơ chứa các giá trị nhỏ x1 x2
nhất của x theo thứ tự
Nhóm dữ liệu dplyr::union(y, z)
A 1
xếp thứ tự khác nhau) B 2
cumprod
dplyr::ntile(x,n) Véc-tơ giá trị của tích
C 3 Dòng có trong y hoặc z.
D 4
dplyr::group_by(iris, Species) Chia véc-tơ thành n nhóm pmax
dplyr::between(x,a,b) Véc-tơ giá trị lớn nhất x1 x2 dplyr::setdiff(y, z)
Nhóm các biến thành các hàng có cùng giá trị pmin A 1
của Species Kiểm tra các giá trị của x trong Véc-tơ giá trị nhỏ nhất
Dòng có trong y nhưng không có trong z
khoảng [a,b]
dplyr::ungroup(iris) Binding
Loại bỏ nhóm x1 x2
iris %>% group_by(Species) %>% mutate(…) A 1 dplyr::bind_rows(y, z)
iris %>% group_by(Species) %>% summarise(…)
Tạo các biến mới với mỗi nhóm B 2
Nối dòng dữ liệu từ z sang y,
Tính toán và trả các giá trị với mỗi nhóm C
B
3
2
C 3
D 4
x1 x2 x1 x2
dplyr::bind_cols(y, z)
A 1 B 2 Nối cột dữ liệu từ z sang y
B 2 C 3
Lấy dữ liệu: devtools::install_github("rstudio/EDAWR") C 3 D 4 Lưu ý: trùng giá trị của biến.
RStudio® is a trademark of RStudio, Inc. • CC BY RStudio • info@rstudio.com • 844-448-1212 • rstudio.com Translator: ranalytics.vn Xem thêm: Vignettes(package = c("dplyr", "tidyr")) • dplyr 0.4.0• tidyr 0.2.0 • Updated: 1/15