You are on page 1of 1

BÀI TẬP: QUẢN LÝ DỮ LIỆU VỚI R

• Nhập dữ liệu về tình hình Covid-19 hiện nay ở Việt Nam theo tỉnh/thành, gồm các biến số
sau:
• Tên tỉnh/thành
• Dân số của tỉnh/thành tính đến hết năm 2020 (từ GSO)
• Số ca nhiễm bệnh
• Số lượng vắc xin được phân bổ (a)
• Số lượng vắc xin đã tiêm (b)
• Đọc file dữ liệu vào R.
• Tạo biến tỷ lệ tiêm trên số lượng đã phân bổ.
• Tạo biến tỷ lệ nhiễm trên 1000 người.
• Tạo biến nguy cơ để phân nhóm tỉnh/thành theo số lượng ca nhiễm (cụ thể: từ 10.000 ca trở
lên = "Cao", từ 5.000- dưới 10.000 ca = "Trung bình", và dưới 5.000 ca = "Thấp").
• Lọc những tỉnh/thành có nguy cơ "thấp" và tỷ lệ tiêm từ 50% trở lên, thành dataset mới.
• Sản phẩm: R script, và các file dữ liệu.

You might also like