You are on page 1of 43

Covid 19 Analysis

Hoàng Minh Thanh (21C11029)


Nguyễn Trần Khánh Nguyên (21C11017)
Nguyễn Công Phú (21C11018)
Nguyễn Thành Thái (21C11026)
1. Giới Thiệu 

2. Dữ Liệu 

3. Tiền Xử Lí 
Contents
4. Trực Quan Hóa 

5. Dashboard 

6. Story 

7. Mô hình dự đoán
1. Giới thiệu
Dịch Covid-19

 Đến nay có hơn 6.39 triệu


người tử vong do Covid-19.
Trong đó Việt nam hiện
có 43,092 tử vong.
 Covid-19 là dịch bệnh có  số
người chết nhiều thứ 7 trong
lịch sử nhân loại.
Vaccine Covid-19

 Đến nay đã có tổng


cộng vacxin 12.3 tỷ
liều vacxin,  trong đó
Việt Nam đã tiếp
nhận 150.623.444
liều
2. Dữ liệu
2. Dữ Liệu

 Dữ liệu số ca nhiễm Covid được lấy từ OurWorldInData


và VnExpress
 Dữ liệu về số Vacxin được lấy từ VnExpress
 Github : https://github.com/owid/covid-19-data
Data Schema

 Dữ liệu thu thập được


(Thống kê từ ngày 23/01/2020 – 27/07/2022)
Data Schema

 Dữ liệu thu thập được


Score Data Schema

 Dữ liệu về số ca nhiễm

Properties Type Meaning

date datetime Thời gian

total_cases number Tổng số ca nhiễm

new_cases number Số ca nhiễm tăng mới mỗi ngày

total_deaths number Tổng số ca người tử vong

new_deaths number Số người tử vong tăng mới mỗi ngày

total_vaccinations number Tổng số vaccxin được tiêm mỗi ngày

new_vaccinations number Số vacxin tăng mới mỗi ngày


Score Data Schema

 Dữ liệu về số Covid theo tỉnh thành

Properties Type Meaning

tinh string Tên tỉnh thành

total_case number Tổng số ca nhiễm

total_death number Số ca tử vong

new_deaths number Số người chết tăng mới mỗi ngày

new_vaccinations number Số vacxin tăng mới mỗi ngày

population number Số dân của tỉnh/thành phố


3. Tiền xử lý dữ liệu
Các khó khăn khi xử lý dữ liệu

 Dữ liệu thu được gồm rất nhiều cột khác


nhau, nhiều cột bị trống, dữ liệu bị NaA. 
Các khó khăn khi xử lý dữ liệu

 Dữ liệu chỉ có số ca nhiễm mới nhưng


bảng về số vacxin không mapping với bảng
số ca nhiễm.
 Các dữ liệu về số ca nhiễm, số tiêm vacxin
rời ràng do được thu thập theo khung thời
gian khác nhau.
Chuẩn hóa dữ liệu

 Giải pháp : Chuẩn hóa dữ liệu theo ca nhiễm theo số


lượng gần 100 dữ liệu và thông tin dữ liệu của 63 tỉnh
thành được liên kết với nhau.
Properties Type

new_cases number

new_deaths number

new_vaccinations number

Properties Type

new_cases_smoothed number

new_deaths_smoothed number

new_vaccinations_smoothed number
4. Trực quan hóa
Visualization

Vì sao mọi người phải tiêm vaccine


Visualization

Số ca tử vong theo thời gian

• Type: Biểu đồ đường


• X-axis: Thời gian
• Y-axis: Số ca tử vong mới
• Interactive:
• Time
• New deaths
Visualization

Số ca tử vong theo thời gian


Thời điểm
Phía Nam Thời điểm 2
(phía bắc)

• Thời điểm 2 số lượng ca nhiễm mới tăng cao


nhất, nhưng số ca tử vong ít hơn thời điểm 1
• Không nên chủ quan mặc dù đã tiêm vacccine
Visualization

Số ca nhiễm mới theo thời gian

• Type: Biểu đồ đường


• X-axis: Thời gian
• Y-axis: Số ca
• Interactive:
• Thời gian
• Số ca nhiễm mới
Visualization

Số ca nhiễm mới theo thời gian


Thời điểm sau khi phần lớn
người dân tiêm đủ vaccine
Visualization

So sánh số người đã tiêm và tiêm đầy đủ vaccine

o Type: Biểu đồ đường
o X-axis: Thời gian
o Y-axis: số người
o Interactive:
• Số người đã tiêm
• Số người tiêm đủ
liều
Visualization

So sánh số người đã tiêm và tiêm đầy đủ vaacine

Người dân tuân thủ


tiêm đủ liều vaccine
Visualization

So sánh số lượng test mới và số ca nhiễm mới

• Type: Biểu đồ đường
• X-axis: Thời gian
• Y-axis: Số lượng
• Interactive:
• Số Test mới
• Số nhiễm mới
Visualization

So sánh số lượng test mới và số ca nhiễm mới

Việc Test nhiều chỉ làm tăng


gánh nặng về kinh phí
Visualization

Tổng số ca nhiễm theo thời gian

o Type: Biểu đồ cột


o X-axis: Thời gian
o Y-axis: Số ca nhiễm
o Interactive:
• Tổng số ca Covid
Visualization

Bản đồ số ca nhiễm Covid ở các tỉnh thành

o Type: Heat Map


o Color: Thể hiện số người nhiễm
o Interactive:
o Tỉnh thành
o Số lượng người nhiễm
Visualization

Bản đồ tiêm vaccine ở các tỉnh thành


o Type: Heat Map
o Color: Đại diện cho số người đã
tiêm vaccine
o Interactive:
• Tỉnh thành
• Số lượng đã tiêm vaccine
5. Dashboard
5. Dashboard
5. Dashboard
5. Dashboard
 Website : https://hmthanh.github.io/covid
 Tableau: 
https://public.tableau.com/app/profile/hoa
ng.minh.thanh/viz/CovidDashboard_1658
9433345230/Dashboard1
6. Story
6. Story

Story 1
- Số lượng bệnh nhân ở TPHCM ít hơn nhưng nhiều ca tử vong hơn so
với HN vì TPHCM bùng phát dịch khi chưa có sự chuẩn bị kỹ
(vắc xin, bác sĩ, y tá, giường bệnh, …)
6. Story
Story 1
6. Story

Story 2
- Thời điểm bùng dịch vào cuối
tháng 7/2021, tuy nhiên không
tăng mạnh vì đã có những biện
pháp giãn cách.
- Số ca tăng nhanh vào khoảng
tháng 2/2022 do nước ta
chuẩn bị mở cửa trở lại.
- Sau thời gian tăng nhanh
thì hiện nay có dấu hiệu dừng
lại.
6. Story
Story 2
6. Story

Story 3

- Độ tương đồng của tổng


số ca tử vong với tổng số ca
mắc bệnh cao (0.849).
- Kết luận đơn giản là tổng
số ca bệnh càng tăng thì
tổng số ca tử vong cũng
tăng tương ứng.
7. Mô hình dự đoán
7. Mô hình dự đoán

- Thử nghiệm nhiều tham số khác


nhau cho mô hình ARIMA.
- ARIMA(0,2,5)(0,0,0)\[0] cho kết
quả tốt nhất.
- Mô hình khá tốt với các hệ số
lượng đều có ý nghĩa thống kê (p-
value rất nhỏ).
7. Mô hình dự đoán

- Dự đoán tổng số ca nhiễm


mới trong vòng 2 tháng với
khoảng tin cậy là 95% bằng trực
quan.
Reference
 Website : https://hmthanh.github.io/covid
 Tableau: 
https://public.tableau.com/app/profile/hoang.minh.thanh/
viz/CovidDashboard_16589433345230/Dashboard1
 Colab: 
https://drive.google.com/file/d/1W9g-UndDZ0h8ucUM2
Vpd00xtQtQH5ryc/view?usp=sharing

Github Data Source  (https://github.com/owid/covid-19-data)


Vnexpress : 
 Số ca nhiễm (https://vnexpress.net/covid-19/covid-19-viet-nam)
 Vacxin (https://vnexpress.net/covid-19/vaccine)

You might also like