Professional Documents
Culture Documents
Big Data 09 ĐHCNTT03 Nhóm7
Big Data 09 ĐHCNTT03 Nhóm7
THẦY VÀ CÁC
BẠN ĐẾN VỚI BÀI
PHÂN TÍCH DỮ LIỆU XU
HƯỚNG TOÀN CẦU VỀ RỐI
LOẠN SỨC KHỎE TÂM THẦN
1
NGUYỄN NGỌC TÚ 0950080079
2
HUỲNH TẤN ĐẠT 0950080091
NỘI DUNG:
2 MÔ TẢ MÔ HÌNH
PHÂN LỚP DỮ LIỆU 4 KẾT LUẬN
1 TỔNG QUAN
1.1.Tổng quan về bigdata
Định nghĩa:
Big Data là các tập dữ liệu có khối lượng lớn
và phức tạp. Độ lớn đến mức các phần mềm
xử lý dữ liệu truyền thống không có khả năng
thu thập, quản lý và xử lý dữ liệu trong một
khoảng thời gian hợp lý.
Tính chất bigdata
Big Data là bao gồm 5 tính chất
như sau:
Một số ứng dụng tiêu biểu của bigdata
Bộ dữ liệu này chứa dữ liệu thông tin từ các quốc gia trên toàn cầu về tỷ lệ rối
loạn sức khỏe tâm thần bao gồm tâm thần phân liệt, rối loạn lưỡng cực, rối loạn
ăn uống, rối loạn lo âu, rối loạn sử dụng ma túy, trầm cảm và rối loạn sử dụng
rượu. Bằng cách cung cấp dữ liệu này ở định dạng dễ hình dung, bạn có thể hiểu
rõ hơn về cách những vấn đề này ảnh hưởng đến cuộc sống; cho phép hiểu sâu
hơn về các điều kiện này và các tác động. Data được lấy từ trang : Kaggle.com
3.1.2. Cấu trúc dữ liệu:
from google.colab import files
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy import stats
print("Chọn file data")
uploaded = files.upload()
df = pd.read_csv(input("Nhap
ten file vua upload "))
print(df)
3.2.2. Kiểm tra dòng cột dữ liệu rỗng:
df.info()
print('----'*15)
df.isnull().sum()
Nhóm DataFarme dựa trên City và tính tổng doanh thu của mỗi nhóm:
Có thể thấy thì thành phố có doanh thu cao nhất là Charlestron : 39974797 và
thấp nhất là thành phố Omaha: 5929038
Sử dụng trực quan hóa dữ liệu để vẽ
biểu đồ doanh thu:
Tìm tháng có lợi nhuận cao nhất:
Thực hiện nhóm tháng và năm để tính lợi nhuận
Ta có thể thấy là lợi nhuận cao nhất
Năm 2020:
o Tháng 4 có lợi nhuận cao nhất là
9301302
o Tháng 6 có lợi nhuận thấp nhất là
2292728
Năm 2021:
o Tháng 7 có lợi nhuận cao nhất là
29137256
o Tháng 3 có lợi nhuận thấp nhất là
14577799
Tìm tháng có lợi nhuận trung bình cao nhất trong năm :
Ta thấy tháng có lợi nhuận trung bình cao nhất là
tháng 8 : 17225734.5
Nhận xét: Qua việc phân dữ
liệu ở trên cho thấy được sự
phát triển mạnh mẽ của
thương hiệu giày Adidas với
lương doanh thu về cực
khủng
4 KẾT LUẬN
4.1. Những công việc đã thực hiện :
Có kiến thức về phân tích dữ liệu cũng như hiểu rõ hơn về ngôn
ngữ python các mô hình phân lớp dữ liệu. Cũng như hiểu rõ về việc
xem xét dữ liệu thực hiện các thao tác phân tích một cách rành
mạch . Biết thêm được các loại bệnh tâm thần và tác hại của chúng
thong qua số liệu nhìn ro vấn đề ngày cang nghiêm trọng của dành
cho cả nhóm em bài học về sức khỏe tâm lý .
4.2. Hướng phát triển và kiến nghị :
4.2.1. Hướng phát triển:
Qua bài thực hành big data nay của chúng em, em đã học được nhiều
hơn về big data và pypon.Kiến thức về Big data và pypon là kiến thức
quan trọng những kiến thức này là hành trangcho em trong con dường
tìm hiểu vè dữ liệu . Còn nhiều thứ hon để chúng ta tìm hiểu và cải
tiếng, chúng ta phải biết trao dồi kiến thức k ngừng để ngày cảm giúp
công nghệ chăm sốc sức khỏe taam thần này phat triển tốt hơn phực vụ
nhu cầu khám chữa bệnh của người dân.
4.2.2. Kiến Nghị:
Em mong mọi người có được nhiều cơ họi hợp tác nhóm để trao đổi về big
data và pypon cùng nhau phát triển kiến thức và kinh nghiệm hợp tác nhóm.
THANK YOU