Professional Documents
Culture Documents
Do An May Hoc
Do An May Hoc
Do An May Hoc
2
NỘI DUNG
I NGUỒN DỮ LIỆU
II TẬP DỮ LIỆU
3
I/NGUỒN DỮ LIỆU
https://www.kaggle.com/uciml/pima-indians-diabetes-database
4
III/TẬP DỮ LIỆU
1. Mang Thai: số lần mang thai
2. Glucoso: Nồng độ glucoso huyết tương 2 giờ trong xét nghiệm dung nạp
glucoso đường uống
3. Huyết áp: Huyết áp tâm trương(mm Hg)
4. Độ dày da: Độ dày nếp gấp cơ tam đầu
5. insulin: insulin huyết thanh 2 giờ (mu U / ml)
6. BMI: chỉ số cơ thể() (m:Cân nặng(kg),h:chiều cao(m))
7. Chức năng phả hệ
8. Tuổi
9. Kết quả: Biến lớp (0 hoặc 1) 268 trên 768 là 1, các biến khác là 0
5
IV/THUẬT TOÁN NAVIE BAYES
1.Sơ lược về thuật toán
a/Định lý Bayes:
()= với i=1,2,3,…,n
Trong đó: - một biến cố trong một nhóm biến cố đầy đủ(hay một giả thiết)
- B là biến cố xảy ra
- là xác suất tiên nghiệm
dụ: B được dùng để mô tả khách hàng trên 2 thuộc tinh là tuổi và thu nhập. là
Ví
biến cố khách hàng sẽ mua máy tính. Khi đó P(|B) biểu diễn xác suất khách
hàng B sẽ mua máy tính khi biết được tuổi và thu nhập của B. P() là xác suất tiên
nghiệm. Theo công thức trên ta được:
()=
6
IV/THUẬT TOÁN NAVIE BAYES
1.Sơ lược về thuật toán
b/Nguyên tắc hoạt động của bộ phân lớp Navie Bayes
• Cho D là tập dữ liệu huấn luyện cùng với các nhãn lớp tương ứng. Mỗi bộ dữ
liệu được mô tả bởi n thuộc tính và được diễn đạt dưới dạng vector n chiều
X=(, ,…, ).
7
IV/THUẬT TOÁN NAVIE BAYES
2.Áp dụng thuật toán vào chẩn đoán bệnh
tiểu đường
8
IV/THUẬT TOÁN KNN
1.Sơ lược về thuật toán
9
IV/THUẬT TOÁN KNN
2.Áp dụng thuật toán vào chẩn đoán bệnh
tiểu đường
10
V/SO SÁNH HAI THUẬT TOÁN
11