Professional Documents
Culture Documents
Báo Cáo NDM
Báo Cáo NDM
Dữ liệu đầu vào: Cân nặng của các vận động viên nam và nữ, lấy từ tập dữ liệu
athletes.csv trên Kanggle
Mô tả bài toán: Dùng bayes, tính likelihood, posterior, risk của 2 tập dữ liệu. Sau
đó áp dụng luật quyết định của bayes, phân loại x (cân nặng) vào các lớp phù hợp
(nam và nữ)
1. Xử lý dữ liệu: Tải dữ liệu lên, sau đó trích xuất cân nặng của vận động viên
theo giới tính, lưu vào ω 1 và ω 2
Omega1, omega2 lần lượt là cân nặng của vận động viên nam và nữ
Samples là tập không gian mẫu
Array_x là các giá trị x xuất hiện trong samples
2. Xây dựng hàm:
3. Áp dụng:
Tính likelihood:
Biểu đồ thể hiện:
Tính posterior:
I. Phân lớp bằng biệt hàm với hàm phân phối chuẩn
1. Biệt hàm
p ( x|ωi ) P ( ωi )
gi ( x ) =P ( ωi|x )= c
∑ p ( x|ω j ) P ( ω j )
j=1
~ gi (x )= p(x∨ω i) P(ω i)
gi (x)=ln p(x∨ω i)+ ln P( ωi )
1 (2)
p( x )=
¿¿
1
gi ( x ) ¿− ¿
2
3. Tường hợp 1: ∑i =σ 2I
|∑ i|=σ 2 d, ∑i−1=( 1/σ 2 )
2
−¿∨x−μi ∨¿
gi ( x ) = 2
+ ln P ( ω i )
2σ
−( x T x−2 μ Ti x+ μTi μ i)
gi ( x ) = + ln P(ωi )
2 σ2
T
1 T −μi μ i T
¿> μ x+[
2 i 2
+ln P(ω i)]=w i x + wi 0
σ 2σ
−1
gi ( x ) = ¿
2
ω=argmax ( P ( ω|x ))
Priori được tích dựa trên xác xuất suất hiện lớp đó
Với giả thiết Naive Bayes, các thành phần x sẽ độc lập với
nhau vì vậy p ( x|ω ) được tính:
d
p ( x|ω ) =∏ p ( x i|ω )
i=1
d
ω=argmax ( P ( ω ) ∏ p ( x i|ω ) )
i=1
Kết quả :