Professional Documents
Culture Documents
HTTT - C7-Machine Learning
HTTT - C7-Machine Learning
H C M
❖Ví dụ: Cần một thuật toán tự xác định giá nhà dựa
trên các đặc điểm của căn nhà đó.
❖Giả thiết đặt ra: giá nhà (𝑦) sẽ phụ thuộc vào các
yếu tố sau:
▪ Diện tích 𝑥1
▪ Số phòng ngủ 𝑥2
▪ Khoảng cách đến trung tâm thành phố 𝑥3 .
❖Mô hình bài toán
𝑥1
𝒙2 Regression 𝑦ො
𝒙3
20/04/2023 Biên soạn: ThS. Nguyễn Thanh Tâm
Bài toán hồi qui
❖Gọi:
▪ Giá nhà thật sự là 𝑦
▪ Giá nhà dự đoán là 𝑦ො
❖Ta cần tìm công thức tính:
▪ 𝑦ො = 𝑓 𝑥1 , 𝑥2 , 𝑥3
▪ Sao cho 𝑦ො ≈ 𝑦
❖Giả thiết giá nhà phụ thuộc vào diện tích, số phòng
ngủ và khoảng cách đến trung tâm thành phố theo 1
hàm tuyến tính, ta có:
▪ 𝑦ො = 𝑓 𝑥1 , 𝑥2 , 𝑥3 = 𝑤0 + 𝑤1 𝑥1 + 𝑤2 𝑥2 , +𝑤3 𝑥3
❖Ta cần tìm 𝑤0 , 𝑤1 , 𝑤2 , 𝑤3
20/04/2023 Biên soạn: ThS. Nguyễn Thanh Tâm
Bài toán hồi qui
❖Code python:
# import các class cần sử dụng
from __future__ import division, print_function, unicode_literals
import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets, linear_model
❖Code python:
# Vẽ biểu dồ hiển thị dữ liệu
plt.plot(X, y, 'ro')
plt.axis([140, 190, 45, 75])
plt.xlabel('Height (cm)')
plt.ylabel('Weight (kg)')
plt.show()
❖Code python:
# Tạo mô hình bài toán hồi qui tuyến tính
regr = linear_model.LinearRegression(fit_intercept=False)
# Huấn luyện mô hình
regr.fit(Xbar, y)
# Thử dự đoán với giá trị chiều cao 155cm và 160cm
x_test = regr.predict(np.array([[1,155]]))
print( 'Giá trị dự đoán cho X=155 là:', x_test )
x_test = regr.predict(np.array([[1,160]]))
print( 'Giá trị dự đoán cho X=160 là:', x_test )
❖Ví dụ: Một nhóm 20 sinh viên dành thời gian trong
khoảng từ 0 đến 6 giờ cho việc ôn thi. Thời gian ôn
thi này ảnh hưởng đến xác suất sinh viên vượt qua
kỳ thi như thế nào?
Hours 0.5 0.75 1 1.25 1.5 1.75 1.75 2 2.25 2.5
Pass 0 0 0 0 0 0 1 0 1 0
Pass 1 0 1 0 1 1 1 1 1 1
❖2D - Data
❖Linear Classifier
❖Linear Classifier
❖Shifty
❖Shifty
k=2
KNN (k-nearest neighbors)
k=3