You are on page 1of 2

Phân loại các loài hoa iris bằng cách dùng Logistic regression:

DataSet: http://www.mediafire.com/file/o9j54e61cjsgafx/iris.csv

Bộ dữ liệu chứa các số đo chiều dài và chiều rộng của lá đài và cánh hoa cho ba loài hoa iris khác nhau:
iris setosa, iris versicolor và iris virginica.
Yêu cầu:

1. Tải tập dữ liệu iris và xem 5 dòng dữ liệu đầu tiên. Output như sau:

3. Bước tiếp theo là kỹ thuật tính năng. Chúng ta cần chọn các tính năng thích hợp nhất sẽ cung cấp mô
hình phân loại mạnh mẽ nhất. Vẽ biểu đồ một số đặc điểm khác nhau so với các phân loại loài được
phân bổ, ví dụ, chiều dài đài hoa so với chiều dài cánh hoa và loài. Kiểm tra trực quan các ô và tìm kiếm
bất kỳ mẫu nào có thể chỉ ra sự tách biệt giữa từng loài.

4. Chọn các đặc tính (feature) thích hợp để có thể cung cấp mô hình phân loại mạnh mẽ nhất. Vẽ biểu đồ
một số đặc tính khác nhau đối với các phân loại loài được phân bổ, ví dụ, chiều dài đài hoa so với chiều
dài cánh hoa và loài (output như hình bên dưới). Quan sát các biểu đồ và tìm kiếm mẫu nào có thể cho
thấy sự tách biệt giữa từng loài:

5. Trước khi có thể xây dựng mô hình, trước tiên chúng ta phải chuyển đổi các giá trị của loài thành các
nhãn có thể được sử dụng trong mô hình. Hãy thay thế chuỗi loài Iris-setosa bằng giá trị 0, chuỗi loài Iris-
versicolor bằng giá trị 1 và chuỗi loài Irisvirginica bằng giá trị 2.

6. Tạo mô hình bằng cách sử dụng các đặc tính được chọn từ 4. và các nhãn loài được chỉ định trong 5.
Output như sau:

LogisticRegression(C=1.0, class_weight=None, dual=False, fit_intercept=True,intercept_scaling=1,


max_iter=100, multi_class='auto',n_jobs=None, penalty='l2', random_state=None, solver='lbfgs',
tol=0.0001, verbose=0, warm_start=False)

7. Tính độ chính xác của mô hình so với tập huấn luyện. Output như sau:
0.9533333333333334

8. Xây dựng một mô hình khác bằng lựa chọn đặc tính thứ hai của bạn và so sánh hiệu suất.

9. Xây dựng một mô hình khác bằng cách sử dụng tất cả thông tin có sẵn và so sánh hiệu suất.

You might also like