You are on page 1of 2

Học máy (Machine learning - ML) là một lĩnh vực nghiên cứu về trí tuệ nhân tạo liên

quan đến việc phát triển và nghiên cứu các thuật toán thống kê có thể học từ dữ liệu và
khái quát hóa thành dữ liệu chưa nhìn thấy, từ đó thực hiện các nhiệm vụ mà không cần
hướng dẫn rõ ràng. Phương pháp học máy đã được áp dụng cho nhiều lĩnh vực bao gồm
mô hình ngôn ngữ lớn (Large Language Models - LLM), thị giác máy tính (computer
vision), nhận dạng giọng nói (speech recognition), lọc email (email filtering), nông
nghiệp và y học. Các mô hình học máy cần dữ liệu đủ lớn để huấn luyện và đánh giá mô
hình, vì vậy chúng ta cần đánh giá, tìm hiểu dữ liệu và lựa chọn kỹ thuật phù hợp (dữ liệu
phải sạch và không có sai lệch và phải là dữ liệu thật)
Học máy được phân thành 3 loại:
- Học máy có giám sát (supervised learning) là thuật toán dự đoán đầu ra của tập dữ
liệu mới dựa trên dữ liệu đã biết trước, là nhóm phổ biến nhất trong các thuật toán
học máy. Trong học có giám sát, dữ liệu đã được gán nhãn và máy tính học cách
mô hình hóa các mối quan hệ dựa trên tập dữ liệu đó.

Hình 3.1: Mô hình học có giám sát


Nguồn: (VinIF (2024, 13 03), Supervised Learning và Unsupervised Learning)
- Học không giám sát (unsupervised learning) là thuật toán dựa vào cấu trúc dữ liệu
để thực hiện một công việc. Trong học không giám sát, dữ liệu không được gán
nhãn, chỉ có dữ liệu đầu vào và không biết được kết quả dữ liệu đầu ra.
Hình 3.2: Mô hình học không dám sát
Nguồn: (VinIF (2024, 13 03), Supervised Learning và Unsupervised Learning)
- Học bán giám sát (semi – supervised learning) là sự kết hợp giữa học có giám sát
và học không giám sát. Trong quá trình đào tạo, nó sử dụng một tập dữ liệu có
nhãn nhỏ hơn để hướng dẫn phân loại và trích xuất tính năng từ một tập dữ liệu
lớn hơn mà không được gắn nhãn.

You might also like