You are on page 1of 4

Câu 1: học máy là gì ?

 thành phần
T nhiệm vụ: bài toán giải quyết nhiệm vụ nào
P hiệu xuất: dùng gì để đánh giá hiệu xuất của bài toán
E kinh nghiệm: ….
Máy học là một nhánh của trí tuệ nhân tạo (AI) và khoa học máy tính,
tập trung vào việc sử dụng dữ liệu và thuật toán, dần dần cải thiện độ
chính xác của nó.
Về bản chất, học máy là quá trình cho phép hệ thống máy tính tự dạy
cách thực hiện các tác vụ phức tạp bằng cách phân tích các bộ dữ liệu lớn,
thay vì được lập trình rõ ràng với một thuật toán hoặc giải pháp cụ thể.

Câu 2: tầm quan trọng


Học máy là sự giao thoa giữa thống kê cổ điển với khoa học máy
tính. Một mục tiêu quan trọng của ngành học máy là làm sao để máy tính
thông minh hơn, có khả năng học hỏi và hình thành tri thức một cách tự
động từ kinh nghiệm và trở nên hữu ích hơn trong giao tiếp với con người.

Câu 3: lịch sử phát triển của học máy


1950 – Alan Turing tạo ra phép thử Turing (Turing Test) để xác định
xem một máy tính có trí thông minh thực sự hay không. Để vượt qua các
phép thử, máy tính phải có khả năng đánh lừa một người tin rằng nó cũng
là con người.
1952 – Arthur Samuel đã viết chương trình máy học đầu tiên.
Chương trình này là trò cờ đam, và máy tính IBM càng chơi càng tiến bộ,
học được các nước đi tạo lập nên chiến lược để chiến thắng và tích hợp
các nước đi đó vào chương trình của mình.
1957 – Frank Rosenblatt thiết kế hệ thần kinh (neural network) đầu
tiên cho máy tính (gọi là “perceptron”) mô phỏng các quá trình tư duy của
não người.
1967 – Thuật toán “điểm lân cận gần nhất” (nearest neighbor) được
viết ra cho phép các máy tính bắt đầu sử dụng dạng mẫu nhận thức rất cơ
bản. Thuật toán này có thể được sử dụng để vẽ một tuyến đường cho
nhân viên bán hàng lưu động, bắt đầu từ một thành phố ngẫu nhiên nhưng
đảm bảo họ tới tất cả các thành phố trong một chuyến đi ngắn.
1979 – Sinh viên Đại học Standford phát minh ra xe “Standford Cart”
có thể tự xác định được vật cản trong phòng. 
1981 – Gerald Dejong giới thiệu khái niệm Học qua giải thích (Explanation
Based Learning – EBL), trong đó một máy tính phân tích dữ liệu huấn
luyện và tạo ra một quy tắc chung mà nó có thể làm theo bằng cách loại bỏ
các dữ liệu không quan trọng.
1985 – Terry Sejnowski phát minh ra NetTalk, học cách phát âm các
giống như một đứa trẻ.
1990s – Các nghiên cứu về marchine learning chuyển từ cách tiếp
cận hướng-kiến-thức sang cách tiếp cận hướng-dữ-liệu. Các nhà khoa học
bắt đầu tạo các chương trình cho máy tính để phân tích một lượng lớn dữ
liệu và rút ra kết luận – hay “học” – từ các kết quả.
1997 – Máy tính Deep Blue của IBM đánh bại nhà vô địch cờ vua thế
giới.
2006 – Geoffrey Hinton tạo ra thuật ngữ “học sâu” (deep learning) để
giải thích các thuật toán mới cho phép các máy tính “nhìn thấy” và phân
biệt các đối tượng và văn bản trong hình ảnh và video.
2010 – Máy Microsoft Kinect có thể theo dõi 20 tính năng của con
người ở tốc độ 30 lần mỗi giây, cho phép mọi người tương tác với máy
tính thông qua các động tác và cử chỉ.
2011 – Máy IBM Watson đánh bại các đối thủ con người tại
Jeopardy.
2011 – Google Brain được phát triển, và hệ thần kinh sâu (deep
neural network) của nó có thể học để phát hiện và phân loại các đối tượng
bằng với khả năng của một chú mèo.
2012 – X Lab của Google phát triển một thuật toán machine learning
có khả năng tự duyệt video YouTube để xác định các video có chứa hình
ảnh mèo.
2014 – Facebook phát triển DeepFace, một thuật toán phần mềm có
thể nhận diện hoặc xác minh các cá nhân trong các bức ảnh ở mức độ
ngang với con người.
2015 – Amazon ra mắt nền tảng machine learning riêng của mình.
2015 – Microsoft tạo ra bộ công cụ máy học được phân bổ
(Distributed Machine Learning Toolkit), cho phép phân bổ hiệu quả
machine learning trên nhiều máy tính 
2015 – Hơn 3.000 nhà nghiên cứu về AI và Robotics, được Stephen
Hawking, Elon Musk và Steve Wozniak (và nhiều người khác) hậu thuẫn,
đã ký một bức thư ngỏ cảnh báo nguy cơ của vũ khí tự hành có thể lựa
chọn và nhắm vào các mục tiêu mà không cần sự can thiệp của con người.

Câu 4: nêu ví dụ
Ví dụ như các máy có thể "học" cách phân loại thư điện tử xem có
phải thư rác (spam) hay không và tự động xếp thư vào thư mục tương
ứng. Học máy rất gần với suy diễn thống kê (statistical inference) tuy có
khác nhau về thuật ngữ  
Nhận dạng ký tự: phân loại hình chụp ký tự thành các loại, mỗi loại
ứng với một ký tự tương ứng.
Phát hiện và nhận dạng mặt người: phát hiện vùng có chứa mặt
người trong ảnh, xác định đó là mặt người nào trong số những người đã
có ảnh trước đó, tức là phân chia ảnh thành những loại tương ứng với
những người khác nhau.
Lọc thư rác, phân loại văn bản: dựa trên nội dung thư điện tử, chia
thư thành loại “thư rác” hay “thư bình thường”; hoặc phân chia tin tức
thành các thể loại khác nhau như “xã hội”, “kinh tế”, “thể thao”.v.v.
Dịch tự động: dựa trên dữ liệu huấn luyện dưới dạng các văn bản
song ngữ, hệ thống dịch tự động học cách dịch từ ngôn ngữ này sang
ngôn ngữ khác. Hệ thống dịch tự động tiêu biểu dạng này là Google
Translate.
Chẩn đoán y tế: học cách dự đoán người bệnh có mắc hay không
mắc một số bệnh nào đó dựa trên triệu chứng quan sát được.
T: phán đoán xem người bệnh có mắc bệnh hay không
P: tỉ lệ chẩn đoán đúng bệnh trên tổng số bệnh nhân được chẩn đoán
E: tập hồ sơ bệnh án của những bệnh nhân khác có triệu chứng
tương tự
Dự đoán chỉ số thị trường: căn cứ giá trị một số tham số hiện thời và
trong lịch sử, đưa ra dự đoán, chẳng hạn dự đoán giá chứng khoán, giá
vàng.v.v.
Các hệ khuyến nghị, hay hệ tư vấn lựa chọn: cung cấp một danh
sách ngắn các loại hàng hóa, phim, video, tin tức v.v. mà người dùng nhiều
khả năng quan tâm. Ví dụ ứng dụng loại này là phần khuyến nghị trên
Youtube hay trên trang mua bán trực tuyến Amazon.
Ứng dụng lái xe tự động: dựa trên các mẫu học chứa thông tin về
các tình huống trên đường, hệ thống học máy cho phép tự ra quyết định
điều khiển xe, và do vậy không cần người lái. Hiện Google đã có kế hoạch
thương mại hóa xe ôtô tự động lái như vậy.
 
Câu 5: quá trình học máy diễn ra như thế nào ?
Học máy gồm 7 bước
 Thu thập dữ liệu
 Chuẩn bị dữ liệu
 Chọn mô hình 
 Huấn luyện
 Đánh giá
 Điều chỉnh siêu thông số
 Dự đoán
VD: lọc thư rác
T: lọc ra các thư dự đoán là thư ko quan trọng chuyển vào hộp thư rác
P: tỉ lệ thư đc lọc sang hộp thư rác là đúng
E: những thư được gán nhãn là thư rác, nhãn thư ko rác 

You might also like