You are on page 1of 15

TRƯỜNG ĐẠI HỌC ĐIỆN LỰC

KHOA CÔNG NGHỆ THÔNG TIN

BÁO CÁO HỌC PHẦN


HỌC MÁY NÂNG CAO

ĐỀ TÀI: NHẬN DẠNG KHUÔN MẶT

Sinh viên thực hiện :


:
Giảng viên hướng dẫn :
Ngành :
Chuyên ngành :
Lớp :
Khoá : 2018 – 2023

Hà Nội, tháng 02 năm 2021


PHIẾU CHẤM ĐIỂM
Sinh viên thực hiện:
Họ và tên Chữ ký Ghi chú Điểm

Giảng viên chấm:


Họ tên Chữ ký Ghi chú
Giảng viên chấm 1:

Giảng viên chấm 2:

MỤC LỤC
Trang
CHƯƠNG 1: TỔNG QUAN VỀ HỌC MÁY.......Error: Reference source not found
1.1 Học máy là gì?.................................................Error: Reference source not found
1.2. Các phương pháp học máy.............................Error: Reference source not found
1.2.1 Học có giám sát............................................Error: Reference source not found
1.2.2 Học không giám sát......................................Error: Reference source not found
1.2.4 Học củng cố..................................................Error: Reference source not found
1.3 Ứng dụng của học máy....................................Error: Reference source not found
1.3.1 Nhận dạng hình ảnh......................................Error: Reference source not found
1.3.2 Nhận dạng giọng nói.....................................Error: Reference source not found
1.4 Tương lai của học máy là gì?...........................Error: Reference source not found
LỜI CẢM ƠN

Trong lời đầu tiên của báo cáo nhóm em muốn gửi những lời cảm
ơn và biết ơn chân thành nhất của mình tới tất cả những người đã hỗ trợ,
giúp đỡ em về kiến thức và tinh thần trong quá trình thực hiện bài làm.
Em xin chân thành gửi lời cảm ơn tới các thầy, cô giáo trong Trường
Đại Học Điện Lực nói chung và các thầy cô giáo trong Khoa Công nghệ
thông tin nói riêng đã tận tình giảng dạy, truyền đạt cho em những kiến
thức cũng như kinh nghiệm quý báu trong suốt quá trình học tập.
Đặc biệt, em xin gửi lời cảm ơn đến Giảng viên hướng dẫn, giảng
viên Khoa Công nghệ thông tin - Trường Đại Học Điện Lực. Thầy đã tận
tình theo sát giúp đỡ, trực tiếp chỉ bảo, hướng dẫn trong suốt quá trình
nghiên cứu và học tập của em. Trong thời gian học tập với thầy, em
không những tiếp thu thêm nhiều kiến thức bổ ích mà còn học tập được
tinh thần làm việc, thái độ nghiên cứu khoa học nghiêm túc, hiệu quả.
Đây là những điều rất cần thiết cho chúng em trong quá trình học tập và
công tác sau này.
Do thời gian thực hiện có hạn kiến thức còn nhiều hạn chế nên bài
làm của nhóm chúng em chắc chắn không tránh khỏi những thiếu sót nhất
định. Chúng em rất mong nhận được ý kiến đóng góp của thầy, cô giáo và
các bạn để nhóm em có thêm kinh nghiệm và tiếp tục hoàn thiện đồ án
của mình.
Chúng em xin chân thành cảm ơn!
LỜI MỞ ĐẦU
Công nghệ thông tin ngày càng có vai trò quan trọng trong cuộc
sống hàng ngày của chúng ta. Việc ứng dụng công nghệ thông tin vào các
lĩnh vực trong đời sống giúp công việc được tiến hành nhanh chóng và
hiệu quả hơn. Có rất nhiều công việc mới phát triển song song với sự phát
triển của công nghệ thông tin, một trong những số đó là phân tích chuẩn
đoán dữ liệu – big data, hướng đi mang lại hiệu quả rất lớn.
Nhóm chúng em chọn đề tài “Nhận dạng khuôn mặt” nhằm tìm hiểu
sâu hơn về dữ liệu cách khai thác và sử dụng hiệu quả, từ đó viết một ứng
dụng cụ thể thử nghiệm làm cơ sở củng cố kiến thức và định hướng, kế
hoạch xây dựng các ứng dụng trong tương lai.
CHƯƠNG 1: TỔNG QUAN VỀ HỌC MÁY

Thuật ngữ học máy có lẽ không còn quá xa lạ với con người ngày nay
bởi chúng đã được sử dụng trên phạm vi toàn thế giới. Hiện tại, Machine
Learning đã đạt được rất nhiều thành tựu to lớn và trở thành hướng
nghiên cứu chính trong AI (trí tuệ nhân tạo). Vậy học máy là gì? Đừng bỏ
lỡ bài viết sau, chúng mình sẽ giúp bạn tìm hiểu những thông tin liên
quan đến Machine Learning.

1.1 Học máy là gì?


Học máy hay máy học có tên tiếng Anh đầy đủ là Machine Learning,
viết tắt là ML. Thuật toán Machine Learning là các chương trình máy tính
có khả năng học hỏi và hoàn thành các nhiệm vụ, đồng thời là cách để cải
thiện hiệu suất theo thời gian vô cùng hiệu quả.

Hình 1.1 Ảnh minh họa học máy


- Học máy là công nghệ được phát triển từ trí tuệ nhân tạo

1
- Ngoài ra, Machine Learning còn được biết là còn là công nghệ phát
triển từ lĩnh vực trí tuệ nhân tạo tiên tiến nhất hiện nay. Để đảm bảo
không có sai lệch và không xuất hiện dữ liệu giả, Machine Learning vẫn
cần quá trình tìm hiểu và lựa chọn kỹ thuật phân tích dữ liệu từ con
người.

- Học máy ngày càng mang tính phổ biến trên toàn thế giới. Sự tăng
trưởng vượt bậc của dữ liệu lớn (Big Data) và các thuật toán Machine
Learning đã cải thiện độ chính xác của những mô hình và dự đoán tương
lai.

1.2. Các phương pháp học máy


1.2.1 Học có giám sát

Hình 1.2 Học máy có giám sát


Học có giám sát là một hướng tiếp cận của Máy học để làm cho máy
tính có khả năng "học". Trong hướng tiếp cận này, người ta "huấn luyện"
máy tính dựa trên những quan sát có dán nhãn. Học có giám sát mô
phỏng việc con người học bằng cách đưa ra dự đoán của mình cho một
câu hỏi, sau đó đối chiếu với đáp án. Sau đó con người rút ra phương
pháp để trả lời đúng không chỉ câu hỏi đó, mà cho những câu hỏi có dạng
tương tự.

2
- Trong học có giám sát, các quan sát bắt buộc phải được dán nhãn
trước. Đây chính là một trong những nhược điểm của phương pháp này,
bởi vì không phải lúc nào việc dán nhãn chính xác cho quan sát cũng dễ
dàng. Tuy nhiên, việc quan sát được dán nhãn cũng lại chính là ưu điểm
của học có giám sát bởi vì một khi đã thu thập được một bộ dữ liệu lớn
được dán nhãn chuẩn xác, thì việc huấn luyện trở nên dễ dàng hơn rất
nhiều so với khi dữ liệu không được dán nhãn.

- Ví dụ với cách học của con người khi còn nhỏ. Ta đưa bảng chữ cái
cho một đứa trẻ và chỉ cho chúng đây là chữ A, đây là chữ B. Sau một vài
lần được dạy thì trẻ có thể nhận biết được đâu là chữ A, đâu là chữ B
trong một cuốn sách mà chúng chưa nhìn thấy bao giờ.

1.2.2 Học không giám sát


Trong thuật toán này chúng ta không biết được dữ liệu đầu ra
hay nhãn mà chỉ có dữ liệu đầu vào. Thuật toán Học không giám sát dựa
vào cấu trúc của dữ liệu để thực hiện một công việc nào đó, ví dụ như
phân nhóm hoặc giảm số chiều của dữ liệu để thuận tiện trong việc lưu
trữ và tính toán.

- Một cách toán học, Học không giám sát là khi chúng ta chỉ có dữ liệu
vào X mà không biết nhãn Y tương ứng.

- Những thuật toán loại này được gọi là Học không giám sát vì không
giống như Học có giám sát, chúng ta không biết câu trả lời chính xác cho
mỗi dữ liệu đầu vào. Giống như khi ta học, không có thầy cô giáo nào chỉ
cho ta biết đó là chữ A hay chữ B. Cụm không giám sát được đặt tên theo
nghĩa này.

3
Hình 1.3 Học không giám sát
- Ứng dụng phổ biến nhất của Học không giám sát là bài toán về phân
cụm.
1.2.3 Học bán giám sát
Nằm ở đâu đó giữa học tập được giám sát và không giám sát, vì chúng
sử dụng cả dữ liệu được gắn nhãn và không dán nhãn để đào tạo - thường
là một lượng nhỏ dữ liệu có nhãn và một lượng lớn dữ liệu không được
dán nhãn. Các hệ thống sử dụng phương pháp này có thể cải thiện đáng
kể độ chính xác của việc học. Thông thường, việc học bán giám sát được
chọn khi dữ liệu được dán nhãn được yêu cầu đòi hỏi tài nguyên có kỹ
năng và có liên quan để đào tạo/học hỏi từ nó. Nếu không, dữ liệu được
gắn nhãn thường không yêu cầu tài nguyên bổ sung.

Hình 1.4 Học bán giám sát

4
1.2.4 Học củng cố
Reinforcement learning là các bài toán giúp cho một hệ thống tự
động xác định hành vi dựa trên hoàn cảnh để đạt được lợi ích cao nhất
(maximizing the performance). Hiện tại, Reinforcement learning chủ yếu
được áp dụng vào Lý Thuyết Trò Chơi (Game Theory), các thuật toán cần
xác định nước đi tiếp theo để đạt được điểm số cao nhất.

Hình 1.5 Ví dụ Reinforcement Learning( Học củng cố)

1.3 Ứng dụng của học máy


Học máy được sử dụng trong các lĩnh vực khác nhau vì nhiều lý do khác
nhau. Các hệ thống giao dịch dùng Học máy để xác định cơ hội đầu tư
mới. Các nền tảng tiếp thị và thương mại điện tử dùng Học máy để cung
cấp các đề xuất sản phẩm cho người dùng dựa trên lịch sử tìm kiếm trên
internet hoặc các giao dịch trước đó. Các tổ chức cho vay có thể kết hợp
Học máy để dự đoán các khoản nợ xấu và xây dựng mô hình rủi ro tín
dụng. Các ngân hàng có thể áp dụng các kỹ thuật Học máy để tạo ra các
công cụ phát hiện gian lận. Ứng dụng của Học máy trong kỷ nguyên kỹ
thuật số là vô tận khi các doanh nghiệp và chính phủ nhận thức rõ hơn về
các cơ hội mà dữ liệu lớn mang lại.

5
1.3.1 Nhận dạng hình ảnh

Một trong những ứng dụng phổ biến nhất của học máy là nhận dạng hình
ảnh. Có nhiều tình huống trong đó bạn có thể phân loại đối tượng thành
một hình ảnh kỹ thuật số. Đối với hình ảnh kỹ thuật số, các phép đo mô tả
đầu ra của từng pixel trong hình ảnh.

Trong trường hợp hình ảnh đen trắng, cường độ của từng pixel đóng vai
trò là một phép đo. Vì vậy, nếu một hình ảnh đen trắng có N * N pixel,
thì tổng số pixel và do đó đo là N2.

Trong hình ảnh màu, mỗi pixel được coi là cung cấp ba phép đo cường độ
của ba thành phần màu chính, tức là RGB. Vì vậy, trong hình ảnh màu N
* N, có ba phép đo N2.

 Nhận diện khuôn mặt : Thể loại có thể là mặt hiện tại so với
không có mặt. Có thể có một danh mục riêng cho mỗi người trong
cơ sở dữ liệu của một số cá nhân.

Hình 1.6 Ứng dụng của học máy trong nhận dạng khuôn mặt

6
 Nhận dạng ký tự : Chúng ta có thể phân đoạn một đoạn văn bản
thành các hình ảnh nhỏ hơn, mỗi đoạn chứa một ký tự. Các danh
mục có thể bao gồm 26 chữ cái của bảng chữ cái tiếng Anh, mười
chữ số và một số ký tự đặc biệt.

Hình 1.7 Nhận dạng ký tự quang học

1.3.2 Nhận dạng giọng nói

Nhận dạng giọng nói (SR) là bản dịch các từ được nói thành văn bản. Nó
còn được gọi là nhận dạng giọng nói tự động (ASR), nhận dạng giọng nói
máy tính hoặc lời nói thành văn bản (STT).

Trong nhận dạng giọng nói, một ứng dụng phần mềm nhận ra lời nói. Các
phép đo trong ứng dụng này có thể là một tập hợp các số đại diện cho tín
hiệu giọng nói. Chúng ta có thể phân đoạn tín hiệu thành các phần có
chứa các từ hoặc âm vị riêng biệt. Trong mỗi phân đoạn, chúng ta có thể
biểu thị tín hiệu giọng nói theo cường độ hoặc năng lượng trong các dải
tần số thời gian khác nhau.

7
Mặc dù các chi tiết về biểu diễn tín hiệu nằm ngoài phạm vi của bài viết
này, chúng ta có thể biểu diễn tín hiệu bằng một tập hợp các giá trị thực.

Các ứng dụng nhận dạng giọng nói bao gồm giao diện người dùng bằng
giọng nói. Giao diện người dùng giọng nói bao gồm quay số bằng giọng
nói, định tuyến cuộc gọi và điều khiển thiết bị hình khối. Nó cũng có thể
được sử dụng để nhập dữ liệu đơn giản, chuẩn bị các tài liệu có cấu trúc,
xử lý lời nói thành văn bản và các mặt phẳng.

Hình 1.8 Ứng dụng học máy trong nhận dạng giọng nói

Ngoài ra cong các ứng dụng khác như: Chuẩn đoán y khoa, dự đoán,
phân loại, hiệp hội học tập….

1.4 Tương lai của học máy là gì?


- Mặc dù các thuật toán học máy đã tồn tại trong nhiều thập kỷ, nhưng
chúng đã đạt được mức độ phổ biến mới khi trí tuệ nhân tạo ngày càng
phát triển. Đặc biệt, các mô hình học sâu cung cấp năng lượng cho các
ứng dụng AI tiên tiến nhất hiện nay.

8
- Các nền tảng máy học là một trong những lĩnh vực cạnh tranh nhất của
công nghệ doanh nghiệp, với hầu hết các nhà cung cấp lớn, bao gồm
Amazon, Google, Microsoft, IBM và những người khác, đang chạy đua
để khách hàng đăng ký các dịch vụ nền tảng bao gồm toàn bộ các hoạt
động máy học, bao gồm thu thập dữ liệu , chuẩn bị dữ liệu , phân loại dữ
liệu, xây dựng mô hình, đào tạo và triển khai ứng dụng.

- Khi máy học tiếp tục gia tăng tầm quan trọng đối với hoạt động kinh
doanh và AI trở nên thực tế hơn trong các môi trường doanh nghiệp, cuộc
chiến nền tảng máy học sẽ chỉ ngày càng khốc liệt.

- Tiếp tục nghiên cứu sâu hơn và AI ngày càng tập trung vào việc phát
triển các ứng dụng tổng quát hơn. Các mô hình AI ngày nay yêu cầu đào
tạo sâu rộng để tạo ra một thuật toán được tối ưu hóa cao để thực hiện
một nhiệm vụ. Nhưng một số nhà nghiên cứu đang khám phá các cách để
làm cho các mô hình linh hoạt hơn và đang tìm kiếm các kỹ thuật cho
phép máy áp dụng ngữ cảnh đã học từ một nhiệm vụ cho các nhiệm vụ
khác nhau trong tương lai.

You might also like