You are on page 1of 20

Nguyên lý máy

học
Giải thuật
PCA
Thành viên
1. Nguyễn Duy Hòa
2. Phạm Đình Thông
3. Nguyễn Văn Phi
4. Nguyễn Hữu Tân
5. Trần Ngọc Sơn
6. Nguyễn Văn Trâm
7. Ngô Minh Hiếu
Nội dung chính

Chương 1: Tổng quan về bài toán phát hiện khuôn mặt người trong ảnh
Chương 2: Thuật toán nhận dạng khuôn mặt người.
Chương 3: Xây dựng chương trình thử nghiệm.
Tổng quan

Quá trình nhận dạng và phát hiện một đối tượng


Ứng dụng

Xác minh tội phạm

Camera chống trộm

Bảo mật
Ứng dụng

Lưu trữ khuôn mặt

Các ứng dụng khác


What is PCA ?

Sơ lược về thuật
toán PCA

Phương pháp PCA sẽ “chiếu” (biễu diễn) dữ liệu đa


chiều lên một không gian có cơ sở trực giao, tức nếu ta
xem mỗi cơ sở trong không gian mới là một biến thì hình
ảnh của dữ liệu gốc trong không gian mới này sẽ được
biểu diễn thông qua các biến độc lập (tuyến tính)
Mô tả thuật toán

Trên khuôn mặt tồn tại một nét tổng thể nào đó để có thể nhận diện, thuật toán của ta bắt đầu từ ý
tưởng này

Ma trận A có kích thước M*N × P


Ma trận AAT có kích thước M*N×M*N

Vector riêng của ma trận ATA có kích thước P×P

Nếu v là một vector riêng của ATA và λ là trị riêng tương ứng, khi đó ta có
Mô tả thuật toán
Sau khi có các vector riêng của ma trận AAT, ta sẽ chuẩn hóa chúng để thu được một cơ sở trực chuẩn
của không gian khuôn mặt. Đặt L= AAT, tìm V là tập hợp các vector riêng của L, D là tập hợp các trị
riêng tương ứng
E = AV là tập các vector riêng của AAT. Do đây là những vector riêng, mà nó lại có dạng khuôn mặt
nên còn đuợc gọi là Eigenfaces. E là ma trận M*N×Q, mỗi cột là một vector riêng.

Đặt K= H - m với m là vector ảnh trung bình. H được xem là một vector trong không gian M*N chiều.
Cho V là một không gian có tích vô hướng hữu hạn chiều và W là một không gian con của V. Giả sử W có
một cơ sở trực chuần là {u1, …, uQ}. Khi đó hình chiếu trực giao của vector u bất kỳ lên W được xác định
như sau:
Mô tả thuật toán
Độ dài ||u – u0|| được gọi là khoảng cách từ u đến W.
Tập hợp ci = <u/ui> , i=1, …., Q được gọi là tọa độ của u­0­trong không gian W.
Tìm C=ETK là tọa độ của hình chiếu K­­f của K lên không gian khuôn mặt. C là vector cột Q×1

Với A­i là một cột trong ma trận A (tương ứng với bức ảnh T­i trong tập huấn luyện). Ta tính Ci = ETAi
là tọa độ của hình chiếu A­if­của A­i ­lên không gian khuôn mặt. Ta tính hai đại lượng sau:

S = ||K – Kf|| xem như khoảng cách từ bức ảnh H đến không gian mặt.

Si = ||C – Ci|| xem như khoảng cách từ H đến bức ảnh T­i trong tập huấn luyện.

Xét α và β là hai ngưỡng nào đó.

s < α thì H là bức ảnh khuôn mặt (do H đủ gần với không gian mặt).

s­i < β thì T­i­là bức ảnh của cùng một người với H ( H đủ gần với T­i).
Mô tả thuật toán
Vậy là ta đã có thể tìm bức ảnh trong tập huấn luyện giống với bức ảnh H hay xác định đó có phải là
bức ảnh khuôn mặt hay không.
Tuy nhiên ảnh H phải có cùng kích thước với những bức ảnh trong tập huấn luyện. Bây giờ trong
một bức ảnh lớn H có nhiều khuôn mặt, ta sẽ xác định vị trí những khuôn mặt trong bức ảnh.

Tại mỗi vị trí (x,y) trong H, đặt H(x,y) là một vùng trong ảnh H có kích thước M×N tại (x,y) , ta xem
ảnh con H(x,y) là một vector M*N chiều.

K(x,y) = H(x,y) - m

Tìm Kf(x,y) là hình chiếu của K(x,y) lên không gian khuôn mặt.

Tính s(x,y) = || K(x,y) – Kf(x,y)||

Tập hợp các giá trị s(x,y) tạo thành một bản đồ khuôn mặt (face map) của H, từ đó ta có thể xác định
vị trí những khuôn mặt trong ảnh.
Ưu điểm

 Tìm được các đặc tính tiêu biểu của đối tượng cần nhận
dạng mà không cần phải xác định các thành phần và mối
quan hệ giữa các thành phần đó.
 Thuật toán có thể thực hiện tốt với các cảnh có độ phân
giải cao, do PCA sẽ thu gọn ảnh thành một ảnh có kích
thước nhỏ hơn.
 PCA có thể kết hợp với các phương pháp khác như
mạng Nơron, Support Vector Machinge… để mạng lại
hiệu quả nhận dạng cao hơn.
Nhược điểm

 PCA phân loại theo chiều lớn nhất của


tập vector. Tuy nhiên, chiều phân bố lớn
nhất không phải lúc nào cũng mang lại
hiệu quả tốt nhất cho bài toán nhận
dạng. Đây là nhược điểm cơ bản của
PCA.
 PCA rất nhạy với nhiễu.
Xây dựng Demo

Biểu đồ ngữ cảnh của hệ thống


Lưu trữ dữ liệu

Lưu trữ dữ liệu ảnh


Thuộc tính ảnh đầu vào

1 3
ID_images: Mã ảnh là Images: Mã nhị phân của
duy nhất, ràng buộc ảnh
khóa chính tự tăng

2 4
Ten_images: Tên ảnh gốc URL: Đường dẫn tới ảnh
Các thuộc tính khuôn mặt

3
1 Ten_images: Tên ảnh
ID_face: Mã ảnh khuôn chứa mặt, theo tên ảnh
mặt là duy nhất, ràng gốc, thêm số thứ tự để
buộc khoá chính tự tăng phân biệt khi ảnh gốc
nhiều khuôn mặt

2 5 4
ID_images: Khoá ngoại URL: Đường dẫn tới ảnh Images: Mã nhị phân của
tham chiếu đến ảnh gốc khuôn mặt ảnh khuôn mặt
Sơ đồ quan hệ thực thể ER của hệ thống
Câu hỏi ?

You might also like