Professional Documents
Culture Documents
NhandangkhuonmatNoron PDF
NhandangkhuonmatNoron PDF
TÓM TẮT
Nhận dạng khuôn mặt hiện nay có rất nhiều hướng nghiên cứu nhằm nâng cao hiệu suất
nhận dạng và tối ưu hóa hệ thống. Bài báo này nghiên cứu và phát triển hai hệ thống nhận dạng
khuôn mặt đơn giản theo hai phương pháp đối sánh và mạng nơron cùng dựa trên đặc trưng PCA.
Hệ thống được kiểm tra trên cơ sở dữ liệu ORL của AT&T. Kết quả thực nghiệm được phân tích
để đánh giá hiệu suất nhận dạng và tính ổn định của hai hệ thống nhận dạng trong các điều kiện
kiểm thử khác nhau. Kết quả cũng chỉ ra hiệu suất vượt trội của mạng nơron so với phương pháp
đối sánh.
ABSTRACT
Face recognition nowadays has a lot of researchs to improve recognition performance and
optimise system. In this report,we research and develop two simple face recognition systems using
template matching and neural network based on Principal Component Analysis PCA. The system
has been tested on the ORL database of AT&T. The experimental results are analysed to evaluate
recognition performance and the stability of two systems in different conditions. The results have
also examined that the performance of neural network is superior to that of the template matching.
1. Đặt vấn đề
Nhận dạng khuôn mặt người là một công nghệ được ứng dụng rộng rãi trong đời
sống hằng ngày của con người như các hệ thống giám sát, quản lý vào ra, tìm kiếm thông
tin một người nổi tiếng,…Có rất nhiều phương pháp nhận dạng khuôn mặt để nâng cao
hiệu suất tuy nhiên dù ít hay nhiều những phương pháp này đang vấp phải những thử thách
về độ sáng, hướng nghiêng, kích thước ảnh, hay ảnh hưởng của tham số môi trường.
Có hai phương pháp nhận dạng phổ biến hiện nay là nhận dạng dựa trên đặc trưng
của các phần tử trên khuôn mặt như biến đổi Gabor Wavelet và mạng Neural, SVM,…và
nhận dạng dựa trên xét tổng thể toàn khuôn mặt như phương pháp PCA, LDA, LFA [1][2].
Trong đó, PCA là phương pháp trích rút đặc trưng nhằm giảm số chiều của ảnh tuy đơn
giản nhưng mang lại hiệu quả tốt. Nhận dạng khuôn mặt dùng PCA kết hợp với mạng
nơron là phương pháp mang lại hiệu quả nhận dạng cao bởi nó phát huy được ưu điểm của
PCA và mạng nơron [3]. Hệ thống hoạt động ổn định và có tính thích nghi cao khi dữ liệu
đầu vào thay đổi nhiều.
Trong bài báo này, các phương pháp dựa trên PCA và mạng nơron được nghiên
cứu và phát triển trong phần 2. Kết quả thực nghiệm được phân tích trong phần 3. Phần
cuối cùng trình bày kết luận và hướng phát triển của đề tài.
Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 8 Đại học Đà Nẵng năm 2012
Vì ma trận C có kích thước quá lớn (NxN) nên để tìm eigenvector ui của C ta tìm
eigenvector và eigenvalue của ma trận L:
L = A TA với Lm,n Tm n (5)
Ma trận L có kích thước MxM << NxN nên việc tính eigenvector sẽ nhanh chóng hơn.
M
*Gọi vi là eigenvector của L thì eigenvectơ của C là : ui v
k 1
ik k , i 1, M (6)
Sau khi tìm được các eigenface, các ảnh trong tập cơ sở dữ liệu sẽ được chiếu lên
không gian các eigenface này để tạo ra vector đặc tính. Vector này có kích thước nhỏ hơn
nhiều so với kích thước ảnh nhưng vẫn mang nhiều nhất thông tin chứa trong ảnh.
Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 8 Đại học Đà Nẵng năm 2012
Hình 4. Kết quả nhận dạng khi tốc độ học thay đổi
Từ Bảng 1, ta thấy số nơron trong lớp ẩn càng nhiều thì khả năng nhận dạng càng
chính xác. Tuy nhiên khi số nơron trong lớp ẩn đạt đến ngưỡng 110 thì tỉ lệ nhận dạng sẽ
Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 8 Đại học Đà Nẵng năm 2012
giảm. Khi dữ liệu đầu vào không đổi, số nơron trong lớp ẩn quá nhiều cũng gây ta khó
khăn cho việc học của mạng (cấu trúc phức tạp, dữ liệu ít, ...) làm cho tỉ lệ nhận dạng thấp.
Theo Hình 4, tốc độ học cũng ảnh hưởng hiệu suất nhận dạng. Điều này là phù hợp
với công thức (11). Tốc độ học càng nhỏ thì quá trình huấn luyện càng lâu, mạng càng khó
hội tụ, đòi hỏi bộ nhớ lớn. Hiệu suất của mạng không tỉ lệ nghịch với tốc độ học mà ta chỉ
có thể dùng phương pháp thử sai để lựa chọn thông số phù hợp với mạng.
Từ hai nhận xét trên, ta có thể chọn các thông số để tối ưu cho mạng như sau : Số
nơron trong lớp ẩn là 110, tốc độ học lr = 0.01.
3.2.2. Kết quả so sánh hiệu suất nhận dạng giữa hai phương pháp đối sánh và mạng nơron
( tập 3-7)
Hình 5. Hiệu suất nhận dạng giữa hai phương pháp khi thay đổi số eigenfaces
Bảng 2. Hiệu suất nhận dạng giữa hai phương pháp khi thay đổi số ảnh huấn luyện
Tập kiểm Số ảnh huấn Số ảnh kiểm Đối sánh Mạng nơron
tra luyện tra Euclide Mahalanobis
Tập 1 120 280 79.286% 80.357% 85.714%
Tập 2 200 200 87.000% 88.000% 90.500%
Tập 3 280 120 95.000% 94.167% 95.833%
Từ bảng 2 và hình 5, ta thấy rõ ràng hiệu suất nhận của mạng nơron tốt hơn hẳn so
với việc dùng phương pháp đối sánh trong cùng tập cơ sở dữ liệu. Khi dữ liệu đầu vào thay
đổi thì hiệu suất nhận dạng mạng nơron cũng ổn định hơn nhiều so với phương pháp đối
sánh. Điều này cho thấy mạng nơron rất linh hoạt, mềm dẻo khi xử lý các dữ liệu đầu vào
khác nhau.
4.Kết luận và hướng phát triển đề tài
Bài báo đã xây dựng hệ thống nhận dạng khuôn mặt dùng PCA kết hợp với mạng
nơron với các thông số : tốc độ học lr=0.01, số nơron trong lớp ẩn là 110, giá trị mse=1e-
10, hàm truyền ở cả hai lớp là log-sig. Với các thông số này, mạng nơron có hiệu suất nhận
dạng cao và ổn định hơn hẳn phương pháp đối sánh. Một ưu điểm nữa có thể thấy qua các
kết quả đó là dù lượng thông tin vào mạng ít ( 60 eigenfaces so với 120 eigenfaces) nhưng
kết quả nhận dạng vẫn cao hơn mạng đối sánh ( 84% so với 80%). Để thu được kết quả
Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 8 Đại học Đà Nẵng năm 2012
nhận dạng với độ chính xác cao hơn cần tối ưu hơn nữa cấu trúc và các thông số mạng,
điều này đòi hỏi thời gian thử nghiệm và huấn luyện mạng lâu hơn.
Mạng nơron là mạng có tính linh hoạt các nên ta có thể áp dụng nó không chỉ cho
nhận dạng khuôn mặt, mà còn ứng dụng cho nhận dạng vân tay, điệu bộ mà chỉ cần thay
đổi dữ liệu đầu vào với giá trị đầu ra mong muốn. Đây chính là một ưu thế của mạng nơron
mà những thuật toán khó có được [11].
Tuy nhiên kết quả nhận dạng ta thu được nằm trong những điều kiện cụ thể. Việc
ứng dụng hệ thống vào thực tế sẽ gặp những vấn đề thách thức hiện nay như các thông số
của môi trường, chất lượng ảnh thu được…. Đây là một hướng phát triển của đề tài để đưa
hệ thống vào các ứng dụng thực tế như quản lý nhân viên, kiểm soát ra vào. Ngoài ra, có
thể ‘‘nhúng’’ vào các hệ thống vi xử lý, FPGA DSP…để mở rộng phạm vi ứng dụng.