You are on page 1of 11

Translated from English to Vietnamese - www.onlinedoctranslator.

com

360 GIAO DỊCH IEEE VỀ CẢM GIÁC VÀ BẢO MẬT THÔNG TIN, VOL. 6, KHÔNG. 2, THÁNG 6 NĂM 2011

Ước tính độ sâu của hình ảnh khuôn mặt dựa trên
Mô hình ICA ràng buộc
Zhan-Li Sun và Kin-Man Lam, Thành viên, IEEE

Trừu tượng-Trong bài báo này, chúng tôi đề xuất một thuật [17], [23], v.v ... Trong các phương pháp này, các kỹ thuật xử
toán mới và hiệu quả để tái tạo lại cấu trúc 3-D của khuôn mặt lý tín hiệu thống kê, chẳng hạn như phân tích thành phần
người từ một hoặc một số hình ảnh 2-D của nó với các tư thế chính (PCA), thường đóng một vai trò quan trọng. Ví dụ,
khác nhau. Trong thuật toán được đề xuất của chúng tôi, quy
một biểu diễn đa tỷ lệ của các eigenfaces được đề xuất
trình quay và dịch từ hình ảnh khuôn mặt nhìn chính diện sang
hình ảnh khuôn mặt không nhìn chính diện lúc đầu được xây trong [4] để nhận dạng khuôn mặt 3-D. Trong [26] và [27],
dựng dưới dạng mô hình phân tích thành phần độc lập có ràng hình dạng khuôn mặt được phục hồi bằng một mô hình
buộc (cICA). Sau đó, vấn đề ICA không đầy đủ được chuyển đổi thống kê kết hợp, được xây dựng bằng cách thực hiện PCA
thành vấn đề ICA bình thường bằng cách kết hợp một lỗi trước trên các bộ thông số mô tả sự thay đổi cường độ và các biểu
từ mô hình 3-D CANDIDE. Hơn nữa, một phương pháp tích hợp diễn hình dạng khuôn mặt. Hình dạng khuôn mặt 3-D được
mô hình được đề xuất để cải thiện độ chính xác ước tính độ sâu
dự đoán từ một hình ảnh duy nhất trong [28] bằng cách sử
khi có nhiều hình ảnh khuôn mặt không nhìn trực diện. Một ưu
điểm quan trọng của thuật toán được đề xuất là không cần dụng PLS để khám phá mối quan hệ giữa hình ảnh cường
hình ảnh mặt trước để ước tính cấu trúc khuôn mặt 3-D tương độ và hình dạng 3-D. Phân tích thành phần độc lập (ICA) và
ứng. Kết quả thực nghiệm trên cơ sở dữ liệu ảnh 3 chiều mặt tách nguồn mù (BSS) cũng là hai kỹ thuật xử lý tín hiệu
thực chứng minh tính khả thi và hiệu quả của phương pháp đề thống kê quan trọng. ICA xác định một mô hình chung cho
xuất. dữ liệu đa biến quan sát được, trong đó các biến dữ liệu
được giả định là hỗn hợp tuyến tính hoặc phi tuyến của một
Điều khoản lập chỉ mục—Mô hình CANDIDE, phân tích thành số biến tiềm ẩn chưa biết. Các biến tiềm ẩn này được giả
phần độc lập bị ràng buộc (cICA), phân tích thành phần độc lập định là không phải Gaussian và độc lập lẫn nhau, và được
quá mức (ICA), tái tạo mặt 3-D.
gọi là các thành phần độc lập, nguồn hoặc yếu tố, của dữ
liệu quan sát. So với PCA, ICA là một kỹ thuật mạnh mẽ hơn
để xác định các yếu tố hoặc nguồn cơ bản này. ICA đã được
Tôi tôiGIỚI THIỆU
sử dụng rộng rãi trong các lĩnh vực khác nhau, ví dụ: xử lý

Một XÓA mô hình bề mặt của khuôn mặt là một nhiệm vụ quan trọng tín hiệu giọng nói, xử lý hình ảnh, v.v. [2], [19], [20]. Trong
trong xử lý ảnh khuôn mặt, rất hữu ích cho việc nhận dạng bài báo này, chúng tôi đề xuất một phương pháp ước tính
khuôn mặt, theo dõi khuôn mặt, hoạt ảnh khuôn mặt, v.v. [6], [16], [24]. độ sâu mới, dựa trên một mô hình ICA đặc biệt được gọi là
Hiện tại, có hai cách tiếp cận chính để tạo ra các mô hình khuôn mặt 3- “ICA ràng buộc” (cICA) [8], [14], [15], [21], để tái tạo cấu trúc
D. Đầu tiên là sử dụng một số thiết bị đặc biệt, chẳng hạn như máy quét 3-D của một khuôn mặt người từ một chuỗi các hình ảnh
3-D, để chụp hình dạng 3-D của khuôn mặt người. Cách thứ hai là sử khuôn mặt 2-D.
dụng các thuật toán tái tạo 3-D khác nhau để thu được thông tin về độ Trong thuật toán được đề xuất của chúng tôi, quá trình xoay và
sâu từ hình ảnh 2-D. So với phương pháp thứ hai, chi phí cao và những dịch để chuyển đổi hình ảnh khuôn mặt nhìn chính diện thành hình
hạn chế về tốc độ của các thiết bị cảm biến 3-D là những thiếu sót rõ ảnh khuôn mặt nhìn chính diện lần đầu tiên được xây dựng dưới
ràng của phương pháp trước đây. dạng mô hình cICA bằng cách tham khảo cách tiếp cận căn chỉnh
Nhiều thuật toán để tái tạo khuôn mặt 3-D dựa trên cách thứ hình dạng trong [5]. Trong vài thập kỷ qua, các mẫu mặt CANDIDE
hai đã được đề xuất, chẳng hạn như hình dạng từ tô bóng [7], 3-D [5] đã được sử dụng rộng rãi để biểu diễn và nhận dạng khuôn
[25], cấu trúc từ chuyển động [3], mô hình pha trộn 3-D mặt 3-D, chủ yếu là vì tính đơn giản và tính khả dụng của nó. Mô
hình là một mặt nạ được tham số hóa được phát triển đặc biệt để
mã hóa khuôn mặt người dựa trên mô hình. Phiên bản thứ ba của
mô hình CANDIDE, được gọi là CANDIDE-3, bao gồm 113 đỉnh và
Bản thảo nhận được ngày 24 tháng 8 năm 2010; sửa đổi ngày 27 tháng 1 năm
2011; chấp nhận ngày 03 tháng 02 năm 2011. Ngày xuất bản 22 tháng 02 năm 168 bề mặt tam giác, như thể hiện trong Hình 1. Mỗi đỉnh được
2011; ngày của phiên bản hiện tại 18 tháng 5 năm 2011. Công trình này được hỗ biểu diễn bằng tọa độ 3-D của nó. Xem xét các giá trị độ sâu (tọa độ
trợ bởi RGC của HKSAR, Trung Quốc (Dự án PolyU 5207 / 08E) và tài trợ từ Quỹ
z) của mô hình CANDIDE như một đầu vào của cICA, vấn đề ICA
Khoa học Quốc gia Trung Quốc (60905023). Biên tập viên liên kết điều phối việc
đánh giá bản thảo này và phê duyệt bản thảo chopublicationwasDr. PatrickJ. Flynn. không đầy đủ có thể được chuyển đổi thành vấn đề cICA thông
Z.-L. Sun làm việc tại Trung tâm Xử lý Tín hiệu, Khoa Kỹ thuật Điện tử và thường. Điều này có thể cải thiện độ chính xác ước tính độ sâu
Thông tin, Đại học Bách khoa Hồng Kông, Hồng Kông, và cũng làm việc với đáng kể. Một chiến lược được sử dụng thêm trong đó sử dụng mô
Viện Máy thông minh Hợp Phì, Học viện Khoa học Trung Quốc, Hợp Phì, An
Huy, 230031, Trung Quốc (e-mail: zhlsun2006@yahoo.com.cn ).
hình CANDIDE để tạo tín hiệu tham chiếu. Tín hiệu tham chiếu này
K.-M. Lam làm việc tại Trung tâm Xử lý Tín hiệu, Khoa Kỹ thuật Điện tử không chỉ được sử dụng trong việc khởi tạo cấu trúc mặt 3-D để
và Thông tin, Đại học Bách khoa Hồng Kông, Hồng Kông (e-mail: ước lượng, nó còn được sử dụng trong hàm mục tiêu của mô hình
enkmlam@polyu.edu.hk ).
cICA. Hơn nữa, một phương pháp tích hợp mô hình được đề xuất
Phiên bản màu của một hoặc nhiều hình trong bài báo này có sẵn trực tuyến tại
http://ieeexplore.ieee.org. để cải thiện độ chính xác của ước tính độ sâu khi có nhiều hơn một
Mã định danh đối tượng kỹ thuật số 10.1109 / TIFS.2011.2118207 khuôn mặt không nhìn trực diện

1556-6013 / $ 26,00 © 2011 IEEE


MẶT TRỜI VÀ LAM: ƯỚC LƯỢNG CHẾT CỦA HÌNH ẢNH KHUÔN MẶT DỰA TRÊN MÔ HÌNH ICA ĐÃ CÔNG CỨU 361

trong đó các thông số tư thế, và là các góc quay xung quanh, và các
trục, tương ứng. Sau đó, quá trình xoay và dịch để ánh xạ hình ảnh
khuôn mặt nhìn chính diện sang hình ảnh khuôn mặt không nhìn
chính diện có thể được đưa ra bởi

(2)
ở đâu là hệ số quy mô và có những bản dịch dọc theo
và trục. Dạng ma trận của (2) có thể được viết như sau:

(3)

Ở đâu ma trận sao cho mỗi cột đại diện cho


tọa độ của một điểm đặc trưng, là một ma-
trix sao cho mỗi cột đại diện cho tọa độ
Hình 1. Mô hình CANDIDE-3 với 113 đỉnh và 168 bề mặt [1, Hình 4]. của một điểm đặc trưng, và là một ma trận
sao cho tất cả các cột đều .
Về phương pháp căn chỉnh hình dạng trong [5], thuật ngữ
hình ảnh có sẵn. So với một phương pháp hiện có dựa trên dịch thuật có thể bị loại bỏ nếu cả hai và được tập trung tại
thước đo khoảng cách tương tự [11], một ưu điểm quan trọng nguồn gốc, tức là,
của thuật toán được đề xuất là không cần hình ảnh khuôn mặt
(4)
nhìn chính diện để ước tính giá trị độ sâu của các đỉnh của mô
hình mặt 3-D. Kết quả thực nghiệm trên cơ sở dữ liệu ảnh 3 (5)
chiều tiêu chuẩn chứng minh tính khả thi và hiệu quả của (6)
phương pháp đề xuất.
ở đâu là một ma trận sao cho mỗi cột là
Phần còn lại của bài báo được sắp xếp như sau. Trong Phần II, chúng
, và là một ma trận như vậy
tôi trình bày chi tiết thuật toán được đề xuất của chúng tôi. Kết quả thí
mỗi cột là . Chứng tỏ
nghiệm và các thảo luận liên quan được đưa ra trong Phần III, và các
nhận xét kết luận được trình bày trong Phần IV.
(7)
Phương trình (6) sau đó có thể được viết lại thành
II. 3-DFÁT CHỦRXÂY DỰNG KINH TẾUHÁTCONSTRAINEDICA
Trong phần này, mô hình cICA sẽ được xây dựng để tái tạo 3- (số 8)

D của hình ảnh khuôn mặt. Sau đó, mô hình mặt 3-D CANDIDE
Nó có thể được nhìn thấy từ (8) có thể được xem như một ma trận trộn
được sử dụng để cải thiện hơn nữa độ chính xác của ước tính.
rằng và như một hỗn hợp của . Giả sử rằng các phân phối của không
Cuối cùng, nếu có nhiều hình ảnh khuôn mặt, chúng tôi đề xuất
các biến, và phải là Gaussian, cấu trúc 3-D
phương pháp tích hợp mô hình để kết hợp các cấu trúc 3-D
Bài toán ước lượng có thể được xây dựng như một bài toán BSS, như được
được tái tạo tương ứng để ước tính chính xác hơn về cấu trúc
mô tả trong (8). Như chúng ta đã biết, BSS tương đương với ICA trong quá
khuôn mặt 3-D.
trình hỗn hợp tuyến tính và các tín hiệu nguồn có thể được khôi phục bằng
cách sử dụng thuật toán ICA, tức là, độ sâu có thể được phục hồi thông qua
A. Xây dựng mô hình cICA các thuật toán ICA bằng cách tối đa hóa phân phối không Gauss.

đồng
Các đặc điểm hình dạng, được biểu thị bằng thứ tự của các điểm đặc điểm
trên khuôn mặt, được sử dụng trong thuật toán của chúng tôi để ước tính
Lưu ý rằng sau đó các nguồn tín hiệu trong là ba, trong khi
số tín hiệu hỗn hợp trong là hai. Có nghĩa là, một số thông tin
các giá trị độ sâu tương ứng , tức là, coor-
bị mất trong quá trình trộn, và quá trình trộn này là không thể
giảm béo. Giả sử các điểm đặc trưng được đánh dấu trên khuôn mặt
đảo ngược. Khôi phục ba tín hiệu nguồn từ hai tín hiệu quan
hình ảnh. Đại diện cho điểm đặc trưng thứ của một
sát là một vấn đề ICA quá đầy đủ điển hình, đây vẫn là một vấn
, và
Điểm mô hình mặt 3-D xem trực diện của tính năng thứ
đề khó khăn hiện nay.
khuôn mặt 2-D không nhìn trực diện cho . Ma trận xoay
được đưa ra như sau:
Đưa ra các tín hiệu hỗn hợp , vì
hoàn thành vấn đề ICA, một cách tiếp cận để giải quyết
vấn đề là ước tính ma trận trộn và tín hiệu nguồn
cách khác thông qua ước lượng khả năng xảy ra tối
đa (ML) [12], [13]. Cho trước và một ma trận trộn ban đầu, ước tính
ML của các tín hiệu nguồn có thể được đưa ra bởi

(1) (9)
362 GIAO DỊCH IEEE VỀ CẢM GIÁC VÀ BẢO MẬT THÔNG TIN, VOL. 6, KHÔNG. 2, THÁNG 6 NĂM 2011

được xây dựng dưới dạng một hàm tuyến tính và có thể được giải bằng cách
sử dụng các phương pháp cổ điển để lập trình tuyến tính. Hơn nữa, ước tính
ML của một giá trị nhất định có thể được tính như

(10)

ở đâu biểu thị vectơ mẫu của ngay lập tức, và.
vectơ mẫu của ngay lập tức Trong [22], thay vì
sử dụng ước lượng ML, một thuật toán hình học đã được đề
xuất để khôi phục ma trận trộn hiệu quả hơn. Thông tin trước
là một nguồn quan trọng để giảm bớt tác động tiêu cực do
thông tin bị thiếu. Tín hiệu tham chiếu đã được chứng minh là
thông tin hiệu quả trước đây trong các phương pháp ICA và
BSS. Từ (9) và (10) có thể thấy rằng các tín hiệu tham chiếu
không được xem xét trong các phương pháp của [12] và [13].
CICA cung cấp một khuôn khổ chung để kết hợp các Hình 2. Vị trí của 22 điểm đặc trưng được đánh dấu trong cơ sở dữ liệu Bosphorus.

thông tin trước đó. Từ (8) có thể thấy rằng chỉ có một tín
hiệu không xác định nguồn trong đó là thông tin độ sâu. Do
đó, chúng ta chỉ cần trích xuất bằng tín hiệu tham chiếu ở đâu , và là đạo hàm của
tương ứng. Dựa trên những xem xét ở trên, cICA là một đối với . Quy tắc học tập giống như Newton của can
cách tiếp cận phù hợp để ước tính cấu trúc 3-D. Biểu thị là được đưa ra bởi [8], [15]
tín hiệu ước tính của, tức là,

(11)

ở đâu là ma trận không trộn lẫn. Trong thuật toán cICA,


cẩu thả được sử dụng như một hàm tương phản và cICA
được xây dựng dưới dạng một bài toán tối ưu hóa bị ràng buộc như sau [15]: (17)

ở đâu là một hằng số dương, ,


biểu thị ma trận hiệp phương sai nghịch đảo của ,
(12) là cho tín hiệu siêu Gaussian và
cho tín hiệu siêu Gauss.
Tại đây, các chức năng và đại diện cho trong-
bình đẳng và ràng buộc bình đẳng, tương ứng. Các ràng buộc bất bình B. Xây dựng mô hình và khởi tạo ma trận tách
đẳng là các phép đo gần gũi của các đầu ra ước tính và các tham chiếu Có hai vấn đề quan trọng cần giải quyết để đào tạo mô hình.
tương ứng của chúng, và các ràng buộc bình đẳng được thông qua để Một là cách xây dựng một mô hình cICA hiệu quả, và hai là cách
loại bỏ mối quan hệ tương quan giữa bất kỳ thành phần đầu ra nào khởi tạo ma trận không trộn. Mặc dù một số tín hiệu có thể
trong số hai thành phần đầu ra khác nhau [8]. Chúng ta có thể thu được được trích xuất bằng cách sử dụng thuật toán cICA [21] bằng
tín hiệu nguồn bằng cách tối ưu hóa hàm mục tiêu (12). Vấn đề tối ưu cách tối thiểu hóa hàm mục tiêu (12), nhưng ước tính độ sâu
hóa trong (12) có thể được giải quyết bằng cách sử dụng hệ số nhân không đủ chính xác vì hỗn hợp có thể không chứa đủ thông tin
Lagrange như sau: về độ sâu. Ngoài ra, vẫn còn khó khăn để ước tính ma trận
không trộn lẫn và các tín hiệu nguồn cho vấn đề quá đầy đủ. Ở
(13)
đây, chúng tôi sử dụng các giá trị độ sâu
của các điểm tính năng trong CANDIDE
trong đó và biểu thị các số nhân Lagrange, và
mô hình như một hỗn hợp. Sau đó, và được kết hợp để tạo thành đầu
và tương ứng là các thuật ngữ tương ứng với các giới
vào của thuật toán cICA. Chứng tỏ
hạn bất bình đẳng và bình đẳng. Ineachiteration, sự thay đổi của
các số nhân và được cung cấp bởi
(18)
(14)
và Phương trình (11) có thể được viết lại thành

(15)
(19)
ở đâu và là tỷ lệ học tập. Gradient của được với
kính trọng đưa ra như sau [8]: Theo giả thiết này, số lượng tín hiệu nguồn bằng số
lượng tín hiệu hỗn hợp. Do đó, mô hình cICA đã xây
dựng trở thành một vấn đề ICA bình thường hơn là một
(16) vấn đề khẩn cấp.
MẶT TRỜI VÀ LAM: ƯỚC LƯỢNG CHẾT CỦA HÌNH ẢNH KHUÔN MẶT DỰA TRÊN MÔ HÌNH ICA ĐÃ CÔNG CỨU 363

Hình 3. So sánh các tín hiệu tham chiếu dựa trên mô hình CANDIDE và giá trị độ sâu thực cho bốn chủ thể khuôn mặt riêng biệt.

Vấn đề ICA thông thường này cũng có thể được giải quyết bằng mô hình mặt [1], các giá trị độ sâu của nó phù hợp để lấy làm tín hiệu
cách sử dụng một số thuật toán ICA điển hình, chẳng hạn như tham chiếu. Trước tiên, chúng tôi trừ giá trị trung bình của, từ, tức là,
thuật toán điểm cố định nổi tiếng, được gọi là FastICA [9], là một
thuật toán ICA rất hiệu quả và đáng tin cậy. FastICA dựa trên sơ đồ (23)
lặp điểm cố định để xác định mức tối đa không phải Gaussianity,
ở đâu là một vectơ sao cho tất cả các phần tử đều
được đo bằng
. Sau đó, các dấu hiệu của được sử dụng như là
tín hiệu erence , I E,
(20)

trong đó biểu thị một biến Gaussian và hàm, là một phi dân tộc (24)
chẳng hạn như

ở đâu là hàm dấu hiệu.


(21) Để đánh giá hiệu suất của các thuật toán kết hợp, cơ sở dữ liệu Bosphorus [18]
được sử dụng. Mỗi hình ảnh khuôn mặt ở chế độ xem chính diện trong cơ sở dữ
hoặc liệu này có 24 điểm đặc trưng trên khuôn mặt được đánh dấu. Vì không có điểm
tương ứng trong mô hình CANDIDE cho các điểm tính năng
(22) 23 và 24, chỉ các điểm 1–22 được chọn ở đây để tạo thành tín hiệu tham
chiếu, như thể hiện trong Hình 2. Hình 3 cho thấy các tín hiệu tham
Tuy nhiên, thông tin chủ sở hữu trong các tham chiếu không chiếu của bốn đối tượng đầu tiên (bs000 – bs003) thu được bằng cách
chỉ được sử dụng trong hàm tương phản, mà còn trong việc sử dụng CANDIDE mô hình và các giá trị độ sâu thực. Có thể thấy rằng
khởi tạo thuật toán cICA. Do đó, cICA có thể đạt được mức độ các tín hiệu tham chiếu thu được từ mô hình CANDIDE trùng với các tín
chính xác ước tính độ sâu cao hơn so với FastICA. hiệu thu được bởi các giá trị độ sâu thực cho hầu hết các điểm đặc
Trong [8] và [21], các tín hiệu tham chiếu thu được từ các dấu hiệu trưng trên khuôn mặt. Do đó, điều này cho thấy rằng việc sử dụng mô
của các tín hiệu nguồn. Vì độ sâu thực sự của cấu trúc mặt 3-D sẽ được hình CANDIDE để xây dựng tín hiệu tham chiếu là khả thi.
tái tạo là không xác định, nên không thể xác định được tín hiệu tham Cần chỉ ra rằng các tín hiệu nhị phân của các giá trị độ sâu thực được hiển
chiếu. Tuy nhiên, nhìn chung, tất cả các khuôn mặt đều có cấu trúc 3-D thị trong Hình. 3chỉ được sử dụng để thể hiện hiệu quả của phương pháp xây
tương tự nhau. Vì mô hình CANDIDE là mô hình 3-D chung dựng tín hiệu tham chiếu. Chúng không được sử dụng
364 GIAO DỊCH IEEE VỀ CẢM GIÁC VÀ BẢO MẬT THÔNG TIN, VOL. 6, KHÔNG. 2, THÁNG 6 NĂM 2011

các điểm được cung cấp bởi Mô hình CANDIDE (các điểm
đặc trưng này có cùng vị trí với 22 điểm đặc trưng được
hiển thị trong Hình 2).
Bươc 3) Đối với mỗi hình ảnh khuôn mặt đào tạo, đặc điểm hình dạng của
các điểm đặc trưng và được kết hợp để tạo thành đầu vào của
mô hình cICA.
Bươc 4) Tính toán ma trận không trộn ban đầu theo
(25), cập nhật ma trận không trộn theo (17) và tính
toán các giá trị độ sâu ước tính bằng cách sử dụng (11).

Bươc 5) Tính toán các giá trị trung bình tương ứng của độ sâu của
các điểm đặc trưng như được ước tính cho tất cả các hình
ảnh đào tạo, sau đó sẽ thay thế.
Các bước 3–5 được lặp lại cho đến khi số lần lặp đạt đến giá trị
lớn nhất được xác định trước.

III. EXPERIMENTALRESULTS VÀDBÀN LUẬN

A. Dữ liệu thực nghiệm và các phương pháp liên quan được so sánh
Chúng tôi đã đánh giá phương pháp được đề xuất trên cơ sở dữ liệu
Bosphorus [18], đây là một cơ sở dữ liệu khuôn mặt 3-D tương đối mới
bao gồm một bộ biểu cảm phong phú, các biến thể có hệ thống của các
tư thế và các kiểu khớp cắn khác nhau. Một ưu điểm nổi bật khi sử dụng
cơ sở dữ liệu này là có sẵn các tọa độ 3-D của một tập hợp các điểm đặc
trưng trên khuôn mặt được xác định trước. Nói cách khác, các giá trị độ
Hình 4. Lưu đồ của phương pháp tích hợp mô hình. sâu ước tính của cấu trúc mặt 3-D được tái tạo có thể được so sánh với
các giá trị thực trên mặt đất của nó. Do đó, hiệu suất của các thuật toán
tái tạo 3-D có thể được đánh giá và so sánh chính xác hơn. Tọa độ 2-D
tương ứng của các điểm đặc trưng cho tất cả các tư thế trong cơ sở dữ
trong ước tính giá trị độ sâu hoặc tính toán chỉ số hiệu suất. Với
liệu cũng được cung cấp. Nói chung, các điểm đặc trưng tương ứng cho
tín hiệu tham chiếu được dẫn xuất như đã giải thích trước đó,
các chế độ xem 2-D của tư thế tùy ý được hình thành khi chúng ta có
ma trận không trộn ban đầu có thể được tính như sau [21]:
được các điểm đặc trưng này thông qua việc sử dụng các điểm đánh
dấu
(25) trong quá trình thu nhận hình ảnh hoặc bằng cách sử dụng bất kỳ đặc điểm khuôn mặt nào
các thuật toán phát hiện điểm. Trong mô hình cICA, tín hiệu nguồn
được giả định là các giá trị độ sâu của hình ảnh mặt nhìn chính diện. Do
ở đâu là nghịch đảo tổng quát Moore – Penrose của.
đó, để hình thành tín hiệu tham chiếu, chúng ta chỉ cần xác định vị trí
của 22 điểm đặc trưng trong mô hình CANDIDE (như trong Hình 2),
C. Tích hợp mô hình cho nhiều hình ảnh khuôn mặt xem không
tương ứng với 22 điểm đặc trưng được đánh dấu trong cơ sở dữ liệu
trực diện
Bosphorus (như trong Hình 3 ). Đối với cơ sở dữ liệu này, chúng tôi chủ
Lưu ý rằng một hình ảnh khuôn mặt không nhìn trực diện là đủ để yếu xử lý những hình ảnh có sự thay đổi tư thế. Làm thế nào để đối phó
xây dựng mô hình cICA. Khi có nhiều hình ảnh khuôn mặt không nhìn với sự thay đổi biểu hiện, sự thay đổi độ chiếu sáng và sự tắc nghẽn
trực diện, phương pháp tích hợp amodel được đề xuất trong bài báo nằm ngoài phạm vi của bài báo này. Tất cả các mô phỏng được thực
này để cải thiện hơn nữa độ chính xác của ước tính độ sâu. Hình 4 cho hiện trong môi trường MATLAB, chạy trên một máy tính cá nhân thông
thấy sơ đồ của phương pháp tích hợp mô hình. Đối với hình ảnh khuôn thường.
mặt không nhìn trực diện thứ hai, đặc điểm hình dạng được kết hợp với Để đánh giá hiệu quả, phương pháp đề xuất được so sánh với
để tạo thành đầu vào của thuật toán cICA. Sau đó, tín hiệu độ sâu có thể FastICA [9], ICA hình học (gICA) [22], và phương pháp tái tạo khuôn
được xác định bằng thuật toán cICA. Giá trị trung bình của, được hiển mặt 3-D dựa trên sự biến đổi tương tự (SM) [11]. Để làm cho biểu
thị như sau: thức thuận tiện hơn, phương pháp tích hợp mô hình được sử dụng
trong cICA được ký hiệu là cICA_MI.

(26)B. Kết quả thử nghiệm trên Cơ sở dữ liệu Bosphorus


30 đối tượng đầu tiên từ cơ sở dữ liệu Bosphorus đã được sử dụng trong
được sử dụng làm tín hiệu hỗn hợp để thay thế . Sự lặp lại là các thí nghiệm. Hình 5 cho thấy hình ảnh khuôn mặt của một đối tượng
được thực hiện cho đến khi đạt đến số lần lặp tối đa được xác định trong cơ sở dữ liệu. Lưu ý rằng không thể chọn hình ảnh có các điểm đặc
trước. Các bước cụ thể của phương pháp đề xuất được đưa ra như trưng không nhìn thấy làm hình ảnh đào tạo, vì không thể khôi phục các giá
sau. trị độ sâu tương ứng. Kết quả là, chỉ có năm người không
Bươc 1) Đặt số lần lặp lại tối đa . hình ảnh khuôn mặt nhìn chính diện, , , , ,
Bươc 2) Khởi tạo các giá trị độ sâu và thu được tín hiệu tham chiếu và có thể được sử dụng để huấn luyện mô hình trong các thí
bằng cách sử dụng các giá trị độ sâu của tính năng 22 nghiệm. Hệ số tương quan tuyến tính của Pearson được sử dụng để đo lường
MẶT TRỜI VÀ LAM: ƯỚC LƯỢNG CHẾT CỦA HÌNH ẢNH KHUÔN MẶT DỰA TRÊN MÔ HÌNH ICA ĐÃ CÔNG CỨU 365

Hình 7. So sánh hiệu suất của FastICA với và không sử dụng ma trận
không trộn ban đầu.

1) So sánh thử nghiệm với FastICA:Đối với FastICA, các tham


số được đặt làm giá trị mặc định được sử dụng trong gói
chương trình1tương tự như tocICA, thuật toán khởi tạo kênh
đào (25) channelsobeusedintheFastICA. Kết quả thực nghiệm
thu được khi sử dụng cICA và FastICA được thể hiện trong Hình
6, trong đó mỗi điểm đánh dấu biểu thị giá trị trung bình của
Hình 5. Hình ảnh khuôn mặt của một đối tượng ở các tư thế khác nhau trong dữ liệu Bosphorus-
các hệ số tương quan thu được từ ảnh khuôn mặt của từng đối
cơ sở.
tượng. Khoảng cách giữa điểm đánh dấu và điểm cuối của
dòng thể hiện độ lệch chuẩn của các hệ số tương quan.
Phương pháp minh họa độ lệch chuẩn này sẽ không được trình
bày trong các hình tiếp theo. Có thể thấy từ Hình 6 rằng các
phương tiện dựa trên cICA cao hơn so với các phương tiện dựa
trên FastICA cho tất cả các đối tượng. Do đó, cICA có thể được
kết luận là có mức độ chính xác ước tính độ sâu cao
hơnFastICA. Ngoài ra, các định nghĩa tiêu chuẩn dựa trên cICA
rõ ràng là nhỏ hơn so với các định nghĩa dựa trên FastICA. Điều
này có nghĩa là cICA mạnh mẽ hơn FastICA cho các đối tượng
khác nhau. Do đó, kết luận lại, cICA có hiệu suất ước tính độ
sâu tốt hơn FastICA. Hình 7 cho thấy các hoạt động của thuật
toán FastICA có và không sử dụng ma trận không trộn ban đầu
trong (25). Kết quả cho thấy hai trường hợp này biểu diễn
tương tự nhau.
2) So sánh thực nghiệm với gICA:Vì gICA được sử dụng
để giải quyết vấn đề ICA quá đầy đủ, đầu vào của thuật
toán là trong (4), thay vì trong (18). Các kết quả thực
nghiệm dựa trên gICA và các thuật toán cICA được thể
hiện trong Hình 8. Thuật toán cICA có thể đạt được mức
Hình 6. So sánh kết quả hoạt động của FastICA và cICA về mối tương quan. Các trung bình và tiêu chuẩn cao hơn so với gICA. Do đó,
điểm đánh dấu đại diện cho các mối tương quan trung bình và đường thẳng đứng cICA vượt trội hơn gICA.
đi qua một điểm đánh dấu thể hiện phạm vi của hệ số tương quan tương ứng.
Thao tác làm trắng là một quy trình tiền xử lý hữu ích trong các
thuật toán ICA. Các vectơ ngẫu nhiên được cho là có màu trắng nếu
chúng có giá trị trung bình bằng 0 và ma trận hiệp phương sai đơn
vị, có thể nhân với một phương sai không đổi. Mặc dù đã tuyên bố
mối tương quan giữa hai biến. Đây là một tiêu chí quan
trong [22] rằng hiệu suất sẽ được cải thiện nếu đầu vào được làm
trọng để đo mức độ tương tự giữa tín hiệu thực và tín
trắng, kết quả thực nghiệm trong Hình 9 chỉ ra rằng hiệu suất hầu
hiệu ước lượng tương ứng [19], [21]. Do đó, hệ số tương
như không thay đổi bất kể thao tác làm trắng có được thực hiện
quan giữa giá trị độ sâu thực và giá trị độ sâu ước tính sẽ
hay không.
được sử dụng ở đây để đo lường hiệu suất của các thuật
toán tái tạo khuôn mặt 3-D khác nhau. 1Có sẵn: http://www.cis.hut.fi/projects/ica/fastica/.
366 GIAO DỊCH IEEE VỀ CẢM GIÁC VÀ BẢO MẬT THÔNG TIN, VOL. 6, KHÔNG. 2, THÁNG 6 NĂM 2011

Hình 8. So sánh hiệu suất của gICA và cICA đối với các đối tượng khuôn mặt khác Hình 10. So sánh hiệu suất của thuật toán SM và cICA.
nhau.

30 môn học. Trong các thí nghiệm, người ta thấy rằng


hiệu suất thường trở nên ổn định khi số lần lặp lại lớn
nhất khoảng 1500. Chụp các đối tượng 1, 6, 11, 16,
21 và 26 làm ví dụ, các đường cong lặp lại tương ứng dựa
trên phương pháp tích hợp mô hình được mô tả trong Hình
11. Tất cả các kết quả cho thấy rằng hiệu suất hội tụ và trở
nên ổn định khi số lần lặp được thực hiện là hơn 1000 và
nhiều nhất 1500.
Hình 12 cho thấy các kết quả thực nghiệm thu được
khi sử dụng cICA và cICA_MI. Trong hầu hết các trường
hợp, hệ số tương quan thu được khi sử dụng cICA_MI
cao hơn giá trị trung bình thu được khi sử dụng cICA và
là kết quả tốt nhất cho một số đối tượng. phương pháp
cICA.

Hình 13 cho thấy giá trị độ sâu thực và giá trị độ sâu ước tính của
các điểm đặc trưng trên khuôn mặt thu được bằng cách sử dụng
Hình 9. So sánh các hoạt động của gICA khi sử dụng và không sử dụng cICA_MI. Để so sánh, tất cả các giá trị độ sâu hiển thị trong Hình 13
thao tác làm trắng. được chuẩn hóa thành khoảng [0, 1]. Giá trị độ sâu ước tính của 22
điểm đặc trưng được chuẩn hóa như sau:
3) So sánh thử nghiệm với thuật toán SM:Trong phương
pháp SM, kích thước quần thể và số lần lặp lại tối đa của thuật (27)
toán di truyền được đặt lần lượt là 800 và 200. Hình 10 cho thấy
các kết quả thực nghiệm thu được bằng cách sử dụng các thuật ở đâu là giá trị độ sâu chuẩn hóa của , và và
toán SM và cICA. Chúng ta có thể thấy rằng các phương tiện lần lượt là giá trị độ sâu tối thiểu và tối đa. Cần lưu ý rằng
dựa trên cICA cao hơn so với các phương tiện dựa trên SM. Do chuẩn hóa chỉ được sử dụng để hiển thị các giá trị độ sâu, và không
đó, cICA có mức độ chính xác ước tính độ sâu cao hơn so với được sử dụng trong thủ tục ước tính giá trị độ sâu hoặc trong tính
SM. Ngoài ra, độ lệch chuẩn dựa trên cICA rõ ràng là nhỏ hơn toán các hệ số tương quan. Có thể thấy từ Hình 13 rằng giá trị độ
so với độ lệch chuẩn dựa trên SM. Do đó, chúng ta có thể kết sâu của hầu hết các điểm đặc trưng trên khuôn mặt được ước tính
luận rằng cICA chính xác và mạnh mẽ hơn SM. chính xác. Cần nhấn mạnh rằng không có thông tin trước nào về
Lấy Chủ đề 1 làm ví dụ, Bảng I hiển thị các hệ số tương quan của các giá trị độ sâu thực được sử dụng trong toàn bộ quy trình ước
các giá trị độ sâu thực và các giá trị ước tính tương ứng cho các tính. Hệ số tương quan thu được bằng cách sử dụng cICA_MI là
hình ảnh khuôn mặt khác nhau bằng cách sử dụng các thuật 0,9124, cao hơn các giá trị trung bình thu được bằng các phương
toánFastICA, gICA, SM, andcICA. Có thể thấy rằng thuật toán CICA pháp khác khi chỉ sử dụng một hình ảnh khuôn mặt không nhìn
có thể đạt được hiệu suất rất giống nhau cho các hình ảnh khuôn trực diện. Do đó, mức độ chính xác của ước tính độ sâu có thể được
mặt khác nhau và vượt trội hơn ba thuật toán khác về các tương cải thiện một cách hiệu quả bằng cách sử dụng phương pháp tích
quan trung bình và độ lệch chuẩn của nó. hợp mô hình được đề xuất khi có nhiều hình ảnh khuôn mặt xem
4) So sánh thử nghiệm của cICA và cICA_MI: Để đánh giá trực diện hơn. Giá trị độ sâu ước tính của các điểm đặc trưng có thể
phương pháp tích hợp mô hình, cICA_MI được sử dụng để được sử dụng trong ước tính tư thế hoặc nhận dạng khuôn mặt. Độ
ước tính giá trị độ sâu của hình ảnh khuôn mặt cho chính xác cao hơn trong ước tính tư thế
MẶT TRỜI VÀ LAM: ƯỚC LƯỢNG CHẾT CỦA HÌNH ẢNH KHUÔN MẶT DỰA TRÊN MÔ HÌNH ICA ĐÃ CÔNG CỨU 367

BẢNG I
CLỆNHCHIỆU QUẢ CỦATRUEDEPTHVALUES VÀ THEEKÍCH THÍCHVALUESOĐÃ DUYỆTWITHDKHÁC
TMƯAFÁT CHỦTôiMAGES CHOFastICA, gICA, SM,VÀcICA

Hình 11. Các đường cong lặp lại của các Đối tượng 1, 6, 11, 16, 21 và 26 bằng cách sử dụng phương pháp
tích hợp mô hình. Hình 13. Giá trị độ sâu thực và giá trị độ sâu ước tính của các điểm đặc trưng trên khuôn
mặt của Đối tượng 1 trong cơ sở dữ liệu Bosphorus.

Hình 12. So sánh các hoạt động của thuật toán cICA và cICA_MI.

Hình 14. So sánh các hoạt động của thuật toán cICA dựa trên mô hình
ICA quá mức và bình thường.
hoặc nhận dạng khuôn mặt nói chung có thể đạt được nếu đạt được độ
chính xác cao hơn của ước lượng giá trị độ sâu [11]. Vì phương pháp đề
xuất đã được chứng minh là có độ chính xác ước tính giá trị độ sâu cao thuật toán có thể đạt được mức độ chính xác ước tính độ sâu
hơn các phương pháp khác, do đó, nó có thể cung cấp ước tính độ sâu cao hơn và độ lệch chuẩn nhỏ hơn khi được sử dụng làm đầu
đáng tin cậy hơn để sử dụng trong ước tính tư thế và nhận dạng khuôn vào của thuật toán cICA. Do đó, việc sử dụng thông tin bổ sung
mặt. trước đó từ mô hình mặt CANDIDE chung để chuyển đổi vấn đề
quá mức thành mô hình ICA bình thường được xác nhận là hiệu
C. Bàn luận quả hơn để ước lượng độ sâu.
Hình 14 cho thấy các hoạt động của cICA khi chúng có dạng Hình 15 cho thấy các hệ số tương quan của
quá đầy đủ và dạng bình thường, tức là, các đầu vào của thuật giá trị độ sâu thực và giá trị độ sâu ước tính thu được
toán cICA lần lượt là và. Chúng ta có thể thấy rằng bằng thuật toán cICA_MI và hệ số tương quan
368 GIAO DỊCH IEEE VỀ CẢM GIÁC VÀ BẢO MẬT THÔNG TIN, VOL. 6, KHÔNG. 2, THÁNG 6 NĂM 2011

Hình 15. So sánh các hệ số tương quan và Hình 16. So sánh các hệ số tương quan thu được bằng cách sử dụng bốn thống kê
cho 30 đối tượng. bậc nhất khác nhau với phương pháp tích hợp mô hình cho 30 đối tượng.

giá trị độ sâu thực và giá trị độ sâu của mô


hình CANDIDE. Chúng ta có thể thấy rằng các giá trị độ sâu
ước tính gần với giá trị độ sâu thực cho hầu hết các đối
tượng, so với mô hình CANDIDE. Do đó, phương pháp được
đề xuất có thể ước tính chính xác các giá trị độ sâu của ảnh
khuôn mặt. Tuy nhiên, cũng có thể nhận thấy rằng có một
số cải thiện về hiệu suất đối với một số môn học. Điều này
có thể là do những lý do sau đây. Như thể hiện trong Hình
11, hiệu suất thường trở nên ổn định khi số lần lặp tối đa
là khoảng 1500. Tuy nhiên,
hiệu suất tối ưu có thể không đạt được đối với một số môn học với
số lần lặp lại này. Hiện tại, chúng tôi vẫn chưa có một tiêu chí hiệu
quả để thực hiện việc dừng xe sớm. Mặt khác, phương pháp tích
hợp mô hình được đề xuất tương tự như các phương pháp tích hợp
mô hình khác, chẳng hạn như phương pháp tích hợp bộ phân loại.
Hiệu suất có thể được cải thiện đáng kể chỉ khi một số điều kiện
được thỏa mãn, ví dụ: đầu ra của các mô hình khác nhau là đa dạng
và bổ sung cho nhau. Hình 17. Hệ số tương quan của các Đối tượng 1, 6, 11, 16, 21 và 26 thu được bởi
Trong thuật toán cICA_MI, thống kê bậc nhất, giá trị trung bình, sử dụng phương pháp tích hợp mô hình với số lượng mẫu huấn luyện khác nhau.
được sử dụng để tính toán thống kê kết quả thu được khi có nhiều
hình ảnh khuôn mặt không nhìn trực diện. Hình 16 cho thấy kết
quả thực nghiệm khi bốn thống kê bậc nhất khác nhau, cụ thể là đối tượng, được hiển thị trong các thí nghiệm trên. Để so sánh kết
giá trị trung bình, trung bình, trung bình điều hòa (hmean) và trung quả thống kê của tất cả các đối tượng, Bảng II cho thấy các giá trị
bình hình học (gmean), được sử dụng với phương pháp tích hợp trung bình và độ lệch chuẩn của các hệ số tương quan thu được
mô hình. Xem xét độ chính xác và tính mạnh mẽ của ước lượng độ bằng năm phương pháp cho 105 đối tượng riêng biệt. Vì các giá trị
sâu, Hình 16 cho thấy rằng phương pháp tích hợp mô hình có thể độ sâu trong mô hình tham chiếu CANDIDE được sử dụng trong
đạt được hiệu suất tốt nhất khi giá trị trung bình được sử dụng. phương pháp đề xuất, và cho tất cả

Hình 17showsthecorrelationcurvesofSubjects1,6, các chủ đề cũng được đưa ra trong Bảng II để thể hiện
11,16,21 và26bt được duy trì bằng cách sử dụng phương mức độ cải thiện. Ngoài ra, hệ số tương quan giữa các
pháp tích hợp mô hình với số lượng hình ảnh đào tạo giá trị độ sâu thực và giá trị độ sâu được ước tính từ tất
ngày càng tăng. Nói chung, có thể thấy rằng độ chính cả các mẫu của một đối tượng, cũng được đưa ra ở đây
xác được cải thiện khi có nhiều hình ảnh hơn được đưa để điều tra xem hiệu suất được cải thiện khi tiến hành
vào ước tính. Đối với Đối tượng 21, hiệu suất giảm nhẹ. lặp lại. Có thể thấy từ Bảng II rằng hiệu suất tương tự
Nếu không có các giá trị độ sâu thực, rất khó xác định cũng đạt được đối với FastICA, gICA và SM. Vì giá trị độ
một tiêu chí hiệu quả để tìm ra sự kết hợp tối ưu. Trong sâu của các điểm đặc trưng trong mô hình CANDIDE
các thử nghiệm, tất cả các mẫu đào tạo có sẵn được sử được sử dụng trong FastICA và SM, chúng ta có thể thấy
dụng cho thuật toán cICA_MI. rằng hai phương pháp này có hiệu suất tốt hơn một chút
Cần chỉ ra rằng, để thuận tiện cho việc hiển thị kết so với gICA. SM lớn hơn của FastICA và gICA vì di truyền
quả, chỉ 30 đối tượng đầu tiên, thay vì tất cả
MẶT TRỜI VÀ LAM: ƯỚC LƯỢNG CHẾT CỦA HÌNH ẢNH KHUÔN MẶT DỰA TRÊN MÔ HÌNH ICA ĐÃ CÔNG CỨU 369

BẢNG II IV. CKẾT LUẬN


MEAN VÀSTANDARDDĐÁNH GIÁ SAU ĐÓCLỆNHCHIỆU QUẢ
OBỞIFTÔI CÓMETHODS,VÀCLỆNHCHIỆU QUẢ Trong bài báo này, một thuật toán ước lượng độ sâu
, VÌ105 SUBJECTS mới và chính xác cho hình ảnh khuôn mặt đã được đề
xuất dựa trên mô hình cICA. Việc sử dụng thông tin
trước từ mô hình mặt 3-D CANDIDE có thể chuyển đổi
vấn đề quá mức ban đầu thành mô hình ICA bình
thường, mô hình này đã được chứng minh là hiệu quả và
chính xác hơn để tái tạo cấu trúc mặt 3-D dựa trên một
hoặc nhiều -xem hình ảnh khuôn mặt. Khi có nhiều hình
ảnh khuôn mặt không nhìn trực diện, một phương pháp
tích hợp mô hình được đề xuất, phương pháp này có thể
cải thiện hiệu quả độ chính xác và độ mạnh của ước tính.
Đối với phương pháp tích hợp mô hình, phương pháp
thống kê được xác minh là tốt hơn các thống kê bậc nhất
thuật toán (GA) được sử dụng trong SM và sự dao động lớn hơn là khác, chẳng hạn như giá trị trung bình, trung bình điều
do việc khởi tạo GA ngẫu nhiên. Trong thuật toán cICA, tín hiệu hòa và trung bình hình học. So với FastICA, gICA và SM,
tham chiếu này không chỉ được sử dụng trong việc khởi tạo cấu
trúc mặt 3-D để ước lượng, nó còn được sử dụng trong hàm mục
tiêu của mô hình cICA. Như nhiềutiên nghiệmthông tin và các ràng
buộc được thực thi, cICA và cICA_MI có độ chính xác ước tính độ
sâu cao hơn và tính mạnh mẽ hơn so với các phương pháp khác. RTIỀN TỆ
Hơn nữa, so với cICA, giá trị trung bình tăng khoảng 3 phần trăm
đối với cICA_MI. Do đó, phương pháp tích hợp mô hình được đề [1] J. Ahlberg, CANDIDE-3 — Đại học liên kết mặt tham số cập nhật,
Lysator LiTH-ISY-R-2325, 2001.
xuất có thể cải thiện hơn nữa độ chính xác của ước tính theo chiều
[2] MS Bartlett, JR Movellan và TJ Sejnowski, “Nhận dạng khuôn mặt bằng phân tích
sâu. Ngoài ra, chúng ta có thể thấy rằng cICA_MI có giá trị trung thành phần độc lập”IEEE Trans. Mạng thần kinh., quyển sách. 13, không. 6,
bình cao hơn . Vì vậy, trang 1450–1464, tháng 11 năm 2002.
[3] C. Bregler, A. Hertzmann và H. Biermann, “Khôi phục hình dạng 3D không
giá trị độ sâu ước tính gần với giá trị độ sâu thực hơn so với mô
cứng từ các luồng hình ảnh,” trongProc. Hội máy tính IEEE Conf. Thị giác
hình CANDIDE. Chúng ta cũng có thể thấy rằng hệ số trung máy tính và nhận dạng mẫu, 2000, tập. 2, trang 690–696.
bình của cICA_MI không lặp lại thấp hơn của cICA_MI. Do đó, [4] J. Cook, V. Chandran và S. Sridharan, “Biểu diễn đa tỷ lệ cho nhận dạng khuôn
hiệu suất có thể được cải thiện hơn nữa cho cICA_MI với nhiều mặt 3-D,”IEEE Trans. Inf. Pháp y An ninh, quyển sách. 2, không. 3, trang 529–
536, tháng 9 năm 2007.
lần lặp hơn. Kết luận, các phương pháp được đề xuất có thể [5] T. Biểu giá vàC. Taylor, “Amixturemodel để thể hiện sự thay đổi hình dạng,” trong
ước tính giá trị độ sâu của ảnh khuôn mặt chính xác hơn các Proc. Hội chợ Tầm nhìn Máy lần thứ 8 của Anh., 1997, trang 110–119, Nhà xuất
phương pháp khác. bản Hiệp hội Thị giác Máy Britich.
[6] TC Faltemier, KW Bowyer và PJ Flynn, “Một nhóm khu vực để nhận dạng khuôn
Hai loại thuật toán phổ biến để ước lượng cấu trúc 3-D đã thu hút nhiều nhà nghiên cứu: ước tính giá trị chiều sâu của các điểm
mặt 3-D,”IEEE Trans. Inf. Pháp y An ninh, quyển sách. 3, không. 1, trang 62–73,
đặc trưng (ví dụ: cấu trúc từ chuyển động) và tái tạo bề mặt 3-D (ví dụ: hình dạng từ đổ bóng). Phương pháp được đề xuất thuộc về tháng 3 năm 2007.
kiểu cũ, có thể được sử dụng trực tiếp trong cả ước tính tư thế và nhận dạng khuôn mặt [11]. Sau khi có được giá trị độ sâu của các [7] MI Fanany và I. Kumazawa, “Một mạng lưới thần kinh để khôi phục hình dạng 3D
từ các bản đồ độ sâu và ít sai sót của hình ảnh bóng mờ,”Nhận dạng mẫu. Lett.,
điểm đặc trưng liên quan, chúng ta có thể thiết lập mô hình mặt 3-D dựa trên các điểm đặc trưng. Tư thế có thể được ước tính thông
quyển sách. 25, không. 4, trang 377–389, 2004.
qua khoảng cách tương tự giữa các điểm đặc trưng của hình ảnh khuôn mặt 2-D có liên quan và các điểm chiếu tương ứng của mô
[8] DS Huang và JX Min, “Một phương pháp phân tích thành phần độc lập có ràng
hình khuôn mặt 3-D, trong đó các tham số tư thế là các tham số cần được tối ưu hóa. Ngoài ra, mô hình 3-D được xây dựng cũng có buộc mới,”IEEE Trans. Mạng thần kinh., quyển sách. 18, không. 5, trang 1532–
thể được sử dụng để nhận dạng khuôn mặt. Vì chỉ một số điểm tính năng được chọn được sử dụng trong nhận dạng khuôn mặt, nên
1535, tháng 9 năm 2007.
[9] A. Hyvärinen, “Các thuật toán điểm cố định nhanh chóng và mạnh mẽ để phân tích thành
sẽ ít dư thừa hơn. Tái tạo bề mặt ba chiều là một phương pháp phù hợp hơn để phục hồi cấu trúc 3-D đầy đủ của khuôn mặt. Giá trị độ
phần độc lập,”IEEE Trans. Mạng thần kinh., quyển sách. 10, không. 3, trang 626–634,
sâu của bất kỳ điểm nào có thể được lấy trực tiếp từ bề mặt được tái tạo 3-D hoặc bằng cách sử dụng phương pháp nội suy. Sau khi có tháng 5 năm 1999.
được bề mặt 3-D, một số phương pháp trích xuất đối tượng, chẳng hạn như PCA, thường được áp dụng trên đám mây điểm để trích [10] A. Hyvärinen, J. Karhunen và E. Oja, Phân tích thành phần độc
lập. Hoboken, NJ: Wiley, 2001.
xuất đối tượng. Tính năng được trích xuất sau đó được sử dụng để nhận dạng khuôn mặt. Nhìn chung, cả hai phương pháp này đều có
[11] HS Koo và KM Lam, "Khôi phục hình dạng 3D và tư thế của hình ảnh khuôn mặt
thể được sử dụng để nhận dạng khuôn mặt nhưng với các quy trình khác nhau. Việc khai thác tính năng là không cần thiết đối với cấu dựa trên sự biến đổi tương tự,"Nhận dạng mẫu. Lett., quyển sách. 29, trang
trúc khỏi chuyển động. Chúng có thể được chọn để xây dựng mô hình mặt 3-D cho các ứng dụng và điều kiện thực tế. Tái tạo bề mặt 712–723, 2008.
[12] MS Lewicki và TJ Sejnowski, “Học các cách biểu diễn quá mức phi
ba chiều là một phương pháp phù hợp hơn để phục hồi cấu trúc 3-D đầy đủ của khuôn mặt. Giá trị độ sâu của bất kỳ điểm nào có thể
tuyến tính để viết mã hiệu quả,” trongNhững tiến bộ trong hệ thống
được lấy trực tiếp từ bề mặt được tái tạo 3-D hoặc bằng cách sử dụng phương pháp nội suy. Sau khi có được bề mặt 3-D, một số
xử lý thông tin thần kinh, MI Jordan, MJ Kearns và SA Solla, Eds.
phương pháp trích xuất đối tượng, chẳng hạn như PCA, thường được áp dụng trên đám mây điểm để trích xuất đối tượng. Tính năng Cambridge: MIT Press, 1998, tập. 10.
được trích xuất sau đó được sử dụng để nhận dạng khuôn mặt. Nhìn chung, cả hai phương pháp này đều có thể được sử dụng để
[13] MS Lewicki và TJ Sejnowski, “Học cách trình bày chưa đầy đủ”Tính
toán thần kinh, quyển sách. 12, trang 337–365, 2000.
nhận dạng khuôn mặt nhưng với các quy trình khác nhau. Việc khai thác tính năng là không cần thiết đối với cấu trúc khỏi chuyển
[14] W. Lu và JC Rajapakse, “Phương pháp tiếp cận và ứng dụng của ICA hạn chế,”IEEE Trans.
động. Chúng có thể được chọn để xây dựng mô hình mặt 3-D cho các ứng dụng và điều kiện thực tế. Tái tạo bề mặt ba chiều là một Mạng thần kinh., quyển sách. 16, không. 1, trang 203–212, tháng 1 năm 2005.
phương pháp phù hợp hơn để phục hồi cấu trúc 3-D đầy đủ của khuôn mặt. Giá trị độ sâu của bất kỳ điểm nào có thể được lấy trực
[15] W. Lu và JC Rajapakse, “ICA với tài liệu tham khảo,”Máy tính thần kinh, quyển
tiếp từ bề mặt được tái tạo 3-D hoặc bằng cách sử dụng phương pháp nội suy. Sau khi có được bề mặt 3-D, một số phương pháp trích
sách. 69, không. 16–18, trang 2244–2257, 2006.
xuất đối tượng, chẳng hạn như PCA, thường được áp dụng trên đám mây điểm để trích xuất đối tượng. Tính năng được trích xuất sau [16] I. Mpiperis, S. Malassiotis và MG Strintzis, “Mô hình tuyến tính để nhận
đó được sử dụng để nhận dạng khuôn mặt. Nhìn chung, cả hai phương pháp này đều có thể được sử dụng để nhận dạng khuôn mặt dạng 3-Dface và nét mặt,”IEEETrans. Inf. Pháp y An ninh, quyển sách. 3,
không. 3, trang 498–511, tháng 9 năm 2008.
nhưng với các quy trình khác nhau. Việc khai thác tính năng là không cần thiết đối với cấu trúc khỏi chuyển động. Chúng có thể được
[17] S. Romdhani và T. Vetter, “Sự phù hợp hiệu quả, mạnh mẽ và chính xác của một
chọn để xây dựng mô hình mặt 3-D cho các ứng dụng và điều kiện thực tế. Giá trị độ sâu của bất kỳ điểm nào có thể được lấy trực tiếp
mô hình pha trộn 3D,” trongProc. IEEE Int. Lời thú nhận. Tầm nhìn máy tính,
từ bề mặt được tái tạo 3-D hoặc bằng cách sử dụng phương pháp nội suy. Sau khi có được bề mặt 3-D, một số phương pháp trích xuất đối tượng, chẳng hạn2003, tập.
như PCA, 2, được
thường không. 1, trên
áp dụng trang
đám 59–66.
mây điểm để trích xuất đối tượng. Tính năng được trích xuất sau đó được sử dụng để nhận dạng
370 GIAO DỊCH IEEE VỀ CẢM GIÁC VÀ BẢO MẬT THÔNG TIN, VOL. 6, KHÔNG. 2, THÁNG 6 NĂM 2011

[18] A. Savran, N. Alyüz, H. Dibeklioglu, O. Çliktutan, B. Göberk, B. Sankur và L. Zhan-Li Sunnhận bằng Tiến sĩ. cấp bằng của Đại
Akarun, “Cơ sở dữ liệu Bosphorus để phân tích khuôn mặt 3D,” trong học Khoa học và Công nghệ Trung Quốc, năm
Hội thảo COST 2101 đầu tiên về Sinh trắc học và Quản lý nhận dạng 2005.
(BIOID 2008), Đan Mạch, ngày 7-9 tháng 5 năm 2008, Đại học Roskilde. Từ năm 2006, ông đã làm việc với Đại học
[19] ZL Sun, DS Huang, CH Zheng và L. Shang, “Lựa chọn tối ưu thời gian trễ Bách khoa Hồng Kông, Đại học Công nghệ
cho TDSEP dựa trên thuật toán di truyền,”Máy tính thần kinh, quyển sách. Nanyang và Đại học Quốc gia Singapore. Sở
69, không. 7–9, trang 884–887, 2006. thích nghiên cứu của anh ấy bao gồm học máy,
[20] ZL Sun, “Một phần mở rộng của MISEP để tách hỗn hợp sau phi tuyến tính,”IEEE xử lý hình ảnh và tín hiệu.
Trans. Mạch Syst. II, Exp. Tóm tắt, quyển sách. 56, không. 8, trang 654–658,
tháng 8 năm 2009.
[21] ZL Sun và L. Shang "Máy tính thần kinh, quyển sách. 73, không.
4–6, trang 1013–1017, 2010.

[22] FJ Theis, EW Lang, và CG Puntonet, "Một thuật toán hình học cho ICA tuyến
tính quá đầy đủ,"Máy tính thần kinh, quyển sách. 56, trang 381–398, Kin-Man Lam(M'88) đã nhận được Hiệp hội về
2004. kỹ thuật điện tử với sự khác biệt từ Đại học Bách
[23] CZ Zhang và SC Fernand, "Trích xuất và nhận dạng cấu trúc khuôn mặt 3-D từ khoa Hồng Kông (trước đây gọi là Bách khoa
hình ảnh bằng cách sử dụng phép biến hình 3-D và ánh xạ khoảng cách," IEEE Hồng Kông) vào năm 1986, M.Sc. bằng kỹ sư
Trans. Quy trình Hình ảnh., quyển sách. 11, không. 1, trang 1249–1259, 2002. truyền thông của Khoa Điện, Trường Cao đẳng
[24] L. Zou, S. Cheng, ZX Xiong, M. Lu, và KR Castleman, “Nhận dạng khuôn mặt 3-D Khoa học, Công nghệ và Y học Hoàng gia, Luân
dựa trên các khuôn mặt mẫu bị cong vênh”IEEE Trans. Inf. Pháp y An ninh, Đôn, Vương quốc Anh, năm 1987, và bằng Tiến
quyển sách. 2, không. 3, trang 513–528, tháng 9 năm 2007. sĩ. cấp bằng của Khoa Điện, Đại học Sydney,
[25] M. Castelán và ER Hancock, “Thu thập dữ liệu chiều cao từ một hình ảnh duy nhất của khuôn mặt Sydney, Úc, tháng 8 năm 1996.
bằng cách sử dụng các chỉ số hình dạng cục bộ,”Tính toán. Số lượt truy cập Hiểu hình ảnh,
quyển sách. 103, không. 1, trang 64–79, 2006. Từ năm 1990 đến năm 1993, ông là Giảng viên của Trường Đại học

[26] M.CastelánandE.R.Hancock, “Mô hình thống kê kết hợp Asimple để phục hồi hình partmentofElectronicEngineering, TheHongKongPolytechnicUniversity.Ông
dạng khuôn mặt 3D,” trongProc. Ngày 18 Lời thú nhận. Nhận dạng mẫu, 2006, gia nhập Khoa Công nghệ Thông tin và Điện tử, Đại học Bách khoa Hồng
trang 231–234. Kông, với tư cách là Trợ lý Giáo sư vào tháng 10 năm 1996, trở thành Phó
[27] M. Castelán, WAP Smith và ER Hancock, “Một mô hình thống kê kết hợp để phục hồi hình Giáo sư năm 1999 và hiện là Giáo sư. Ông đã từng là thành viên ban tổ chức
dạng khuôn mặt từ các hình ảnh có độ sáng”IEEE Trans. Quy trình Hình ảnh., quyển và ban chương trình của nhiều hội nghị quốc tế. Mối quan tâm nghiên cứu
sách. 16, không. 4, trang 1139–1151, tháng 4 năm 2007. hiện tại của anh ấy bao gồm nhận dạng khuôn mặt người, xử lý hình ảnh và
[28] M. Castelán và J. Van Horebeek, “Xấp xỉ hình dạng khuôn mặt 3D từ các cường độ video, và thị giác máy tính. Tiến sĩ Lâm là một thành viên của BoG theAsia-
sử dụng một phần hình vuông nhỏ nhất,” trongProc. Hội thảo về Thị giác Máy PacificSignalandInformationProcessingAssosystem (AP-SIPA). Ông cũng là
tính và Nhận dạng Mẫu của IEEE, 2008, trang 1–8. Phó tổng biên tập của IEEE TBẬT GIAO DỊCH
TôiMAGEPROCESSINGvàTạp chí Quốc tế EURASIP về Xử lý Hình ảnh và
Video.

You might also like