Professional Documents
Culture Documents
com
360 GIAO DỊCH IEEE VỀ CẢM GIÁC VÀ BẢO MẬT THÔNG TIN, VOL. 6, KHÔNG. 2, THÁNG 6 NĂM 2011
Ước tính độ sâu của hình ảnh khuôn mặt dựa trên
Mô hình ICA ràng buộc
Zhan-Li Sun và Kin-Man Lam, Thành viên, IEEE
Trừu tượng-Trong bài báo này, chúng tôi đề xuất một thuật [17], [23], v.v ... Trong các phương pháp này, các kỹ thuật xử
toán mới và hiệu quả để tái tạo lại cấu trúc 3-D của khuôn mặt lý tín hiệu thống kê, chẳng hạn như phân tích thành phần
người từ một hoặc một số hình ảnh 2-D của nó với các tư thế chính (PCA), thường đóng một vai trò quan trọng. Ví dụ,
khác nhau. Trong thuật toán được đề xuất của chúng tôi, quy
một biểu diễn đa tỷ lệ của các eigenfaces được đề xuất
trình quay và dịch từ hình ảnh khuôn mặt nhìn chính diện sang
hình ảnh khuôn mặt không nhìn chính diện lúc đầu được xây trong [4] để nhận dạng khuôn mặt 3-D. Trong [26] và [27],
dựng dưới dạng mô hình phân tích thành phần độc lập có ràng hình dạng khuôn mặt được phục hồi bằng một mô hình
buộc (cICA). Sau đó, vấn đề ICA không đầy đủ được chuyển đổi thống kê kết hợp, được xây dựng bằng cách thực hiện PCA
thành vấn đề ICA bình thường bằng cách kết hợp một lỗi trước trên các bộ thông số mô tả sự thay đổi cường độ và các biểu
từ mô hình 3-D CANDIDE. Hơn nữa, một phương pháp tích hợp diễn hình dạng khuôn mặt. Hình dạng khuôn mặt 3-D được
mô hình được đề xuất để cải thiện độ chính xác ước tính độ sâu
dự đoán từ một hình ảnh duy nhất trong [28] bằng cách sử
khi có nhiều hình ảnh khuôn mặt không nhìn trực diện. Một ưu
điểm quan trọng của thuật toán được đề xuất là không cần dụng PLS để khám phá mối quan hệ giữa hình ảnh cường
hình ảnh mặt trước để ước tính cấu trúc khuôn mặt 3-D tương độ và hình dạng 3-D. Phân tích thành phần độc lập (ICA) và
ứng. Kết quả thực nghiệm trên cơ sở dữ liệu ảnh 3 chiều mặt tách nguồn mù (BSS) cũng là hai kỹ thuật xử lý tín hiệu
thực chứng minh tính khả thi và hiệu quả của phương pháp đề thống kê quan trọng. ICA xác định một mô hình chung cho
xuất. dữ liệu đa biến quan sát được, trong đó các biến dữ liệu
được giả định là hỗn hợp tuyến tính hoặc phi tuyến của một
Điều khoản lập chỉ mục—Mô hình CANDIDE, phân tích thành số biến tiềm ẩn chưa biết. Các biến tiềm ẩn này được giả
phần độc lập bị ràng buộc (cICA), phân tích thành phần độc lập định là không phải Gaussian và độc lập lẫn nhau, và được
quá mức (ICA), tái tạo mặt 3-D.
gọi là các thành phần độc lập, nguồn hoặc yếu tố, của dữ
liệu quan sát. So với PCA, ICA là một kỹ thuật mạnh mẽ hơn
để xác định các yếu tố hoặc nguồn cơ bản này. ICA đã được
Tôi tôiGIỚI THIỆU
sử dụng rộng rãi trong các lĩnh vực khác nhau, ví dụ: xử lý
Một XÓA mô hình bề mặt của khuôn mặt là một nhiệm vụ quan trọng tín hiệu giọng nói, xử lý hình ảnh, v.v. [2], [19], [20]. Trong
trong xử lý ảnh khuôn mặt, rất hữu ích cho việc nhận dạng bài báo này, chúng tôi đề xuất một phương pháp ước tính
khuôn mặt, theo dõi khuôn mặt, hoạt ảnh khuôn mặt, v.v. [6], [16], [24]. độ sâu mới, dựa trên một mô hình ICA đặc biệt được gọi là
Hiện tại, có hai cách tiếp cận chính để tạo ra các mô hình khuôn mặt 3- “ICA ràng buộc” (cICA) [8], [14], [15], [21], để tái tạo cấu trúc
D. Đầu tiên là sử dụng một số thiết bị đặc biệt, chẳng hạn như máy quét 3-D của một khuôn mặt người từ một chuỗi các hình ảnh
3-D, để chụp hình dạng 3-D của khuôn mặt người. Cách thứ hai là sử khuôn mặt 2-D.
dụng các thuật toán tái tạo 3-D khác nhau để thu được thông tin về độ Trong thuật toán được đề xuất của chúng tôi, quá trình xoay và
sâu từ hình ảnh 2-D. So với phương pháp thứ hai, chi phí cao và những dịch để chuyển đổi hình ảnh khuôn mặt nhìn chính diện thành hình
hạn chế về tốc độ của các thiết bị cảm biến 3-D là những thiếu sót rõ ảnh khuôn mặt nhìn chính diện lần đầu tiên được xây dựng dưới
ràng của phương pháp trước đây. dạng mô hình cICA bằng cách tham khảo cách tiếp cận căn chỉnh
Nhiều thuật toán để tái tạo khuôn mặt 3-D dựa trên cách thứ hình dạng trong [5]. Trong vài thập kỷ qua, các mẫu mặt CANDIDE
hai đã được đề xuất, chẳng hạn như hình dạng từ tô bóng [7], 3-D [5] đã được sử dụng rộng rãi để biểu diễn và nhận dạng khuôn
[25], cấu trúc từ chuyển động [3], mô hình pha trộn 3-D mặt 3-D, chủ yếu là vì tính đơn giản và tính khả dụng của nó. Mô
hình là một mặt nạ được tham số hóa được phát triển đặc biệt để
mã hóa khuôn mặt người dựa trên mô hình. Phiên bản thứ ba của
mô hình CANDIDE, được gọi là CANDIDE-3, bao gồm 113 đỉnh và
Bản thảo nhận được ngày 24 tháng 8 năm 2010; sửa đổi ngày 27 tháng 1 năm
2011; chấp nhận ngày 03 tháng 02 năm 2011. Ngày xuất bản 22 tháng 02 năm 168 bề mặt tam giác, như thể hiện trong Hình 1. Mỗi đỉnh được
2011; ngày của phiên bản hiện tại 18 tháng 5 năm 2011. Công trình này được hỗ biểu diễn bằng tọa độ 3-D của nó. Xem xét các giá trị độ sâu (tọa độ
trợ bởi RGC của HKSAR, Trung Quốc (Dự án PolyU 5207 / 08E) và tài trợ từ Quỹ
z) của mô hình CANDIDE như một đầu vào của cICA, vấn đề ICA
Khoa học Quốc gia Trung Quốc (60905023). Biên tập viên liên kết điều phối việc
đánh giá bản thảo này và phê duyệt bản thảo chopublicationwasDr. PatrickJ. Flynn. không đầy đủ có thể được chuyển đổi thành vấn đề cICA thông
Z.-L. Sun làm việc tại Trung tâm Xử lý Tín hiệu, Khoa Kỹ thuật Điện tử và thường. Điều này có thể cải thiện độ chính xác ước tính độ sâu
Thông tin, Đại học Bách khoa Hồng Kông, Hồng Kông, và cũng làm việc với đáng kể. Một chiến lược được sử dụng thêm trong đó sử dụng mô
Viện Máy thông minh Hợp Phì, Học viện Khoa học Trung Quốc, Hợp Phì, An
Huy, 230031, Trung Quốc (e-mail: zhlsun2006@yahoo.com.cn ).
hình CANDIDE để tạo tín hiệu tham chiếu. Tín hiệu tham chiếu này
K.-M. Lam làm việc tại Trung tâm Xử lý Tín hiệu, Khoa Kỹ thuật Điện tử không chỉ được sử dụng trong việc khởi tạo cấu trúc mặt 3-D để
và Thông tin, Đại học Bách khoa Hồng Kông, Hồng Kông (e-mail: ước lượng, nó còn được sử dụng trong hàm mục tiêu của mô hình
enkmlam@polyu.edu.hk ).
cICA. Hơn nữa, một phương pháp tích hợp mô hình được đề xuất
Phiên bản màu của một hoặc nhiều hình trong bài báo này có sẵn trực tuyến tại
http://ieeexplore.ieee.org. để cải thiện độ chính xác của ước tính độ sâu khi có nhiều hơn một
Mã định danh đối tượng kỹ thuật số 10.1109 / TIFS.2011.2118207 khuôn mặt không nhìn trực diện
trong đó các thông số tư thế, và là các góc quay xung quanh, và các
trục, tương ứng. Sau đó, quá trình xoay và dịch để ánh xạ hình ảnh
khuôn mặt nhìn chính diện sang hình ảnh khuôn mặt không nhìn
chính diện có thể được đưa ra bởi
(2)
ở đâu là hệ số quy mô và có những bản dịch dọc theo
và trục. Dạng ma trận của (2) có thể được viết như sau:
(3)
D của hình ảnh khuôn mặt. Sau đó, mô hình mặt 3-D CANDIDE
Nó có thể được nhìn thấy từ (8) có thể được xem như một ma trận trộn
được sử dụng để cải thiện hơn nữa độ chính xác của ước tính.
rằng và như một hỗn hợp của . Giả sử rằng các phân phối của không
Cuối cùng, nếu có nhiều hình ảnh khuôn mặt, chúng tôi đề xuất
các biến, và phải là Gaussian, cấu trúc 3-D
phương pháp tích hợp mô hình để kết hợp các cấu trúc 3-D
Bài toán ước lượng có thể được xây dựng như một bài toán BSS, như được
được tái tạo tương ứng để ước tính chính xác hơn về cấu trúc
mô tả trong (8). Như chúng ta đã biết, BSS tương đương với ICA trong quá
khuôn mặt 3-D.
trình hỗn hợp tuyến tính và các tín hiệu nguồn có thể được khôi phục bằng
cách sử dụng thuật toán ICA, tức là, độ sâu có thể được phục hồi thông qua
A. Xây dựng mô hình cICA các thuật toán ICA bằng cách tối đa hóa phân phối không Gauss.
đồng
Các đặc điểm hình dạng, được biểu thị bằng thứ tự của các điểm đặc điểm
trên khuôn mặt, được sử dụng trong thuật toán của chúng tôi để ước tính
Lưu ý rằng sau đó các nguồn tín hiệu trong là ba, trong khi
số tín hiệu hỗn hợp trong là hai. Có nghĩa là, một số thông tin
các giá trị độ sâu tương ứng , tức là, coor-
bị mất trong quá trình trộn, và quá trình trộn này là không thể
giảm béo. Giả sử các điểm đặc trưng được đánh dấu trên khuôn mặt
đảo ngược. Khôi phục ba tín hiệu nguồn từ hai tín hiệu quan
hình ảnh. Đại diện cho điểm đặc trưng thứ của một
sát là một vấn đề ICA quá đầy đủ điển hình, đây vẫn là một vấn
, và
Điểm mô hình mặt 3-D xem trực diện của tính năng thứ
đề khó khăn hiện nay.
khuôn mặt 2-D không nhìn trực diện cho . Ma trận xoay
được đưa ra như sau:
Đưa ra các tín hiệu hỗn hợp , vì
hoàn thành vấn đề ICA, một cách tiếp cận để giải quyết
vấn đề là ước tính ma trận trộn và tín hiệu nguồn
cách khác thông qua ước lượng khả năng xảy ra tối
đa (ML) [12], [13]. Cho trước và một ma trận trộn ban đầu, ước tính
ML của các tín hiệu nguồn có thể được đưa ra bởi
(1) (9)
362 GIAO DỊCH IEEE VỀ CẢM GIÁC VÀ BẢO MẬT THÔNG TIN, VOL. 6, KHÔNG. 2, THÁNG 6 NĂM 2011
được xây dựng dưới dạng một hàm tuyến tính và có thể được giải bằng cách
sử dụng các phương pháp cổ điển để lập trình tuyến tính. Hơn nữa, ước tính
ML của một giá trị nhất định có thể được tính như
(10)
ở đâu biểu thị vectơ mẫu của ngay lập tức, và.
vectơ mẫu của ngay lập tức Trong [22], thay vì
sử dụng ước lượng ML, một thuật toán hình học đã được đề
xuất để khôi phục ma trận trộn hiệu quả hơn. Thông tin trước
là một nguồn quan trọng để giảm bớt tác động tiêu cực do
thông tin bị thiếu. Tín hiệu tham chiếu đã được chứng minh là
thông tin hiệu quả trước đây trong các phương pháp ICA và
BSS. Từ (9) và (10) có thể thấy rằng các tín hiệu tham chiếu
không được xem xét trong các phương pháp của [12] và [13].
CICA cung cấp một khuôn khổ chung để kết hợp các Hình 2. Vị trí của 22 điểm đặc trưng được đánh dấu trong cơ sở dữ liệu Bosphorus.
thông tin trước đó. Từ (8) có thể thấy rằng chỉ có một tín
hiệu không xác định nguồn trong đó là thông tin độ sâu. Do
đó, chúng ta chỉ cần trích xuất bằng tín hiệu tham chiếu ở đâu , và là đạo hàm của
tương ứng. Dựa trên những xem xét ở trên, cICA là một đối với . Quy tắc học tập giống như Newton của can
cách tiếp cận phù hợp để ước tính cấu trúc 3-D. Biểu thị là được đưa ra bởi [8], [15]
tín hiệu ước tính của, tức là,
(11)
(15)
(19)
ở đâu và là tỷ lệ học tập. Gradient của được với
kính trọng đưa ra như sau [8]: Theo giả thiết này, số lượng tín hiệu nguồn bằng số
lượng tín hiệu hỗn hợp. Do đó, mô hình cICA đã xây
dựng trở thành một vấn đề ICA bình thường hơn là một
(16) vấn đề khẩn cấp.
MẶT TRỜI VÀ LAM: ƯỚC LƯỢNG CHẾT CỦA HÌNH ẢNH KHUÔN MẶT DỰA TRÊN MÔ HÌNH ICA ĐÃ CÔNG CỨU 363
Hình 3. So sánh các tín hiệu tham chiếu dựa trên mô hình CANDIDE và giá trị độ sâu thực cho bốn chủ thể khuôn mặt riêng biệt.
Vấn đề ICA thông thường này cũng có thể được giải quyết bằng mô hình mặt [1], các giá trị độ sâu của nó phù hợp để lấy làm tín hiệu
cách sử dụng một số thuật toán ICA điển hình, chẳng hạn như tham chiếu. Trước tiên, chúng tôi trừ giá trị trung bình của, từ, tức là,
thuật toán điểm cố định nổi tiếng, được gọi là FastICA [9], là một
thuật toán ICA rất hiệu quả và đáng tin cậy. FastICA dựa trên sơ đồ (23)
lặp điểm cố định để xác định mức tối đa không phải Gaussianity,
ở đâu là một vectơ sao cho tất cả các phần tử đều
được đo bằng
. Sau đó, các dấu hiệu của được sử dụng như là
tín hiệu erence , I E,
(20)
trong đó biểu thị một biến Gaussian và hàm, là một phi dân tộc (24)
chẳng hạn như
các điểm được cung cấp bởi Mô hình CANDIDE (các điểm
đặc trưng này có cùng vị trí với 22 điểm đặc trưng được
hiển thị trong Hình 2).
Bươc 3) Đối với mỗi hình ảnh khuôn mặt đào tạo, đặc điểm hình dạng của
các điểm đặc trưng và được kết hợp để tạo thành đầu vào của
mô hình cICA.
Bươc 4) Tính toán ma trận không trộn ban đầu theo
(25), cập nhật ma trận không trộn theo (17) và tính
toán các giá trị độ sâu ước tính bằng cách sử dụng (11).
Bươc 5) Tính toán các giá trị trung bình tương ứng của độ sâu của
các điểm đặc trưng như được ước tính cho tất cả các hình
ảnh đào tạo, sau đó sẽ thay thế.
Các bước 3–5 được lặp lại cho đến khi số lần lặp đạt đến giá trị
lớn nhất được xác định trước.
A. Dữ liệu thực nghiệm và các phương pháp liên quan được so sánh
Chúng tôi đã đánh giá phương pháp được đề xuất trên cơ sở dữ liệu
Bosphorus [18], đây là một cơ sở dữ liệu khuôn mặt 3-D tương đối mới
bao gồm một bộ biểu cảm phong phú, các biến thể có hệ thống của các
tư thế và các kiểu khớp cắn khác nhau. Một ưu điểm nổi bật khi sử dụng
cơ sở dữ liệu này là có sẵn các tọa độ 3-D của một tập hợp các điểm đặc
trưng trên khuôn mặt được xác định trước. Nói cách khác, các giá trị độ
Hình 4. Lưu đồ của phương pháp tích hợp mô hình. sâu ước tính của cấu trúc mặt 3-D được tái tạo có thể được so sánh với
các giá trị thực trên mặt đất của nó. Do đó, hiệu suất của các thuật toán
tái tạo 3-D có thể được đánh giá và so sánh chính xác hơn. Tọa độ 2-D
tương ứng của các điểm đặc trưng cho tất cả các tư thế trong cơ sở dữ
trong ước tính giá trị độ sâu hoặc tính toán chỉ số hiệu suất. Với
liệu cũng được cung cấp. Nói chung, các điểm đặc trưng tương ứng cho
tín hiệu tham chiếu được dẫn xuất như đã giải thích trước đó,
các chế độ xem 2-D của tư thế tùy ý được hình thành khi chúng ta có
ma trận không trộn ban đầu có thể được tính như sau [21]:
được các điểm đặc trưng này thông qua việc sử dụng các điểm đánh
dấu
(25) trong quá trình thu nhận hình ảnh hoặc bằng cách sử dụng bất kỳ đặc điểm khuôn mặt nào
các thuật toán phát hiện điểm. Trong mô hình cICA, tín hiệu nguồn
được giả định là các giá trị độ sâu của hình ảnh mặt nhìn chính diện. Do
ở đâu là nghịch đảo tổng quát Moore – Penrose của.
đó, để hình thành tín hiệu tham chiếu, chúng ta chỉ cần xác định vị trí
của 22 điểm đặc trưng trong mô hình CANDIDE (như trong Hình 2),
C. Tích hợp mô hình cho nhiều hình ảnh khuôn mặt xem không
tương ứng với 22 điểm đặc trưng được đánh dấu trong cơ sở dữ liệu
trực diện
Bosphorus (như trong Hình 3 ). Đối với cơ sở dữ liệu này, chúng tôi chủ
Lưu ý rằng một hình ảnh khuôn mặt không nhìn trực diện là đủ để yếu xử lý những hình ảnh có sự thay đổi tư thế. Làm thế nào để đối phó
xây dựng mô hình cICA. Khi có nhiều hình ảnh khuôn mặt không nhìn với sự thay đổi biểu hiện, sự thay đổi độ chiếu sáng và sự tắc nghẽn
trực diện, phương pháp tích hợp amodel được đề xuất trong bài báo nằm ngoài phạm vi của bài báo này. Tất cả các mô phỏng được thực
này để cải thiện hơn nữa độ chính xác của ước tính độ sâu. Hình 4 cho hiện trong môi trường MATLAB, chạy trên một máy tính cá nhân thông
thấy sơ đồ của phương pháp tích hợp mô hình. Đối với hình ảnh khuôn thường.
mặt không nhìn trực diện thứ hai, đặc điểm hình dạng được kết hợp với Để đánh giá hiệu quả, phương pháp đề xuất được so sánh với
để tạo thành đầu vào của thuật toán cICA. Sau đó, tín hiệu độ sâu có thể FastICA [9], ICA hình học (gICA) [22], và phương pháp tái tạo khuôn
được xác định bằng thuật toán cICA. Giá trị trung bình của, được hiển mặt 3-D dựa trên sự biến đổi tương tự (SM) [11]. Để làm cho biểu
thị như sau: thức thuận tiện hơn, phương pháp tích hợp mô hình được sử dụng
trong cICA được ký hiệu là cICA_MI.
Hình 7. So sánh hiệu suất của FastICA với và không sử dụng ma trận
không trộn ban đầu.
Hình 8. So sánh hiệu suất của gICA và cICA đối với các đối tượng khuôn mặt khác Hình 10. So sánh hiệu suất của thuật toán SM và cICA.
nhau.
Hình 13 cho thấy giá trị độ sâu thực và giá trị độ sâu ước tính của
các điểm đặc trưng trên khuôn mặt thu được bằng cách sử dụng
Hình 9. So sánh các hoạt động của gICA khi sử dụng và không sử dụng cICA_MI. Để so sánh, tất cả các giá trị độ sâu hiển thị trong Hình 13
thao tác làm trắng. được chuẩn hóa thành khoảng [0, 1]. Giá trị độ sâu ước tính của 22
điểm đặc trưng được chuẩn hóa như sau:
3) So sánh thử nghiệm với thuật toán SM:Trong phương
pháp SM, kích thước quần thể và số lần lặp lại tối đa của thuật (27)
toán di truyền được đặt lần lượt là 800 và 200. Hình 10 cho thấy
các kết quả thực nghiệm thu được bằng cách sử dụng các thuật ở đâu là giá trị độ sâu chuẩn hóa của , và và
toán SM và cICA. Chúng ta có thể thấy rằng các phương tiện lần lượt là giá trị độ sâu tối thiểu và tối đa. Cần lưu ý rằng
dựa trên cICA cao hơn so với các phương tiện dựa trên SM. Do chuẩn hóa chỉ được sử dụng để hiển thị các giá trị độ sâu, và không
đó, cICA có mức độ chính xác ước tính độ sâu cao hơn so với được sử dụng trong thủ tục ước tính giá trị độ sâu hoặc trong tính
SM. Ngoài ra, độ lệch chuẩn dựa trên cICA rõ ràng là nhỏ hơn toán các hệ số tương quan. Có thể thấy từ Hình 13 rằng giá trị độ
so với độ lệch chuẩn dựa trên SM. Do đó, chúng ta có thể kết sâu của hầu hết các điểm đặc trưng trên khuôn mặt được ước tính
luận rằng cICA chính xác và mạnh mẽ hơn SM. chính xác. Cần nhấn mạnh rằng không có thông tin trước nào về
Lấy Chủ đề 1 làm ví dụ, Bảng I hiển thị các hệ số tương quan của các giá trị độ sâu thực được sử dụng trong toàn bộ quy trình ước
các giá trị độ sâu thực và các giá trị ước tính tương ứng cho các tính. Hệ số tương quan thu được bằng cách sử dụng cICA_MI là
hình ảnh khuôn mặt khác nhau bằng cách sử dụng các thuật 0,9124, cao hơn các giá trị trung bình thu được bằng các phương
toánFastICA, gICA, SM, andcICA. Có thể thấy rằng thuật toán CICA pháp khác khi chỉ sử dụng một hình ảnh khuôn mặt không nhìn
có thể đạt được hiệu suất rất giống nhau cho các hình ảnh khuôn trực diện. Do đó, mức độ chính xác của ước tính độ sâu có thể được
mặt khác nhau và vượt trội hơn ba thuật toán khác về các tương cải thiện một cách hiệu quả bằng cách sử dụng phương pháp tích
quan trung bình và độ lệch chuẩn của nó. hợp mô hình được đề xuất khi có nhiều hình ảnh khuôn mặt xem
4) So sánh thử nghiệm của cICA và cICA_MI: Để đánh giá trực diện hơn. Giá trị độ sâu ước tính của các điểm đặc trưng có thể
phương pháp tích hợp mô hình, cICA_MI được sử dụng để được sử dụng trong ước tính tư thế hoặc nhận dạng khuôn mặt. Độ
ước tính giá trị độ sâu của hình ảnh khuôn mặt cho chính xác cao hơn trong ước tính tư thế
MẶT TRỜI VÀ LAM: ƯỚC LƯỢNG CHẾT CỦA HÌNH ẢNH KHUÔN MẶT DỰA TRÊN MÔ HÌNH ICA ĐÃ CÔNG CỨU 367
BẢNG I
CLỆNHCHIỆU QUẢ CỦATRUEDEPTHVALUES VÀ THEEKÍCH THÍCHVALUESOĐÃ DUYỆTWITHDKHÁC
TMƯAFÁT CHỦTôiMAGES CHOFastICA, gICA, SM,VÀcICA
Hình 11. Các đường cong lặp lại của các Đối tượng 1, 6, 11, 16, 21 và 26 bằng cách sử dụng phương pháp
tích hợp mô hình. Hình 13. Giá trị độ sâu thực và giá trị độ sâu ước tính của các điểm đặc trưng trên khuôn
mặt của Đối tượng 1 trong cơ sở dữ liệu Bosphorus.
Hình 12. So sánh các hoạt động của thuật toán cICA và cICA_MI.
Hình 14. So sánh các hoạt động của thuật toán cICA dựa trên mô hình
ICA quá mức và bình thường.
hoặc nhận dạng khuôn mặt nói chung có thể đạt được nếu đạt được độ
chính xác cao hơn của ước lượng giá trị độ sâu [11]. Vì phương pháp đề
xuất đã được chứng minh là có độ chính xác ước tính giá trị độ sâu cao thuật toán có thể đạt được mức độ chính xác ước tính độ sâu
hơn các phương pháp khác, do đó, nó có thể cung cấp ước tính độ sâu cao hơn và độ lệch chuẩn nhỏ hơn khi được sử dụng làm đầu
đáng tin cậy hơn để sử dụng trong ước tính tư thế và nhận dạng khuôn vào của thuật toán cICA. Do đó, việc sử dụng thông tin bổ sung
mặt. trước đó từ mô hình mặt CANDIDE chung để chuyển đổi vấn đề
quá mức thành mô hình ICA bình thường được xác nhận là hiệu
C. Bàn luận quả hơn để ước lượng độ sâu.
Hình 14 cho thấy các hoạt động của cICA khi chúng có dạng Hình 15 cho thấy các hệ số tương quan của
quá đầy đủ và dạng bình thường, tức là, các đầu vào của thuật giá trị độ sâu thực và giá trị độ sâu ước tính thu được
toán cICA lần lượt là và. Chúng ta có thể thấy rằng bằng thuật toán cICA_MI và hệ số tương quan
368 GIAO DỊCH IEEE VỀ CẢM GIÁC VÀ BẢO MẬT THÔNG TIN, VOL. 6, KHÔNG. 2, THÁNG 6 NĂM 2011
Hình 15. So sánh các hệ số tương quan và Hình 16. So sánh các hệ số tương quan thu được bằng cách sử dụng bốn thống kê
cho 30 đối tượng. bậc nhất khác nhau với phương pháp tích hợp mô hình cho 30 đối tượng.
Hình 17showsthecorrelationcurvesofSubjects1,6, các chủ đề cũng được đưa ra trong Bảng II để thể hiện
11,16,21 và26bt được duy trì bằng cách sử dụng phương mức độ cải thiện. Ngoài ra, hệ số tương quan giữa các
pháp tích hợp mô hình với số lượng hình ảnh đào tạo giá trị độ sâu thực và giá trị độ sâu được ước tính từ tất
ngày càng tăng. Nói chung, có thể thấy rằng độ chính cả các mẫu của một đối tượng, cũng được đưa ra ở đây
xác được cải thiện khi có nhiều hình ảnh hơn được đưa để điều tra xem hiệu suất được cải thiện khi tiến hành
vào ước tính. Đối với Đối tượng 21, hiệu suất giảm nhẹ. lặp lại. Có thể thấy từ Bảng II rằng hiệu suất tương tự
Nếu không có các giá trị độ sâu thực, rất khó xác định cũng đạt được đối với FastICA, gICA và SM. Vì giá trị độ
một tiêu chí hiệu quả để tìm ra sự kết hợp tối ưu. Trong sâu của các điểm đặc trưng trong mô hình CANDIDE
các thử nghiệm, tất cả các mẫu đào tạo có sẵn được sử được sử dụng trong FastICA và SM, chúng ta có thể thấy
dụng cho thuật toán cICA_MI. rằng hai phương pháp này có hiệu suất tốt hơn một chút
Cần chỉ ra rằng, để thuận tiện cho việc hiển thị kết so với gICA. SM lớn hơn của FastICA và gICA vì di truyền
quả, chỉ 30 đối tượng đầu tiên, thay vì tất cả
MẶT TRỜI VÀ LAM: ƯỚC LƯỢNG CHẾT CỦA HÌNH ẢNH KHUÔN MẶT DỰA TRÊN MÔ HÌNH ICA ĐÃ CÔNG CỨU 369
[18] A. Savran, N. Alyüz, H. Dibeklioglu, O. Çliktutan, B. Göberk, B. Sankur và L. Zhan-Li Sunnhận bằng Tiến sĩ. cấp bằng của Đại
Akarun, “Cơ sở dữ liệu Bosphorus để phân tích khuôn mặt 3D,” trong học Khoa học và Công nghệ Trung Quốc, năm
Hội thảo COST 2101 đầu tiên về Sinh trắc học và Quản lý nhận dạng 2005.
(BIOID 2008), Đan Mạch, ngày 7-9 tháng 5 năm 2008, Đại học Roskilde. Từ năm 2006, ông đã làm việc với Đại học
[19] ZL Sun, DS Huang, CH Zheng và L. Shang, “Lựa chọn tối ưu thời gian trễ Bách khoa Hồng Kông, Đại học Công nghệ
cho TDSEP dựa trên thuật toán di truyền,”Máy tính thần kinh, quyển sách. Nanyang và Đại học Quốc gia Singapore. Sở
69, không. 7–9, trang 884–887, 2006. thích nghiên cứu của anh ấy bao gồm học máy,
[20] ZL Sun, “Một phần mở rộng của MISEP để tách hỗn hợp sau phi tuyến tính,”IEEE xử lý hình ảnh và tín hiệu.
Trans. Mạch Syst. II, Exp. Tóm tắt, quyển sách. 56, không. 8, trang 654–658,
tháng 8 năm 2009.
[21] ZL Sun và L. Shang "Máy tính thần kinh, quyển sách. 73, không.
4–6, trang 1013–1017, 2010.
[22] FJ Theis, EW Lang, và CG Puntonet, "Một thuật toán hình học cho ICA tuyến
tính quá đầy đủ,"Máy tính thần kinh, quyển sách. 56, trang 381–398, Kin-Man Lam(M'88) đã nhận được Hiệp hội về
2004. kỹ thuật điện tử với sự khác biệt từ Đại học Bách
[23] CZ Zhang và SC Fernand, "Trích xuất và nhận dạng cấu trúc khuôn mặt 3-D từ khoa Hồng Kông (trước đây gọi là Bách khoa
hình ảnh bằng cách sử dụng phép biến hình 3-D và ánh xạ khoảng cách," IEEE Hồng Kông) vào năm 1986, M.Sc. bằng kỹ sư
Trans. Quy trình Hình ảnh., quyển sách. 11, không. 1, trang 1249–1259, 2002. truyền thông của Khoa Điện, Trường Cao đẳng
[24] L. Zou, S. Cheng, ZX Xiong, M. Lu, và KR Castleman, “Nhận dạng khuôn mặt 3-D Khoa học, Công nghệ và Y học Hoàng gia, Luân
dựa trên các khuôn mặt mẫu bị cong vênh”IEEE Trans. Inf. Pháp y An ninh, Đôn, Vương quốc Anh, năm 1987, và bằng Tiến
quyển sách. 2, không. 3, trang 513–528, tháng 9 năm 2007. sĩ. cấp bằng của Khoa Điện, Đại học Sydney,
[25] M. Castelán và ER Hancock, “Thu thập dữ liệu chiều cao từ một hình ảnh duy nhất của khuôn mặt Sydney, Úc, tháng 8 năm 1996.
bằng cách sử dụng các chỉ số hình dạng cục bộ,”Tính toán. Số lượt truy cập Hiểu hình ảnh,
quyển sách. 103, không. 1, trang 64–79, 2006. Từ năm 1990 đến năm 1993, ông là Giảng viên của Trường Đại học
[26] M.CastelánandE.R.Hancock, “Mô hình thống kê kết hợp Asimple để phục hồi hình partmentofElectronicEngineering, TheHongKongPolytechnicUniversity.Ông
dạng khuôn mặt 3D,” trongProc. Ngày 18 Lời thú nhận. Nhận dạng mẫu, 2006, gia nhập Khoa Công nghệ Thông tin và Điện tử, Đại học Bách khoa Hồng
trang 231–234. Kông, với tư cách là Trợ lý Giáo sư vào tháng 10 năm 1996, trở thành Phó
[27] M. Castelán, WAP Smith và ER Hancock, “Một mô hình thống kê kết hợp để phục hồi hình Giáo sư năm 1999 và hiện là Giáo sư. Ông đã từng là thành viên ban tổ chức
dạng khuôn mặt từ các hình ảnh có độ sáng”IEEE Trans. Quy trình Hình ảnh., quyển và ban chương trình của nhiều hội nghị quốc tế. Mối quan tâm nghiên cứu
sách. 16, không. 4, trang 1139–1151, tháng 4 năm 2007. hiện tại của anh ấy bao gồm nhận dạng khuôn mặt người, xử lý hình ảnh và
[28] M. Castelán và J. Van Horebeek, “Xấp xỉ hình dạng khuôn mặt 3D từ các cường độ video, và thị giác máy tính. Tiến sĩ Lâm là một thành viên của BoG theAsia-
sử dụng một phần hình vuông nhỏ nhất,” trongProc. Hội thảo về Thị giác Máy PacificSignalandInformationProcessingAssosystem (AP-SIPA). Ông cũng là
tính và Nhận dạng Mẫu của IEEE, 2008, trang 1–8. Phó tổng biên tập của IEEE TBẬT GIAO DỊCH
TôiMAGEPROCESSINGvàTạp chí Quốc tế EURASIP về Xử lý Hình ảnh và
Video.