Tiểu Luận Nhận Dạng Đối Tượng Trên Khung Ảnh-Tạ Nhật Anh

ĐẠI HỌC
NGUYỄN TẤT THÀNH
TIỂU LUẬN MÔN HỌC

ĐỒ ÁN CƠ SỞ KHOA HỌC DỮ LIỆU
Đề tài: Nhận dạng đối tượng trên khung ảnh
MSSV: 2100003560
SV thực hiện: Tạ Nhật Anh
MỤC LỤC
LỜI NÓI ĐẦU.........................................................................................................3

Tóm tắt......................................................................................................................4
1. Giới thiệu.............................................................................................................4
Hình 1a: Hình ảnh vật liệu cần nhận dạng.........................................................5
Hình 1b: Hình ảnh khuôn mặt con người cần nhân dạng...................................6
2. Một số phương pháp nhận dạng........................................................................6
Hình 2: Những màu sắc khác nhau cho thấy các kết cấu/loại vật liệu...............7
4. Một số kết quả thực nghiệm...............................................................................8
4.1. Kết quả trên điểm chuẩn LFW...................................................................8
Hình 3: Chứng minh tác dụng của kỹ thuật điểm chuẩn LFW..........................8
Hình 4: Mặt so sánh kết quả nhận dạng trên tiêu chuẩn LFW...........................9
Bảng 1: Hiệu suất nhận dạng trên các số liệu Multi-PIE.................................10
4.2 Kết quả trên Flickr Materials Database....................................................10
Bảng 2: Kích thước, số lượng các cụm và số trung bình tính năng cho mỗi
hình ảnh............................................................................................................11
4.3 Kết quả trên PIE-Multi...............................................................................12
TÀI LIỆU THAM KHẢO....................................................................................13
2
LỜI NÓI ĐẦU
Do hạn chế về trình độ chuyên môn và tiếng Anh nên luận văn “Nhận dạng đối
tượng trên khung ảnh” gồm có hai bài:
Khám phá các tính năng được tập hợp từ hai bài viết: Exploring Features of a
Bayesian Framework for Material Recognition và Face Recognition with Learning-based
Descriptor không giới thiệu hết các nội dung đã học ở trên mà chủ yếu giới thiệu các kiến
thức cơ bản sau:
Cấu trúc của bài luận như sau:
Phần 1: Tóm tắt
Phần 2: Giới thiệu lại vài khái niệm cơ bản cần trong bài báo, các thể hiện tổng thể
tối thiểu của nhận dạng hình ảnh, hoặc các phương pháp nhận dạng mới với kết quả qua
một số thực nghiệm cụ thể.
Phần 3: Trình bày một số kết luận dựa trên các kết quả thực nghiệm.
Sinh viên
Tạ Nhật Anh
3
NỘI DUNG
Tóm tắt
Bài toán nhận dạng hình ảnh người hoặc hình ảnh vật liệu, ví dụ: thủy tinh, kim
loại, vải, nhựa hoặc gỗ từ hình ảnh một chiều. Không giống như các nhiệm vụ nhận dạng
trong thị giác máy tính, rất khó để tìm ra các tính năng tốt, đáng tin cậy có thể chỉ ra loại
vật liệu. Nhiều phương pháp đã được giới thiệu, chẳng hạn như chiến lược sử dụng tập
hợp các đặc trưng có độ giàu thấp và trung bình để nhận biết các khía cạnh khác nhau
của vật liệu xuất hiện, mô hình phân bổ Dirichlet tiềm ẩn (aLDA) kết hợp các đặc điểm
này theo định dạng Bayesian và học cách kết hợp tối ưu. . về các tính năng, cách tiếp cận
của chúng tôi mã hóa cấu trúc vi mô của đối tượng theo một phương pháp mã hóa mới.
Không giống như các phương pháp mã hóa được thiết kế thủ công trước đây (ví dụ: LBP
hoặc SIFT), chúng tôi sử dụng các kỹ thuật học không giám sát để tìm hiểu bộ mã hóa
từ các ví dụ đào tạo. Động lực học có thể tự động đạt được sự cân bằng rất tốt giữa vi
phân và bất biến vi phân. Sau đó chúng tôi áp dụng PCA để có được mô tả đối tượng
nhỏ gọn. Kết quả thử nghiệm cho thấy hệ thống mới thực hiện nhận dạng vật liệu khá tốt
trên cơ sở dữ liệu mẫu vật liệu.
1. Giới thiệu
Nhận dạng chất liệu là một khía cạnh quan trọng của nhận dạng. Phải tương tác
với nhiều loại vật liệu cơ bản và liên tục đánh giá sự xuất hiện của chúng trong hình ảnh.
Ví dụ, khi tiếp xúc một hình ảnh hoặc chất lượng vật liệu ảnh hưởng quyết định cuối
cùng. Vì vậy, rất có giá trị để xây dựng một hệ thống nhận dạng hình ảnh có thể suy ra
tính chất vật liệu từ hình ảnh.
Vấn đề nhận dạng các tài liệu từ các bức ảnh đã được giải quyết chủ yếu là trong
bối cảnh dự toán phản xạ. Sự xuất hiện hình ảnh của một bề mặt phụ thuộc vào nhiều yếu
tố - những điều kiện chiếu sáng, cấu trúc hình học của các mẫu bề mặt tại một số quy mô
không gian, và các tính chất phản xạ bề mặt, thường đặc trưng bởi chức năng phân phối
hai hướng phản xạ (BRDF) [24] và các biến thể của nó [9, 16, 26]. Một số kỹ thuật đã
được phát triển mà có thể ước tính các thông số của một mô hình BRDF từ một bộ ảnh,
theo giả định hạn chế của ánh sáng, hình học và các thuộc tính vật chất [10, 11]. Chẳng
hạn, nhận dạng khuôn mặt đã thu hút nhiều nỗ lực nghiên cứu [1, 3, 4, 5, 6, 8, 12, 13, 14,
15] do sự tiến bộ của kí hiệu nhận dạng cục bộ [17, 21, 23, 25, 27, 29, 31, 32] và nhu cầu
4
ngày càng cao của thực tế ứng dụng, chẳng hạn như mặt gắn thẻ vào máy tính để bàn
[33] hay các Internet1.
Ở đây, tập trung vào nhận dạng mức cao hình ảnh loại vật liệu: như con người,
thủy tinh, kim loại, vải, nhựa hoặc gỗ. Các tính chất phản xạ của vật liệu thường được
tương quan với thể loại cao cấp của nó (ví dụ như thủy tinh thường là mờ và gỗ thường
có màu nâu), và trong công việc này, sẽ khai thác những đặc tính tương quan. Tuy nhiên,
điều quan trọng là chỉ ra rằng chỉ biết các tính chất phản xạ của một bề mặt không đủ để
xác định loại vật liệu. Ví dụ, một thực tế là một bề mặt mờ là không cho biết nếu nó được
làm bằng nhựa, sáp hoặc thủy tinh.
Hình 1a: Hình ảnh vật liệu cần nhận dạng
5
Hình 1b: Hình ảnh khuôn mặt con người cần nhân dạng
2. Một số phương pháp nhận dạng
Những yêu cầu này đặt ra một vấn đề khó khăn. Hiện tại, các phương pháp tiếp
cận dựa trên mô tả [5, 13, 34] đã được chứng minh là có thể xác định các điểm đại diện
trên hình ảnh là hiệu quả với hiệu suất tốt nhất [35, 36, 37]. Ahonen và cộng sự. [38] đề
xuất sử dụng biểu đồ mẫu nhị phân cục bộ (LBP) [23] để mô tả cấu trúc vi mô của hình
ảnh. LBP mã hóa mức cường độ tương đối giữa mỗi pixel và các pixel lân cận. Nó bất
biến đối với những thay đổi trắc quang đơn điệu và có thể được trích xuất một cách hiệu
quả. Do LBP được mã hóa thủ công nên nhiều LBP tương tự [34, 14, 40] đã được đề
xuất để cải thiện LBP ban đầu. SIFT [21] hoặc Biểu đồ độ dốc (HOG) [17] là các mã
định danh hiệu quả bằng cách sử dụng mã hóa thủ công. Các phần tử nguyên tử trong mã
định danh có thể được coi là mã lượng tử của độ dốc thị giác. Về cơ bản, các phương
pháp mã hóa và mô tả khác nhau cần phải được cân bằng. Tuy nhiên, phương pháp mã
hóa có hai nhược điểm. Một mặt, phương pháp mã hóa tối ưu là rất khó. Nói chung, việc
sử dụng nhiều pixel theo ngữ cảnh hơn (kích thước vectơ) có thể tạo ra mã khác biệt
hơn. Nhưng không dễ để thiết kế một phương pháp mã hóa và định cỡ đạt được sự cân
bằng hợp lý giữa nhận dạng chính xác và độ thô trong không gian đầu vào lớn. Một số
mã có thể hiếm khi xuất hiện trong ảnh khuôn mặt thật. Điều này có nghĩa là biểu đồ
của mã kết quả sẽ nhỏ hơn và ít thông tin hơn, làm giảm khả năng mô tả phân biệt đối xử.
Việc nhận dạng chất liệu cao cấp trong ảnh khác với vấn đề cũng như đối tượng nghiên
cứu nhận dạng. Mặc dù việc nhận dạng đối tượng đôi khi được dự đoán theo loại vật
liệu, một lớp đối tượng có thể bao gồm các vật liệu khác nhau (xem Hình 2) và các lớp
6
đối tượng khác nhau có thể bao gồm các vật liệu khác nhau và tương tự (xem Hình 1).
Do đó, nhiều tiến bộ gần đây trong nhận dạng đối tượng như bối cảnh hình dạng [2],
phát hiện đối tượng [7] và chuyển nhãn [19] có thể không áp dụng được cho nhận dạng
tài liệu. . Trong thực tế, hầu hết các hệ thống nhận dạng đối tượng đều dựa vào các tính
năng phần cứng bất biến và có xu hướng bỏ qua hoàn toàn thông tin phần cứng.
4. Một số kết quả thực nghiệm
Hình 2: Những màu sắc khác nhau cho thấy các kết cấu/loại vật liệu.
Chất liệu nhận dạng là liên quan chặt chẽ, nhưng khác nhau từ, nhận dạng kết cấu. Kết
cấu đã được định nghĩa trong thành phần kích thước giống như chu kỳ, orientedness, và
ngẫu nhiên [20]. Nó có thể là một thành phần quan trọng của sự xuất hiện vật chất, ví dụ:
gỗ có xu hướng có kết cấu khác biệt với những kim loại đánh bóng. Tuy nhiên, như minh
họa trong hình 3, bề mặt làm bằng chất liệu khác nhau có thể chia sẻ các mẫu kết cấu
giống nhau và như là một hậu quả, cơ chế thiết kế cho nhận dạng kết cấu [18, 30] có thể
không được lý tưởng cho sự công nhận vật chất.
Chất liệu nhận dạng cũng khác nhau từ BRDF dự toán. Sự xuất hiện hình ảnh của
các vật liệu như gỗ hoặc da, đã được làm mẫu về chức năng phân phối hai hướng phản xạ
(BRDF) [10, 22] và đại diện liên quan như BTF [9] và BSSRDF [16]. Chất liệu nhận
dạng có thể có vẻ tầm thường nếu BRDF được biết đến, nhưng nói chung, nó gần như
không thể ước tính BRDF từ một hình ảnh duy nhất mà không cần đơn giản hóa các giả
định [10, 11].
7
4.1. Kết quả trên điểm chuẩn LFW
Chúng tôi trình bày kết quả ghi nhận của mình về LFW dưới dạng đường cong
ROC. Hình 3 cho thấy kết quả so sánh các đề xuất của chúng tôi. Trong Hình 3, “LE đơn
+ Hoàn chỉnh” có nghĩa là chúng ta chỉ sử dụng LE tốt nhất để thể hiện tổng thể khuôn
mặt và đây là cơ sở để thể hiện sức mạnh của LE mà không cần đến các kỹ thuật khác.
“LE đơn + comp” chỉ áp dụng ở cấp độ thành phần, cài đặt thích ứng với đường cơ sở LE
đơn. Nhiều mã định danh LE được kết hợp để tạo thành một “đa LE+ hoàn chỉnh”. Và
"multi LE + comp" là màn trình diễn tốt nhất của chúng tôi. Độ chính xác của bốn
phương pháp là 81,22% ± 0,53%, 82,72% ± 0,43%, 83,43% ± 0,55% và 84,45% ±
0,46%. Mặc dù khả năng phân biệt đối xử mạnh mẽ của LE là tự mô tả, nhưng sự kết
hợp, thích ứng và kết hợp của nhiều bộ mô tả sẽ cải thiện hơn nữa hiệu suất nhận dạng
của hệ thống của chúng tôi.
Hình 3: Chứng minh tác dụng của kỹ thuật điểm chuẩn LFW.
8
Hình 4: Mặt so sánh kết quả nhận dạng trên tiêu chuẩn LFW.
Đường cong ROC tốt nhất của chúng tôi là so sánh với kết quả trước của các
phương pháp state-of-the-art, như trong hình 4. Trên tiêu chuẩn LFW, hai thuật toán mới
cho thấy hiệu suất hàng đầu. Wolf et al. 'S làm việc [31] thông qua nền tảng học bằng
cách sử dụng các thông tin nhận dạng trong đào tạo các thiết lập. Kumar et al. [13] đã sử
dụng để đào tạo học có giám sát phân loại cao cấp thông qua một khối lượng lớn các hình
ảnh đào tạo bên ngoài của các tập dữ liệu LFW. Hai phương pháp [13, 31] đều sử dụng
thông tin bổ sung bên ngoài giao thức thử nghiệm LFW. Vì vậy, so sánh với các phương
pháp khác (bao gồm cả chúng ta) trong hình 4 là không thực sự công bằng. đào tạo bổ
sung dữ liệu hoặc thông tin cũng có thể cải thiện cách tiếp cận khác. Hệ thống của chúng
tôi đạt được tốt nhất giao thức thử nghiệm tiêu chuẩn [12]. Quan trọng hơn, công việc
của chúng tôi tập trung vào khuôn mặt đại diện cấp thấp, mà có thể dễ dàng kết hợp với
các thuật toán trước đó để tạo ra hiệu suất tốt hơn.
9
Bảng 1: Hiệu suất nhận dạng trên các số liệu Multi-PIE.
4.2 Kết quả trên Flickr Materials Database
Chúng tôi sử dụng các vật liệu Flickr Materials Database [28] cho tất cả các thí
nghiệm được mô tả trong bài báo này. Có mười loại vật liệu trong cơ sở dữ liệu: vải, lá,
thủy tinh, da, kim loại, giấy, nhựa, đá, nước và gỗ. Mỗi thể loại có chứa 100 hình ảnh, 50
trong số đó là quan điểm cận và phần còn lại 50 là quan điểm ở quy mô-đối tượng (xem
hình 1a). Với nhãn đôi, human-labeled kết hợp với mỗi hình ảnh mô tả vị trí của đối
tượng. Chúng tôi chỉ xem xét điểm ảnh bên trong mặt nạ này nhị phân để công nhận tài
liệu và bỏ qua tất cả các điểm ảnh nền. Đối với mỗi thể loại, chúng tôi đã chọn ngẫu
nhiên 50 hình ảnh cho việc huấn luyện và 50 hình ảnh cho thử nghiệm. Tất cả các kết quả
thực nghiệm được báo cáo trong bài báo này được dựa trên cùng một phân tách huấn
luyện và thử nghiệm.
Tâm tính toán chi phí, chúng tôi lấy mẫu màu, jet, sàng lọc, micro-jet và các tính năng
micromicro-sift trên một lưới thô (thứ tự 5 pixel trong cả hai hướng ngang và dọc). Một
khi các tính năng được chiết xuất, bằng cách sử dụng cụm K-means theo số lượng các
cụm trong Bảng 2. Chúng tôi xác định số lượng các cụm cho từng tính năng, xem xét cả
đa chiều và số lượng các trường hợp cho mỗi tính năng.
10
Bảng 2: Kích thước, số lượng các cụm và số trung bình tính năng cho mỗi hình ảnh
Hiệu suất tăng từ tính năng đơn lẻ tốt nhất (SIFT, 35,4%) lên tính năng tốt nhất.
Việc điều chỉnh (màu + SIFT + lát cắt cạnh, 44,6%) là do mô hình của chúng tôi tăng
aLDA của thị giác. Điều thú vị là việc thêm các tính năng bổ sung sẽ làm giảm hiệu suất
tổng thể. Khi chúng tôi sử dụng tất cả các tính năng, tỷ lệ thử nghiệm là 38,8%. Giảm bớt
bằng cách sử dụng ít tính năng hơn. Việc SIFT là tính năng hoạt động tốt nhất cho thấy
tầm quan trọng của kết cấu trong nhận dạng vật liệu. Ngoài ra, Sift còn gói gọn một số
thông tin chụp microsieve. Lát cắt cạnh dùng để đo độ phản xạ cũng rất hữu ích.
Để so sánh, chúng tôi triển khai và thử nghiệm thuật toán VarmaZisserman (VZ) từ [30]
trên cơ sở dữ liệu tài liệu Flickr. Thuật toán VZ nhóm các pixel thang độ xám 5x5 làm từ
mã, thu được biểu đồ từ mã cho mỗi hình ảnh và thực hiện nhận dạng bằng cách sử
dụng bộ phân loại lân cận gần nhất. Để kiểm tra tính nhất quán, chúng tôi chạy triển khai
VZ trên cơ sở dữ liệu CURET và nhận được 96,1% (con số của chúng là 95% đến 98%,
[30]). Tiếp theo, chúng tôi chạy hệ thống chính xác VZ đã được thử nghiệm trên
CURET dựa trên cơ sở dữ liệu vật liệu Flickr. Tốc độ kiểm tra VZ là 23,8%. Điều này
ủng hộ kết luận rằng cơ sở dữ liệu vật liệu Flickr khó khăn hơn nhiều so với cơ sở dữ
liệu kết cấu CURET.
Sự tinh tế trong hệ thống ma trận của chúng tôi (màu + SIFT + lát cắt cạnh, tỷ lệ kiểm tra
44,6%). Việc cho chúng tôi biết tần suất phân loại lỗi của mỗi danh mục là khác nhau. Ví
dụ, vải thường bị xếp lớp lỗi như đá, da thường bị xếp lớp lỗi như vải, nhựa thường bị
xếp lớp lỗi như giấy. Kim loại có nhiều khả năng được phân loại là thủy tinh hơn là thủy
tinh. Những kết quả này không có gì đáng ngạc nhiên vì có những điểm tương đồng giữa
da và vải, nhựa và giấy, kim loại và thủy tinh.
4.3 Kết quả trên PIE-Multi
11
Chúng tôi cũng thực hiện các thử nghiệm sâu rộng trên nhóm Multi-PIE để xác
minh khả năng khái quát hóa phương pháp tiếp cận của chúng tôi. Các hình Multi-PIE
chứa hình ảnh khuôn mặt của 337 đối tượng, được chụp dưới 15 góc nhìn và 19 điều
kiện ánh sáng. Có sự khác biệt lớn giữa LFW và Multi-PIE, tùy thuộc vào điều kiện phơi
sáng, độ chiếu sáng và độ phân giải. Ngoài ra, Multi-PIE được thu thập như một phần
của thiết lập điều khiển có hệ thống nhằm mô phỏng các tác động của tư thế, ánh sáng và
biểu cảm. Mặt khác, LFW gần với các tham số thực của nó hơn do các khuôn mặt được
chọn từ các hình ảnh tin tức. Vì những lý do này, việc đào tạo trên một tập dữ liệu và thử
nghiệm trên tập dữ liệu kia có thể chứng minh tốt hơn tính khái quát của hệ thống nhận
dạng.
Tương tự như điểm chuẩn LFW, chúng tôi tạo ngẫu nhiên 10 tập hợp hình ảnh khuôn
mặt bằng Multi-PIE, mỗi tập hợp có 300 cặp nội bộ và 300 cặp liên cá thể. Danh tính đối
tượng loại trừ lẫn nhau giữa 10 tập hợp con và chế độ xác thực tương tự như LFW được
áp dụng. Bộ mô tả “LE đơn” mặc định và bộ mô tả “LE multiple” được đào tạo trên
LFWbenchmark được áp dụng trong các thử nghiệm. Như được hiển thị trong Bảng 1,
các LE có biểu diễn một mặt nhìn chung nhanh hơn 5 điểm so với các bộ mô tả thường
được sử dụng và các bộ phân loại theo tư thế cụ thể được đào tạo trên tập dữ liệu LFW
cũng hoạt động tốt trên tập dữ liệu Multi-PIE. Tất cả những kết quả này chứng tỏ khả
năng khái quát hóa tuyệt vời của hệ thống của chúng tôi.
12
TÀI LIỆU THAM KHẢO
[1] M. Guillaumin, J. Verbeek, C. Schmid, I. LEAR, and L. Kuntzmann. Is that you?

Metric learning approaches for face identification. In Proc. ICCV, 2009.
[2] S. Belongie, J. Malik, and J. Puzicha. Shape matching and object recognition using
shape contexts. TPAMI, 24(4):509–522, 2002.
[3] X. Wang and X. Tang. A unified framework for subspace face recognition. IEEE
Transactions on pattern analysis and machine intelligence, 26(9):1222–1228, 2004.
[4] X. Wang and X. Tang. Random sampling for subspace face recognition. International
Journal of Computer Vision, 70(1):91–104, 2006.
[5] G. Hua and A. Akbarzadeh. A robust elastic and partial matching metric for face
recognition. In Proc. ICCV, 2009.
[6] P. Hua, G. Viola and S. Drucker. Face recognition using discriminatively trained
orthogonal rank one tensor projections. In Proc. CVPR, 2007.
[7] N. Dalal and B. Triggs. Histograms of oriented gradients for human detection. In
CVPR, volume 2, pages 886–893, 2005.
[8] N. Kumar, A. Berg, P. Belhumeur, and S. Nayar. Attribute and Simile classifiers for
face verification. In Proc. ICCV, 2009.
[9] K. J. Dana, B. Van-Ginneken, S. K. Nayar, and J. J. Koenderink. Reflectance and
texture of real world surfaces. ACM Transactions on Graphics, 18(1):1–34, 1999.
[10] P. Debevec, T. Hawkins, C. Tchou, H. P. Duiker, W. Sarokin, and M. Sagar.
Acquiring the reflectance field of a human face. In ACM SIGGRAPH, pages 145–156,
2000.
[11] R. Dror, E. H. Adelson, and A. S. Willsky. Recognition of surface reflectance
properties from a single image under unknown real-world illumination. In IEEE
Workshop on identifying objects across variation in lighting, 2001.
[12] N. Pinto, J. DiCarlo, and D. Cox. How far can you get with a modern face
recognition test set using only simple features. In Proc. CVPR, 2009.
[13] Y. Taigman, L. Wolf, T. Hassner, and I. Tel-Aviv. Multiple One-Shots for utilizing
class label information. In BMVC, 2009.
[14] L.Wolf, T. Hassner, and Y. Taigman. Descriptor based methods in the wild. In
Faces in Real-Life Images Workshop in ECCV, 2008.
[15] L. Zhang, R. Chu, S. Xiang, S. Liao, and S. Li. Face detection based on multi-block
lbp representation. Lecture Notes in Computer Science, 4642:11, 2007.
[16] H. W. Jensen, S. Marschner, M. Levoy, and P. Hanrahan. Apractical model for
subsurface light transport. In ACM SIG-GRAPH, pages 511–518.
[17] N. Dalal and B. Triggs. Histograms of oriented gradients for human detection. In
Proc. CVPR, 2005.
[18] T. Leung and J. Malik. Representing and recognizing the visual appearance of
materials using three-dimensional textons. IJCV, 43(1):29–44.
[19] C. Liu, J. Yuen, and A. Torralba. Nonparametric scene parsing: Label transfer via
dense scene alignment. In CVPR, 2009.
[20] F. Liu and W. Picard. Periodicity, directionality and randomness: Wold features for
image modeling and retrieval. TPAMI, 18:722–733.
[21] D. Lowe. Distinctive image features from scale-invariant keypoints. International
Journal of Computer Vision, 60(2):91–110, 2004.
13
[22] S.Marschner, S. H.Westin, A. Arbree, and J. T. Moon. Measuring and modeling the
appearance of finished wood. In ACM SIGGRAPH, pages 727–734, 2005.
[23] T. Ojala, M. Pietikainen, and T. Maenpaa. Multiresolution gray-scale and rotation
invariant texture classification with local binary patterns. IEEE Transactions on pattern
analysis and machine intelligence, 24(7):971–987, 2002.
[24] F. Nicodemus. Directional reflectance and emissivity of an opaque surface. Applied
Optics, 4(7):767–775, 1965.
[25] E. Tola, V. Lepetit, and P. Fua. A fast local descriptor for dense matching. In Proc.
CVPR, 2008.
[26] S. C. Pont and J. J. Koenderink. Bidirectional texture contrast function. IJCV, 62(1).
[27] S. Winder and M. Brown. Learning local image descriptors. In Proc. CVPR, 2007.
[28] L. Sharan, R. Rosenholtz, and E. Adelson. Material perception: What can you see in
a brief glance? [Abstract]. Journal of Vision, 9(8):784, 2009.
[29] S. Winder, G. Hua, and M. Brown. Picking the best DAISY. In Proc. CVPR, 2009.
[30] M. Varma and A. Zisserman. A statistical approach to material classification using
image patch exemplars. TPAMI, 31(11):2032–2047, 2009.
[31] L. Wiskott, J. Fellous, N. Krüger, and C. Von der Malsburg. Face recognition by
elastic bunch graph matching. IEEE Transactions on pattern analysis and machine
intelligence, 19(7):775–779, 1997.
[32] J. Cui, F. Wen, R. Xiao, Y. Tian, and X. Tang. EasyAlbum: an interactive photo
annotation system based on face clustering and re-ranking. In Proc. of the SIGCHI
conference on human factors in computing systems, page 376, 2007.
[33] L.Wolf, T. Hassner, and Y. Taigman. Similarity scores based on background
samples. In Proc. ACCV, 2009.
[34] R. Gross, I. Matthews, J. Cohn, T. Kanade, and S. Baker. Multi-PIE. In International
Conference on Automatic Face and Gesture Recognition, 2008.
[35] P. Phillips, H. Moon, S. Rizvi, and P. Rauss. The FERET evaluation mthodology for
face-recognition algorithms. IEEE Transactions on pattern analysis and machine
intelligence, 22(10):1090–1104, 2000.
[36] G. Huang, M. Ramesh, T. Berg, and E. Learned-Miller. Labeled faces in the wild: A
database for studying face recognition in unconstrained environments. University of
Massachusetts, Amherst, Technical Report 07-49, 2007.
[37] T. Ahonen, A. Hadid, and M. Pietikainen. Face Recognition with Local Binary
Patterns. Lecture Notes in Computer Science, pages 469–481, 2004.
[38] X. Tan and B. Triggs. Enhanced local texture feature sets for face recognition under
difficult lighting conditions. Lecture Notes in Computer Science, 4778:168, 2007.
[39] L. Zhang, R. Chu, S. Xiang, S. Liao, and S. Li. Face detection based on multi-block
lbp representation. Lecture Notes in Computer Science, 4642:11, 2007.
[40] N. Kumar, A. Berg, P. Belhumeur, and S. Nayar. Attribute and Simile classifiers for
face verification. In Proc. ICCV, 2009.
14

Tiểu Luận Nhận Dạng Đối Tượng Trên Khung Ảnh-Tạ Nhật Anh

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Tiểu Luận Nhận Dạng Đối Tượng Trên Khung Ảnh-Tạ Nhật Anh

Uploaded by

Copyright:

Available Formats

ĐẠI HỌC

NGUYỄN TẤT THÀNH

TIỂU LUẬN MÔN HỌC

Đề tài: Nhận dạng đối tượng trên khung ảnh

LỜI NÓI ĐẦU.........................................................................................................3

Hình 1a: Hình ảnh vật liệu cần nhận dạng

[1] M. Guillaumin, J. Verbeek, C. Schmid, I. LEAR, and L. Kuntzmann. Is that you?

You might also like