You are on page 1of 4

PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC

Đồ án cuối kỳ
Lý Phi Long - 20C29028
March 2021

1 Tóm tắt
• Ngày nay dữ liệu về LifeLog ngày càng nhiều do chúng đều được ghi lại
hằng ngày thông qua các thiết bị di động.
• Trong lĩnh vực y khoa, hình ảnh LifeLog có thể cho chúng ta những thông
tin quá khứ quan trọng của người đó như chế độ ngủ, chế độ dinh dưỡng,
nhịp tim,...

• Hình ảnh về đồ ăn có thể cho chúng ta biết về chế độ ăn uống để giúp


tầm soát các bệnh về sức khỏe cũng như chế đọ tập thể dục
• Tuy nhiên, tạ thời điểm bài báo được công bố chưa có hệ thống nào để
nhận diện hìn ảnh đồ ăn. Nên đó là động lực cho nhóm tác giả công bố
mô hình.

2 Phương pháp

1
• Hệ thống mà bài báo đề xuất như hình .
– Bước 1: The eating moment được xác định bằng phương pháp của
Zhou và cộng sự.
– Bước 2: Hệ thống sẽ làm tăng cường ảnh bằng contrast limited adap-
tive histogram equalization của Pizer và cộng sự
– Bước 3: Mô hình nhận diện đồ ăn (Đây là mô hình chính của bài
báo)
• Bài báo tiếp cận mô hình nhận diện đồ ăn bằng cả hai phương pháp: Bằng
tay, phương pháp học sâu.

• Đối với phương pháp feature tay, bài báo sử dụng các feature SURF, SIFT,
HOG để trích xuất thông tin. Sau đó dùng các phương pháp máy học, cụ
thể là SVM và XGBoost để phân loại thức ăn.
• Đối với phương pháp học sâu, nhóm tác giả sử dụng phương pháp tranfer
learning với hai mô hình AlexNet và mô hình GoogleNet.

• Tuy nhiên, ứng với 2 mô hình nhóm tác giả tiếp tục huấn luyện với 2
phương pháp khác nhau là end-to-end, fine-tunning.

3 Dữ liệu
Dưới đây là một vài dữ liệu từ bộ dữ liệu:

2
• Xây dựng bộ dữ liệu gồm 14760 tấm ảnh với 8 loại đồ ăn khác nhau:
Vietnamese Roll Cake, Sizzling Cake, Broken Rice, Fried Chicken, Beef
Noodle, Bread, Salad và Pizza.
• Mỗi nhãn gồm 2000 đến 3000 tấm ảnh.
• Dữ liệu được chia thành 3 tập: train, val, test
• Mỗi loại đồ ăn sẽ được lấy ngẫu nhiên 80% trainning, 10% cho valid, 10%
cho test

4 Kết quả

Kết quả của feature HOG + SIFT là tốt nhất với cả 2 phương pháp máy
học là SVM và XGBoost

Khi thay thế AlexNet thành GoogleNet thì kết quả từ 9.67% lên 65.997%

3
5 Nhận xét
• Đây là hệ thống đầu tiên nhận diện đồ ăn từ hình ảnh thường nhật.

• Nhóm tác giả đã so sánh giữa việc feature bằng tay và bằng các mô hình
học sâu.
• Đóng góp bộ dataset hình ảnh đồ ăn từ cuộc sống thường nhật.
• Về ý tưởng mới ở bài báo này thì dương như không có. Bài báo ở mức ứng
dụng các công cụ cũ vào bài toán mới.

You might also like