You are on page 1of 14

Báo cáo đồ án thiết kế

ĐỀ TÀI: DỰ ĐOÁN TUỔI VÀ PHÂN LOẠI GIỚI TÍNH DỰA TRÊN PHƯƠNG PHÁP
HỌC SÂU
Mục lục
I. Giới thiệu
II. Bộ dữ liệu và tiền xử lý
III. Xây dựng và huấn luyện mô hình
IV. Đánh giá kết quả
I. Giới thiệu
- Cuộc sống con người phát sinh nhiều vấn đề cần giải quyết một cách thông
minh.
- Các vấn đề liên quan tới “thị giác" luôn hiện hữu cần các giải pháp.
- AI là một công cụ giúp con người thực hiện công việc nhanh hơn, thông minh
hơn.
=> Bài toán: Dự đoán tuổi và giới tính dựa trên phương pháp học sâu.
I. Bộ dữ liệu và tiền xử lý dữ liệu
1. Bộ dữ liệu
- Bô dữ liệu về khuôn mặt có quy mô lớn (trải từ 0 đến 116 tuổi). Bộ dữ liệu bao gồm hơn 20000
ảnh với chủ thích về tuổi, giới tính và dân tộc.
- Hình ảnh đa dạng về tư thế, nét mặt, ánh sáng, khớp cắn, độ phân giải,…

Hình 1. Một vài ví dụ trong tập dữ liệu UTKFace.


I. Bộ dữ liệu và tiền xử lý dữ liệu
1. Bộ dữ liệu
Chú thích về dữ liệu. Nhãn của mỗi ảnh được định dạng như sau:
[age]_[gender]_[race]_[data&time].jpg
• [age] là một số tự nhiên từ 0 đến 106, biểu thị độ tuổi.
• [gender] là 0(nếu là nam) hoặc 1(nếu là nữ).
• [race] là số tự nhiên từ 0 đến 4, chú thích cho White, Black, Asian, Indian,…
• [date&time] biểu diễn định dạng yyyymmddHHMMSSFF, chỉ ra ngày và giờ cá hình ảnh được sưu tầm trong bộ
UTKFace.
I. Bộ dữ liệu và tiền xử lý dữ liệu
2. Tiền xử lý dữ liệu
- Tiến hành loại bỏ đi những bức ảnh có chất lượng kém qua việc kiểm tra thủ công một lượt.
- Đưa tất cả hình ảnh về kích thước 198x198x3.
- Chuyển đổi giá trị pixel của tất cả ảnh đầu trong dải [0,1].
- Phân tích cú pháp của nhãn và tách thành 2 nhãn riêng biệt gồm Age và Gender.
=> Dữ liệu bao gồm 24104 ảnh chia làm 3 tập training, validation và test, cụ thể:
• Tập train gồm 13810 ảnh.
• Tập validation gồm 7602 ảnh.
• Tập test gồm 3232 ảnh.
I. Bộ dữ liệu và tiền xử lý dữ liệu
2. Tiền xử lý dữ liệu
Thực hiện khảo sát dữ liệu trên một số trường như phân phối thuộc tính age, gender:

Hình 2. Phân phối dữ liệu về tuổi được biểu diễn theo dạng cột.
II. Xây dựng và huấn luyện mô hình
1. Xây dựng mô hình
Xây dựng mô hình one-input multi-output có cấu trúc như sau:
• Nhánh 1: Nhánh trích xuất đặc trưng tuổi.
• Nhánh 2: Nhánh trích xuất đặc trưng giới tính.

Hình 4. Kiến trúc mô hình xây dựng.


II. Xây dựng và huấn luyện mô hình
2. Xây dựng hàm mất mát
Mô hình xây dựng theo cấu trúc 2 nhánh-2 đầu ra nên tương ứng tồn tại 2 hàm mất mát mỗi
nhánh. Hàm mất mát tổng quát được xây dựng như sau:

Hình 3. Công thức hàm mất mát tổng quát.


II. Xây dựng và huấn luyện mô hình
3. Phương pháp tối ưu hóa mô hình
- Tối ưu tham số học Adam với hệ số học ban đầu là 0.001 và giảm khi số lượng epoch tăng theo
công thức:
lr_rate = lr_rate/epochs

Hình 5. Phương pháp tối ưu hóa Adam.


III. Đánh giá kết quả
Kết quả đánh giá trên bộ test của mô hình như sau:
Bảng 1. Đánh giá trên bộ test sau quá trình huấn luyện

Total loss Age loss Gender loss Age mean Gender


Absolute Error Accuracy
0.2935 0.0662 0.2857 0.1129 0.92
III. Đánh giá kết quả
Một số hình ảnh dự đoán sau quá trình huấn luyện mô hình:

Hình 5. Một vài kết quả dự đoán.


Reference
1. G. Levi and T. Hassncer, "Age and gender classification using convolutional neural networks,"
2015 IEEE Conference on Computer Vision and Pattern Recognition Workshops (CVPRW),
2015, pp. 34-42, doi: 10.1109/CVPRW.2015.7301352.

2. I. Rafique, A. Hamid, S. Naseer, M. Asad, M. Awais and T. Yasir, "Age and Gender Prediction
using Deep Convolutional Neural Networks," 2019 International Conference on Innovative
Computing (ICIC), 2019, pp. 1-6, doi: 10.1109/ICIC48496.2019.8966704.

You might also like