HỌC MÁY – HỌC SÂU Đề 1. Xây dựng chương trình dự đoán lượng mua sản phẩm - Cơ sở dữ liệu sản phẩm: https://github.com/tiepvupsu/tabml_data/tree/master/instacart - Tham khảo ứng dụng: Instacart Product2vec https://machinelearningcoban.com/tabml_book/ch_embedding/product2ve c.html
Đề 2. Phân loại email rác (supervised learning)
Đề 3. Phân loại chuyên mục các bài báo (supervised learning) Đề 4. Phân nhóm các email có nội dung gần nhau (unsupervised learning) Đề 5. Dự đoán các tin tức có liên quan đến nhau ((unsupervised learning - association) Đề 6. Xây dựng chương trình so sánh văn bản tiếng Việt Đề 7. Xây dựng chương trình tách từ tiếng Việt (segmenter) Đề 8. Xây dựng hệ thống tìm kiếm trang web (như google) Đề 9. Xây dựng hệ thống tóm tắt văn bản Đề 10. Xây dựng hệ thống dịch tự động ngôn ngữ Đề 11. Xây dựng hệ thống phân tích cảm xúc người dùng mạng xã hội (sentiment analysis) Đề 12. Xây dựng hệ thống chatbot Đề 13. Xây dựng hệ thống check từ vựng tiếng Việt trong văn bản Đề 14. Xây hệ thống đoán từ tiếp theo (như gõ message ở smart phone) Đề 15. Xây dựng hệ thống gán nhãn từ loại tiếng Việt (POS) Đề 16. Xây dựng hệ thống đánh giá chất lượng dịch tự động (đánh giá chủ quan và khách quan) Đề 17. Xây dựng hệ thống nhận dạng tiếng nói tiếng Việt Đề 18. Xây dựng hệ thống nhận dạng người nói Đề 19. Xây dựng hệ thống trợ lý ảo II. XỬ LÝ ẢNH, VIDEO – HỌC MÁY Đề 1. Xây dựng hệ thống gợi ý phim - Cơ sở dữ liệu phim: https://grouplens.org/datasets/movielens/1m/ - Tham khảo ứng dụng: https://machinelearningcoban.com/tabml_book/ch_recommendation_system/ introduction.html
Đề 2. Phân lớp ảnh động vật (supervised learning)
Đề 3. Phân lớp giới tính người (supervised learning) Đề 4. Phân nhóm các động vật dựa trên đặc điểm (như số chân) (unsupervised learning) .......