You are on page 1of 2

Các đề tài nghiên cứu (đề nghị).

I. NLP (tiếng Việt):


1. Hệ thống đọc hiểu để trả lời câu hỏi trong một lĩnh vực:
Tìm kiếm câu trả lời cho một câu hỏi trong kho tài liệu phi cấu trúc. Chẳng hạn, trong kho dữ
liệu văn bản các điều trong luật, nghị định, thông tư, quyết định,… người dùng hỏi “thuế thu
nhập cá nhân là gì?”, hệ thống đưa ra được văn bản liên quan.
Bước đầu chỉ yêu cầu đưa ra các điều liên quan câu hỏi, tiếp theo sau sẽ sinh ra câu trả lời.
Hệ thống áp dụng được cho bất cứ dữ liệu thuộc lĩnh vực nào: y tế, giáo dục,….

Ví dụ trong tiếng Anh là “Reading Wikipedia to Answer Open-Domain Questions”:


https://github.com/facebookresearch/DrQA.

Lạc Việt có dữ liệu:


- Văn bản luật lĩnh vực thuế (từng điều)
- Cặp câu hỏi đáp lĩnh vực thuế.

Yêu cầu đầu ra:

- Code viết bằng Python


- WebAPI với các method để gọi được từ các app (web app, mobile app).

2. Hệ thống sinh câu hỏi và câu trả lời tự động từ kho dữ liệu văn bản.
Từ kho dữ liệu văn bản, chẳng hạn văn bản về lịch sử, hệ thống sẽ tự động sinh ra câu hỏi và
câu trả lời.
Tham khảo: https://github.com/obss/turkish-question-generation

Lạc Việt có dữ liệu:


- Văn bản cho kiến thức về y khoa

Yêu cầu đầu ra:

- Code viết bằng Python


- WebAPI với các method để gọi được từ các app (web app, mobile app).

II. Computer Vision.


1. Nhận dạng biểu thức Toán (in và viết tay):
Nhận dạng các biểu thức Toán (chữ in và viết tay), chuyển ra dạng LaTex.
Tham khảo:
https://github.com/Green-Wood/BTTR
https://arxiv.org/pdf/1801.03530.pdf?
fbclid=IwAR03pT8no3W13_wpVlq18xVC1B2eIEp5LXbZOhtbyCr1kFgFwHTRYB_PcOA

Lạc Việt chưa có dữ liệu (có thể tìm được các data set trên mạng)

Yêu cầu đầu ra:

- Code viết bằng Python


- WebAPI với các method để gọi được từ các app (web app, mobile app).

2. Nhận dạng chữ viết tay tiếng Việt:


- Bước 1: các cụm chữ viết tay số hiệu văn bản (bao gồm chữ cái và số)
- Bước 2: các đoạn viết tay tiếng Việt (bút phê, ghi chú,…).

Lạc Việt chưa có dữ liệu, tham khảo trên mạng.

Yêu cầu đầu ra:

- Code viết bằng Python


- WebAPI với các method để gọi được từ các app (web app, mobile app).

You might also like