Professional Documents
Culture Documents
Mẫu tóm tắt - Khóa luận tốt nghiệp 1
Mẫu tóm tắt - Khóa luận tốt nghiệp 1
13
Trong mười năm gần đây, cùng với sự phát triển mạnh mẽ của các công nghệ tìm
kiếm thông tin trên Internet, hệ thống hỏi đáp tự động đã thu hút sự quan tâm đặc biệt
của các nhà khoa học, các công ty lớn (Yahoo, Google, Microsoft, IBM…), các hội nghị
lớn về trích chọn thông tin, xử lý ngôn ngữ tự nhiên (TREC, CLEF, ACL...). Những
nghiên cứu về hệ thống hỏi đáp trên thế giới cũng đã đạt được những kết quả nhất định.
Tuy nhiên, các nghiên cứu về hệ thống hỏi đáp cho tiếng Việt vẫn còn rất nhiều vấn đề
cần giải quyết. Khóa luận phân tích câu hỏi trong hệ thống hỏi đáp tiếng Việt tập trung
vào khảo sát các phương pháp được áp dụng cho xây dựng hệ thống hỏi đáp trên thế
giới, đặc biệt tập trung nghiên cứu pha phân tích câu hỏi - pha đầu tiên trong hệ thống
hỏi đáp, có ý nghĩa đặc biệt quan trọng đối với hoạt động của toàn hệ thống. Trên cơ sở
các nghiên cứu với điều kiện thực tế của các công cụ xử lý ngôn ngữ tiếng Việt, khóa
luận tiến hành thực nghiệm mô hình phân tích câu hỏi cho tiếng Việt sử dụng phương
pháp học máy thống kê bằng việc kết hợp thuật toán máy hỗ trợ vector SVM và mô hình
trường ngẫu nhiên có điều kiện CRF. Các kết quả ban đầu đạt được khá khả quan. Pha
trích xuất thành phần câu hỏi sử dụng mô hình CRF đạt kết quả 2.3% (độ đo F1). Bộ
phân lớp câu hỏi cho hệ thống hỏi đáp thực thể tên người trong tiếng Việt đạt kết quả
84,41% (độ đo F1) khi sử dụng thuật toán SVM với đặc trưng phân lớp là bi-gram kết
hợp thành phần câu hỏi và từ điển liên quan.
Từ khoá: Hệ hỏi đáp tiếng Việt; CRF
14
Phụ lục 05: Mẫu tổng hợp tóm tắt khóa luận tốt nghiệp năm học 20….-20…. (dành cho khoa)
Ví dụ:
STT Sinh Khoa Khóa Năm Tên đề tài Từ khóa Tóm tắt khóa luận tốt nghiệp (khoảng 300 từ)
viên
Lê
1 Toán- QH. 2014 Phân tích Hệ hỏi Trong mười năm gần đây, cùng với sự
Thị
Cơ 2010. câu hỏi đáp phát triển mạnh mẽ của các công nghệ tìm
Lan
-Tin T trong hệ tiếng kiếm thông tin trên internet, hệ thống hỏi
học thống hỏi Việt; đáp tự động đã thu hút sự quan tâm đặc biệt
đáp tiếng CRF của các nhà khoa học, các công ty lớn
Việt (Yahoo, Google, Microsoft, IBM…), các
hội nghị lớn về trích chọn thông tin, xử lý
ngôn ngữ tự nhiên (TREC, CLEF, ACL,...).
Những nghiên cứu về hệ thống hỏi đáp
trên thế giới đã đạt được những kết quả nhất
định. Tuy nhiên, các nghiên cứu về hệ thống
hỏi đáp cho tiếng Việt vẫn còn rất nhiều vấn
đề cần giải quyết. Khóa luận Phân tích câu
hỏi trong hệ thống hỏi đáp tiếng Việt tập
trung vào khảo sát các phương pháp được
áp dụng cho xây dựng hệ thống hỏi đáp trên
thế giới, đặc biệt tập trung nghiên cứu pha
phân tích câu hỏi - pha đầu tiên trong hệ
thống hỏi đáp, có ý nghĩa đặc biệt quan
trọng đối với hoạt động của toàn hệ thống.
Trên cơ sở các nghiên cứu với điều kiện
thực tế của các công cụ xử lý ngôn ngữ
tiếng Việt, khóa luận tiến hành thực nghiệm
mô hình phân tích câu hỏi cho tiếng Việt sử
dụng phương pháp học máy thống kê bằng
việc kết hợp thuật toán máy hỗ trợ vector
SVM và mô hình trường ngẫu nhiên có điều
kiện CRF. Các kết quả ban đầu đạt được
khá khả quan. Pha trích xuất thành phần câu
hỏi sử dụng mô hình CRF đạt kết quả 2.3%
(độ đo F1). Bộ phân lớp câu hỏi cho hệ
thống hỏi đáp thực thể tên người trong tiếng
Việt đạt kết quả 84,41% (độ đo F1) khi sử
dụng thuật toán SVM với đặc trưng phân
lớp là bi-gram kết hợp thành phần câu hỏi
và từ điển liên quan.
Lưu ý:
- Trong file tổng hợp tóm tắt khóa luận tốt nghiệp (phụ lục 05) từng tên sinh viên được đặt
Hyperlink đến file toàn văn khóa luận của sinh viên đó.
- Tất cả các file: file toàn văn khóa luận, file tóm tắt khóa luận của sinh viên (phụ lục 04),
file tổng hợp tóm tắt khóa luận tốt nghiệp (phụ lục 05) của mỗi khoa được lưu trong cùng
một thư mục và gửi về cho Phòng Đào tạo theo địa chỉ email: daotao@hus.edu.vn hoặc
daotaodaihoc@hus.edu.vn
15