Professional Documents
Culture Documents
NGÔN NGỮ CỠ NHỎ TRÊN MIỀN TRI THỨC KHOA HỌC DỮ LIỆU
Input
Craw
Kết luận
Các kiến trúc mô hình
Kết quả cho thấy tín hiệu khả thi của
các mô hình cỡ nhỏ trên bộ dữ liệu
nhất định. Bước đầu giải quyết vấn Encoder-Decoder
đề thiếu tài nguyên phần cứng của
các nhóm nghiên cứu cá nhân.
Tuy kết quả chưa thực sự tốt,
nhưng đây là tiền đề để nhóm tiếp
tục cải thiện, phát triển mô hình
trong tương lai gần.
Bảng so sánh
Model Bloomz ViT5 GPT2 XGLM
Training Time
Epochs 15 15 10 15
R1
R2
R3
So sánh loss các mô hình trên tập test trước khi pretrain và khi pretrain
So sánh chỉ số Rouge cuả các mô hình so với mô hình GPT-3.5