Professional Documents
Culture Documents
10 - Mang Neural Hoi Quy (P1)
10 - Mang Neural Hoi Quy (P1)
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
1
NỘI DUNG
1. Sequence models.
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
2
SEQUENCE MODEL
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
3
Sequence model
─ Sequence model là một tác vụ dự đoán một đối tượng nào đó sẽ
xuất hiện tiếp theo trong một chuỗi các đối tượng.
+ VD:
• “con” từ xuất hiện tiếp theo có thể là: “bò”, “chó”, ...
• “đi” từ xuất hiện tiếp theo có thể là: “đến trường”, ”học”,
“mần”.
─ Trong sequence model, input của lớp hiện tại sẽ phụ thuộc vào
output của lớp trước đó. Độ dài của dữ liệu input vào sẽ không cố
định.
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
4
Minh hoạ
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
5
Các dữ liệu dạng sequence - Text
DNA sequence analysis AGCCCCTGTGAGGAACTAG AGCCCCTGTGAGGAACTAG
Machine translation Voulez-vous chanter avec Do you want to sing with me?
moi?
Name entity recognition Yesterday, Harry Potter met Yesterday, Harry Potter met
Hermione Granger. Hermione Granger.
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
6
Các dữ liệu dạng sequence – multi
media
“The quick brown fox jumped
Speech recognition over the lazy dog.”
Music generation ∅
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
7
SEQUENCE MODEL – BÀI TOÁN
NAME ENTITIES RECOGNITION
X Harry Potter and Hermione Granger invented a new spell.
X<1> X<2> X<3> ...... X<9>
y 1 1 0 1 1 0 0 0 0
y<1> y<2> y<3> ...... y<9>
Tx = 9: Độ dài X sẽ là 9
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
8
Một số ký hiệu mới trong Sequence
model
Ký hiệu Ý nghĩa
X<i>
X<i> Phần
Phần tử tử vị
vị trí
trí thứ
thứ ii trong
trong sequence
sequence
Phần
Phần tử
tử thứ
thứ tt trong
trong sequence
sequence thứ thứ ii (sequence
(sequence thứ
thứ ii ở
ở đây
đây
là
là điểm
điểm dữdữ liệu
liệu thứ
thứ ii trong
trong tập
tập huấn
huấn luyện)
luyện)
TX Độ dài của input sequence X
TX Độ dài của input sequence X
Độ dài của input sequence X ở điểm dữ liệu thứ i trong
Độ dài của input sequence
tập huấn Xở điểm dữ liệu thứ i trong
luyện
tập huấn luyện
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
9
Biểu diễn từ trong Sequence model
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
10
Biểu diễn từ trong Sequence model
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
11
Biểu diễn từ trong Sequence model
[] [] [] []
0 1 0 0
0 0 1 0
0 0 0 0
dim = 9 0 0 0 ... 0
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 1
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
12
Recurrent Neural Network
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
13
Mạng neural truyền thống
X y
¿ 1>¿¿
𝑥 𝑦
¿1>¿ ¿
¿ 2>¿¿
𝑥 𝑦
¿2>¿ ¿
⋮
⋮
⋮
⋮
¿ 𝑇 𝑥 >¿¿ ¿𝑇 𝑦 >¿¿
𝑥 𝑦
X Harry Potter and Hermione Granger invented a new spell.
y 1 1 0 1 1 0 0 0 0
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
14
Vấn đề xảy ra khi dùng mạng neural
truyền thống cho sequence data
─ Input và output có thể khác nhau về độ dài ở các điểm dữ liệu
khác nhau trong tập dữ liệu.
+ Khác so với CNN: các ảnh trong tập dữ liệu có cùng kích thước
(VD: 64x64x3).
─ Không thể share feature với các vị trí khác trong sequence model.
VD:
Harry Potter and Hermione Granger invented a new spell.
Hai vị trí trên trong các câu khác có khả năng là các tên riêng
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
15
Recurrent Neural network
Truyền qua từng layer ─ Lớp thứ 1:
+ Input: sequence x<1> + đầu vào
lớp 0 – a<0>: vector of zero.
^ 𝑦 ¿1>¿ ¿ ^ 𝑦 ¿2>¿ ¿ ^ 𝑦 ¿3> ¿¿ ^ 𝑦 ¿𝑇 𝑦 >¿¿
+ Output: giá trị dự đoán y<1>.
¿ 𝑇 𝑥 − 1>¿¿
𝑎 ¿ 1>¿¿ 𝑎 ¿ 2>¿¿ ⋯
𝑎
𝑎 ¿ 0>¿ ¿
¿ 𝑇 𝑥 >¿¿
𝑥 ¿ 1>¿¿ 𝑥 ¿ 2>¿¿ 𝑥 ¿ 3>¿ ¿ 𝑥
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
16
Recurrent Neural network
Truyền qua từng layer ─ Lớp thứ 1:
+ Input: sequence x<1> + đầu vào
lớp 0 – a<0>: vector of zero.
^ 𝑦 ¿1>¿ ¿ ^ 𝑦 ¿2>¿ ¿ ^ 𝑦 ¿3> ¿¿ ^ 𝑦 ¿𝑇 𝑦 >¿¿
+ Output: giá trị dự đoán y<1>.
𝑎 ¿ 1>¿¿ 𝑎 ¿ 2>¿¿ 𝑎
¿ 𝑇 𝑥 − 1>¿¿ ─ Lớp thứ 2:
𝑎 ¿ 0>¿ ¿ ⋯
+ Input: sequence x<2> + giá trị
deactivation của lớp 1 – a<1>.
¿ 𝑇 𝑥 >¿¿ + Output: giá trị dự đoán y<2>.
𝑥 ¿ 1>¿¿ 𝑥 ¿ 2>¿¿ 𝑥 ¿ 3>¿ ¿ 𝑥
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
17
Recurrent Neural network
Truyền qua từng layer ─ Lớp thứ 1:
+ Input: sequence x<1> + đầu vào
lớp 0 – a<0>: vector of zero.
^ 𝑦 ¿1>¿ ¿ ^ 𝑦 ¿2>¿ ¿ ^ 𝑦 ¿3> ¿¿ ^ 𝑦 ¿𝑇 𝑦 >¿¿
+ Output: giá trị dự đoán y<1>.
𝑎 ¿ 1>¿¿ 𝑎 ¿ 2>¿¿ 𝑎
¿ 𝑇 𝑥 − 1>¿¿ ─ Lớp thứ 2:
𝑎 ¿ 0>¿ ¿ ⋯
+ Input: sequence x<2> + giá trị
deactivation của lớp 1 – a<1>.
¿ 𝑇 𝑥 >¿¿ + Output: giá trị dự đoán y<2>.
𝑥 ¿ 1>¿¿ 𝑥 ¿ 2>¿¿ 𝑥 ¿ 3>¿ ¿ 𝑥
─ Lớp thứ 3:
+ Input: sequence x<3> + giá trị
deactivation của lớp 2 – a<2>.
+ Output: giá trị dự đoán y<3>.
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
18
Tham số trong mô hình RNN
^𝑦 ¿1>¿ ¿ ^𝑦 ¿2>¿ ¿ ^𝑦 ¿3> ¿¿ ^𝑦 ¿𝑇 𝑦 >¿¿
Way Way Way
¿ 𝑇 𝑥 − 1>¿¿
𝑎 ¿ 1>¿¿ 𝑎 ¿ 2>¿¿ 𝑎
𝑎 ¿ 0>¿ ¿
Waa Waa Waa
⋯
Mạng RNN quét dữ liệu sequence từ trái sang phải. Có 3 loại tham số chính:
• Govening parameter: Wax.
• Deactivation parameter (horizontal connection): Waa.
• Output prediction: Way.
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
19
Truyền tham số trong mô hình RNN
^𝑦 ¿1>¿ ¿ ^𝑦 ¿2>¿ ¿ ^𝑦 ¿3> ¿¿ ^𝑦 ¿𝑇 𝑦 >¿¿
Way Way Way
¿ 𝑇 𝑥 − 1>¿¿
𝑎 ¿ 1>¿¿ 𝑎 ¿ 2>¿¿ 𝑎
𝑎 ¿ 0>¿ ¿
Waa Waa Waa
⋯
Khi dự đoán giá trị y<3>, mô hình RNN nhận các input gồm: X<3>, X<1>, X<2>.
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
20
Ví dụ: bài toán nhận dạng tên người
─ Câu 1:
He said, “Teddy Roosevelt was a great President.”
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
21
Forward Propagation
─
─ Lớp
0:
a<0> =
^ 𝑦 ¿1>¿ ¿ ^ 𝑦 ¿2>¿ ¿ ^ 𝑦 ¿3> ¿¿ ^ 𝑦 ¿𝑇 𝑦 >¿¿
─ Lớp 1:
¿ 𝑇 𝑥 − 1>¿¿ a<1> = g1(Waa*a<0> + Wax*X<1> + ba)
𝑎 ¿ 1>¿¿ 𝑎 ¿ 2>¿¿ ⋯ 𝑎
𝑎 ¿ 0>¿ ¿
y<1> = g2(Wya*a<1> + by)
─ Lớp 2:
𝑥 ¿ 1>¿¿ 𝑥 ¿ 2>¿¿ 𝑥 ¿ 3>¿ ¿ 𝑥
¿ 𝑇 𝑥 >¿¿ a<2> = g1(Waa*a<1> + Wax*X<2> + ba)
y<2> = g2(Wya*a<2> + by)
Tổng quát:
a<t> = g(Waa*a<t> + Wax*x<t> + ba)
y<t> = g(Wya*a<t> + by)
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
22
Forward Propagation
a<t> = g(Waa*a<t> + Wax*x<t> + ba) y<t> = g(Wy*a<t> + by)
(100, 100) (100, 10000)
[Waa; Wax] = Wa
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
23
Backward propagation cho RNN
<1> <2> <3> <Tx> L
Hàm chi phí: L(<t>, <t>) = -<t> * log(<t>) + (1 - <t>) * log(1 - <t>)
=
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
24
Backward propagation cho RNN
<1> <2> <3> <Tx> L
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
25
Backward propagation through time
<1> <2> <3> L
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
26
Backward propagation through time
<1> <2> <3> <Tx> L
Tổng quát
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
27
Các loại RNN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
28
Many-to-many
─ Đầu vào: 1 sequence (input
sequence.
^𝑦 ^𝑦
¿1>¿ ¿ ¿2>¿ ¿ ¿𝑇 𝑦 >¿¿
^𝑦
─ Đầu ra: 1 sequence với độ dài
𝑎 ¿ 0>¿ ¿ ⋯ bằng độ dài đầu vào.
𝑥 ¿ 1>¿¿ ¿ 2>¿¿ 𝑥¿ 𝑇 𝑥 >¿¿
𝑥
Many to many
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
29
Many-to-one
─ Đầu vào: 1 sequence.
^𝑦 ─ Đầu ra: một giá trị dự đoán
𝑎 ¿ 0>¿ ¿
⋯
¿ 1>¿¿
Ứng dụng: bài toán classification:
𝑥
𝑥 ¿ 2>¿¿ 𝑥¿ 𝑇 𝑥 >¿¿ + Đầu vào (X): 1 chuỗi text.
Many to one + Đầu ra (y): nhãn (giá trị) dự đoán.
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
30
One-to-many
─ Đầu vào: 1 giá trị (có thể là 1
^𝑦 ¿1>¿ ¿ ^𝑦 ¿2>¿ ¿ ^𝑦 ¿𝑇 𝑦 >¿¿ null input).
𝑎 ¿ 0>¿ ¿
─ Đầu ra: 1 sequence.
⋯
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
31
Many-to-many
encoder decoder
─ Đầu vào: 1 sequence.
^𝑦 ¿
¿ ¿
𝑦 ¿
^ ─ Đầu ra: 1 sequence khác với
đầu vào.
𝑎 ¿ 0>¿ ¿ ⋯
⋯
⋯
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
32
Language models
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
33
Định nghĩa Language model
─ Language model (tạm dịch: mô hình ngôn ngữ) là một phân phối
xác suất (probability distribution) giữa các chuỗi ký tự (bao gồm
từ - words) trong một đoạn văn bản.
─ Định nghĩa của D. Jurafsky: Models that assign probabilities to
sequences of words are called language models or LMs.
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
34
Ví dụ:
─ Sentence 1: The apple and pair salad.
─ Sentence 2: The apple and pear salad.
P(next_sentence) = ? – xác suất xuất hiện câu tiếp theo là bao nhiêu ?
Language model
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
35
Token in language model Vocabulary:
Sentences Cats
average
15
Cats average 15 hours of sleep a day. <EOS>
hours
y<1> y<2> y<3> y<4> y<5> y<6> y<7> y<8> y<9> <EOS>: là
token định of
token nghĩa kết thúc sleep
một câu a
<UNK> (End of
The Egyptian Mau is a bread of cat. <EOS> sentence) day
The
y<1> y<2> y<3> y<4> y<5> y<6> y<7> y<8> y<9>
Egyptian
token is
bread
<UNK>: token đặc biệt, được dùng khi token đó không có trong bộ từ vựng (Vocabulary)
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
36
Huấn luyện RNN model cho language
model
─ Mục tiêu huấn luyện: dự đoán xác suất xuất hiện từ tiếp theo
trong một câu dựa vào từ trước đó.
VD: (y<1>, y<2>, y<3>) là một câu dự đoán (gồm 3 token).
Tính xác suất: cho từng token trên theo language model.
P(y<1>): xác suất xuất hiện token y<1>.
P(y<2>| y<1>): xác suất xuất hiện token y<2> khi biết y<1>.
P(y<3>| y<2>, y<1>): xác suất xuất hiện y<3> khi biết y<1>và y<2>.
Đánh giá độ chính xác: dựa vào hàm Cost function của mạng RNN.
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
37
Ví dụ
<1> = P(cats) ... P(dog) <2> = P( _ | cats ) <3> = P( _ | cats average) <8> = P(day | ... )
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
38
Tổng kết
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
39
TÀI LIỆU THAM KHẢO
1. Khoá học Neural Network and Deep learning, deeplearning.ai.
2. Ian Goodfellow, Yoshua Bengio, Aaron Courvile, Deep learning,
MIT Press, 2016.
3. Andrew Ng., Machine Learning Yearning. Link:
https://www.deeplearning.ai/machine-learning-yearning/
4. Vũ Hữu Tiệp, Machine Learning cơ bản, NXB Khoa học và Kỹ
thuật, 2018.
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH
[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn
40