Professional Documents
Culture Documents
Nội dung
142
• Có hai người chơi, khi đến lượt, người chơi có thể lấy một số lượng
tùy ý đồng xu từ một đống duy nhất.
• Họ phải lấy ít nhất 1 đồng xu và họ không được lấy các đồng xu từ
đống khác.
• Người thắng là người lấy đồng xu cuối cùng, nghĩa là không còn đồng
xu nào sau nước đi của người đó
143
1
9/27/21
144
145
2
9/27/21
146
147
3
9/27/21
148
149
4
9/27/21
150
1
1 1
0
1
0 1 Chọn các
nước đi –
trạng thái
0
1
0 có mũi tên
liên tục
0 1
151
5
9/27/21
152
min
10 10 9 100
153
6
9/27/21
154
Nút lá
155
7
9/27/21
156
157
8
9/27/21
Hàm Heuristic:
E(n) = M(n) – O(n)
Trong đó: M(n) là tổng số
đường thắng có thể của tôi
O(n) là tổng số đường
thắng có thể của đối thủ
E(n) là trị số đánh giá
tổng cộng cho trạng thái n
Trích từ Nilsson (1971).
158
159
9
9/27/21
160
3 5 7 8
5 7 8 3 7 8 3 5 8 3 5 7
7 8 5 8 5 7 7 8 3 8 3 7 5 8 3 8 3 5 5 7 3 7 3 5
8 7 8 5 7 5 8 7 8 3 7 3 8 5 8 3 5 3 7 5 7 3 5 3
161
10
9/27/21
Nút gốc
3 5 7 8
5 7 8 3 7 8 3 5 8 3 5 7
7 8 5 8 5 7 7 8 3 8 3 7 5 8 3 8 3 5 5 7 3 7 3 5
8 7 8 5 7 5 8 7 8 3 7 3 8 5 8 3 5 3 7 5 7 3 5 3
162
Player 2 Min
10 8 10
Player 1 Max
10 -12 8 10
Player 2 Min
8 10
10 -12
Player 1 Max
Điểm cho
người chơi
Player 1
163
11
9/27/21
■ Tìm kiếm alpha – beta thực hiện theo kiểu tìm kiếm sâu.
■ Hai giá trị a, b được tạo ra trong quá trình tìm kiếm.
– a gắn với các nút MAX, không giảm.
– b gắn với các nút MIN, không tăng.
■ Luật cắt tỉa alpha – beta: Quá trình tìm kiếm có thể kết
thúc bên dưới:
– Nút MIN có b <= a của nút cha MAX bất kỳ (a-cut)
– Nút MAX có a >= b của nút cha MIN bất kỳ (b-cut)
164
a-cut
big
subtre
e
165
12
9/27/21
b-cut
big
subtree
166
k <= a b b <= k
a MAX B C
MIN B C b-cut
a-cut
k
D
D k
13
9/27/21
168
168
alpha cutoff
169
169
14
9/27/21
170
170
171
171
15
9/27/21
172
172
173
16
9/27/21
174
Alpha-Beta Pruning
max
min
max
eval 5 2 10 11 1 2 2 8 6 5 12 4 3 25 2
175
17