Professional Documents
Culture Documents
Chuong 4 - Lý Thuyet Tro Choi
Chuong 4 - Lý Thuyet Tro Choi
• Trong phân tích quyết định, một người ra quyết định duy
nhất tìm cách chọn một phương án tối ưu.
• Giả định rằng mỗi người chơi có cùng thông tin và sẽ chọn
chiến lược cung cấp kết quả tốt nhất có thể theo quan điểm
của mình.
1. Lý thuyết trò chơi là gì ?
• Mỗi người chơi chọn một chiến lược một cách độc lập mà
không cần biết trước chiến lược của (các) người chơi khác.
• Sự kết hợp của các chiến lược cạnh tranh cung cấp giá trị của
trò chơi cho người chơi.
• Ví dụ. Bài toán “Tình thế lưỡng nan của người tù” (The
Prisoner’s Dilemma).
• Ví dụ. Bài toán “Tình thế lưỡng nan của người tù” (The
Prisoner’s Dilemma).
Người tù A 𝟐; 𝟐 𝟏𝟎; 𝟏
không nhận tội
Người tù A 𝟏; 𝟏𝟎 𝟓; 𝟓
nhận tội
• Tổng bằng không có nghĩa là mức tăng (hoặc thua) cho một
người chơi bằng với mức thua (hoặc lãi) tương ứng cho
người chơi khác.
Giả sử chỉ có hai đại lý buôn bán xe trong một thành phố nhỏ.
Mỗi đại lý đang xem xét ba chiến lược được thiết kế để bán xe
từ đại lý đối thủ trong thời gian bốn tháng. Các chiến lược,
được coi là giống nhau cho cả hai đại lý như sau:
Chiến lược 1: Cung cấp giảm giá tiền mặt trên một phương
tiện mới.
Chiến lược 2: Cung cấp tùy chọn miễn phí thiết bị trên một
xe mới.
Chiến lược 3: Cung cấp khoản vay 0% trên một phương tiện
mới.
2. Bài toán cạnh tranh để giành thị phần
Bảng payoff: thể hiện số lượng xe bán tăng lên của đại lý A
(đồng nghĩa số xe giảm xuống của đại lý B)
Đại lý B
• Bước 1: Xác định mức payoff tối thiểu cho mỗi hàng (cho
người chơi A).
• Bước 2: Đối với Người chơi A, chọn chiến lược cung cấp
mức tối đa của hàng tối thiểu (được gọi là maximin).
3. Chiến lược tối ưu thuần túy
Đại lý B
𝑎2 -3 3 -1 -3
Đại lý A
𝑎3 1 -2 0 -2
3. Chiến lược tối ưu thuần túy
• Bước 3: Xác định mức payoff tối đa cho mỗi cột (dành cho
người chơi B).
• Bước 4: Đối với Người chơi B, chọn chiến lược cung cấp
mức tối thiểu của cột tối đa (gọi là minimax).
3. Chiến lược tối ưu thuần túy
Đại lý B
𝑎2 -3 3 -1 -3
Đại lý A
𝑎3 1 -2 0 -2
Một chiến lược tối ưu thuần túy (optimal pure Strategy) tồn
tại khi:
• Maximin(A) = Minimax(B);
• Trò chơi được cho là có điểm yên ngựa (giao điểm của các
chiến lược tối ưu);
• Giá trị của điểm yên ngựa là giá trị của trò chơi;
• Không người chơi nào có thể cải thiện kết quả của mình bằng
cách thay đổi chiến lược ngay cả khi anh ta/cô ta biết trước
chiến lược của đối thủ.
3. Chiến lược tối ưu thuần túy
Đại lý B
𝑎2 -3 3 -1 -3
Đại lý A
𝑎3 1 -2 0 -2
Nhận xét:
• Giá trị của trò chơi (điểm yên ngựa) là 1;
• Người chơi A nên chọn Chiến lược 𝑎1 (cung cấp giảm giá
tiền mặt).
• Người chơi A có thể mong đợi mức tăng ít nhất 1 xe mỗi
tuần.
• Người chơi B nên chọn Chiến lược 𝑏3 (cung cấp khoản vay
0%).
• Người chơi B có thể mong đợi mức giảm không quá 1 xe mỗi
tuần.
4. Chiến lược hỗn hợp
• Nếu giá trị maximin cho Người chơi A không bằng giá trị
minimax cho Người chơi B, thì chiến lược thuần túy không
tối ưu cho trò chơi.
• Trong trường hợp này, một chiến lược hỗn hợp là tốt nhất.
Với một chiến lược hỗn hợp, mỗi người chơi sử dụng nhiều
hơn một chiến lược.
• Mỗi người chơi nên sử dụng một chiến lược trong 1 khoảng
thời gian và các chiến lược khác trong khoảng thời gian còn
lại.
• Giải pháp tối ưu đặc trưng bởi tần suất mà mỗi người chơi
nên sử dụng các chiến lược có thể của mình.
Mixed Strategy Example
Hãy xem xét trò chơi hai người có tổng bằng 0 như bên
dưới. Các maximin không bằng minimax. Do đó, không có
một chiến lược tối ưu thuần túy.
Player B
Row
b1 b2 Minimum
Player A
Maximin
a1 4 8 4
a2 11 5 5
Column
11 8
Maximum Minimax
4. Chiến lược hỗn hợp
• Để tìm xác suất tối ưu cho Người chơi A, chúng ta cho hai
giá trị trung bình bằng nhau và giải phương trình tìm 𝑝.
𝑝. 4 + 1 − 𝑝 . 11 = 𝑝. 8 + 1 − 𝑝 . 5
⇔ 11 − 7𝑝 = 5 + 3𝑝
⇔ 𝑝 = 0.6
Player B
Row
b1 b2 Minimum
Player A
Maximin
a1 4 8 4
a2 11 5 5
Column
11 8
Maximum Minimax
4. Chiến lược hỗn hợp
• Để tìm xác suất tối ưu cho Người chơi B, chúng ta cho hai
giá trị trung bình bằng nhau và giải phương trình tìm 𝑝.
𝑞. 4 + 1 − 𝑞 . 8 = 𝑞. 11 + 1 − 𝑞 . 5
⇔ 8 − 4𝑞 = 5 + 6𝑞
⇔ 𝑞 = 0.3
Expected gain
Giá trị của trò chơi: per game
for Player A
• Đối với người chơi A
𝐸𝑉 = 0.6 × 4 + 0.4 × 11 = 6.8
Nếu một trò chơi lớn hơn 2 x 2 có chiến lược hỗn hợp, trước
tiên chúng ta tìm kiếm các chiến lược thống trị để giảm kích
thước của trò chơi.
Player B
Player A b1 b2 b3
a1 6 5 -2
a2 1 0 3
a3 3 4 -3
Trong bảng trên, chiến lược 𝑎3 bị “thống trị” bởi chiến lược
𝑎1 . Vì vậy, đối với người chơi A, chiến lược 𝑎3 có thể được
loại bỏ.
Dominated Strategies Example
5. Chiến lược thống trị
Tương tự, đối với người chơi B, chiến lược 𝑏1 bị thống trị
bởi 𝑏2 . Và do đó có thể bỏ qua.
Player B
Player A b1 b2 b3
a1 6 5 -2
a2 1 0 3
Dominated Strategies Example
5. Chiến lược thống trị
Player B
Player A b2 b3
a1 5 -2
a2 0 3
Bài toán này được giải bằng chiến lược gì (tối ưu thuần
túy hay hỗn hợp)? Vì sao?
Vận dụng
• Hai công ty cạnh tranh nhau để giành thị phần nước giải
khát. Mỗi công ty đã làm việc với một công ty quảng cáo để
phát triển các chiến lược quảng cáo thay thế cho năm tới.
• Một loạt các quảng cáo trên truyền hình, online, trưng bày
tại cửa hàng, v.v. cung cấp ba chiến lược khác nhau cho mỗi
công ty. Bảng sau đây tóm tắt sự thay đổi dự kiến về thị phần
của Công ty A khi hai công ty lựa chọn chiến lược quảng cáo
cho năm tới. Giải pháp tối ưu cho trò chơi này đối với mỗi
người chơi là gì? Giá trị của trò chơi là gì?
Công ty B
𝒃𝟏 𝒃𝟐 𝒃𝟑
𝒂𝟏 -2 1 0
𝒂𝟐 2 5 6
Công ty A
𝒂𝟑 6 -1 0
Củng cố & Dặn dò
• Lý thuyết trò chơi là gì? Thế nào là trò chơi hai người có
tổng bằng 0?
Max GAINA
s.t.
2PA1 – 3PA2 + 3PA3 – GAINA > 0 (Strategy b1)
2PA1 + 3PA2 – 2PA3 – GAINA > 0 (Strategy b2)
1PA1 – 1PA2 + 0PA3 – GAINA > 0 (Strategy b3)
PA1 + PA2 + PA3 = 1 (Probabilities sum to 1)
PA1, PA2, PA3, GAINA > 0 (Non-negativity)
Two-Person Zero-Sum Game Example #2