You are on page 1of 30

Chương 5:

Tính hữu dụng và lý thuyết trò chơi

Lý thuyết dụng ích


$2,000,000

$0
Heads
(0.5)

Tails
(0.5)
$5,000,000

1
Đánh giá dụng ích (hữu dụng)
l Mức độ hữu dụng xấu nhất là: 0; và mức độ
hữu dụng tốt nhất là 1.
l Một ví dụ về chơi xổ số được sử dụng để
tính các giá trị hữu dụng.
l Khi bạn bàng quan (indifferent), thì các giá
trị dụng ích bằng nhau.

Ví dụ

(p)
Mức hữu dụng
tốt nhất = 1

(1-p)
Mức hữu dụng
Xấu nhất = 0

Kết quả khác


= ??

2
Ví dụ
p= 0.80 $10,000
U($10,000) = 1.0

(1-p)= 0.20 0
U(0)=0

$5,000
U($5,000)=p
=0.80

Đường dụng ích của Jane

1
0.9
0.8
0.7
0.6
Utility

0.5
0.4
0.3
0.2
0.1
0
$- $2,000 $4,000 $6,000 $8,000 $10,000
Monetary Value

© 2003 by Prentice Hall, Inc.


Upper Saddle River, NJ 07458

3
Mức độ thích rủi ro
dụng ích

Kết quả tiền tệ


7

MarkSimkin đứng trước quyết định

Đinh ngửa
(0.45)
$10,000

Đinh xấp
(0.55)
-$10,000

Mark không tham gia cuộc chơi


0

4
Đường dụng ích của Mark Simkin

1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
-$20,000 -$10,000 $0 $10,000 $20,000 $30,000

© 2003 by Prentice Hall, Inc.


Upper Saddle River, NJ 07458

Sử dụng mức dụng ích


kỳ vọng để ra quyết định
Mức dụng ích
Đinh ngửa
(0.45) 0.30

Đinh xấp (0.55)


0.05

Không tham gia


0.15

10

5
Tính độ nhạy của ví dụ cty
Thompson Lumber
EMV(nút 1) = ($106,400) p + ( 1 − p ) ($2,400)
= $104,000 p + 2,400
Cho EMV(nút 1) bằng EMV của phương án
không thực hiện khảo sát thị trường, ta có
$104,000 p + $2,400 = $40,000
$104,000 p = $37,600
or
$37,600
p = = 0.36
$104,000

11

Nội dung hôm nay

l Những tình huống mà chúng ta phải


ứng xử hàng ngày
l Lý thuyết trò chơi là gi?
l Trò chơi động với thông tin đầy đủ
l Trò chơi tĩnh với thông tin đầy đủ
l Phân tích tình huống.

12

6
Ai gọi ai?

13

Tuổi Trẻ vs Thanh Niên

Chọn tin gì để đăng


trên trang bìa hôm
nay???

14

7
Attila Elizabeth (SYM) vs. Air Blade (Honda)

15

Ghen hay không?

16

8
Trả tiền nhậu hay Karaoke?

17

Làm thế nào để có câu trả lời cho các tình


huống trên?

l Mình phải biết mình,


l và cũng phải biết người
l Người là ai?

l Họ đang nghĩ gì?

l Mục tiêu của họ là gì?

l Họ có những lựa chọn nào?

l Trả lời các câu hỏi trên và đưa ra quyết định


cho chính mình đó là “một trò chơi”
l Biết mình biết người, trăm trận trăm thắng.
18

9
Lý thuyết trò chơi là gì?
l Game Theory: Nghiên cứu các tình huống ra quyết định có
liên quan đến nhiều người và các quyết định của mỗi người
ảnh hưởng đến quyết định của người khác.
l Hay nói các khác: Lý thuyết trò chơi sẽ xác định xác suất
thành công khi cho trước một không gian chiến lược. Nghĩa
là mỗi người đều có hơn 1 sự lựa chọn và lựa chọn của họ
ảnh hưởng lẫn nhau.
l Ví dụ: Nếu hai người cùng gọi, thì máy của cả hai đều bận. Tốt nhất
là một người gọi và một người thì đợi. Vấn đề là ai đợi?

19

Lý thuyết trò chơi là gì?


l Ví dụ: Ban Biên tập báo Thanh Niên sẽ phải có một
cuộc họp kín để quyết định chọn tin gì đưa lên trang 1
của báo ngày hôm nay. Và họ cũng biết ban Biên tập
báo Tuổi Trẻ cũng họp ở đâu đó để bàn về việc này.
l Ví dụ: Có hai dòng xe, một dòng dành cho “phái yếu”
và một dòng dành cho “phái mạnh”. Với ngân sách có
hạn, bản thân Honda lẫn SYM đề không thể đầu tư
cùng một lúc cả hai dòng này và họ lại là đối thủ cạnh
tranh của nhau. Nếu cả hai cùng tung ra cùng lúc 1
dòng xe cho phái mạnh (hoặc phái yếu) thì cả hai đều
thiệt. Chiến lược tốt nhất là mỗi hãng chọn dòng xe để
đầu tư. Vấn đề là làm sao biết đối thủ của mình đang
đầu tư dòng xe nào?
20

10
Lý thuyết trò chơi là gì?

l Ví dụ: Nên ghen ra mặt hay không? Nó tuỳ thuộc vào


“cô kia” có “để ý” anh ấy hay không? Nếu cô kia đang
để ý thì mình ghen và mất tình bạn (được tìn yêu); còn
ngược lại thì không cần ghen (được cả tình yêu lẫn
tình bạn). Và ngược lại.
l Ví dụ: Ai là người sẽ trả tiền trong buổi họp mặt hôm
nay. Nếu hội “con gái” dành trả tiền cho buổi tiệc nhậu
thì “hội con trai” trả tiền cho chầu karaoke; và người
lại. Hội nào sẽ hành động trước? Tiền trả cho nhậu
(bình quân đầu người) là ít hay nhiều hơn tiền trả cho
karaoke (bình quân đầu người)?

21

Những khái niệm cơ bản

l Người chơi (Players): Là những người tham gia vào một hay
nhiều trò chơi. Ví dụ: Hà và Trí, Honda và SYM; hai cô gái …
l Luật chơi (Rules): Là những nguyên tắc và chế tài trong một
cuộc chơi.
l Kế cục (Payoff): Là lượng hữu dụng (thường là tiền) mà một
người chơi khi thắng hoặc thua của một chiên lược cụ thể trong
trò chơi.
l Chiến lược (Strategy): Là một tập các phải ứng của người chơi
có thể xảy ra trong một trò chơi. Một chiến lược phải trọn vẹn,
xác định rõ ràng trong các tình huống bất ngờ.
l Chiến lược áp đảo (Dominant Strategy): Là chiến lược có kết
cục tốt nhất bất chấp các chiến lược của đối thủ
l Chiến lược bị áp đảo (Dominated Strategy): Là chiến lược có
kết cục tệ nhất bất chấp các chiến lược của đối thủ
22

11
Những khái niệm cơ bản
l Chiến lược thuần tuý (Pure Strategy): Là chiến lược dự trên phán
đoán các chiến lược của đối thủ
l Chiến lược hỗn hợp (Mixed Strategy): Là chiến lược khi không
dự đoán được chiến lược của đối thủ.
l Cân bằng (Equilibrium): Là một kết quả (outcome) mà trong đó
các bên tham gia cuộc chơi không muốn thay đổi.
l Cân bằng áp đảo (Dominant Strategy Equilibrium): Là một cân
bằng mà trong đó mỗi người chơi đều sử dụng chiến lược áp đảo
của mình.
l Cân bằng Nash (Nash Equilibrium): Là cân bằng mà trong đó các
người chơi hành động điều tốt nhất mà họ có thể làm khi đối với
hành động của đối phương.
l Tình thế lưỡng nan của người tù (Prinsoner’s dlemma): Là một
kết cục mà mặc dù mọi người hành động khônn ngoan theo tư lợi
của mình nhưng kết nhận được thì không khôn ngoan
23

Các dạng trò chơi


l Trò chơi đồng thời (Simultaneous-move game):
hay còn gọi là trò chơi tĩnh: là dạng trò chơi mà các
nguời chơi phải hành động cùng lúc.
l Ban biên tập báo Thanh Niên và Tuổi Trẻ phải ra quyết định
đồng thời.
l Hai cô gái phải cùng quyết định
l Trò chơi luôn phiên (Sequential-move game): hay
còn gọi là trò chơi động, là dạng trò chơi có nhiều giai
đoạn và mỗi người chơi sẽ hành động ở mỗi giai
đoạn.
l Nếu Honda ra quyết định trước thì SYM sẽ rất dễ dàng có
quyết định.
l Trả tiền nhậu hay karaoke là trò chơi luôn phiên.
24

12
Các dạng trò chơi

Căn cứ vào thông tin Khả năng hợp tác:


l Trò chơi với thông tin l Trò chơi hợp tác
đầy đủ (complete (cooperative games):
information): là mỗi các người chơi cùng lập
người chơi có thể tính chương trình hành động
toán được kết cục và có biện pháp chế tài
(payoff) của các người cho những thoả thuận
chơi còn lại. chung.
l Trò chơi với thông tin l Trò chơi bất hợp tác
không đầy đủ (non- cooperative
(incomplete information). games): không có hợp
đồng (khế ước), hoặc
nếu có thì rất khó chế
25
tài.

Trong bài giảng này:

Trò chơi có thông tin hoàn hảo;


Trò chơi không hợp tác; và
Trò chơi luôn phiên và đồng thời.

26

13
Năm giả định quan trọng
1. Mỗi người ra quyết định (người chơi – player) luôn có hai hay nhiều lựa
chọn.
2. Mỗi lựa chọn phải dẫn đến một kết cục rõ ràng (thắng, thua hay hoà) khi
kết thúc cuộc chơi.
3. Kết cục cụ thể cho mỗi người chơi phải gắn với mỗi giai đoạn kết thúc
(một trò chơi có tổng bằng không – zero sum game nghĩa là tổng tất cả
các kết cục của các người chơi là bằng zero khi kết thúc mỗi giai đoạn
chơi).
4. Các người chơi đều có kiến thức hoàn hảo về trò chơi cũng như về đối
phương của họ. Nghĩa là anh ta/chị ta biết đầy đủ chi tiết các luật lệ của
trò chơi cũng như kết cục của tất cả các người khác.
5. Tất cả những quyết định của người chơi là duy lý (rational), mỗi người
chơi, chẳng hạn có hai lựa chọn, thì khi đó họ sẽ lựa chọn cái nào đem
lại kết cục tốt nhất.

27

Trò chơi luôn phiên


(Sequential-move game)

28

14
Tình huống của Honda vs. SYM

Nam
(-5; -5)
Nam SYM
Nữ
(10;20)
Honda
Nam
(20;10)
Nữ SYM
Nữ
(-5;-5)

29

Qui luật 1:

Nhìn xa hơn và suy luận ngược về


(Look ahead and reason backward)

30

15
Người tiên phong là người khôn?

Không chắc!
l Trong chợ, nếu gian hàng của bạn là người niêm yết
giá cố định trước, đối thủ của bạn sẽ có cơ hội hạ giá
để dành khách hàng.
l Trong một trận đánh, nếu một bên ra quân trước có
thể bọc lộ yếu điểm và bia kia sẽ khai thác.
l Khi công ty quyết định tung ra một sản phẩm mới trên
thị trường. Bạn phải đầu tư để người tiêu dùng hiểu
nó là gì, công dụng mới, chức năng vượt trột so với
các sản phẩm hiện hành…người đi sau không cần
phải làm như vậy nữa! Họ sẽ cưỡi trên lưng
(piggyback) trên lưng của người đi trước).
31

Chiến thuật

l Đe doạ (a threat): là chiến lược tác động vào


chi phí để đối phương thay đổi hành vi hay
niềm tin.
l Lời hứa (a promise): là chiến lược tác động
vào lợi ích để đối phương thay đổi hành vi hay
niềm tin.
l Mức độ tin cậy (credibility) của “đe doạ”
hay “lời hứa” trong trò chơi là yếu tố then chốt.
l Ví dụ: đội mũ bảo hiểm hay không?

32

16
Đe doạ không tin cậy và tin cậy
XYZ
Gia nhập Không gia nhập
Tấn công $30 (ABC) $40 (ABC)
ABC $-10 (XYX) $0 (XYX)
Không tấn công $50 (ABC) $100 (ABC)
$10 (XYX) $0 (XYX)

XYZ
Gia nhập Không gia nhập
Tấn công $30 (ABC) $40 (ABC)
ABC $-10 (XYX) $0 (XYX)
Không tấn công $20 (ABC) $70 (ABC)
$10 (XYX) $0 (XYX)

33

Trò chơi đồng thời


(Simultaneously-move game)

34

17
“Quay bài” hay không?

Những sinh viên khác


Quay Không
Quay 8 (Mình) 10 (Mình)
“Mình” 6 (Khác) 4 (Khác)

Không 4 (Mình) 5 (Mình)


8 (Khác) 5 (Khác)

35

Qui luật 2:

Nếu có chiến lược áp đảo, hãy sử dụng.


(If you have a dominant strategy, use it)

36

18
Tình thế lưỡng nan của người tù

Linh
Khai Không khai
Khai 5 năm Thả (Việt)
20 năm (Linh)
Việt
Không khai 20 năm (Việt) Phục hồi nhân
Thả (Linh) phẩm

37

Nhận xét:

l Mặc dù mọi người hành động khôn ngoan,


nhưng kết quả chung lại không khôn ngoan.
l Mọi người vứt rác bừa bãi, hệ quả là ai cũng
chịu thiệt do đường phố bẩn thiểu.
l Tất cả các tỉnh đều ưu đãi đầu tư và cạnh
tranh nhau, tất cả đều có kết cục xấu (chạy
đua xuống đáy)
l Ai cũng cố vượt lên khi đến ngã tư, không
chịu nhường, hậu quả là tất cả bị kẹt lại.

38

19
Chiến lược của A và B
Công ty B
Giảm giá Không làm Cải tiến
gì cả chất
lượng
Giảm giá 90 (A) 120 (A) 150 (A)
90 (B) 110 (B) 110 (B)
Không làm 100 (A) 150 (A) 200 (A)
Công ty A gì cả 110 (B) 150 (B) 140 (B)
Cải tiến 110 (A) 140 (A) 170 (A)
chất 150 (B) 120 (B) 170 (B)
lượng

39

Chiến lược của A và B

Đối với công ty A: Đối với công ty B:


l Không có chiến lược áp l Không có chiến lược
đảo thống trị
l “Giảm giá” là chiến lược l “Giảm giá” là chiến lược
bị áp đảo bởi hai chiến bị áp đảo bởi chiến lược
lược còn lại. “cải tiến chất lượng”
l Hãy loại bỏ chiến lược l Lưu ý, giảm giá không
“giảm giá” ra khỏi trò phải là chiến lược bị áp
chơi cho dù B chọn đảo bởi chiến lược
chiến lược gì đi chăng “không làm gì cả”.
nữa

40

20
Chiến lược lặp lại
Công ty B
Giảm giá Không làm Cải tiến
gì cả chất
lượng
Giảm giá 90 (A) 120 (A) 150 (A)
90 (B) 110 (B) 110 (B)
Không làm 100 (A) 150 (A) 200 (A)
Công ty A gì cả 110 (B) 150 (B) 140 (B)
Cải tiến 110 (A) 140 (A) 170 (A)
chất 150 (B) 120 (B) 170 (B)
lượng

41

Qui luật 3:

Nếu không có chiến lược áp đảo, cố tìm một chiến


lược áp đảo lặp lại khác.
(If you do not have any dominant strategy, try to
find an iterated dominant strategy)

42

21
Khi không có chiến lược áp đảo

Uniliver
Quảng cáo Không
Quảng cáo 10 (P&G) 15 (P&G)
5 (Uni) 0 (Uni)
P&G
Không 6 (P&G) 20 (P&G)
8 (Uni) 2 (Uni)

Uniliver chọn chiến lược áp đảo, P&G phải chọn chiến lược
dựa theo: Không.

43

Qui luật 4:

Nếu không có chiến lược áp đảo, giả sử đối phương của mình
họ sử dụng chiến lược áp đảo của họ, khi đó chọn chiến lược
phù hợp tiếp theo.
(If you do not have any dominant strategy, then assume that
your rival will use this dominant strategy and choose your
strategy accordingly)

44

22
Pepsi vs. Coke
Không ai
có chiến Pepsi
lược áp
đảo! Giá thấp Giá trung Giá cao
bình
Giá thấp 100 (C) 120 (C) 140 (A)
75 (P) 70 (P) 60 (B)
Giá trung 95 (C) 130 (C) 150 (C)
Coke bình 90 (P) 95 (P)) 110 (P)
Giá cao 90 (C) 120 (C) 160 (C)
110 (P) 120 (P) 110 (P)

45

Nếu không có chiến lược áp đảo

l Khi đó, chiến lược tốt nhất cho mỗi người


chơi là hành xử dựa trên các chiến lược mà
họ nghĩ rằng đối thủ của mình sẽ sử dụng.
l Trong tình huống trên: Coke chọn “giá thấp”
thì Pepsi nên chọn “giá thấp”. Ngược lại, nếu
Pepsi chọn “giá thấp” thì Coke cũng chọn “giá
thấp”. Cân bằng này có tên gọi là cân bằng
Cân bằng Nash.

46

23
Một ví dụ khác về cân bằng Nash

Kinh Đô
Giá thấp Quảng cáo
Giá thấp 60 (ĐP) 60 (ĐP)
60 (KĐ) 80 (KĐ)
Đức Phát
Quảng cáo 80 (ĐP) 50 (ĐP)
60 (KĐ) 50 (KĐ)

Có hai cân bằng Nash ở tình huống trên

47

Qui luật 5:

Nếu cả hai đều không có chiến lược áp đảo, nên


chọn một tình huống cân bằng chung.
(If neither firms has a dominant strategy, you should
choose the equilibrium)

48

24
Nếu không có cân bằng Nash

Kinh Đô
Giá thấp Quảng cáo
Giá thấp 15 (ĐP) 17 (ĐP)
15 (KĐ) 14 (KĐ)
Đức Phát
Quảng cáo 17 (ĐP) 15 (ĐP)
14 (KĐ) 15 (KĐ)

Không có cân bằng nào trong tình huống này.

49

Chiến lược hỗn hợp

l Gọi p là xác suất Đức Phát chọn chiến


lược “giá thấp”; khi đó (1-p) là xác suất
của chiến lược “quảng cáo”.
l Gọi q là xác suất Kinh Đô chọn chiến
lược “giá thấp”; khi đó (1-q) là xác suất
của chiến lược “quảng cáo”.
l (p; q <1)
l Khi đó (xem hình bên)

50

25
Lợi nhuận kỳ vọng
Kinh Đô (q)
Giá thấp Quảng cáo
Giá thấp 15 (ĐP) 17 (ĐP) 15q+17(1-q)
15 (KĐ) 14 (KĐ) 15q+14(1-q)
Đức Quảng cáo 17 (ĐP) 15 (ĐP) 17q+15(1-q)
Phát 14 (KĐ) 15 (KĐ) 14q+15(1-q)
15p+17(1-p) 17p+15(1-p)
(p) 15p+14(1-p) 14p+15(1-p)

Trong bảng trên, các ô cập nhật lợi nhuận kỳ vọng (expected
profit) cho mỗi chiến lược của từng công ty.

51

Giải thích thêm


Lợi nhuận kỳ
vọng của Đức
Phát khi họ chọn
Kinh
giá thấp Đô (q)
Giá thấp Quảng cáo
Giá thấp
Lợi nhuận15kỳ(ĐP)
vọng 17 (ĐP) 15q+17(1-q)
của Kinh15Đô(KĐ)
khi 14 (KĐ) 15q+14(1-q)
Đức QuảngĐức
cáo Phát 17
chọn
(ĐP)giá 15 (ĐP) 17q+15(1-q)
Phát thấp
14 (KĐ) 15 (KĐ) 14q+15(1-q)
15p+17(1-p) 17p+15(1-p)
(p)
Lợi nhuận kỳ 15p+14(1-p) 14p+15(1-p)
vọng của Kinh Đô
khi họ chọn giá
thấp

52

26
Đức Phát
Giảm Quảng
17 giá Cáo 17

15 15

0 0.5 1 q

Nếu q <0.5 lựa chọn tốt nhất cho Đức Phát là nên giảm giá, và
ngược lại, nếu q>0.5 thì Quảng cáo.

53

Kinh Đô
Giảm Quảng
17 giá Cáo 17

15 15

0 0.5 1
p

Nếu p <0.5 lựa chọn tốt nhất cho Kinh Đô là nên giảm giá, và
ngược lại, nếu p>0.5 thì Quảng cáo.

54

27
Nếu cả hai đều chọn trung dung:
p = q = 0.5
Kinh Đô (q=0.5)
Giá thấp Quảng cáo
Giá thấp 15 (ĐP) 17 (ĐP) 16
15 (KĐ) 14 (KĐ) 14.5
Đức Quảng cáo 17 (ĐP) 15 (ĐP) 16
Phát 14 (KĐ) 15 (KĐ) 14.5
16 16 16
(p=0.5) 14.5 14.5 14.5

Khi này lựa chọn chiến lược không còn ý nghĩa nữa!

55

MaiLinh vs. VinaSun

MaiLinh
Mở Không
Mở -50 (VS) 100 (VS)
-50 (ML) 0 (ML)
VinaSun
Không 0 (VS) 0 (VS)
100 (ML) 0 (ML)

Trò chơi này có 2 cân bằng Nash.

56

28
Thử tìm một chiến lược hỗn hợp
MaiLinh (q)
Mở Không
Mở -50 (VS) 100 (VS)
-50 (ML) 0 (ML)
VinaSun
Không 0 (VS) 0 (VS)
(p) 100 (ML) 0 (ML)

-50q+100(1-q) = 0 và -50p + 100(1-p) = 0


Kết quả: q = p = 2/3: Như vậy, MaiLinh hoặc Vinasun có thể thu lợi khi mà
họ tin chắc rằng đối thủ của mình không tham gia thị trường ngách

57

Qui luật 6:

Phải tìm chiến lược hỗn hợp khi không có chiến lược
cân bằng. Và ngay cả khi có chiến lược cân bằng
cũng thử tìm một chiến lược hỗn hợp.
(Try mixed strategy even if pure strategy equilibrium
exists, and definitely if pure strategy equilibrium does
not exist.)

58

29
59

60

30

You might also like