You are on page 1of 34

Độ thỏa dụng và Lý thuyết trò chơi

Chương này nhằm giới thiệu:


• Cách thức ra quyết định nhằm tối đa hóa độ thỏa dụng
trung bình;
• Một số chiến lược trong Mô hình trò chơi hai người có
tổng bằng 0.
Độ thỏa dụng

1. Độ thỏa dụng là gì ?

2. Độ thỏa dụng và Ra quyết định

3. Người ra quyết định tránh rủi ro và người ra quyết định


chấp nhận rủi ro
1. Độ thỏa dụng là gì ?

• Độ thỏa dụng/độ hài lòng/tiện ích (Utility), một thuật ngữ


trong kinh tế học vi mô, dùng để chỉ mức độ hài lòng hay
thỏa mãn của người tiêu dùng khi sử dụng hàng hóa hoặc
dịch vụ.

• Qua độ thỏa dụng, người ta muốn thể hiện sở thích, sự hài


lòng dưới hình thức gần như là lượng hóa, có thể so sánh
được.

• Giả định người tiêu dùng muốn tối đa hóa độ thỏa dụng là
một trong những giả định cơ bản giải thích về sự lựa chọn
của người tiêu dùng.
1. Độ thỏa dụng là gì ?

• Ví dụ, khi chúng ta nói, người tiêu dùng thích giỏ hàng hóa A
hơn giỏ hàng hóa B, thì điều đó cũng hàm ý rằng khi tiêu
dùng giỏ hàng hóa A sẽ đem lại cho người tiêu dùng sự hài
lòng lớn hơn khi tiêu dùng giỏ hàng hóa B.

• Trên thực tế, không thể đo độ thỏa dụng bằng một thước đo
khách quan, cụ thể hay định lượng được.

• Tuy nhiên, trong kinh tế học, “Cái gì không đo lường được


thì không đánh giá được” → Đo độ thỏa dụng bằng 1 cách
nào đó!
1. Độ thỏa dụng là gì ?

Một số tính chất tiêu biểu của độ thỏa dụng:

• Tính thứ tự: con người luôn sắp xếp được các giỏ hàng theo
thứ tự ưa thích của mình.

• Tính bắc cầu:


𝑈 𝐴 ≥ 𝑈(𝐵)
൜ ⇒ 𝑈 𝐴 ≥ 𝑈(𝐶)
𝑈 𝐵 ≥ 𝑈(𝐶)

• Nhiều thì tốt hơn là ít.


1. Độ thỏa dụng là gì ?

Ví dụ: Bảng bên dưới thể hiện độ thỏa dụng theo mức thu
nhập hàng tháng

Mức thu nhập 10 20 30 40 50 60 70


(triệu đồng/tháng)
Độ thỏa dụng (𝑼) 10 18 24 29 33 36 38
1. Độ thỏa dụng là gì ?

Các dạng cơ bản của hàm thỏa dụng:


 Thỏa dụng biên tăng dần;
 Thỏa dụng biên giảm dần;
 Thỏa dụng biên không đổi.
𝑈

𝑋
2. Độ thỏa dụng và Ra quyết định

• Trong kinh tế học và cả thực tiễn, con người đưa ra quyết


định lựa chọn phương án mang lại cho họ độ thỏa dụng
(hoặc độ thỏa dụng trung bình) cao nhất (mà không hẳn
là lợi nhuận, chi phí hay doanh thu,…)

• Ví dụ (Key study). Trong năm tới, Swofford có ba lựa


chọn đầu tư bất động sản và giá bất động sản trong tương
lai là không chắc chắn. Các khoản đầu tư có thể được thể
hiện trong bảng bên dưới.
Key study

PAYOFF TABLE States of Nature


Real Estate Prices:
Go Up Remain Same Go Down
Decision Alternative s1 s2 s3
Make Investment A, d1 30,000 20,000 -50,000
Make Investment B, d2 50,000 -20,000 -30,000
Do Not Invest, d3 0 0 0
Probability 0.3 0.5 0.2
Example: Swofford,Key
Inc.study

• Dùng cách tiếp cận giá trị trung bình (EV), ta được:

EV(d1) = .3(30,000) + .5( 20,000) + .2(-50,000) = $9,000


EV(d2) = .3(50,000) + .5(-20,000) + .2(-30,000) = -$1,000
EV(d3) = .3( 0 ) + .5( 0 ) + .2( 0 ) = $0

• Không xét đến yếu tố nào khác, quyết định tối ưu dường
như là 𝑑1 với giá trị lợi nhuận dự kiến là $ 9,000 …….
Nhưng
2. Độ thỏa dụng và Ra quyết định

Ý kiến khác:
• Giả sử vị trí tài chính hiện tại của Swofford là yếu. Chủ tịch
của hãng tin cho rằng, tương lai của Swofford sẽ gặp nguy
hiểm nếu phát sinh khoản lỗ 50.000 đô la. Do đó phương án
𝑑1 có thể bị loại bỏ để tránh rủi ro.
• Hoặc cũng có thể, Chủ tịch của hãng không chấp nhận
phương án 𝑑2 với khả năng lỗ lên đến 70%.

→ Không dựa vào mức payoff mà dựa vào độ thỏa dụng


2. Độ thỏa dụng và Ra quyết định

• Độ thỏa dụng là thước đo tổng hợp, phản ánh thái độ của


người ra quyết định đối với một tập hợp các yếu tố.

• Một số yếu tố này có thể là lợi nhuận, thua lỗ và rủi ro,…

• Phân tích này đặc biệt thích hợp trong trường hợp payoff
được giả định các giá trị cực kỳ cao hoặc cực kỳ thấp.
2. Độ thỏa dụng và Ra quyết định

Sau đây là các bước nhằm:


• Chuyển bảng Payoff sang bảng độ thỏa dụng;
• Từ đó xác định phương án tối đa hóa độ thỏa dụng trung bình
(Expected Utility – EU).

 Bước 1: Phát triển bảng payoff bằng các giá trị tiền tệ.
 Bước 2: Xác định độ thỏa dụng của payoff tốt nhất và
payoff tệ nhất bằng cách gán cho chúng các giá trị, sao
cho:
𝑈(Payoff tốt nhất) > 𝑈(Payoff tệ nhất).
 Bước 3: Xác định xổ số. Payoff tốt nhất có được với xác
suất 𝑝; Payoff tệ nhất thu được với xác suất 1 − 𝑝 .
Key study

PAYOFF TABLE States of Nature


Real Estate Prices:
Go Up Remain Same Go Down
Decision Alternative s1 s2 s3
Make Investment A, d1 30,000 20,000 -50,000
Make Investment B, d2 50,000 -20,000 -30,000
Do Not Invest, d3 0 0 0
Probability 0.3 0.5 0.2
Example: Swofford, Inc.
Key study

Step 1: Develop payoff table.

Monetary payoff table on earlier slide.

Step 2: Assign utility values to best and worst payoffs.


Utility of $50,000 = U(50,000) = 0
Utility of $50,000 = U(50,000) = 10

Step 3: Define the lottery.


Swofford obtains a payoff of $50,000 with
probability p and a payoff of $50,000 with
probability (1  p).

The lottery: 𝒑. 𝟓𝟎𝟎𝟎𝟎 + 𝟏 − 𝒑 . (−𝟓𝟎𝟎𝟎𝟎)


2. Độ thỏa dụng và Ra quyết định

Bước 4: Đối với mọi giá trị khác M trong bảng Payoff
 4a. Xác định giá trị của 𝑝 (xác suất bàng quan –
Indifference Probability) sao cho người ra quyết định
không quan tâm đến sự khác biệt giữa 1 bên là số tiền
được đảm bảo của M và bên kia là tham gia vào cuộc sổ
xố được xác định ở Bước 3. Tức là:
𝒑. 𝟓𝟎𝟎𝟎𝟎 + 𝟏 − 𝒑 . (−𝟓𝟎𝟎𝟎𝟎) vs M
2. Độ thỏa dụng và Ra quyết định

Bước 4: Đối với mọi giá trị khác M trong bảng Payoff
 4a. Xác định giá trị của 𝑝 (xác suất bàng quan –
Indifference Probability) sao cho người ra quyết định
không quan tâm đến sự khác biệt giữa 1 bên là số tiền
được đảm bảo của M và bên kia là tham gia vào cuộc sổ
xố được xác định ở Bước 3. Tức là:
𝒑. 𝟓𝟎𝟎𝟎𝟎 + 𝟏 − 𝒑 . (−𝟓𝟎𝟎𝟎𝟎) vs M

 4b. Khi đó, độ thỏa dụng của M là


𝑈(M) = 𝑝. 𝑈(Payoff tốt nhất) + 1 − 𝑝 . 𝑈(Payoff xấu nhất)
Example: Swofford, Inc.
Key study

Ta tính độ thỏa dụng của mức payoff $30,000:


B4a: Xác định giá trị 𝑝 bằng cách giải phương trình

30,000 = 𝑝 50,000 + (1 − 𝑝)(−50,000)


⇔ 30,000 = 𝑝 100,000 − 50,000
⇔ 𝑝 = 0.8

B4b: Tính U(30,000).

U(30,000) = pU(50,000) + (1  p)U(50,000)


= 0.8 x 10 + 0.2 x 0
=8
 Bước 5: Chuyển đổi bảng Payoff sang bảng độ thỏa dụng (SV
thực hiện chuyển đổi).
ple: Swofford, Inc.
PAYOFF TABLE States of Nature
Real Estate Prices:
Go Up Remain Same Go Down
Decision Alternative s1 s2 s3
Make Investment A, d1 30,000 20,000 -50,000
Make Investment B, d2 50,000 -20,000 -30,000
Do Not Invest, d3 0 0 0
Probability 0.3 0.5 0.2
 Bước 6: Áp dụng cách tiếp cận độ thỏa dụng trung bình cho
bảng độ thỏa dụng được phát triển ở bước 5 và chọn quyết định
có độ thỏa dụng trung bình cao nhất.
ple: Swofford, Inc.
 Bước 5: p

States of Nature
Real Estate Prices:
UTILITY TABLE
Go Up Remain Same Go Down
Decision Alternative s1 s2 s3
Make Investment A, d1 8 7 0
Make Investment B, d2 10 3 2
Do Not Invest, d3 5 5 5
Probability 0.3 0.5 0.2

 Bước 6:
𝐸𝑈 𝑑1 = 0.3 × 8 + 0.5 × 7 + 0.2 × 0 = 5.9;
𝐸𝑈 𝑑2 = 0.3 × 10 + 0.5 × 3 + 0.2 × 2 = 4.9;
𝐸𝑈 𝑑3 = 5.
Vận dụng

Làm lại ví dụ trên trong 2 trường hợp với quy tắc xác định 𝑝
(ở Bước 4) như sau:
a) Người ra quyết định không quan tâm đến sự khác biệt giữa
1 bên là số tiền được đảm bảo M và bên kia là tham gia
vào cuộc sổ xố khi và chỉ khi
𝑝.(Payoff tốt nhất) + 1 − 𝑝 .(Payoff xấu nhất) = 1.5M
b) Người ra quyết định không quan tâm đến sự khác biệt giữa
1 bên là số tiền được đảm bảo M và bên kia là tham gia
vào cuộc sổ xố khi và chỉ khi
𝑝.(Payoff tốt nhất) + 1 − 𝑝 .(Payoff xấu nhất) = 0.5M
3. Người ra quyết định tránh rủi ro và
người ra quyết định mạo hiểm
• Trong Ví dụ trên, người đầu tiên với 𝑝 được xác định bởi
𝑝.(Payoff tốt nhất) + 1 − 𝑝 .(Payoff xấu nhất) = M
là người trung lập với rủi ro.
• Người thứ hai là với 𝑝 được xác định bởi
𝑝.(Payoff tốt nhất) + 1 − 𝑝 .(Payoff xấu nhất) = 1.5M > M
là người tránh rủi ro.
• Người thứ ba là với 𝑝 được xác định bởi
𝑝.(Payoff tốt nhất) + 1 − 𝑝 .(Payoff xấu nhất) = 0.5M < M
là người chấp nhận rủi ro (mạo hiểm).
3. Người ra quyết định tránh rủi ro và
người ra quyết định mạo hiểm.

• Người tránh rủi ro sẽ có hàm thỏa dụng là hàm lõm (concave)


khi độ thỏa dụng được đo trên trục tung và giá trị tiền tệ được
đo trên trục hoành. Cá nhân mua bảo hiểm thể hiện hành vi
tránh rủi ro.
• Một người chấp nhận rủi ro, chẳng hạn như một con bạc, trả
phí để có được rủi ro. Hàm thỏa dụng của họ là hàm lồi
(convex). Điều này phản ánh người ra quyết định làm tăng
giá trị biên của tiền.
• Một người ra quyết định trung lập rủi ro có hàm thỏa dụng là
hàm tuyến tính. Trong trường hợp này, cách tiếp cận giá trị
trung bình có thể được sử dụng.
Các dạng cơ bản của hàm thỏa dụng:
 Thỏa dụng biên tăng dần;
 Thỏa dụng biên giảm dần;
 Thỏa dụng biên không đổi.
𝑈

$
3. Người ra quyết định tránh rủi ro và
người ra quyết định mạo hiểm.

Đối với hầu hết các cá nhân, các khoản tiền của họ cũng
thường được chia làm 3 phần:
• Phần tiền mà họ hạn chế rủi ro (tránh rủi ro);
• Phần tiền trung lập với rủi ro;
• Và phần tiền mà họ chấp nhận rủi ro.

→ Điều này giải thích tại sao cùng một cá nhân sẽ mua cả bảo
hiểm và vé số.
Ví dụ

Hãy xem xét bảng payoff với 3 phương án 𝑑1 , 𝑑2 , 𝑑3 và 3


trạng thái tự nhiên 𝑠1 , 𝑠2 , 𝑠3 trong bảng sau:

𝑠1 𝑠2 𝑠3
𝑑1 100,000 40,000 - 60,000
𝑑2 50,000 20,000 - 20,000
𝑑3 20,000 20,000 - 10,000
Xác suất 0.1 0.3 0.6
Utility Example 1
Ví dụ

 Đối với người ra quyết định trung lập với rủi ro, thì
cách tiếp cận giá trị trung bình và độ thỏa dụng trung
bình là như nhau.

EV(d1) = .1(100,000) + .3(40,000) + .6(-60,000) = -$14,000


EV(d2) = .1( 50,000) + .3(20,000) + .6(-30,000) = -$ 7,000
EV(d3) = .1( 20,000) + .3(20,000) + .6(-10,000) = +$ 2,000

The optimal decision is d3.


Utility Ví dụ
Example 1
 Ngoài ra, ta còn có 2 người ra quyết định khác (I & II) với
bảng độ thỏa dụng như sau:
Utility Utility
Amount Decision Maker I Decision Maker II
$100,000 100 100
$ 50,000 94 58
$ 40,000 90 50
$ 20,000 80 35
-$ 10,000 60 18
-$ 20,000 40 10
-$ 60,000 0 0

a) Hãy xác định người ra quyết định tránh rủi ro và chấp nhận
rủi ro?
b) Dùng cách tiếp cận độ thỏa dụng trung bình để chỉ ra quyết
định của họ.
Utility Example 1
Ví dụ

 Graph of the Two Decision Makers’ Utility Curves


Utility

100 Decision Maker I

80

60

40 Decision Maker II

20

-60 -40 -20 0 20 40 60 80 100


Monetary Value (in $1000’s)
Utility Example 1
Ví dụ

 Decision Maker I
• Decision Maker I has a concave utility function.
• He/she is a risk avoider.
 Decision Maker II
• Decision Maker II has convex utility function.
• He/she is a risk taker.
Utility Example 1
Ví dụ

 Expected Utility: Decision Maker I

Expected
Optimal s1 s2 s3 Utility Largest
decision expected
is d3 d1 100 90 0 37.0
utility
d2 94 80 40 57.4
d3 80 80 60 68.0
Probability .1 .3 .6

Decision Maker I should make decision d3.


Utility Example 1
Ví dụ

 Expected Utility: Decision Maker II

Expected
Optimal s1 s2 s3 Utility
decision
is d1 d1 100 50 0 25.0
d2 58 35 10 22.3 Largest
expected
d3 35 35 18 24.8 utility
Probability .1 .3 .6

Decision Maker II should make decision d1.


Vận dụng
Giả sử một công ty có 3 phương án đầu tư, với bảng payoff về lợi nhuận
(đvt: nghìn USD) được cho như sau:

a) Người trung lập với rủi ro chọn phương án nào?


b) Sử dung phương pháp độ thỏa dụng trung bình (EU), hãy chỉ ra phương
án tối ưu đối với 2 người ra quyết định A và B, nếu biết xác suất bàng quan
của họ như sau:
Củng cố & Dặn dò

• Xem lại độ thỏa dụng và các tính chất liên quan

• Cách ra quyết định dựa vào độ thỏa dụng

• Người ra quyết định tránh rủi ro và người ra quyết định chấp


nhận rủi ro

You might also like