Professional Documents
Culture Documents
Lecture Note 1 PDF
Lecture Note 1 PDF
ทฤษฎีเกมสจะเปนการศึกษาถึงปญหาในลักษณะที่การตัดสินใจและผลลัพธที่เกิดขึ้น
ขึ้นอยูกับบุคลลมากกวา 1 คน ซึ่งใชกันอยางกวางขวางในชวงทศวรรษที่ผานมา ทั้งในสาย
เศรษฐศาสตรและอื่น ๆ ตัวอยางการใชทฤษฎีเกมสตัดสินใจปญหาทางเศรษฐศาสตรไดแก:
- การตัดสินใจปริมาณสินคาที่แตละบริษัทจะผลิตในตลาดผูแขงขันนอยราย
- การตัดสินใจในเรื่องของคาจางแรงงานระหวางบริษท ั และสหภาพแรงงาน
- การเจรจาการคาเพื่อลดอัตราภาษีศุลกากรระหวางประเทศ
- การประมูล
นอกจากนี้ ทฤษฎีเกมสยังสามารถนําไปประยุกตใชเพือ่ ศึกษาปญหาในดานอื่น ๆ เชน
ธุรกิจ ชีววิทยา การศึกษา และสังคมศาสตร
โดยลักษณะของเกมสที่จะทําการศึกษาในที่นี้ จะเปนเกมสในลักษณะที่เราเรียกวา
“Non-cooperative game theory”
ตัวเลขดานหนาในแตละชองคือผลตอบแทนสําหรับนักโทษคนที่ 1 และตัวเลขดานหลัง
คือผลตอบแทนสําหรับนักโทษคนที่ 2 ในเกมส Prisoner-dilemma จะมีสวนประกอบของเกมส
ดังตอไปนี้ :
1. ผูเลน: ในที่นมี้ ีผูเลน 2 คน ไดแก prisoner 1 และ prisoner 2
2. เซ็ตของกลยุทธ: เซ็ตกลยุทธของ prisoner 1 ไดแก = {confess, don’t confess}
3. ผลตอบแทน แสดงไดในเมทริคผลตอบแทนขางบน
Strategy Profile
เปนสวนผสมของกลยุทธทแี่ ตละคนเลือกรวมกัน ซึ่ง Strategy profile ซึ่งจะมีดวยกัน 2
แบบ ไดแก
1. Pure strategy profile
จากตัวอยางเกมส prisoner-dilemma ขางตน เราสามารถเขียน pure strategy profile
ทั้งหมดไดดังนี้
= {(confess, confess), (confess, don’t confess), (don’t confess, confess), (don’t
confess, don’t confess)}
นั่นคือ สวนผสมระหวางกลยุทธของผูเลนทั้งสองคนที่เปนไปไดทั้งหมด ซึ่งก็คือชอง
ทั้งหมดในเมทริคผลตอบแทนนั่นเอง
2. Mixed strategy profile
เปนกรณีที่มีการกําหนดความนาจะเปนใหกับกลยุทธของผูเลนแตละคน หรือกลาวอีก
นัยหนึ่งคือเปนกลยุทธในลักษณะที่มีการใหเครื่องมือสุม (random device) แกผูเลนแตละคน
โดยผูเลนจะใชเครื่องมือสุมดังกลาว เพื่อตัดสินวาตนจะเลือกกลยุทธแบบใด ในเวลาทีจ่ ะ
ตัดสินใจ ตัวอยางเชน หากตองการกําหนดความนาจะเปนเทากับ ½ ใหกับกลยุทธแตละอยาง
ตามตัวอยาง เราสามารถใหเครื่องมือสุมเปนการโยนเหรียญ โดยกําหนดใหผูเลนทําการเลือกกล
ยุทธ confess หากเหรียญออกหัว และ don’t confess หากเหรียญออกกอย
สมมติให σ แทน mixed strategy profile เราจะสามารถเขียนกลยุทธผสม (mixed
strategy) ของผูเลนแตละคนไดดังนี้
σ 1 = {σ 1 (confess ), σ 1 (don' t )}
σ 2 = {σ 2 (confess), σ 2 (don' t )}
สมมติให mixed strategy ของแตละคนเปนดังนี้
σ 1 = {1 / 3,2 / 3}
σ 2 = {3 / 4,1 / 4}
ในกรณีนี้ เราจะสามารถเขียน mixed strategy profile ไดดังนี้
Prisoner 2
confess Don’t confess
confess
1,1 3,0
prisoner
1 Don’t
0,3 2,2
confess
ตัวอยางที่ 2:
L R
T 3,… 0,…
M 2,… 2,…
D 1,… 1,…
หมายเหตุ:
1. การจะหาวากลยุทธใดเปน dominant strategy เราสามารถตรวจสอบเฉพาะกลยุทธ
แบบ pure ก็พอ
2. แตหากเราจะตรวจสอบวากลยุทธใดเปน strictly dominated strategy เราจะตอง
พิจารณากรณีที่กลยุทธถูก dominate ดวยกลยุทธแบบผสม (mixed strategy) ดวย
เพราะกลยุทธบางกลยุทธจะไมถูก dominate โดยกลยุทธแบบ pure แตสามารถถูก
dominate โดยกลยุทธแบบผสมได ดังตัวอยางตอไปนี้
L R
T 3,… 0,…
M 0,… 3,…
D 1,… 1,…
จะเห็นไดวาทุกกลยุทธของผูเลนคนแรก คือ T,M และ D จะไมถูก dominate โดย pure
strategy อันใดเลย แตหากเราพิจารณากรณีที่สราง mixed strategy ระหวาง T กับ M
จะสามารถ dominate กลยุทธ D ได โดยการสราง mixed strategy ½ T + ½ M ซึ่งจะ
ทําใหผลตอบแทนสามารถแสดงไดดังเมทริคตอไปนี้
L R
½T+½M 1.5,… 1.5,…
D 1,… 1,…
ดังนั้น กลยุทธ D จะถูก dominate โดยกลยุทธ ½ T + ½ M ทําใหเราสามารถตัดกล
ยุทธ D ออกจากการพิจารณาหาผลลัพธของเกมสไดเชนกัน
3. หากกลยุทธแบบ pure อันไหนเปน strictly dominated strategy กลยุทธแบบผสมที่ถูก
สรางขึ้นโดยใชกลยุทธแบบ pure อันนั้นเปนสวนประกอบก็จะเปน strictly dominated
strategy ดวยเชนกัน
Left Middle
Up 1,0 1,2
Down 0,3 0,1
จากเกมสในขางบนนี้ จะเห็นไดวา กลยุทธ Down ของผูเลนคนแรก จะถูก dominated
โดยกลยุทธ Up ดังนั้น เราสามารถตัดกลยุทธ Down ทิ้งไปไดเชนกัน ทําใหเกมสลดรูปเหลือดัง
เมทริคตอไปนี้
Left Middle
Up 1,0 1,2
L C R
T 2,2 6,1 1,1
M 1,3 5,5 9,2
B 0,0 4,2 8,8
3. Nash Equilibrium
เปนผลลัพธของเกมสที่เกิดขึ้นเมื่อผูเลนทุกคนในเกมสเลือกกลยุทธที่เปน “Best-
response” เมื่อกลยุทธของคนอื่นถูกกําหนดให กลาวคือคนอื่นถูกกําหนดใหเลือกกลยุทธที่เปน
Best-response เชนกัน
นิยาม: Best-response
กลยุทธ σ i* จะเรียกวาเปน Best-response สําหรับผูเลนที่ i ก็ตอเมื่อ
σ i* = arg max u i (σ i , σ −*i )
σi
กลาวคือ เมื่อกําหนดใหผูเลนทุกคน ยกเวนคนที่ i เลือกที่จะเลนกลยุทธที่เปน Best-
response ของเขาเหลานั้นแลว กลยุทธ σ i* จะเรียกวาเปน Best-response เมื่อกลยุทธ σ i* ทํา
ใหผลตอบแทนสําหรับผูเลน i สูงสุด
ตัวอยางที่ 5:
ใหกลับมาพิจารณาเกมส prisoner-dilemma ในตัวอยางที่ 1 และหากลยุทธที่เปน Best-
response สําหรับผูเลนแตละคน
Prisoner 2
confess Don’t confess
confess
1,1 3,0
prisoner
1 Don’t
0,3 2,2
confess
Nash Equilibrium
จะเปนดุลยภาพที่เกิดขึ้นเมื่อผูเลนทุกคนเลือกกลยุทธที่เปน Best-response พรอมกัน
คํานิยาม: Nash Equilibrium
Strategy profile (σ 1* , σ 2* ,....., σ N* ) เปน Nash equilibrium เมื่อ กลยุทธ σ i* เปนกลยุทธแบบ
Best-response สําหรับผูเลนที่ i ทุกคน เมื่อ i = {1,…………,N}
จากตัวอยางที่ 5 ในเกมส Prisoner-dilemma จะสามารถหา strategy profile ที่เปน
Best-response สําหรับผูเลนทั้งสองคนพรอมกันไดแก (Confess, Confess) ดังนั้น Strategy
profile ดังกลาวจึงเปน Nash equilibrium
การตีความของ Nash equilibrium อีกประการนึงก็คือ ณ จุดดุลยภาพแบบ Nash จะไม
มีผูเลนคนไหนมีแรงจูงใจที่จะเปลี่ยนไปเลือกกลยุทธแบบอื่น (No incentives to deviate from
Nash equilibrium)
L C R
T 0,4 4,0 5,3
M 4,0 0,4 5,3
B 3,5 3,5 6,6