You are on page 1of 10

หัวขอที่ 15

ทฤษฎีเกมและพฤติกรรมเชิงกลยุทธ

เคาโครงการบรรยาย วันพุธ ที่ 4 กันยายน พ.ศ. 2556

บทนำ Make-up class


หมวดหมูและประเภทของเกม
การหาดุลยภาพของเกมแบบเลนพรอมกัน
Prisoners’ Dilemma
เกมแบบผลัดกันเลน
STUDENT Version
วิชาทฤษฎีเศรษฐศาสตรจุลภาค (EC311) Sec030003 ภาค 1/2556 อ.ลอยลม ประเสริฐศรี
ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร

15.1 บทนำ
นิยาม
เกม (Game) คือ สถานการณที่มีการแขงขันเพื่อเอาชนะกัน โดยที่ผูเลนแตละฝายตระหนักถึง
ผลกระทบที่อาจเกิดขึ้นซึ่งกันและกัน (Mutually Interdependent) ตามกลยุทธที่แตละฝายเลือกใช
ทั้งนี้ เพื่อใหไดผลประโยชนของตนสูงสุด

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร 2 อ.ลอยลม ประเสริฐศรี


องคประกอบของเกม
1 ผูเลน(Players): ผูที่เขารวมเลนหรือแขงขันในเกม

Player B
Strategy 1 Strategy 2
Strategy 1 3
Player A

(Payoff A , Payoff B) (Payoff A , Payoff B)


ผลรางวัล (Payoff): ผลประโยชนหรือ
Strategy 2 (Payoff A , Payoff B) (Payoff A , Payoff B)
ผลลัพธ ที่แตละฝายอาจจะไดรับจาก
การเลนเกม

2 กลยุทธ (Strategies): กฎเกณฑ (Rules) หรือกติกาที่เกมอนุญาตใหเลน


ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร 3 อ.ลอยลม ประเสริฐศรี

ขอสมมติเกี่ยวกับเกม
การศึกษาทฤษฎีเกม มีขอสมมติ ดังนี้
มีขอมูลที่สมบูรณ (Perfect information) Brain System:-
ผูเลนทุกคนรูกฎเกณฑ และผลรางวัล The cerebral cortex:
และรูเขารูเรา "The cerebral cortex is divided into
lobes that each have a specific function. For
มีเหตุมีผล (Rational) ผูเลนใชขอมูลที่มีอยู example, there are specific areas involved in
vision, hearing, touch, movement, and smell.
ทั้งหมด ในการตัดสินใจเลือกกลยุทธที่ดีที่สุด Other areas are critical for thinking and
ตัวอยางที่ 1: เกมทดลอง reasoning."
ผูเลน (Players): นักศึกษาทุกคนเปนผูเลนในเกม
The limbic system:
กติกา (Rule of the Game): ใหเขียนตัวเลข "The limbic system is located
1-100 ลงในกระดาษ (พรอมชื่อ-นามสกุล) จากนั้น beneath the cerebral cortex. This
จะนำเอาขอมูลทุกคนมาหาคาเฉลี่ย ใครเขียนตัวเลข system is the center for emotional
ไดใกลเคียงกับคาเฉลี่ยที่สุด รับรางวัล thinking. The limbic system is where
most of your emotions, like happiness,
ผลลัพธ (Payoffs): .................................................. sadness and anger. Memory is also
stored here."

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร 4 อ.ลอยลม ประเสริฐศรี


รูปแบบการนำเสนอเกม
รูปแบบปกติ (Normal or Payoff matrix form)

จุดที่ทำการตัดสินใจ (Node)

รูปแบบขยาย (Extensive form or game tree)


ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร 5 อ.ลอยลม ประเสริฐศรี

15.2 หมวดหมูและประเภทของเกม

1 พิจารณาจากลักษณะของความรวมมือ

เกมแบบเกื้อกูลกัน (Cooperative Game) เกมแบบขับเคี่ยวกัน (Noncooperative


ผูเลนสามารถเจรจาตกลงทำสัญญาที่ใชบังคับ Game) ผูเลนไมสามารถเจรจาตกลงทำ
(binding contracts) ที่ทำใหไดประโยชนรวม สัญญาที่ใชบังคับ (No binding contracts)
กัน เชน การทำ Cartel เชน การประมูล

2 พิจารณาจากจังหวะเวลาในการเลน

เลนพรอมกัน (Simultaneous games) ผลัดกันเลน (Sequential games)


นั่นคือ ผูเลนทุกคนเลนเกมพรอมกัน ผูเลนคนแรกเลนกอนแลวผูเลนอื่นเลนตาม
ตัวอยาง: เปา-หยิง-ฉุบ ตัวอยาง: Poker, Stackelberg,
Cournot competition Price leadership

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร 6 อ.ลอยลม ประเสริฐศรี


หมวดหมูและประเภทของเกม
3 พิจารณาจากจำนวนครั้งที่เลน

แขงขันครั้งเดียว (One-shot games): เชน แขงซ้ำหลายครั้ง (Repeated games):


FA Cup ธุรกิจการคา

4 พิจารณาจากผลรางวัล

ผลรางวัลรวมคงที่ (Constant sum ผลรางวัลรวมไมคงที่ (Non-constant sum


games) ผลรวมรางวัลของคูแขงทั้งหมดคงที:่ games) ผลรวมรางวัลของคูแขงทั้งหมดไม
การพนัน คงที่: oligopoly, การเจรจาเปดเสรีการคา

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร 7 อ.ลอยลม ประเสริฐศรี

15.3 การหาดุลยภาพของเกมแบบเลนพรอมกัน
Dominant Strategies
Definition: Dominant Strategy Equilibrium เกิดขึ้นเมื่อผูเลนแตละฝายเลือกกลยุทธที่โดดเดน
สำหรับตนเอง “ฉันจะทำสิ่งที่ดีที่สุดสำหรับตัวฉันเอง ฉันไมสนใจหรอกวาเธอจะทำอะไร”

ตัวอยางที่ 2: เกมการโฆษณาของ Honda VS Toyota


การตัดสินใจใชกลยุทธการโฆษณาหรือไมใชการโฆษณา สงผล
ตอยอดขายรถยนต (หนวย:พันลานบาท) ดังแสดงในตาราง

Toyota
โฆษณา ไมโฆษณา Honda:
Honda

โฆษณา 16 , 16 20 , 15
ไมโฆษณา 15 , 20 18 , 18 Toyota:
Equilibrium:
Payoff:
ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร 8 อ.ลอยลม ประเสริฐศรี
Dominant Strategies
ตัวอยางที่ 3: เกมการลงทุนของ Honda VS Toyota
การตัดสินใจลงทุนสรางโรงงานเพิ่มหรือไมลงทุน สงผลตอยอดขาย
ชาเขียว (หนวย: รอยลานบาท) ดังแสดงในตาราง
อิชิตัน
ลงทุน ไมลงทุน
โออิชิ

ลงทุน 10 , 5 10 , 10
ไมลงทุน 6,8 20 , 2
โออิชิ:

อิชิตัน:

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร 9 อ.ลอยลม ประเสริฐศรี

Nash Equilibrium
Definition: Nash Equilibrium เกิดขึ้นเมื่อผูเลนแตละฝายเลือกกลยุทธที่ดีที่สุด ภายใตกลยุทธที่คู
แขงเลือกใชอยู “ฉันจะทำสิ่งที่ดีที่สุด ภายใตสิ่งที่เธอทำ”
ตัวอยางที่ 4: เกม Bank Runs “เธอทำในสิ่งที่ดีที่สุด ภายใตสิ่งที่ฉันทำ”
การที่ลูกคาธนาคาร ตัดสินใจวาจะถอนเงินหรือไมถอนเงิน สงผล
กระทบตอเงินฝากของตนเอง ดังแสดงในตาราง

ลูกคาธนาคารคนที่ 2
ลูกคาธนาคารคนที่ 1

ถอนเงิน ไมถอนเงิน
ถอนเงิน 25 , 25 50 , 0 ลูกคาธนาคารคนที่ 1:
ไมถอนเงิน 0 , 50 110 , 110
ลูกคาธนาคารคนที่ 2:
Equilibrium:
Payoff:
ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร 10 อ.ลอยลม ประเสริฐศรี
Nash Equilibrium
ตัวอยางที่ 5: Simple 2-firms Cournot Model
สมมติวา ในแบบจำลองการแขงขันเชิงปริมาณในธุรกิจหนังสือพิมพภาคภาษาอังกฤษในประเทศไทย ซึ่งมีบริษัทอยู
2 ราย ไดแก หนังสือพิมพ Bangkok Post และหนังสือพิมพ The Nation
กำหนดให π *B = ( P* − AC B ) q*B = ( 40 − 10 ) ( 30 ) = 900
อุปสงคของตลาดที่คูแขงขันเผชิญ: P = 100 − Qi π *N = ( P* − AC N ) q*N = ( 40 − 10 ) ( 30 ) = 900
โดยที่ P คือ ราคาคาหนังสือพิมพตอฉบับ
Qi คือ จำนวนยอดพิมพ (หนวย: ลานฉบับตอเดือน)
โดย Qi = qB + qN
qB แทนยอดพิมพ BANGKOK POST q1N = 30 qN2 = 45
qN แทนยอดพิมพ THE NATION
q1B = 30 900 , 900 450 , 675
ตนทุนสวนเพิ่มในการพิมพคงที่ (เทากัน):
MC B = MC N = 10 qB2 = 45 675 , 450 0,0
สมมติ qB2 = 45, q1N = 30 (หาราคา):
P = 100 − Qi = 100 − (45 + 30) = 25

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร 11 อ.ลอยลม ประเสริฐศรี

Maximin Strategies
Definition: Maximin Strategies เปนวิธีการหาดุลยภาพที่ผูเลนเลือกกลยุทธที่ใหคา Payoffs สูง
ที่สุด ในบรรดา Payoffs ที่เลวรายที่สุด

ตัวอยางที่ 6: Entry Game in Natural Monopoly


สมมติวา กระทรวงคมนาคม คิดที่จะสรางเสนทางรถไฟฟาสาย
เหลือง-แดง จากทาพระจันทร-รังสิต โดยแตละทางเลือกมีขอมูล
ดังตาราง

BTS
Equilibrium:
เขาสูตลาด ออกจากตลาด
MRT

เขาสูตลาด -200 , -200 300 , 0 Payoff:

ออกจากตลาด 0 , 300 0,0

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร 12 อ.ลอยลม ประเสริฐศรี


15.4 Prisoners’ Dilemma

Prisoners’ Dilemma เปนเกมการตัดสินใจ


ที่อธิบายวาเหตุใดผูเลนจึงไมสามารถรวมมือ สารภาพผิด ปฏิเสธขอหา
กันได เปรียบเสมือนกลบางอยางที่ทำใหตอง
ตัดสินใจแบบหนีเสือปะจรเข

สารภาพผิด

8 ป 8 ป 0 ป 10 ป

ปฏิเสธขอหา

10 ป 0 ป 1 ป 1 ป
ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร 13 อ.ลอยลม ประเสริฐศรี

Prisoners’ Dilemma
ตัวอยางที่ 7: Prisoners’ Dilemma
สมมติวา นกสองตัวถูกหมูขโมยไข จึงตองหาวิธีแกแคน โดยเขาไป
ทำลายบานหมูดวยการระดมยิงหนังสะติ๊กระเปดใสบานหมู สุดทาย
ถูกเจาหนาที่จับไดจึงทำการสอบสวน เพื่อลงโทษตามกฎหมาย
สารภาพผิด ปฏิเสธขอหา
สารภาพผิด -8 , -8 0 , -10
ปฏิเสธขอหา -10 , 0 -1 , -1

Dominant Strategies Nash Equilibrium Maximin Strategies


ทั้งคูสารภาพผิด ทั้งคูสารภาพผิด ทั้งคูสารภาพผิด
ติดคุกรายละ 8 ป ติดคุกรายละ 8 ป ติดคุกรายละ 8 ป

Note: Pareto Efficient Solution คือ ดุลยภาพที่อยางนอยหนึ่งคนมีโอกาสดีขึ้น โดยที่อีกฝายไมแยลง


ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร 14 อ.ลอยลม ประเสริฐศรี
Prisoners’ Dilemma
ตัวอยางที่ 8: Prisoners’ Dilemma กับการอธิบาย Cartel
สมมติวา ประเทศผูสงออกขาวรายใหญของโลกสองประเทศ ประชุมเพื่อจะกำหนดโควตาการสงออกรวมกัน และ
จัดตั้งเปนกลุมผูสงออกขาวของโลก หรือ “OREC” ตัวอยางนี้จะอธิบายวาเหตุใดจึงมักมีการโกงในการทำ Cartel

ประเทศที่ 2
มากกวาโควตา ตามโควตา
ประเทศที่ 1

มากกวาโควตา 5,5 50 , -25


ตามโควตา -25 , 50 25 , 25

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร 15 อ.ลอยลม ประเสริฐศรี

15.5 เกมแบบผลัดกันเลน

Definition: เกมแบบผลัดกันเลน (Sequential Game) เปนเกมที่มีผูเลนฝายใดฝายหนึ่งไดโอกาส


เริ่มตนเลนเกมกอนโดยเสนอกลยุทธของตนเอง จากนั้นอีกฝายจะเลือกกลยุทธในภายหลังวาจะตัดสิน
ใจเชนไรภายใตขอเสนอที่ไดรับ
ชวงเวลาที่ 1 ชวงเวลาที่ 2 ชวงเวลาที่ 3
timing
Player 1 Player 2 Player 1 ...

เกมแบบผลัดกันเลน มีขอสังเกต ดังนี้


ผูที่เริ่มตนเลนเกมกอนไดเปรียบ เชน บริษัทที่ออก
ผลิตภัณฑกอนมักไดเปรียบ หรือ เกมแบบ Stackelberg ที่
บริษัทซึ่งผลิตกอนไดเปรียบ และผลิตเปนจำนวนมาก
การหาดุลยภาพของเกม ใชวิธี Backward Induction
ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร 16 อ.ลอยลม ประเสริฐศรี
การหาดุลยภาพของเกมแบบผลัดกันเลน
ตัวอยางที่ 9: การปองกันการเขาสูตลาด (Entry Deterrence)
ในการแขงขันเชิงธุรกิจ ผูที่เปนเจาเดิม (incumbent firm) อาจ
ปองกันการเขาตลาด โดยทำใหเจาใหมเชื่อวา การเขามานั้นไมมีกำไร
0 , 10
สูง
เจาเกา ราคา

ไมเขา ราคาต่ำ 0,5


เจาใหม

สูง 2,5
เขา ราคา

ราคาต่ำ
Payoff to: เจาใหม , เจาเกา -2 , 4
ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร 17 อ.ลอยลม ประเสริฐศรี

การหาดุลยภาพของเกมแบบผลัดกันเลน
ตัวอยางที่ 10: การปองกันการเขาสูตลาด (Entry Deterrence)
ในกรณีนี้ ตางจากตัวอยางที่ 9 คือ ไมใชขูดวยวาจาเพียงอยางเดียว
แตยังลงทุนเพิ่มดวย ทำให Payoffs เปลี่ยนแปลงไป กอนการลงทุน หลังการลงทุน
0 , 10 0,7
สูง
เจาเกา ราคา

ไมเขา ราคาต่ำ 0,5


เจาใหม 0,4

สูง 2,5 2,2


เขา ราคา

ราคาต่ำ
Payoff to: เจาใหม , เจาเกา -2 , 4 -2 , 3
ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร 18 อ.ลอยลม ประเสริฐศรี
Game Theory: Movie Recommendations

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร 19 อ.ลอยลม ประเสริฐศรี

You might also like