You are on page 1of 62

Probability and Statistics

သတိ: စာကိမ
ု ကျက်ပါနှင။့်
နားလည်အောင်ဖတ်ပပီးစဉ်းစားပါ။
Will you Gamble or Risk?
ကျွန်အတာ်တို ့ အမးေွန်းတစ်ေုနဲ ့ စရအောင်ပါ။
ဘယ်ဟာကို အရွးမလဲ။

ေီ 2 ေုမှာ ဆိုရင် ဘာကို အရွးမလဲ။ ေီ 2 ေုဘာကွာတာလဲ


ဆိုရင် ဘယ်လို အပဖမလဲ။

ေမှန်အတာ့ ပထမ တစ်ေုမှာ ကျွန်အတာ်တို ့က ဘာကို


သိလဲလို ့ဆိုရင် Probability ကို ကကိုသိပါသည်။
ေင်ဗျား အသဖို ့သည် 6 ပုံ တစ်ပုံ ပဖစ်ပပီး အေါ်လာ 1
သန်းရဖို ့ သည် 5 ပုံ 6 ပုံ ပဖစ်သည်။ ပိုပပီး ေအရးကကီးတာ
ေီ Probability ကို ေင်ဗျား ပပင်လို ့မရ။ Fixed
Probability ပဖစ်သည်။ ဘယ်လိုပဲ
8 ထပ်တိုက် 2 ေုကကားက အပ 40 အလာက်အေးသည်။
ကကိုးစားကကိုးစား အသဖို ့သည် 6 ပုံ တစ်ပုံ ပဖစ်ပပီး တိုက် 2 ေုရဲ ့ အေါင်မိုးများကို လက် 3 လုးံ အလာက် ရှိတဲ့
အေါ်လာ 1 သန်းရဖို ့ သည် 5 ပုံ 6 ပုံ ပဖစ်သည်။ သံမဏိအေျာင်းနဲ ့ ဆက်ထားသည်။ တစ်ဖက်အေါင်မိုးမှ
ေပေားတစ်ဖက်သို ့ သံမဏိအေျာင်းအပါ်ကအန
ေုတိယ တစ်ေုက ကျွန်အတာ်တို ့ Probability ကို ကူးသွားရမယ် ဆိုပါအတာ့။ ပပီးရင် ေါကို အလ့ကျင့်ဖို ့ 6
Russian Roulette လို ့ အေါ်တဲ့
ကကိုမသိပါဘူး။ ေင်ဗျား ပပုတ်ကျဖို ့ Probability လ ေေျိန်အပးမည် ဆိုပါအတာ့။ ပပုတ်မကျဘဲ
Game တစ်ေု ရှိပါသည်။ Revolver
(အပောက်လုံးပပူး) ထဲကို ကျည်ဆန် ဘယ်အလာက်ရှိလဲ ကကိုမသိပါဘူး။ ပိုေအရးကကီးတာက ေီ အရာက်အောင် ကူးသွားနိင ု ်ရင် အေါ်လာ 1
တစ်အတာင့် ထည့်ထားမည်။ ပပီးရင် Probability ကို ေင်ဗျား ပပင်လို ့ ရသည်။ သန်းရမယ်ဆိုပါအတာ့။ ပပုတ်ကျသွားရင်အတာ့...
ဆုံလည်ကို လှည့်လက ို ်ပပီး အလ့ကျင့်ဖို ့ 6 လ ရှိသည့် ေတွက် ေင်ဗျား ကကိုးစားရင်
ကိုယ့်အေါင်းကို ကိုယ် ပပန်ပစ်မည် ကကိုးစားသလို ပပုတ်ကျဖို ့ နည်းသွားမှာ ပဖစ်သည်။
ဆိုပါအတာ့။ ကျည်မထွက်လာရင်
အေါ်လာ 1 သန်းရမယ်ဆိုပါအတာ့။ ပထမ ေမျိုးေစားကို Gamble (ေအလာင်းေစား)
ကျည်ထွက်လာရင်အတာ့... ဟုအေါ်ပပီး ေုတိယ ေမျိုးေစားကို Risk (စွန် ့စားမှု)
ဟုအေါ်သည်။
Non Deterministic Causality
• Risk ပဲ ပဖစ်ပဖစ်၊ Gamble ပဲ ပဖစ်ပဖစ် Result ကို ကျွန်အတာ်တို ့ ကကိုမသိပါဘူး။ ေိအေေိေ
မအပပာနိုင်ပါဘူး။

• ေီလို ေိအေေိေ မအပပာနိုင်တဲ့ အကကာင်းကျိုး ဆက်စပ်မှုကို Non Deterministic Causality


ဟု အေါ်ပါသည်။

• ကျွန်အတာ်တို ့ Calculus သည် Deterministic Causality နှင့် Deterministic


Change ကို အလ့လာအသာ သေချာပညာ ပဖစ်သည် လို ့ အပပာေဲ့ပါသည်။

• ေီတစ်ေါအတာ့ Non Deterministic Causality ကို အလ့လာအသာ သေချာပညာ


ေအကကာင်းကို အဆွးအနွးကကပါမည်။

• ေါကို Mathematics of Chance လို ့ အေါ်မည်ဆိုလည်း အေါ်နိုင်ပါသည်။

• ေီ သေချာပညာ သည် Probability နှင့် Statistics ပဖစ်သည်။


Population and Sample
• Population သည် State Space တစ်ေု ပဖစ်သည်။ ဆိုလိုသည်က A Set of All (Complete)
States ကို ဆိုလိုတာ ပဖစ်သည်။ A Set of All Numbers ဆိုရင်လဲ ဂဏန်းေားလုံးကို ဆိုလိုတာ
ပဖစ်သည်။

• ပမန်မာပပည်၏ လူဦးအရဆိုလျှင် ဗိုက်ထဲက ကအလးမှ စ၍ အသလုနီးပါး လူနာများ ေထိ ပါသည်။

• ေမှန်အတာ့ Population တစ်ေုလုံးကို ဘယ်သူမှ မသိပါ။ ေါသည် Theoretical Assumption


တစ်ေု ပဖစ်သည်။

• Coin တစ်ေုကုိ အေါင်းပန်း လှန်ရင်အတာင် အေါင်လိုက်ကျ နိင


ု ်အသးသည်။ ပဖစ်ဖို ့အတာ့ ေင်မတန်နည်းသည်၊
ေါအပ့မယ် ပဖစ်နုင
ိ ်သည်။

• ထို ့အကကာင့် ပမန်မာပပည်၏ လူဦးအရဆိုလျှင် ရှိသမျှ လူေားလုံးမဟုတ်အတာ့ဘဲ စစ်တမ်းအကာက်နင


ို ်အသာ
လူဦးအရကို သာဆိုလိုပါသည်။

• ထို ့ေတူ အေါင်းပန်းလှန်ရင်လဲ အေါင်းနှင့် ပန်းကိုသာ စဉ်းစားသည်။ အေါင်ကျပေင်းကို ထည့်မအပပာအတာ့။

• ေါကို Sample Space ဟုအေါ်သည်။ Sample Space သည် A Set of All Possible
(Observable) States ကို အပပာတာပဖစ်သည်။
Sampling
• Population တစ်ေလ ု ုံးကို ဘယ်သူမှ မသိနိုင်သည့် ေတွက် Population မှ Sample များကို
ရယူပေင်းသည် ေအရးကကီးပါသည်။ ေါကို Sampling (စစ်တမ်းအကာက်ပေင်း) ဟုအေါ်သည်။

• Sampling လုပ်အသာ နည်းမျိုးစုရ


ံ ှိပါသည်။

• Random Sampling သည် Population မှ Sample များကို Randomly စစ်တမ်းအကာက်ပေင်း


ပဖစ်သည်။ ဥပမာ၊ ေမျိုးသား၊ ေမျိုးသမီးဦးအရကို သိေျင်ပါက လမ်းအပါ်မှာ လူများကို Randomly
စစ်တမ်းအကာက်ပေင်း ပဖစ်သည်။

• Random Sampling မှာ ေားနည်းေျက်က Bias ရှိနုင ိ ်ပါသည်။ ဥပမာ၊ အကာ်ဖီအသာက်သူများကို


စစ်တမ်းအကာက်မည်ဆိုပါအတာ့။ ေါဆိုရင် လူဦးအရ 1000 ရှိအသာ ပမို ့အလးတစ်ပမို ့မှာ လူ 100
စစ်တမ်းအကာက်သည် ဆိုပါအတာ့။ သို ့အသာ် လူဦးအရ 100,000 ပမို ့ကကီးတစ်ပမို ့မှာ လူ 100 ပဲ
စစ်တမ်းအကာက်လို ့ မရအတာ့။ ေနည်ဆုံး လူ 10,000 ကို စစ်တမ်းအကာက်မှ ရသည်။ ေါကို Systematic
Sampling ဟု အေါ်သည်။

• စစ်တမ်းအကာက်ပေင်း (Sampling) လုပ်ပေင်းမှ Data (Sample) များကို ရရှိလာပါသည်။


Continuous and Discrete Data
• Sample Data များသည် Continuous သို ့မဟုတ် Discrete Data များပဖစ်နုင
ိ ်ပါသည်။

• ေအလးေျိန်၊ ေရပ် စသည်တို ့သည် Continuous Data များပဖစ်ကကပပီး လူဦးအရ၊ မိသားစုဦးအရတို ့သည်
Discrete Data များပဖစ်ကကသည်။

• Continuous Data = {0.001, 0.0011, 0.0012, 0.0013, …}

• Discrete Data = {2, 3, 4, 5, 6, … }

• ကျွန်အတာ်တို ့ ေီ Data များကို ဘာလုပ်ကကမည်လဲ။

• ကျွန်အတာ်တို ့သည် ေများေားပဖင့် Data များကို ေမျိုးေစားေွဲပေင်း (Classification)၊


ေလယ်ညွှန်းကိန်းများ ရှာပေင်း (Central Tendency)၊ အသွဖယ်ပေင်း (Variation)နှင့် ပျံ ့နှံ ့ပေင်း
(Distribution)များကို ရှာပေင်း၊ ကကိမ်နှုန်းများ (Frequency)ကို ရှာပေင်း၊ ပုံမမှန်ပေင်း
(Outliers) များကို ရှာပေင်း တို ့ကို ပပုလုပ်ကကပါသည်။

• ေီလို Data များ ေအပါ် လုပ်အဆာင်အသာ သေချာနည်းစနစ်များကို Statistics ဟုအေါ်ပါသည်။


Classification
• ပမို ့တစ်ပမို ့ရှိ လူဦးအရ၏ ေသက်များ ဆိုပါအတာ့။ ကျွန်အတာ်တို ့ လူ 41 ကို Random Sample လုပ်ထားသည်
ဆိုပါအတာ့။

Age = [2, 3, 4, 5, 3, 2, 1, 1, 4, 15, 14, 14, 14, 13, 12, 18, 18, 19,
20, 20, 23, 21, 24, 30, 32, 34, 36, 32, 33, 41, 40, 42, 35, 50, 65, 54,
61, 73, 34, 63, 100]

• ကျွန်အတာ်တို ့ ေသက်များကို ေီေတိုင်းထားမည့်ေစား Class (Group) များလုပ်ပပီး


Classification လုပ်လို ့ရပါသည်။

Age 1 – 10 : 1, 1, 2, 2, 3, 4, 4, 5
Age 10 – 20 : 12, 13, 14, 14, 14, 15, 18, 18, 19, 20, 20
Age 20 – 30 : 21, 23, 24, 30
Age 30 – 40 : 32, 32, 33, 34, 34, 35, 36, 40
Age 40 – 50 : 41, 42, 50
Age > 50 : 54, 61, 63, 65, 73, 100
Central Tendency
• ပပီးရင် Central Tendency ကို ကကည့်ရအောင်ပါ။ Central Tendency ကို Mean (Average),
Median, Mode တို ့ပဖင့် အဖာ်ပပပါသည်။

Age = [2, 3, 4, 5, 3, 2, 1, 1, 4, 15, 14, 14, 14, 13, 12, 18, 18, 19,
20, 20, 23, 21, 24, 30, 32, 34, 36, 32, 33, 41, 40, 42, 35, 50, 65, 54,
61, 73, 34, 63, 100]

• Sample Data ၏ Average ကို Sample Mean ဟုအေါ်ပပီး ေါကို ပဖင့်အဖာ်ပပပါသည်။


• Data များကို Sort by Ascending လုပ်ပပီး ရရှိလာအသာ ေလယ်ကိနး် ကို Median ဟုအေါ်ပါသည်။
ေလယ်ကိန်းက 2 ေုဆိုပါက အပါင်ပပီး 2 ပဖင့် စားပါသည်။
• ေကကိမေ
် အရေတွက် ေများဆုံးရှိအသာ Sample ကို Mode ဟုအေါ်ပါသည်။

Mean = = 28.5

Median = 23

Mode = 14
More Central Tendency
• Central Tendency သည် Similar Samples from Different Population များကို
Compare လုပ်ရာမှာ ေင်မတန် ေသုံးေင်ပါသည်။

• ဥပမာ၊ သေချာေတန်း 2 တန်းဆိုပါအတာ့။ ပထမ ေတန်းမှာ သေချာ 100 ရသူ 2 အယာက်၊ 80 ေထက် 3၊
ကျန်သူက 70 ရသည် ဆိုပါအတာ့။ ေုတိယ ေတန်းမှာလည်း သေချာ 100 ရသူ 2 အယာက်၊ 80 ေထက် 3
အယာက်၊ ကျန်သူက 70 ရသည် ဆိုပါအတာ့။

• ေါဆိုရင် ေတန်း 2 တန်းလုံး ေတူတူ အတာ်တယ်လို ့ အပပာလို ့ရမလား။ ေမှန်အတာ့ မအပပာနိုင်ပါ။

• တကယ်လို ့ ပထမေတန်း အကျာင်းသား၊ အကျာင်းသူ 10 အယာက်ရှိပပီး ေုတိယေတန်းက အကျာင်းသား၊


အကျာင်းသူက 6 အယာက်ဆိုရင် ေုတိယေတန်း ပိုအတာ်တယ်လို ့ အပပာလို ့ရသည်။

• ပထမေတန်းရဲ Sample Mean က 79 ပဖစ်ပပီး ေုတိယေတန်းရဲ Sample Mean က 85 ပဖစ်သည်။

• ထို ့အကကာင့် Similar Samples from Different Population များကို Compare လုပ်ရာမှာ
Central Tendency ကို သုံးပါသည်။

• Sample Mean သည် Sample Set တစ်ေ၏


ု Center ကို အဖာ်ပပသည်။
Variation
• Variation သည် Central Tendency မှ ေကွာေအေး (Distance)ကို တိုင်းတာပေင်း ပဖစ်သည်။

Square Distance = (y – x)2

Square Distance from Center =

Variance = Average Square Distance from Center =

Standard Deviation = Average Distance from Center =

• ဆိုလိုသည်က Sample Mean သည် Sample Set တစ်ေ၏ ု Center တစ်ေဆ ု ိုပါက Data များသည်
Center မှ ဘယ်အလာက် ေကွားေအေးတွင် ရှိကကသည်ကို Variation ပဖင့် အဖာ်ပပနိုင်သည်။
Mean and Variation
• Sample Mean သည် Sample Set တစ်ေ၏ ု Center တစ်ေဆ ု ိုပါက Data များသည် Center မှ
ဘယ်အလာက် ေကွားေအေးတွင် ရှိကကသည်ကို Variation ပဖင့် အဖာ်ပပနိင
ု ်သည်။

• Circle တစ်ေုကုိ Center နှင့် Radius ပဖင့် အဖာ်ပပနိုင်သလို Data များကိလ


ု ည်း Mean နှင့်
Variation ပဖင့် အဖာ်ပပလို ့ ရသည်။

Mean

Variation

Data
Frequency
• Frequency (ကကိမ်နှုန်း)သည် Sample Set တစ်ေတ
ု ွင် Sample Data များ ဘယ်နှကကိမ် ပါေင်သည်ကို
တိုင်းတာသည်။

Age = [2, 3, 4, 5, 3, 2, 1, 1, 4, 15, 14, 14, 14, 13, 12, 18, 18, 19,
20, 20, 23, 21, 24, 30, 32, 34, 36, 32, 33, 41, 40, 42, 35, 50, 65, 54,
61, 73, 34, 63, 100]

• Relative Frequency က Frequency ကို Total Number of Sample ပဖင့်စားထားပေင်း


ပဖစ်သည်။

Relative Frequency =

• Cumulative Frequency က Relative Frequency များကို အပါင်းထားပေင်း ပဖစ်သည်။

• Sample Mean ကို Frequency မှလည်း ရှာနိုငပ


် ါသည်။

Mean =
Frequency Distribution
• Frequency နှင့် Age ကို Plot လုပ်ပေင်းပဖင့် Frequency Diagram ကို ရရှိပါသည်။ ထို Diagram
သည် Sample Set ၏ Distribution ကို ကိုယ်စားပပုပါသည်။

Age = [2, 3, 4, 5, 3, 2, 1, 1, 4, 15, 14, 14, 14, 13, 12, 18, 18, 19,
20, 20, 23, 21, 24, 30, 32, 34, 36, 32, 33, 41, 40, 42, 35, 50, 65, 54,
61, 73, 34, 63, 100]

3.5
3
2.5
2
1.5
1
0.5
0
Age
Outliers
• Age 100 သည် Outlier တစ်ေု ပဖစ်သည်။ Frequency Diagram မှာ ကကည့်ရင် Age 100 သည်
Sample ေများစုနင
ှ ့် ေအေးမှာ ရှိအနသည်။

Age = [2, 3, 4, 5, 3, 2, 1, 1, 4, 15, 14, 14, 14, 13, 12, 18, 18, 19,
20, 20, 23, 21, 24, 30, 32, 34, 36, 32, 33, 41, 40, 42, 35, 50, 65, 54,
61, 73, 34, 63, 100]

3.5
3
2.5
2
1.5
1
0.5
0
Age Outlier
Statistics Summary
• ေေုထိ အပပာပပီး အပပာပပီးတာသည် Basic Statistics ပဖစ်သည်။

• ေေုအေတ်ကကီးမှာ Facebook Analytics တို ့၊ Google Analytics တို ့ အေတ်စားလာကကပပီး


ကိယ
ု ့်ပစ္စည်း သို ့မဟုတ် ကိုယ့် Page ကိကု ကည့်သူအတွ၊ ေယ်သူအတွကုိ Analyze လုပ်လို ့ ရလာပါသည်။

• ဥပမာ၊ ကကည့်သူအတွရဲ ့ Age သို ့မဟုတ် Location ရဲ ့ Central Tendency ကို ရှာပေင်းပဖင့်
ပုံမှန်ေင်ကကည့်သူအတွက ေသက်ဘယ်အလာက်ရှိလဲ၊ ဘယ်က ကကည့်တာများလဲ။ Outliers အတွက
ဘယ်သူအတွပဖစ်မလဲ။

• ထို ့အကကာင့် Statistics သည် ေင်မတန် ေသုံးေင်ပါသည်။


Probability Space
• Probability Space ကို Sample Space (Ω)၊ Random Events (F) နှင့်
Probability Measure (P) တို ့ပဖင့် အဖာ်ပပပါသည်။

• Sample Space (Ω) သည် A Set of Possible (Observable) Outcomes


ပဖစ်ပါသည်။ Sample Space သည် Population ရဲ ့ Subset တစ်ေု ပဖစ်သည်။

• Random Event သည် Repeat လုပ်နိုင်အသာ Experiment (Trial) တစ်ေု၏


Outcome ပဖစ်သည်။ ဥပမာ၊ အေါင်းပန်းလှန်ပေင်းသည် Experiment တစ်ေုပဖစ်ပပီး
ထပ်ေါထပ်ေါ Repeat လုပ်နိုင်သည်။ အေါင်းကျပေင်း၊ ပန်းကျပေင်းတို ့သည် Random Event
ပဖစ်သည်။ Experiment ၏ Outcome ပဖစ်အသာ Random Events (F) များသည်
Sample Space (Ω) ၏ Subset ပဖစ်သည်။

• Probability Measure က Random Event တစ်ေုစီ၏ Probability ကို အဖာ်ပပ


(Assign လုပ) ် သည်။ Probability Measure တစ်ေုသည် လုံးေ မပဖစ်နိုင်ပေင်း (0) နှင့်
လုံးေပဖစ်နိုင်ပေင်း (1) တို ့ကကား မှာရှိသည်။

• Probability Measure ကို Experimental Estimation သို ့မဟုတ်


Theoretical Estimation တို ့နှင့် Assign လုပ်နိုင်သည်။
Experimental Estimation of Probability
• အေါင်းပန်းလှန်ရင် တကယ်အတာ့ ဘာကျမလဲ ဘယ်သူမှ အသေျာမသိ။ အေါင်းကျမည်၊ ပန်းကျမည်၊
အေါင်လိုက်ကျမည်၊ ေဂခါး 2 ပေမ်းလည်းကွဲသွားနိုင်သည်။ ပဖစ်နိုင်အသာ ေရာေားလုံးသည်
Population ပဖစ်သည်။ ထိုေထဲမှ စိတ်ေင်စားအသာ ပဖစ်နိုင်အေျများသည် Sample Space
ပဖစ်သည်။ အေါင်းကျပေင်းနှင့် ပန်းကျပေင်း။

• Experimental Estimation မှာ Sample Space နှင့် Population တို ့ မတူဟု


ယူဆထားသည်။

• ထို ့အကကာင့် အေါင်းကျပေင်း၊ ပန်းကျပေင်းသည် ေီေတိုင်း စဉ်းစားလို ့ မရအတာ့။ အေါင်းပန်း


လှန်ကကည့်ရမည်။ ေါကို Experiment (Trial) ဟုအေါ်သည်။ Experiment တစ်ေု၏
Outcome သည် Random Event တစ်ေု ပဖစ်သည်။ Random Event သည် Sample
Space ၏ Subset တစ်ေု ပဖစ်သည်။

• Random Event တစ်ေုမှာ Probability Measure တစ်ေု ရှိသည်။ ဥပမာ၊ အေါင်းပန်း 10


ကကိမ်မှာ အေါင်းကျပေင်း P(H) သည် 0.43234 ပဖစ်သည်။

• Random Event တစ်ေု၏ Probability Measure by Experimental


Estimation သည် လက်အတွ ့ လုပ်အဆာင်ပေင်းမှ ရရှိလာသည်။
Theoretical Estimation of Probability
• Theoretical Estimation မှာ Sample Space နှင့် Population တို ့ တူသည် ဟု
ယူဆထားသည်။

• ထို ့အကကာင့် အေါင်းကျပေင်း၊ ပန်းကျပေင်း စသည့် Random Event ၏ Probability


Measure ကို Estimate လုပ်ရတာ လွယ်ကူသွားသည်။ ဥပမာ၊ P(H) သည် 0.5 ပဖစ်သည်။

• Random Event တစ်ေု၏ Probability Measure by Theoretical


Estimation သည် Theoretical Assumption တစ်ေုသာ ပဖစ်သည်။

• လက်အတွ ့မှာ အေါင်းကျပေင်း၏ Probability P(H) သည် 0.5 ေတိေကျ မဟုတ်နိုင်။


ဥပမာ၊ အေါင်းပန်း 2 ေါလုပ်လို ့ ပထမတစ်ေါ အေါင်းကျပပီး ေုတိယ ပန်းကျမည်လို ့ မအပပာနိုင်။

• သို ့အသာ် တွက်ေျက်ရလွယ်အောင် Random Event တစ်ေု၏ Probability Measure by


Theoretical Estimation ကို ကျွန်အတာ်တို ့ အလာအလာဆယ် စဉ်းစားပါမည်။

• ထို ့အကကာင့် Probability ဟုအပပာလျှင် Probability Measure by Theoretical


Estimation ကို ဆိုလိုပါသည်။ Theoretical Estimation နှင့် Experimental
Estimation တို ့ ဆက်စပ်မှုကို အနာက်ပိုင်း အဆွးအနွးပါမည်။
Probability
• ကျွန်အတာ်တို ့ ငယ်ငယ်တုံးက Probability ကို ေီလို define လုပ်ေဲ့ပါသည်။

• အေါင်းပန်းလှန်ရင် A set of possible outcomes = {H, T}၊ A set of favorable outcomes = {H}။
ေါအကကာင့် P(H) = 1 / 2 = 0.5 လို ့ တွက်ေဲ့ကကပါသည်။

• ေါဆိုရင် မနက်ပဖန် မိုးရွာမလား ဆိုပါအတာ့။ A set of possible outcomes = {Rain, No Rain}၊ A set of
favorable outcomes = {Rain}။ ေါအကကာင့် P(Rain) = 1 / 2 = 0.5 ။ ေါအကကာင့် မနက်မိုးရွာနိုင်အပေ 50
ရာေိုင်နှုန်း ရှိသည်ဆိုရင် မှန်မလား။

• ေီေေျက် ေင်မတန် ေအရးကကီးပါသည်။ ေမှန်က Probability ကို ရရှိတာသည် Probability Distribution


က ရရှိတာ ပဖစ်ပါသည်။ ေါအကကာင့် ေထက်ပါ Formula သည် Uniform Probability Distribution ေတွက်ပဲ
မှန်ပါသည်။

• Uniform Probability Distribution မှာ Sample Space ရှိ Sample များသည် ပဖစ်နိုင်အပေေတူတူ
(Equally Likely) ပဖစ်လို ့ ပဖစ်သည်။ ေပေား Probability Distribution များ သည် Equally Likely
မပဖစ်ပါ။ ေါအကကာင့် မိုးရွာပေင်း၊ မရွာပေင်းသည် Uniform Probability Distribution မဟုတ်ပါ။

• ေီေေျက်က ေင်မတန် ေအရးကကီးပါသည်။ ေါကို မသိရင် ေလိမ်ေံရနိုင်သည်။ ေါအကကာင့် Probability လို ့ အပပာရင်
Equally Likely နှင့် Probability Distribution ကို စဉ်းစားဖို ့ လိုေပ်သည်။
Probability
• ထို ့အကကာင့် Sample Space ( A set of possible outcomes) ေတွင်းရှိ Sample များသည် ပဖစ်နိုင်အပေေတူတူ
(Equally Likely) ပဖစ်မှသာလျှင်

• ေီေတွက် Condition 2 ေု ရှရ


ိ ပါသည်။
– (၁) Sample Space (A set of possible outcomes) ကို သိရပါမည်။
– (၂) Sample Space ေတွင်းရှိ Sample များသည် ပဖစ်နိုင်အပေေတူတူ (Equally Likely) ပဖစ်ရပါမည်။

“If we knew Lady Luck better, Las Vegas would still be a road-stop in
the desert.”

-Stephen Jay Gould


Expectation
• Probability Measure ကို Experimental Estimation သို ့မဟုတ် Theoretical Estimation တို ့နှင့်
Assign လုပ်နိုင်သည်လို ့ ကျွန်အတာ်တို ့ အပပာေဲ့ပါသည်။

• ေမှန်အတာ့ Statistics သည် Empirical (Experimental) Framework (ေထူးသပဖင့် Sample Space)


ကို ေဓိကထားတာ ပဖစ်ပပီး Probability က Theoretical Framework (Sample Space and
Population) ကို ေဓိက ထားတာ ပဖစ်သည်။

• ထို ့အကကာင့် Statistics နှင့် Probability တို ့သည် ဆက်စပ်လျက် ရှိသည်။

• Statistics ရှိ Relative Frequency သည် Probability Measure by Experimental


Estimation သို ့မဟုတ် Empirical Probability ပဖစ်သည်။

• ထိုနည်းတူ Statistics ရှိ Mean (Average) သည် Probability ေရ Expected Value ပဖစ်လာသည်။

Expectation = E(x) =
Exclusivity
• Random Event များသည် တစ်ေု ပဖစ်လျှင် တစ်ေု ပဖစ်လို ့မရပါက ထို Random Event များကို Exclusive
(Mutually Exclusive) ပဖစ်သည်ဟု အေါ်သည်။

• Random Event များသည် Exclusive မပဖစ်ပါက Inclusive ပဖစ်ကကသည်။

A B A B

Inclusive Exclusive
Dependency
• Random Event တစ်ေု၏ Probability Measure သည် ေပေား Random Event တစ်ေု ေအပါ်မူတည်ပါက
Random Event များသည် Dependent ပဖစ်ကကသည်။

• Random Event များသည် Dependent မပဖစ်ပါက Independent ပဖစ်ကကသည်။

A B A B

Dependent Independent

Dependency = P(B/A) = Probability of B given A


Operations of Random Events
Operations Exclusive Inclusive
P(A) ꓴ P(B) P(A) + P(B) P(A) + P(B) – P(AB)
P(A) ꓴ P(B) P(AB) = 0 P(A) . P(B)
P(A’) 1 – P(A) 1 – P(A)
P(A) – P(B) P(A) – P(B) P(A) – P(AB)

Operations Dependent Independent


P(A) ꓴ P(B) P(A | B) . P(B) = P(B | A). P(A) P(A). P(B) = P(AB)
P(A’) 1 – P(A) 1 – P(A)
P(A | B) P(AB) / P(B) P(A)
P(B) P(B | A)P(A) + P(B | A’)P(A’) P(B)
Bayes’ Theorem
• Random Event တစ်ေု၏ Probability Measure သည် ေပေား Random Event တစ်ေု ေအပါ်မူတည်ပါက
Random Event များသည် Dependent ပဖစ်ကကသည်။

P(A | B) =

• Bayes’ Theorem ကို ေီက ရပါသည်။

P(A) ꓴ P(B) = P(A | B)P(B) = P(B | A)P(A)

• Bayes Rule သည် ကျွန်အတာ်တို ့ အနာက်ပိုင်းမှာ Statistical Machine Learning ေတွက် ေင်မတန်
ေအရးကကီးအသာ ေအပေေံ ပဖစ်ပါသည်။
Discriminative and Generative Model
• Discriminative နှင့် Generative Model သည် Statistical Machine Learning မှာ ေသုံများပါသည်။

• Discriminative Model ေရ Statistical Data များမှ ကျွန်အတာ်တို ့က Joint Probability P(X, Y)


နှင့် Priori Probability P(X) ကို သိပါသည်။ ေါကို ေအပေပပုပပီး P(Y | X) ကို Bayes Rule အပါ် ေအပေေံပပီး
ပပန်တွက်ပေင်း ပဖစ်သည်။

P(Y | X) =

• Generative Model ေရ Statistical Data များမှ ကျွန်အတာ်တို ့က Marginal Probability P(Y) နှင့်
Posterior Probability P(X |Y) ကို သိပါသည်။ ေါကို ေအပေပပုပပီး Joint Probability P(Y, X) ကို
ပပန်တွက်ပေင်း ပဖစ်သည်။

P(Y, X) = P(Y) P(X | Y)


Example
• ကျွန်အတာ်တို ့ မီးပွိုင့်မှာ ကားတိုက်ေံရပေင်း ေအကကာင်းကို စဉ်းစားရအောင်ပါ။ ကျွန်အတာ်တို ့မှာ P(H) = Probability of
being hit by a car နှင့် P(L) = Probability of traffic light တို ့ ရှိပါသည်။

• P(L) ၏ Sample Space သည် {R, Y, G } ပဖစ်ပပီး သူရဲ့ Probability ကို ကကိုသိပါသည်။ ေါအကကာင့် P(L) သည်
Priori Probability (ကကိုသိထားအသာ Probability) ပဖစ်သည်။ သို ့အသာ် P(H) ကို ကျွန်အတာ်တို ့ မသိပါ။
ထို ့အကကာင့် P(H) သည် Marginal Probability ပဖစ်သည်။ လိုေျင်တဲ့ Probability ပဖစ်သည်။

P(L = R) = 0.2, P(L = Y) = 0.1, P(L = G) = 0.7

• ကျွန်အတာ်တို ့ မီးနီ၊ မီးေါ၊ မီးစိမ်းေျိန်မှာ ကားတိုက်ေံရပေင်းကို အဖာ်ပပအသာ Conditional Probability P(H | L )ကို
လည်း သိပါသည်။

Red (R) Yellow (Y) Green (G)

Not Hit 0.99 0.9 0.2

Hit 0.01 0.1 0.8


Example
• ေေု ကျွန်အတာ်တို ့က Priori Probability P(L) နှင့် Conditional Probability P(H | L)
တို ့အပါ်မူတည်ပပီး Joint Probability P(H, L) = P(HL) ကိုတွက်ကကည့်ပါမည်။

P(H, L) = P(H | L) P(L)

• အနာက်ဆုံးကျွန်အတာ်တို ့ Marginal Probability P(H) ကို ရရှိပါသည်။

Red (R) Yellow (Y) Green (G) P(H)

Not Hit 0.198 0.09 0.14 0.428

Hit 0.002 0.01 0.56 0.572

P(L) 0.2 0.1 0.7 1.0

• Marginal Probability P(H) ေအပါ်ေအပေေံပပီး Posterior Probability P(L | H) ကို တွက်ကကည့်လို ့


ရပါသည်။

P(L | H) =
Experimental and Theoretical Framework
• ကျွန်အတာ်တို ့ အေါင်းပန်းလှန်ပေင်း နှင့် မိုးရွာမရွာ ေန် ့မှန်းပေင်းမှ P(H), P(T) နှင့် P(Rain), P(No Rain) တို ့
မတူညီအကကာင်း သိေဲ့ပါသည်။

• ေေုေျိန်ထိ ကျွန်အတာ်တို ့ Probability ကို Probability ေအနပဖင့်သာ နားလည်ထားတာ ပဖစ်သည်။ ေါအပ့မယ်


Probability များသည် တစ်ေုနှင့် တစ်ေု မတူညီအကကာင်းအတာ့ ထိုက်သင့်သအလာက် သိလာပပီ ပဖစ်သည်။

• ထို ့အကကာင့် Probability များသည် တစ်ေုနှင့် တစ်ေု မတူညီအကကာင်းကို အလ့လာဖို ့ ေထူးလိုေပ်လာပါသည်။ ေါအကကာင့်
Probability များကို အလ့လာဖို ့ Theoretical Framework တစ်ေု ရှိဖို ့ လိုေပ်လာသည်။

• ထို Theoretical Framework ေရ ကျွန်အတာ်တို ့သည် Probability များကို Mathematical Function


များေအနပဖင့် အလ့လာကကဖို ့ ပဖစ်သည်။ Mathematical Function များ ေအနပဖင့် အလ့လာပေင်းသည် Function
များ၏ ကွဲပပားပုံကို ပိုပပီး နားလည်နိုင်ပါသည်။ ဥပမာ၊ y = sin(x) နှင့် z = x2 + 3x + 5 တို ့သည် Function များ
ပဖစ်ကကအသာ်လည်း တစ်ေုနှင့် တစ်ေု မတူပါ။

• ေါအကကာင့် Probability Function များကို ဘယ်လုိ သတ်မှတ်မလဲ။ Probability Function များသည်


တစ်ေုနှင့် တစ်ေု ဘာကွာလဲ။ ေါကို ဆက်လက် အဆွအနွးမှာ ပဖစ်သည်။
Random Variable
• ေလွယ်ဆုံးအပပာရင်အတာ့ Random Variable များသည် Probability Function တစ်ေု၏ Variable
များပဖစ်သည်လို ့ အပပာလို ့ ရပါသည်။ ဥပမာ၊ x သည် f(x)၏ variable တစ်ေု ပဖစ်သည် ဆိုသလို မျိုးအပါ့။

• သို ့အသာ် ေါကို ပိုပပီးအတာ့ Formal ပဖစ်အောင် Define လုပ်ဖို ့ လိုေပ်ပါသည်။ Variable လို ့ အပပာရင် ကျွန်အတာ်တို ့က
Domain ကို အပပာရမှာ ပဖစ်သည်။

• ပုံမှန်ေားပဖင့်အတာ့ Domain ကို Define လုပ်ရတာလွယ်သည်။ ဥပမာ၊ x သည် -400 နှင့် 400 ကကားရှိ Real Number
များပဖစ်သည်။

• သို ့အသာ် Probability မှာ ကကအတာ့ P(Head), P(Rain), P(No Rain), P(being hit by a car)။
ေါဆိုရင် Probability Function တစ်ေုရဲ ့ Domain က ဘာလဲ။

• ေါအကကာင့် Random Variable ကို Set တစ်ေု ေအနပဖင့် မယူဆအတာ့ဘဲ Measurable Function တစ်ေု
ေပဖစ်ယူဆပါသည်။

A random variable is understood as a measurable function defined on a


probability space that maps from the sample space to the real numbers.
More Random Variable
• တစ်နည်းေားပဖင့် Random Variable သည် Sample Space ကို Real Number (Continuous or
Discrete) Map လုပ်အပးအသာ Function တစ်ေု ပဖစ်ပပီး Probability Function တစ်ေု၏ Domain
လည်းပဖစ်သည်။

• Random Variable ကို “X” ပဖင့် Represent လုပ်ကကပါသည်။ P(X = 2) = 0.02 ။

Sample Random
Probability
Space Variable

Discrete or Continuous (Real Number)


Probability Distribution
• Probability Distribution ဆိုတာသည် Probability Function တစ်ေု ပဖစ်ပပီး Random Variable
များကို Input ယူပပီး Probability ကို Output ထုတ်အပးအသာ Function ပဖစ်သည်။

• Probability Distribution များသည် Continuous Function သို ့မဟုတ် Discrete Function


ပဖစ်နိုင်ပါသည်။

• ေန်စာတုံးအေါက်ပေင်း၏ Probability Distribution ကို ေီလို အဖာ်ပပနိုင်သည်။ ေန်စာတုံးအေါက်ပေင်း၏


Probability Distribution သည် Uniform Probability Distribution [ P(X) = 1/6]
ပဖစ်သည်။ Function ေအနပဖင့် အပပာရင် Constant Function ပဖစ်သည်လို ့ ဆိုလို ့ရနိုင်ပါသည်။)

P
1

1/6

0
1 2 3 4 5 6 X
Probability Distributions
• Uniform Probability Distribution သည် ေရိုးရှင်းဆုံးအသာ Probability Distribution ပဖစ်ပပီး
Constant Function တစ်ေုနှင့် ေလားတူပါသည်။ y = f(x) = constant; y = P(X) = constant ။

• ပိုပပီးရှုပ်အထွးအသာ Mathematical Function များရှိသလို ပိုပပီးရှုပ်အထွးအသာ Probability Distribution


များလည်းရှိပါသည်။

• ေသုံးများဆုံးက Distribution များက

– Uniform Distribution
– Bernoulli Distribution
– Normal (Gaussian) Distribution
– Binomial Distribution
– Poisson Distribution
– Exponential Distribution

• ေါအတွကို ကျွန်အတာ်တို ့ ဆက်ပပီး အဆွးအနွးပါမည်။


Probability Mass Function
• Probability Distribution ကို အဖာ်ပပကကအသာ်လည်
ေများေားပဖင့် Cumulative Probability P
Distribution ကို ပိုသုံးကကပါသည်။ Discrete
Cumulative Probability Distribution ကို 1
Probability Mass Function (PMF) ဟုအေါ်သည်။

PMF =
0
X
• Probability ကို PDF မှ တွက်လို ့ရပါသည်။

P(X = 2) =

• PMF သည် ေမှန်အတာ့ Area Under Probability


Distribution ပဖစ်ပပီး Total Area သည် ေပမဲ 1
ပဖစ်သည်။
Probability Density Function
• Continuous Cumulative Probability
Distribution ကို Probability Density P
Function (PDF) ဟုအေါ်သည်။
1

PDF =

0
• Probability ကို PDF မှ တွက်လို ့ရပါသည်။ a X
b

P(X = 2) =
Expectation of Random Variable
• Expectation သည် Probability Distribution တစ်ေု၏ Mean (Center) ပဖစ်သည်။

• For Discrete Probability Distribution

μ = E[x] =

Uniform Distribution
• For Continuous Probability Distribution

μ = E[x] =
Variance of Random Variable
• Variance သည် Probability Distribution တစ်ေု၏ Square Distance from Mean(Center)
ပဖစ်သည်။

• For Discrete Probability Distribution

σ2 = E[x - μ]2 =
Uniform Distribution

• For Continuous Probability Distribution

σ2 = E[x - μ]2 =
Moment of Random Variable
• Moment သည် Probability Distribution တစ်ေု၏ General Form ပဖစ်သည်။

• For Discrete Probability Distribution

E[x - c]n =
Uniform Distribution
• For Continuous Probability Distribution

E[x - c]n =

• တကယ်လို ့ n = 0 ဆိုရင် PDF သို ့မဟုတ် PMF ကို ရရှိမှာ ပဖစ်သည်။


• တကယ်လုိ ့ n = 1, c = 0 ဆိုရင် Expectation ကိုရရှိမှာ ပဖစ်သည်။
• တကယ်လုိ ့ n = 2, c = μ ဆိုရင် Variance ကို ရရှိမှာ ပဖစ်သည်။
Uniform Distribution
• ပထမဆုံး Probability Distribution P
ေများသိပပီးသား ပဖစ်အသာ Uniform Distribution
ပဖစ်ပါသည်။

• ကျွန်အတာ်တို ့ Continuous Version ေအနပဖင့်သာ


အဖာ်ပပပါမည်။ (Discrete Version လည်း ရှိပါသည်။)

• P(X) = k = constant ပဖစ်သည်။


0
• Uniform Distribution ရှိ Random Variable a b X
ေားလုံးသည် Same Probability ရှမ
ိ ည် ပဖစ်သည်။

E[X] = (b – a) / 2 PDF =

VAR[X] = (b – a)2 / 12
Bernoulli Distribution
• Bernoulli Distribution က Discrete
Distribution ပဖစ်ပါသည်။ Bernoulli
P
Distribution ကို ေထူးသပဖင့် Binary
Classification မှာ သုံးပါသည်။
1

p
• P(X = 1) = p, P(X=0) = q = 1 - p ပဖစ်သည်။ p နှင့်q
မတူဘူးလို ့ ယူဆထားသည်။ တူသွားရင် Uniform
Distribution ပဖစ်သွားမည်။ Bernoulli q=1-p
Distribution ရှိအသာ Experiment တစ်ေုကို
Bernoulli Process ဟု အေါ်သည်။ 0
1 0 X
• ဥပမာ၊ Email ကို Spam Mail ဟုတ်မဟုတ် Classify
လုပ်မည် ဆိုပါအတာ့။ P(X = spam) = p ဆိုရင် P(X = not
spam) = 1 – p ပဖစ်သည်။

E[X] = p PMF = pk (1 – p)1-k , k = 0,1

VAR[X] = pq = p(1 - p)
Permutation
• ဂဏန်း 4 လုံးရှိတ့ဲ PIN Code တစ်ေု ဆိုပါအတာ့။ ဂဏန်း တစ်လုံးေျင်းသည် 0 မှ 9 (Possible Numbers) ေတွင်း
ပဖစ်လို ့ရသည်။ ေါဆိုရင် ဂဏန်း 4 လုံး ေတွက် All Possible Outcomes သည်

P = nr , n = Possible Number, r = Length

• ဂဏန်း တစ်လုံးေျင်းသည် 0 မှ 9 ေတွင်း ပဖစ်လို ့ရသည်။ သို ့အသာ် ဂဏန်း 4 လုံးသည် တစ်ေု နှင့် တစ်ေု မတူရဘူး ဆိုပါအတာ့။
Uniform Distribution
ေါဆိုရင် ပထမဂဏန်းသည် 10 Possible Numbers၊ ေုတိယဂဏန်းသည် 9 Possible Numbers…

P = n(n - 1)(n - 2)… (n - r + 1) , n = Possible Number, r = Length

• ေါကို Factorial ပဖင့် ပပမည်ဆိုရင်

nP = , n = Possible Number, r = Length


r

• Permutation သည် Ordered Arrangement များေတွက် သုံးပါသည်။ Permutation (Arrangment) မှာ


Order က ေအရးကကီးပါသည်။
Combination
• ကျွန်အတာ်တို ့မှာ ေန်ထမ်းများ { A, B, C, D, E, F, G, H, Z} ရှိသည် ဆိုပါအတာ့။ ကျွန်အတာ်တို ့က သုံးအယာက်ကို
ေဖွဲ ့တစ်ဖွဲ ့ (Team or Group) ဖွဲ ့ေျင်သည်။ ပဖစ်နိုင်တဲ့ All Possible Groups or Teams သည် ဘယ်လုိ ပဖစ်မလဲ။

• Permutation ေရ ကျွန်အတာ်တို ့ (9 × 8 × 7) ရရှမ


ိ ှာ ပဖစ်ပါသည်။ သို ့အသာ် {A, B, C}, {B, C, A}, {B, A, C},
{C, A, B} တို ့သည် Order မတူအသာ်လည်း တစ်ဖွဲ ့ထဲပဖစ်သည်။

• ထို ့အကကာင့် Permutation မှ တစ်ဖွဲ ့ထဲ ပဖစ်နိုင်အသာ Arrangement များကို ပပန်ဖယ်ရမည်။ တစ်ဖွဲ ့ထဲ ပဖစ်နိုင်အသာ
Permutable Arrangement များသည် r! ပဖစ်သည်။
Uniform Distribution
R = r(r - 1)(r - 2) … (r – r + 1) , r = Member

• ထို ့အကကာင့် Combination သည် Permutation ကို r! ပဖင့် ပပန်စားထားပေင်းပဖစ်သည်။

nC = , n = Possible People, r = Member


r

• Combination သည် Group or Team များေတွက် သုံးပါသည်။ Combination (Grouping) မှာ Order က
ေအရးမကကီးပါ။
Bernoulli Process
• Experiment တစ်ေုသည် Bernoulli Distribution ရှိအသာ Bernoulli Process တစ်ေု ဆိုပါအတာ့။

• ေီ Experiment ကို N ေကကိမ် ထပ်ေါထပ်ေါ လုပ်အဆာင်ကကည့်မည်။ ေါဆိုရင် N ေကကိမ်ထဲမှာမှ ဘယ်နှကကိမ်သည် p [P(X =


1) = p] ရမလဲ။

• ပဖစ်နိုင်အသာ Random Event များက {p, p, q, q, p, p, …}, {q, q, p, p, p,…} စသည်ပဖင့်အပါ့။ Random
Event များသည် p နှင့် q တို ့၏ Combination များ ပဖစ်ကကသည်။


Uniform Distribution
ေမှန်အတာ့ Bernoulli Process ကို N ေကကိမ် ထပ်ေါထပ်ေါ လုပ်အဆာင်ကကည့်လို ့ ရရှိလာအသာ p [P(X = 1) = p] ကို
Binomial Distribution ပဖင့် အဖာ်ပပနိုင်သည်။
Binomial Distribution
P
• Binomial Distribution က Discrete
p < q
Distribution ပဖစ်ပါသည်။ p > q
p = q
• Binomial Distribution ရှိ Random Event p
တစ်ေုပေင်းစီသည် Bernoulli Process ပဖစ်သည်။ n က
ဘယ်နှကကိမ် Repeat လုပ်မလဲ ပဖစ်သည်။

• တကယ်လုိ ့ p: [P(X ) = 1] နှင့် q = 1 –p: [P(X ) = 0


0] တို ့ တူသွားလျှင် Distribution သည် Symmetric n X
ပဖစ်သည်။ p < q ဆိုလျှင် ဘယ်ဖက်(Skew Left) ကပ်ပပီး p
> q ဆိုလျှင် ညာဖက် (Skew Right) ကပ်မည်။

E[X] = np PMF = nCr pr (1 – p)n-r

VAR[X] = npq = np(1 - p)


Normal Distribution
• သဲများကို ေအပါ်ကအန သွန်ေျလိုက်ပါ။ သဲပုံအလး
တစ်ေုရပါမည်။ ေလယ်မှာ ေများဆုံး ပဖစ်ပပီး အဘးဖက်များမှာ
တစ်ပဖည်းပဖည်းနည်းသွားပါမည်။

• ေတန်းထဲရှိ အကျာင်းသားများ၏ ေရပ်ကို တိုင်းကကည့်ပါ။


ေလယ် (Average) နားမှာ ေများဆုံးပဖစ်ပပီး ေနိမ့်ဆုံးနှင့်
ေပမင့်ဆုံးတို ့သည် တပဖည်းပဖည်း နည်းသွားမည်။

• နိုင်ငံတစ်နိုင်ငံရှိ ေသက်၊ ေရပ်၊ လူများ၏ ေင်အငွ၊ IQ စသည့်


အတာ်အတာ်များများသည် သဲပုံ ပုံစံ ပဖစ်အနသည်ကို အတွ ့ရပါမည်။

• ေါသည် ပုံမှန်ပဖစ်အလ့ရအှိ သာ ေရာ တစ်ေု ပဖစ်သည်။ ေလယ်ရဲ ့


Probability သည် ပဖစ်နိုင်အေျ ေများဆုံး ပဖစ်သည်။

• ေါအကကာင့်မို ့ ေီလို Probability Distribution ကို


Normal Distribution ဟုအေါ်သည်။

• ေီ Distribution ကို Gauss ကအတွ ့ရှိေဲ့တဲ့


ေတွက်အကကာင့် Gaussian Distribution
လို ့လည်းအေါ်ပါသည်။
Normal Distribution
• ကျွန်အတာ်တို ့ Normal Distribution ကို
Continuous Version ေအနပဖင့်သာ အဖာ်ပပပါမည်။ P
(Discrete Version လည်း ရှိပါသည်။)

• Normal Distribution ၏ Expectation သည် μ


(Mean)ပဖစ်သည်။

• Normal Distribution ေပါေေင် ေပေား


Distribution များသည် Theoretical Sample
0
Space (Population) ကို အပပာတာ ပဖစ်သည်။
-σ μ σ X
• ထို ့အကကာင့် Population’s Mean μ သည် Sample’s
Mean နှင့် မတူပါ။

E[X] = μ PDF =

VAR[X] = σ2
Poisson Distribution
• ေင်ဗျားကို ဆိုင်တစ်ဆိုင် ဖွင့်ထားတယ်ဆိုပါအတာ့။ Online ပဲ ပဖစ်ပဖစ်၊
Offline ပဲ ပဖစ်ပဖစ်အပါ့။

• ေင်ဗျားဆိုင်ကို တစ်အန ့ တစ်အန ့ ေကကမ်းဖျဉ်း ေယ်သူ ေအယာက် 20


အလာက်လာ ေယ်တယ် ဆိုပါအတာ့။

• ေါဆိုရင် ေေုေျိန်မှ စပပီး အနာက် 3 နာရီ ေတွင်း ေယ်သူ ဘယ်အလာက်


လာေယ်နိုင်မလဲ။

• ေါရဲ ့ ေအပဖကို သိေျင်ရင်အတာ့ ကျွန်အတာ်တို ့ Poisson Distribution


ကို သုံးရမှာ ပဖစ်ပါသည်။

• ေမှန်အတာ့ Poisson Distribution ကို အေးအရာင်းမှ မဟုတ်ပါဘူး။


ဘဏ်အတွရဲ ့ Teller Counter အတွ၊ အဆးရုံအဆးေန်းရဲ ့ Booking အတွ
(Queue လုပ်ရတဲ့ အနရာတိုင်းမှာ) စသည့်အနရာအတွမှာ သုံးနိုင်ပါသည်။

• ကျွန်အတာ်တို ့က Arrival Rate ကိုသာ သိရင် သို ့မဟုတ် ေန် ့မှန်းနိုင်ရင်


ဘယ်ေေျိန်မှာ Customers ဘယ်အလာက်ရှိမယ်ဆိုတာရဲ ့ Probability
ကို Poisson Distribution နဲ ့ အပပာနိုင်ပါသည်။
Poisson Distribution
• Poisson Distribution က Discrete P
Distribution ပဖစ်ပါသည်။

• λ က Arrival Rate ပဖစ်ပပီးအတာ့ k က Number of λ


Arrival in a Timer Interval ပဖစ်သည်။

• P(λ = 5, k = 2) ဆိုပါအတာ့။ Arrival Rate က 5 per


day ဆိုပါအတာ့၊ ေါဆိုရင် Customer 2 အယာက် 1
အန ့ေတွင်းလာနိုင်အသာ Probability သည် 0.084 0
ပဖစ်သည်။ k X

E[X] = λ PMF =

VAR[X] = λ
Exponential Distribution
• ကျွန်အတာ်တို ့ အပပာအနကကရှိပါသည်။ ဆိုင်က ေရမ်းအရာင်းရတာပဲ၊ လူအတွကို ကကိတ်ကကိတ်တိုးအနတာပဲ။

• ေမှန်ေားပဖင့် ကကိတ်ကကိတ်တိုးအနရတာ မအကာင်းပါ။ Customer များက ေပမဲတန်း ကကိတ်ကကိတ်တိုးအနရရင် ကကာရင်


တပေားဆိုင်အပပာင်းသွားမှာပါ။ ကကိတ်ကကိတ်တိုးအနရတဲ့ ေတွက် Time နှင့် Effort waste ပဖစ်ပါသည်။

• ကျွန်အတာ်တို ့ ဆီမှာက ကကိတ်ကကိတ်တိုးရတာက ထုံးစံလိုပါပဲ။ Passport ရုံးမှာလဲ ကကိတ်ကကိတ်တိုးရသည်။


ဘဏ်မှာလည်း ကကိတ်ကကိတ်တိုးရသည်။ ဘက်စ်ကားလည်း ကကိတ်ကကိတ်တိုးရသည်။ ကကိတ်ကကိတ်တိုးရတာက
အရာင်းအကာင်းတာကို ပပတာမဟုတ်၊ Service မအကာင်းတာကို ပပတာပဖစ်သည်။

• Poisson Distribution က Arrival Rate ကို အပပာပါသည်။ Customer အတွ အရာက်ရိန ှ ှုန်းပဖစ်သည်။ ေီ
Customer များကို Service အပးရမှာ ပဖစ်သည်။ ေါကို Service Rate ဟု အေါ်သည်။ Customer
ဘယ်နှအယာက်ကို ေေျိန်တစ်ေုေတွင်း Service အပးနိုင်လဲ။ Service Rate သည် Arrival Rate
ထက်နည်းလို ့ ကအတာ့ ကကိတ်ကကိတ်တိုးပါပပီ။

• ထို ့အကကာင့် Arrival Rate ကိုသာ increase လုပ်ဖို ့သာ မဟုတ် Service Rate ပါ increase လုပ်ဖို ့
လိုေပ်သည်။ ဘဏ်မှာ လူအတွကကိတ်ကကိတ်တိုးရင် Counter ေသစ်တိုးပေင်း၊ Branch ေသစ်ဖွင့်ပေင်းတို ့ လုပ်ရမည်။
ေါကကီးကို ငါတို ့ကအတာ့ အရာင်းအကာင်းလိုက်တာ ဆိုပပီး ဂုဏ်ယူအနဖို ့ မဟုတ်။

• Service Rate ကိုသာ သိရင် ကျွန်အတာ်တို ့ Exponential Distribution ကိုသုံးပပီး


ေေျိန်တစ်ေုေတွင်းမှာ Customer ဘယ်နှစ်အယာက်ကို Service အပးနိုင်ပေင်းရဲ ့ Probability ကို တွက်လို ့
ရပါသည်။
Exponential Distribution
• Poisson Distribution နှင့် ကိုက်ညီအောင် P
ကျွန်အတာ်တို ့ Exponential Distribution ကို
Discrete Version ေအနပဖင့်သာ အဖာ်ပပပါမည်။
(Continuous Version လည်း ရှိပါသည်။)
λ
• λ က Service Rate ပဖစ်ပပီးအတာ့ t က Service Time
ပဖစ်သည်။

• P(λ = 5, t = 0.5) ဆိုပါအတာ့။ Service Rate က 5 0


Customer per day ဆိုပါအတာ့၊ ေါဆိုရင် အန ့တေက် t
ေတွင်း အစာင့်ရမည့် Probability သည် 0.41 ပဖစ်သည်။
X
ေါဆိုရင် အန ့တေက် ေတွင်း Service အပးပပီးသည့်
Probability သည် (1 - 0.41) = 0.59 ပဖစ်သည်။

E[X] = 1/λ PMF = , t >= 0

VAR[X] = 1/λ2
Multivariate Random Variable
• Probability Distribution သည် Function တစ်ေု ပဖစ်သည့် ေားအလျာ်စွာ Random Variable များသည်
တစ်ေု ထက်ပို ပါေင်နိုင်ပါသည်။

P(X1, X2, X3, … , Xn)

• P(X, Y)၏ Normal Distribution သည် အောက်ပါေတိုင်း ပဖစ်မည်။


Covariance
• ကျွန်အတာ်တို ့ Variance ကို Center (Mean) မှ ေကွာေအေးလို ့ အပပာေဲ့ပါသည်။ Covariance သည် Joint
Variability (Joint Distance) ကို အဖာ်ပပဖို ့ပဖစ်သည်။

COV(X, Y) = E[(X – E[X])(Y – E[Y])]

COV(X,X) = E[X – E[x]]2 = VAR(X)

Y Y Y

X X X
COV(X, Y) < 0 COV(X, Y) = 0 COV(X, Y) > 0
Induction and Deduction
• လှပပေင်းသည် အယဘုယျတရား ပဖစ်ပါသည်။ အကာင်းမွန်ပပည့်စုံပေင်း၊ ေပပစ်ကင်းပေင်း၊ ညီညွတ်မျှတပေင်း ဆိုအသာ
အယဘုယျ ေဓိပ္ပါယ်ကို အဆာင်ပါသည်။ လှပပေင်းကို သက်ရှိသတ္တ ေါ၊ ေရာေထ္ထု၊ ေပဖစ်ေပျက်၊ စိတ်သအဘာထား
စသည့်တို ့ေား အဖာ်ပပကကသည်။ လှပအသာ ငှက်ကအလးသည်၊ လှပအသာ အတာေုပ်နားရှိ လှပအသာ ေိမ်ကအလးထဲမှ
ထွက်လာသည့် လှပအသာ မိန်းကအလး နားမှာ လှပစွာ ပျံေဲပပီး အတးသီဆိုအနသည်။ သို ့အသာ် စဉ်းစားဖို ့က ငှက်ကအလး၏
လှပပေင်းက မိန်းကအလး၏ လှပပေင်းနှင့် မတူ။ ေါဆိုရင် ဘာကွဲတာတုံး။

• ေသီးတစ်ေုသည် ေပင်တစ်ပင်၏ ပန်းပွင့်မှ ပဖစ်လာအသာ သီးနှံတစ်ေု ပဖစ်သည်။ ပန်းသီး၊ ေရမ်းေျဉ်သီးတို ့သည်


ေသီးများ ပဖစ်သည်။ ေသီးများကို ေရမ်းေျဉ်သီးယို စသည်ပဖင့် ယိုထိုးကကသည်။ ေသီးများကို ေရမ်းေျဉ်သီးအဖျာ်ရည်
စသည်ပဖင့် အဖျာ်ရည်လုပ်ကကသည်။ ထို ့အကကာင့် ေရမ်းေျဉ်သီးသည် သီးနှံ (Fruit) ပဖစ်သည်။ ဟင်းသီးဟင်းရွက်
(Vegetables) မဟုတ်နိုင်။ ေါဆိုရင် Is Tomato Fruit or Vegetable?

• ထို ့အကကာင့် အယဘုယျ သအဘာကို အဖာ်ပပအသာ General Cases များ ရှသ


ိ လို တစ်ေုေျင်းစီကို အဖာ်ပပအသာ
Specific Cases များလည်းရှိပါသည်။ Population သည် General Case ပဖစ်ပပီး Sample Space
သည် A Collection of Specific Case ပဖစ်ပါသည်။

• Probability မှလာအသာ Probability Distribution များသည် General Case ကို


အဖာ်ပပတာပဖစ်ပပီး Statistics မှလာအသာ Frequency Distribution များသည် Specific Case ကို
အဖာ်ပပတာ ပဖစ်သည်။

• ေါဆိုရင် General မှ Specific၊ Specific မှ General ကို ဘယ်လို ဆက်စပ်ကကပါလဲ။


Induction and Deduction
• Mathematical Reasoning သည် General Case နှင့် Specific Case တို ့ ဆက်စပ်ပေင်းကို
အလ့လာအသာ ပညာရပ်ပဖစ်သည်။

• General Case မှ Specific Case ကို စဉ်းစားပေင်းကို Deduction (ဆွဲထုတ်ဆင်ပေင်ပေင်း) လို ့ အေါ်ပပီး
Specific Case မှ General Case ကို စဉ်းစားပေင်းကို Induction (ပေုံငုံဆင်ပေင်ပေင်း) လို ့အေါ်သည်။

• ေမှန်အတာ့ သင်ယူပေင်း (Learning) သည် ေဆင့် 3 ဆင့် ပါေင်ပါသည်။ ပထမ ကျွန်အတာ်တို ့ Specific
Case (Example) များကို အလ့လာပါသည်။ ေုတိယ ထို Specific Case များကို General Case များ
ေပဖစ် Induction (ပေုံငုံဆင်ပေင်ပေင်း) လုပ်ပါသည်။ တတိယ ေပေား Specific Case များကို
အတွ ့သည့်ေေါ သင်ယူထားပပီးအသာ General Case များမှ Deduction (ဆွဲထုတ်ဆင်ပေင်ပေင်း) ပပီး
ပပဿနာများကို ရှင်းပါသည်။

• ထို ့ေတူ Machine Learning လည်းေတူတူ ပဖစ်သည်။ ပထမ ကျွန်အတာ်တို ့ Specific Case
(Training Data) များကို Machine များကို သင်ပါသည်။ ေုတိယ Machine များကို General Case
များ ေတွက် Model ကို Learn လုပ်အစပါသည်။ တတိယ လိုေပ်အသာ ေပေား Specific Case များကို
General Model ပဖင့် ပပန်အပဖရှင်းပါသည်။

• ထိုအကကာင့် ကျွန်အတာ်တို ့ Specific To General၊ ပပီးရင် General To Specific ကိုအပဖရှင်းရမှာ


ပဖစ်သည်။

• Specific To General မှာ ကျွန်အတာ်တို ့က Specific Case ကိုသိသည်၊ General Case ကို
ရှာေျင်တာပဖစ်သည်။ General To Specific မှာက General Case ကို သိသည်၊ Specific Case
ကိုရှာေျင်တာ ပဖစ်သည်။
Specific to General Problems
• Specific to General Problems များသည် Deduction ဆိုင်ရာ ပပဿနာများ ပဖစ်ကကသည်။

• ကျွန်အတာ်တို ့ ေတန်းထဲရှိ အကျာင်းသာများ၏ ေရပ်သည် 5 အပ 6 လက်မ ပတ်ေန်းကျင် ပဖစ်သည်။ ေါဆိုရင် ပမန်မာပပည်ရှိ


အကျာင်းသားများ၏ ေရပ်သည် ဘယ်အလာက် ရှိမလဲ။

• Specific to General Problems များကို အပဖရှင်းနည်း မျိုးစုံ ရှိပါသည်။ ထိုေထဲမှာMaximum Likelihood


နှင့် Regression Analysis များကို အပပာပါမည်။
Maximum Likelihood
• ကျွန်အတာ်တို ့ Sampling လုပ်ပေင်းမှ Sample Data များကို ရရှိပါသည်။ ထို Sample Data များ၏ General
Probability Distribution သည် ဘာပဖစ်နိုင်မလဲ။

• Probability Distribution တစ်ေုကို Expectation (μ) နှင့် Variance (σ2) တို ့ပဖင့် အဖာ်ပပနိုင်ပါသည်။

• Maximum Likelihood မှာ ကျွန်အတာ်တို ့က Sample Data များ၏ Mean ( ) နှင့် Variance (s2) တို ့က
ဘယ်လို Probability Distribution Expectation (μ) နှင့် Variance (σ2) တို ့နှင့် ေများဆုံး
ကိုက်ညီမလဲကို တွက်ေျက်တာ ပဖစ်သည်။

• Bayes’ Theorem ေရ, Likelihood Function သည်

L(Ɵ) = P(X | Ɵ) , X =[x1, x2, x3, …, xn] = constants, Ɵ =[μ,σ2]

Maximum Likelihood : = 0
Regression Analysis
• Regression Analysis ကို ကျွန်အတာ်တို ့က Linear Regression နှင့် Non Linear Regression ဆိုပပီး
ေွဲနိုင်ပါသည်။

• Linear Regression က Advanced Calculus ရဲ ့ Supervised Learning မှာ အပပာပပီးသားပဖစ်လို ့


ထပ်မအပပာအတာ့ပါ။ ေဲေါအလး ပပန်ဖတ်ကကည့်ပါ။

• ကျွန်အတာ်တို ့က ေီမှာ Non Linear Regression တစ်ေု ပဖစ်တဲ့ Logistics Regression ေအကကာင်းကို
အပပာပါမည်။
Logistics Regression
• Logistics Regression ကို Binary Classification လုပ်ရာမှာ သုံးပါသည်။ Logistics
Regression ကို Binary Regression လို ့ ယူဆလို ့ ရပါသည်။

• Logistics Function သည် Sigmoid Function ပဖစ်သည်။

σ(t) = =

• ကျွန်အတာ်တို ့မှာ Study Hour (H) နှင့် Exam Pass (P) တို ့ရဲ ့ Sample Data ရှိသည် ဆိုပါအတာ့။

H 0.50 0.75 1.00 1.25 1.50 1.75 1.75 2.00 2.25 2.50 2.75 3.00 3.25 3.50 4.00 4.25 4.50 4.75 5.00 5.50

P 0 0 0 0 0 0 1 0 1 0 1 0 1 0 1 1 1 1 1 1

P(X = 1 | H) =

• Sample များမှ P(X = 1 | H) Logistics Model ကိုရပါသည်။ ထို Logistics Model ကို သုံးပပီး H = 1.8 ကို
တွက်ကကည့်လျှင် P(X = 1 | H = 1.8) = 0.2 ပဖစ်သည်။
General to Specific Problems
• General to Specific Problems များသည် Induction ဆိုင်ရာ ပပဿနာများ ပဖစ်ကကသည်။ General to
Specific Problems များတွင် ကျွန်အတာ်တို ့သည် General Case များကို သိသည်ဟု ယူဆထားသည်။

• General Case ဆိုသည်မှာ ေများေားပဖင့် Theory များပဖစ်ကကသည်။ ထို Theory များကို သုံးပပီး လက်အတွ ့ ဘယ်လို
ပပန်ရှင်းမလဲ ဆိုတဲ့ ပပဿနာများ ပဖစ်သည်။

• General to Specific Problems များကို အပဖရှင်းနည်း မျိုးစုံ ရှိပါသည်။ ထိုေထဲမှာ Hypothesis Testing
များကို အပပာပါမည်။
Central Limit Theorem
• ကျွန်အတာ်တို ့သည် Expectation (μ) နှင့် Variance (σ2) ရှိအသာ Population တစ်ေုမှ Sample
များကို အရွးထုတ်လိုက်သည် ဆိုပါအတာ့။ ကျွန်အတာ်တို ့ မူလ Population ရဲ ့ Probability
Distribution ကို မသိပါ။ သို ့အသာ် Randomly အရွးထုတ်လိုက်အသာ N Sample များ၏ Mean( )ရဲ ့
Probability Distribution သည် ေပမဲ Normal Distribution ပဖစ်သည်။

• ပန်းသီးပေံတစ်ေုမှာ ပန်းသီးများ ရှိသည်။ ထိုပန်းသီးများရဲ ့ Weight ကို မသိပါ။ ထို ့အကကာင့် N ပန်းသီးများကို အရွးပပီး
ေျိုတဲ့ေသီးများရဲ Mean (ပျမ်းမျှ Weight)ကိုရာှ ပါသည်။ ထို ့အနာက် အနာက်ထပ် N ပန်းသီးများကို အရွးပပီး
ေျိုတဲ့ေသီးများကို Mean ကိုရှာပပန်ပါသည်။ ထို Sample များ၏ ေျိုတဲ့ေသီးများ၏ Mean သည် ေပမဲ Normal
Distribution ပဖစ်သည်။

Original Population Randomly Selected N Sample

P P

0 0
-σ μ σ X μ X
Hypothesis Testing
• Hypothesis Testing သည် Central Limit Theorem ေအပါ် ေအပေေံပါသည်။

• ကျွန်အတာ်တို ့သာ Population တစ်ေုရဲ ့ Expectation (μ) နှင့် Variance (σ2)ကိုသာ သိရင် သို ့မဟုတ်
ေန် ့မှန်းနိုင်ရင် Sample များ ေတွက် Hypothesis ထုတ်ပပီး မှန်မမှန် စစ်လို ့ရပါသည်။

• ပန်းသီးပေံတစ်ေုမှာ ပန်းသီးများ ရှိသည်။ ထိုပန်းသီးများ၏ Weight ရဲ ့ Expectation (μ) နှင့် Variance


(σ2)ကိုသိသည် ဆိုပါအတာ့။ μ = 0.2 kg ပဖစ်ပပီး σ2= 0.05 ဆိုပါအတာ့။

• ပန်းသီးပေံရဲ ့ ေအရှ ့ပိုင်းရှိ ပန်းသီးများက ေပေားေသီးများ ထက်ပိုအလးသည် ဆိုပပီး Hypothesis ထုတ်သည်


ဆိုပါအတာ့။ ေါကို Null Hypothesis လို ့အေါ်ပါသည်။ ေီေဆိုကို မှန်၊ မမှန်စစ်မယ် ဆိုရင်။

• ကျွန်အတာ်တို ့ ပန်းသီးပေံရဲ ့ ေအရှ ့ပိုင်းမှ Random Sample (n) ကို အရွးရပါမည်။ ထို ့အနာက် Mean ရှာရပါမည်။

Z =

• Z တန်ဖိုး နည်းအလ Null Hypothesis မှန်ဖို ့ များအလပဖစ်သည်။ Z တန်ဖိုးသည် သတ်မှတ်ထားအသာ


Threshold Value ထက်နည်းပါက Null Hypothesis မှန်သည်လို ့ ယူဆပပီး ပိုများပါက Null
Hypothesis မှားသည်ဟု ယူဆပါသည်။
Summary
• ကဲ ကျွန်အတာ်တို ့ Probability နှင့် Statistics ကို ထိုကသ
် င့်သအလာက် သိသွားပါပပီ။

• ေါဆိုရင် ပထမဆုံး အမးေွန်းကို အပဖဖို ့ ေဆင့်သင့် ပဖစ်ပပီလား။ Will you Gamble or Risk?

• ေမှန်အတာ့ ဘေကကီးသည်ပင် Risk တစ်ေု ပဖစ်ပါသည်။ လုပ်ငန်းလုပ်ပေင်း၊ စာအမးပွဲအပဖပေင်း၊


ေိမ်အထာင်ပပုပေင်း ေါအတွေားလုံးသည် Risk ပဖစ်သည်။ ကျွန်အတာ်တို ့ ေါအတွကို ကံအသကံမ, မအပပာနိုငပ
် ါ။

• သို ့အသာ် Risk ပဖစ်သည့် ေားအလျာ်စွာ ကျွန်အတာ်တို ့ရဲ ့ Probability ကို Increase သို ့မဟုတ်
Decrease လုပ်လို ့ရပါသည်။ ဘယ်ေေျိန် အသမည်ကို မသိပါ၊ သို ့အသာ် ကျန်းမာအရး ဂရုစုကိ ်ပေင်းပဖင့်
အသဖို ့နည်းအောင် လုပ်လို ့ရပါသည်။

• Life is not a Gamble; it is a Risk. Thank goodness!

You might also like