Professional Documents
Culture Documents
თემა 02-03
თემა 02-03
თემა 2-3
მონაცემთა აღწერა რიცხვითი
მახასიათებლების გამოყენებით
ნინო სვანიძე
მათემატიკის დეპარტამენტის
ასოცირებული პროფესორი
ვარიაციის
კოეფიციენტი
ალბათობა და სტატისტიკა. ბიზნესის ადმინისტრირება თემა 2-3-4
ცენტრალური ტენდენციის და ლოკალიზაციის
საზომები
მიმოხილვა
ცენტრი და ლოკალიზაცია
n
x i
XW
wx i i
x
w
i 1
n i
x
N
i W
wx i i
i 1
N
w i
ალბათობა და სტატისტიკა. ბიზნესის ადმინისტრირება თემა 2- 3-5
საშუალო (არითმეტიკული საშუალო)
x i
x1 x 2 x n
x i1
n n
პოპულაციის საშუალო N = პოპულაციის მოცულობა
N
x
x1 x 2 xN
i
i1
N N
ალბათობა და სტატისტიკა. ბიზნესის ადმინისტრირება თემა2-3 -6
საშუალო (არითმეტიკული საშუალო)
(გაგრძელება)
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
საშუალო = 3 საშუალო = 4
1 2 3 4 5 15 1 2 3 4 10 20
3 4
5 5 5 5
x
საშუალოდან გადახრების ჯამი ნულის ტოლია n
i x 0
i 1
ნებისმიერი a რიცხვისათვის
x x
n 2 n 2
i x i a
i 1 i 1
ე.ი. საშუალო ის რიცხვია, რომლიდანაც ცალკეული დაკვირვებების გადახრების
კვადრატების ჯამი მინიმალურია.
z x y
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
მედიანა = 3 მედიანა = 3
მონაცემთა დალაგებულ მწკრივში მედიანა
არის “შუა” რიცხვი
თუ n ან N კენტია, მედიანა არის შუა რიცხვი
თუ n ან N ლუწია, მედიანა არის შუა ორი რიცხვის
საშუალო არითმეტიკული
ალბათობა და სტატისტიკა. ბიზნესის ადმინისტრირება თემა 2- 3-9
მედიანა
ნებისმიერი a რიცხვისათვის
n
n
xi x xi a
~
i 1 i 1
~ ~
y a x b
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6
5 4 XW
wx
i i
(4 5) (12 6) (8 7) (2 8)
6 12 w i 4 12 8 2
7 8 164
6.31 days
8 2 26
$2,000,000
500,000 $500 K
300,000 $300 K
100,000
100,000
$100 K
$100 K
სახლების
ფასები: საშუალო: ($3,000,000/5)
= $600,000
$2,000,000
500,000
300,000
100,000 მედიანა: რანჟირებული მონაცემების
100,000 საშუალო მნიშვნელობა
ჯამი 3,000,000 = $300,000
საშუალო < მედიანა < მოდა საშუალო = მედიანა = მოდა მოდა < მედიანა < საშუალო
(მარცხნივ გვაქვს უფრო გრძელი კუდი) (მარჯვნივ გვაქვს უფრო გრძელი კუდი)
ლოკალიზაციის
სხვა
მახასიათებლები
პროცენტილები კვარტილები
მწკრივში :
2nd კვარტილი = 50th პროცენტილი
მონაცემთ p% არის ნაკლები ან
= მედიანა
ტოლო ამ მონაცემზე
(100 – p)% მონაცემებისა არის ამ
მონაცემზე მეტი 3rd კვარტილი = 75th პროცენტილი
(სადაც 0 ≤ p ≤ 100)
p
i (n 1)
100
მაგალითი: 60 პროცენტილი დალაგებულ ვარიაციულ
მწკრივში 19 მონაცემით არის მწკრივის მე-12 წევრი:
p 60
i (n 1) (19 1) 12
100 100
ალბათობა და სტატისტიკა. ბიზნესის ადმინისტრირება თემა 2- 3-18
კვარტილები
კვარტილები რანჟირებულ მონაცემთა მწკრივს ყოფს 4
თანაბარ კლასად
Q1 Q2 Q3
მაგალითი: იპოვეთ პირველი კვარტილი
შერჩევის მონაცემები: 11 12 13 16 16 17 18 21 22
(n = 9)
Q1 = 25th პროცენტილი, რადგან 25 (9+1) = 2.5
100
ამიტომ იპოვოთ მე-2 და მე-3 მნიშვნელობების საშუალო
Q1 = 12.5
ალბათობა და სტატისტიკა. ბიზნესის ადმინისტრირება თემა 2- 3-19
ბოქსლოტი (Box and Whisker Plot)
მაგალითი:
Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3
Skewness
Statistic < 0 0 >0
ალბათობა და სტატისტიკა. ბიზნესის ადმინისტრირება თემა 2- 3-24
განაწილების ფორმა (Kurtosis)
Kurtosis
Statistic < 0 0 >0
ალბათობა და სტატისტიკა. ბიზნესის ადმინისტრირება თემა 2- 3-25
ბოქსლოტის მაგალითი
00 22 33 55 27
27
როგორც მონაცემებიდან ჩანს, აქ გვაქვს ძლიერი
მარჯვენა ასიმეტრია
ალბათობა და სტატისტიკა. ბიზნესის ადმინისტრირება Chap 3-26
ლოკაციის მახასიათებლები
დაჯგუფებული მონაცემებისათვის
პროცენტილები
ინტერვალი …
სიხშირეები
დაგროვების …
სიხშირეები
შერჩევის
დისპერსია შერჩევის
სტანდარტული
გადახრა
ერთიდაიგივე ცენტრი,
სხვადასხვა დისპერსია
მაგალითი:
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Range = 14 - 1 = 13
ალბათობა და სტატისტიკა. ბიზნესის ადმინისტრირება თემა 2- 3-32
რანგის უარყოფითი მხარეები
უგულებელყოფს მონაცემთა განაწილების გზას
7 8 9 10 11 12 7 8 9 10 11 12
Range = 12 - 7 = 5 Range = 12 - 7 = 5
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5
Range = 5 - 1 = 4
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120
Range = 120 - 1 = 119
ალბათობა და სტატისტიკა. ბიზნესის ადმინისტრირება თემა 2- 3-33
კვარტილთშორისი რანგი
მაგალითი:
Median X
X Q1 Q3 maximum
minimum (Q2)
25% თემა 2- 25%
25% 25%
12 30 45 57 70
კვარტილთშორისი
რანგი
= 57 – 30 = 27
(x i x) 2
s2 i1
n -1
პოპულაციის ვარიაცია:
N
(x i μ) 2
σ2 i1
N
ალბათობა და სტატისტიკა. ბიზნესის ადმინისტრირება თემა 2- 3-36
ვარიაცია
შერჩევითი ვარიაციის და პოპულაციის
ვარიაციის გამოთვლისას მიზანშეწონილია
ვისარგებლოთ გამარტივებული ფორმულებით
შერჩევითი ვარიაცია:
x
2
s2
x2
n
n -1
x
პოპულაციის ვარიაცია:
2
2
x2
N
N
ალბათობა და სტატისტიკა. ბიზნესის ადმინისტრირება თემა 2- 3-37
სტანდარტული გადახრა
ყველაზე ხშირად გამოყენებული ვარიაციის საზომი
გვიჩვენებს საშუალოს მიმართ განფენილობას
აქვს იგივე განზომილება რაც მონაცემებს
i
(x x ) 2
s i1
n -1
პოპულაციის სტანდარტული გადახრა N
i
(x μ) 2
σ i1
N
ალბათობა და სტატისტიკა. ბიზნესის ადმინისტრირება თემა 2- 3-38
გამოთვლის მაგალითი:
შერჩევის სტანდარტული გადახრა
Sample
Data (Xi) : 10 12 14 15 17 18 18 24
n=8 საშუალო= x = 16
126
4.2426
7
ალბათობა და სტატისტიკა. ბიზნესის ადმინისტრირება Chap 3-39
სტანდარტული გადახრის გამოთვლა
Data A
საშუალო = 15.5
s = 3.338
11 12 13 14 15 16 17 18 19 20 21
Data B
საშუალო = 15.5
s = 0.9258
11 12 13 14 15 16 17 18 19 20 21
Data C
საშუალო = 15.5
s = 4.57
11 12 13 14 15 16 17 18 19 20 21
შემოსავლების
ინტერვალი
[0;10) 5 25 11 55 125
[10;20) 15 225 19 285 4275
[20;30) 25 625 30 750 18750
[30;40) 35 1225 15 525 18375
[40;50) 45 2025 10 450 20250
[50;60) 55 3025 15 825 45375
100 2890 107150
ალბათობა და სტატისტიკა. ბიზნესის ადმინისტრირება Chap 3-42
ვარიაციის კოეფიციენტი
ზომავს ფარდობით გაფანტულობას
ყოველთვის გამოისახება პროცენტებში (%)
აჩვენებს ფარდობით განფენილობას საშუალოს
მიმართ
გამოიყენება სხვადასხვა ერთეულის მონაცემთა
ორი ან მეტი სიმრავლის შესადარებლად
პოპულაცია შერჩევა
σ s
C V 1 0 0 % C V 100%
μ x
ალბათობა და სტატისტიკა. ბიზნესის ადმინისტრირება Chap 3-43
ვარიაციის კოეფიციენტის
შედარება
საფონდო ბირჟა A:
საშუალო ფასი გასულ წელს = $50
სტანდარტული გადახრა = $5
s $5
C VA 1 0 0 % 100% 10%
x $50 ორივე ფონდს
აქვს ერთნაირი
საფონდო ბირჟა B: სტანდარტული
გადახრა, მაგრამ
საშუალო ფასი გასულ წელს = $100 B ბირჟას აქვს
სტანდარტული გადახრა = $5 ნაკლები
ფარდობითი
s
ვარიაბელობა მის
$5
C V B 1 0 0 %
ფასთან
100% 5% მიმართებაში
x $100
ალბათობა და სტატისტიკა. ბიზნესის ადმინისტრირება Chap 3-44
ემპირიული წესი
68%
μ
μ 1σ
ალბათობა და სტატისტიკა. ბიზნესის ადმინისტრირება თემა 2- 3-45
ემპირიული წესი
μ 2σ შეიცავს პოპულაციის ან შერჩევის
მონაცემთა 95% პროცენტს
μ 3σ პოპულაციის ან შერჩევის მონაცემთა
99,7% პროცენტს
95% 99.7%
μ 2σ μ 3σ
მაგალითი:
არანაკლებ ფარგლები
XX
Z
S
შეარჩიეთ მენიუ:
tools / data analysis / descriptive statistics
შეარჩიეთ მენიუ:
tools / data analysis /
descriptive statistics
შეიყვანეთ
მონაცემები
დიალოგურ
ფანჯარაში
შეარჩიეთ
ფანჯარა summary
statistics
OK
ალბათობა და სტატისტიკა. ბიზნესის ადმინისტრირება Chap 3-54
Excel-ის გამოყენება
Microsoft Excel
descriptive statistics output,
using the house price data:
House Prices:
$2,000,000
500,000
300,000
100,000
100,000