მონაცემთა გაფანტულობა

მონაცემთა გაფანტულობის საზომები
1
ცენტრალური ტენდენციის საზომები
ცენტრალური ტენდენციის საზომები: მოდა, მედიანა და საშუალო
 მოდა - მონაცემი რომელიც ყველა ხშირად მეორდება.
 მედიანა - მნიშვენლობა რომელიც განაწილებას ორ თანაბარ ნაწილად ყოფს, ისე რომ ერთ
ნახევარი მის ზემოთ მდებარეობს, ხოლო მეორე ნახევარი მის ქვემოთ
 საშუალო - ყოველი მნიშვენლობის ჯამი, შეფარდებული მნიშნელობების რაოდენობაზე
𝛴 𝑥
𝑥=
𝑛
2
მონაცემთა გაფანტულობა გულისხმობს, თუ მონაცემების ერთმანეთისგან როგორ

განსხვავდება
მაგალითად:
7, 6, 3, 3, 1 მონაცემების მაღალ გაფანტულობაზე მიუთითებს
3, 4, 4, 5, 4 მონაცემების დაფალ გაფანტულობაზე მიუთითებს
4, 4, 4, 4, 4 გაფანტულობის მაჩვენებელი საერთოდ არ აქვს
3
 გაფანტულობა (ასევე უწოდებენ გავრცელებას ან დისპერსიას) შეიძლება ჩაითვალოს ,

როგორც საზომი იმისა, თუ რამდენად განსხვავებულია ქულები ერთმანეთისგან. კიდევ
უფრო ზუსტია (და შესაძლოა უფრო ადვილიც) ვიფიქროთ გაფანტულობაზე , თუ რამდენად
განსხვავებულია ქულები ერთი კონკრეტული ქულისგან.
 ისე, იმის ნაცვლად, რომ შევადაროთ თითოეული ქულა განაწილების ყველა სხვა ქულას,
ერთი ქულა, რომელიც შეიძლება გამოყენებულ იქნას შედარებად არის - ეს მართალია -
საშუალო. ამრიგად, ცვალებადობა ხდება საზომი იმისა, თუ რამდენად განსხვავდება
თითოეული ქულა ქულების ჯგუფში საშუალოდან, ჩვეულებრივ, საშუალოდან .
 ეს ორი ერთად (საშუალო და ცვალებადობა) შეიძლება გამოყენებულ იქნას განაწილების

მახასიათებლების აღსაწერად და იმის საჩვენებლად , თუ როგორ განსხვავდება განაწილებები
ერთმანეთისგან.
4
 დიაპაზონი (Range)
 ინტერკავრტილური დიაპაზონი - IQR
 სტანდარტული გადახრა (SD)
 დისპერსია - (Variance)
 ვარიაციის კოეფიციენტი- (Variance)
5
დიაპაზონი (Range)
დიაპაზონი არის მონაცემთა გაფანტულობის მარტივი საზომი და ერთგვარი ინტუიციური,

ეს არის ყველაზე დიდი ქულის სხვაობა უმცირესი ქულისგან.
r=h-l დიაპაზონის ფორმულა
r – დიაპაზონი
h – უმაღლესი ქულა (Highest Score)
l – ყველაზე დაბალი ქულა (Lowest Score)

მაგალითად:
98, 86, 77, 56, 48
98 – 48 = 50
6
ინტერკავრტილური დიაპაზონი - IQR
IQR - ნიშნავს ინტერკვარტულ დიაპაზონს, რომელიც არის სტატისტიკური დისპერსიის საზომი. ეს არის
დიაპაზონი პირველ მეოთხედს (Q1) და მესამე მეოთხედს (Q3) შორის მონაცემთა ბაზაში. კვარტლთაშორისი
დიაპაზონი იძლევა მონაცემების შუა 50%-ის გავრცელების განცდას და ნაკლებად მგრძნობიარეა გარედან,
ვიდრე სრული დიაპაზონი.
ქვემოთ მოცემულია ნაბიჯები ინტერკვარტილური დიაპაზონის გამოსათვლელად :
1 .დაალაგეთ მონაცემები ზრიდს მიხედვით.
2 .იქოვეთ მედიანა (Q2), რომელიც არის მონაცემთა ნაკრების საშუალო მნიშვნელობა. თუ მონაცემთა ნაკრებს
აქვს ლუწი რაოდენობის მნიშვნელობები, მედიანა არის ორი შუა მნიშვნელობის საშუალო.
3 .იპოვეთ პირველი კვარტილი (Q1), რომელიც არის მონაცემთა ნაკრების ქვედა ნახევრის მედიანა (საერთო
მედიანას გამოკლებით, თუ მონაცემთა ნაკრებს აქვს კენტი რაოდენობის მნიშვნელობები).
4 .იპოვეთ მესამე კვარტილი (Q3), რომელიც არის მონაცემთა ნაკრების ზედა ნახევრის მედიანა (საერთო
მედიანას გამოკლებით, თუ მონაცემთა ნაკრებს აქვს კენტი რაოდენობის მნიშვნელობები).
5 .გამოთვალეთ ინტერკვარტილური დიაპაზონი (IQR), როგორც სხვაობა Q3 და Q1 შორის::
IQR=Q3−Q1
7
განვიხილოთ შემდგომი მაგალთი:
დავუშვათ, რომ თქვენ გაქვთ შემდეგი მონაცემთა ნაკრები, რომელიც

წარმოადგენს სტუდენტების ქულებს ბიოლოგიის ტესტში:
65, 70, 72, 75, 78, 80, 85, 88,

90
იპოვეთ მედიანა (Q2):
ვინაიდან ცხრა მნიშვნელობაა, მედიანა არის მეხუთე მნიშვნელობა, რომელიც არის

Q2=78
იპოვეთ Q1 - პირველი კვარტილი
მონაცემებში ყველაზე დაბალი მნიშვნელობა აქვს 65,70,7265,70,72, so Q1= 70+72/2= 71
იპოვეთ Q3 - მესამე კვარტილი

Q3 = (85 + 88) / 2 = 86.5
IQR – ის გამოთვლა
IQR=Q3−Q1=86.5−71=15.5 მაშასადამე, ინტერკვარტილური დიაპაზონი ამ მონაცემთა
ნაკრებისთვის არის 15.5. ეს ნიშნავს, რომ ქულების შუა 50% 15,5
ქულის დიაპაზონშია.
8
მართკუთხა დიაგრამები (Box Plots)
მართკუთხა დიაგრამა (Box Plot) - ეს არის სტატისტიკური მონაცემების გრაფიკული წარმოდგენა ხუთ
რიცხვიან შეჯამებაზე: მინიმალური, პირველი მეოთხედი (Q1), მედიანა , მესამე მეოთხედი (Q3) და
მაქსიმალური. ეს არის მონაცემთა განაწილების ჩვენების სტანდარტიზებული გზა ხუთნომრიანი
შეჯამების საფუძველზე. აი, როგორ არის სტრუქტურირებული და გამოყენებული :
9
სტანდარტული გადახრა (SD)
სტანდარტული გადახრა (SD) - რამდენადაა მონაცემები გაფანტული საშუალო მნიშვნელობის

გარშემო. წარმოადგენს ცვალებადობის საშუალო რაოდენობას ქულების ერთობლიობაში . ეს არის
თითოეული ქულის მანძილი საშუალოდან. რაც უფრო დიდია სტანდარტული გადახრა და რაც უფრო
დიდია საშუალო მანძილი თითოეული მონაცემთა წერტილიდან განაწილების საშუალოდან , მით
უფრო ცვალებადია ქულების ნაკრები.
s – სტანდარტული გადახრა; ეს ფორმულა ეძებს განსხვავებას თითოეულ ინდივიდუალურ

ქულასა და საშუალოს შორის, აყალიბებს თითოეულ
E – მონაცემთა ჯამი; განსხვავებას და აჯამებს მათ ყველა ერთად. შემდეგ, ის
ყოფს ჯამს მნიშვენლობის ზომაზე, და იღებს შედეგის
X – ინდივიდუალური ქულა; კვადრატულ ფესვს. სტანდარტული გადახრა არის საშუალო
გადახრა საშუალოდან
X – საშუალო ქულა;
n – მნიშვნელობების სრული რაოდენობა
10
მაგალითად, გვაინტერესებს ჩვენი რესპონდენტების სიმაღლის სტანდარტული
გადახრა
გვაინტერესებს მონაცემები საშუალოდან რამდენითა გაფანტული
რესპონდენტების სიმაღლის საშუალო
ს 18 CM
ი 8 CM 6 CM
მ 155 სმ.
ა 8 CM 9 CM
15 CM
ღ
ლ
ე
11
მონაცემები რომელსაც
გამოვიყენებთ
173, 147, 140, 163, 146, 161
საშუალო - = 930 / 6 = 155
s
173 155 18 324
163 155 8 64 𝑆= √ 794 − 5=12.6

161 155 6 36 სტანდარტული გადახრის სიდიდე მკვლევრის
ინტერპრეტაციაზეა დამოკიდებული.
147 155 -8 64
146 155 -8 81 დიდი სტანდარტული გადახრა ნიშნავს, რომ

მონაცემთა წერტილები უფრო დიდზე
გაფანტულია. ეს ნიშნავს, რომ მონაცემთა
140 155 -15 225
ნაკრებში მეტი ცვალებადობაა.
930 0 794
12
მაგალითად, სკოლის ადმინისტრაცია დაინტერესდა, თუ ბოლო 10 დღის განმავლობაში , მოსწავლეების სკოლაში
სიარულის რაოდენობაზე.
5, 8, 5, 4, 6, 7, 8, 8, 3, 6
საშუალო - = 60 / 10 = 6
s
8 6 8–6=2 4
8 6 8–6=2 4
s = = 1.76
8 6 8–6=2 4
7 6 7–6=1 1
6 6 6–6=0 0 სტუდენტების უმეტესობის
დასწრების რიცხვი საშუალოსთან
6 6 6–6=0 0
ახლოსაა, უმეტესობა ესწრება ±1,76
5 6 5 – 6 = -1 1 დღეს საშუალოდ. ეს მიუთითებს
5 6 5 – 6 = -1 1 სტუდენტების შედარებით
თანმიმდევრულ დასწრებაზე.
4 6 4 – 6 = -2 4
3 6 3 – 6 = -3 9
60 0 28
13
მაგალითი: დავუშვათ, რომ გვაქვს შემდეგი მონაცემთა ნაკრები, რომელიც წარმოადგენს სტუდენტების ქულებს
მათემატიკის ტესტში:
70, 72, 75, 78, 80, 70, 72, 75, 78, 80
სტანდარტული გადახრის გამოსათვლელად, ამ ნაბიჯებს უნდა მივყვეთ:
1.გამოვთვალოთ საშუალო ქულა :
საშუალო=(70 + 72 + 75 + 78 + 80 + 70 + 72 + 75 + 78 + 80) / 10 = 750 / 10 = 75
2. ინდივიდუალური მონაცემები კვადრატში ავიყვანოთ:
(70−75)2 = 25; (72−75)2 = 9; (75−75)2 = 0; (78−75)2 = 9, (80−75)2 = 25; (70−75)2 = 25; (72−75)2 = 9; (75−75)2 = 0, (78−75)2 = 9, (80−75)2 = 25;
3. მიღებულ მონაცემებს ვაჯამებთ და ვყოფთ მნიშნელობების რაოდენას გამოკლებული 1 (n-1):
s = √(25 + 9 + 0 + 9 + 25 + 25 + 9 + 0 + 9 + 25) / 10 -1 = √ 136 / 9 = √15.1
4. მიღებული მონაცემის ფესვი გამოვთვალოთ:
s = √ 15.1.6≈3.88
ამრიგად, მოცემული მონაცემთა ნაკრების სტანდარტული გადახრა არის დაახლოებით 3.88 ეს მნიშვნელობა გაძლევს
წარმოდგენას იმის შესახებ, თუ რამდენად განსხვავდება ინდივიდუალური ქულები საშუალოდან. უფრო მცირე სტანდარტული
გადახრა მიუთითებს იმაზე, რომ ქულები უფრო ახლოსაა საშუალოსთან, ხოლო უფრო დიდი სტანდარტული გადახრა
მიუთითებს მონაცემთა ნაკრების დიდ ცვალებადობაზე.
14
დისპერისა - Variance
დისპერსია - არის სტატისტიკური საზომი, რომელიც აღწერს მონაცემთა პუნქტების
ნაკრების გავრცელებას ან დისპერსიას მონაცემთა ბაზაში. ის რაოდენობრივად
განსაზღვრავს, თუ რამდენად არის დაშორებული სიმრავლის თითოეული მონაცემთა
წერტილი საშუალოდან (საშუალოდან) და ამგვარად იძლევა მონაცემებში ცვალებადობის
ან გავრცელების ხარისხის მითითებას.
დისპერსიული (s2) გამოითვლება კვადრატული სხვაობების საშუალოს აღებით თითოეულ
მონაცემთა წერტილსა და საშუალოს შორის. დისპერსიის ფორმულა შემდეგია:
2
𝑠 =
∑ ( 𝑥 − 𝑥) 2
𝑛 −1
– დისპერსია;
E – მნიშვნელობათა ჯამი;
X – ინდივიდუალური მნიშვნელობა;
X – საშუალო
N – მნიშნელობათა რაოდენობა
15
ვარიაციის კოეფიციენტი - CV
ვარიაციის კოეფიციენტი (CV) არის სტატისტიკური საზომი, რომელიც გამოიყენება მონაცემთა

ნაკრების ფარდობითი ცვალებადობის შესაფასებლად. ის გამოიხატება პროცენტულად და
გამოითვლება მონაცემთა ნაკრების სტანდარტული გადახრის გაყოფით მის საშუალოზე , შემდეგ
შედეგის 100-ზე გამრავლებით. ფორმულა არის:
𝑠
𝐶𝑣 = ⋅ 100 %
𝑥
CV - ვარიაციის კოეფიციენტი
ვარაციის კოეფიციენტი კარგია მაშინ, როდესაც ვადარებთ ერთ
s - სტანდარტული გადახრა მონაცემეს, მეორეთი ვადარებთ, განსაკუთრებით მაშინ,
როდესაც საშუალოები ერთმანეთისგან მნიშნელოვნად
განსხვავდება.
x - საშუალო ეს არის ეფექტური გზა მონაცემთა ცვალებადობის კონტექსტის
გასაგებად.
16
ვარიაციის კოეფიციენტი - CV
მაგალითი
წარმოიდგინე გვაქვს გამოცდის ქულების ორი ნაკრები:
•პირველი ნაკრები: 45, 50, 55
•მეორე ნაკრები: 80, 85, 90
1. პირველ რიგში გამოვითვალოთ ამ ქულების ნაკრების საშუალო და სტანდარტული გადახრა
 პირველი ნაკრების ქულების საშუალო: (45+50+55)/3 = 50

პირველი ნაკრების ქულების სტანდარტული გადახრა: 4.08
 მეორე ნაკრების ქულების საშუალო: (80 + 85 + 90) / 3 = 85

მეორე ნაკრების ქულების სტანდარტული გადახრა: 4.08
2. გამოვთვალოთ ვარიაციის კოეფიციენტი

 CV 1 = (4.08 / 50) * 100% = 8.16% პირველი ნაკრების CV უფრო დიდია ვიდრე მეორე
ნაკრების, რაც ნიშნავს, რომ პირველი ნაკრების
 CV 2 = (4.08 / 85) * 100% = 4.6% ქულები უფრო ცვალებადია, ვიდრე მეორე ნაკრების
17
მადლობა ყურადღებისთვის!
18

მონაცემთა გაფანტულობა

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

მონაცემთა გაფანტულობა

Uploaded by

Copyright:

Available Formats

მონაცემთა გაფანტულობის საზომები

ცენტრალური ტენდენციის საზომები: მოდა, მედიანა და საშუალო

 მოდა - მონაცემი რომელიც ყველა ხშირად მეორდება.

 საშუალო - ყოველი მნიშვენლობის ჯამი, შეფარდებული მნიშნელობების რაოდენობაზე

მონაცემთა გაფანტულობა გულისხმობს, თუ მონაცემების ერთმანეთისგან როგორ

7, 6, 3, 3, 1 მონაცემების მაღალ გაფანტულობაზე მიუთითებს

3, 4, 4, 5, 4 მონაცემების დაფალ გაფანტულობაზე მიუთითებს

4, 4, 4, 4, 4 გაფანტულობის მაჩვენებელი საერთოდ არ აქვს

 გაფანტულობა (ასევე უწოდებენ გავრცელებას ან დისპერსიას) შეიძლება ჩაითვალოს ,

 ეს ორი ერთად (საშუალო და ცვალებადობა) შეიძლება გამოყენებულ იქნას განაწილების

 ინტერკავრტილური დიაპაზონი - IQR

 სტანდარტული გადახრა (SD)

 ვარიაციის კოეფიციენტი- (Variance)

დიაპაზონი არის მონაცემთა გაფანტულობის მარტივი საზომი და ერთგვარი ინტუიციური,

r=h-l დიაპაზონის ფორმულა

h – უმაღლესი ქულა (Highest Score)

l – ყველაზე დაბალი ქულა (Lowest Score)

98, 86, 77, 56, 48

ქვემოთ მოცემულია ნაბიჯები ინტერკვარტილური დიაპაზონის გამოსათვლელად :

1 .დაალაგეთ მონაცემები ზრიდს მიხედვით.

5 .გამოთვალეთ ინტერკვარტილური დიაპაზონი (IQR), როგორც სხვაობა Q3 და Q1 შორის::

დავუშვათ, რომ თქვენ გაქვთ შემდეგი მონაცემთა ნაკრები, რომელიც

65, 70, 72, 75, 78, 80, 85, 88,

ვინაიდან ცხრა მნიშვნელობაა, მედიანა არის მეხუთე მნიშვნელობა, რომელიც არის

მონაცემებში ყველაზე დაბალი მნიშვნელობა აქვს 65,70,7265,70,72, so Q1= 70+72/2= 71

იპოვეთ Q3 - მესამე კვარტილი

სტანდარტული გადახრა (SD) - რამდენადაა მონაცემები გაფანტული საშუალო მნიშვნელობის

s – სტანდარტული გადახრა; ეს ფორმულა ეძებს განსხვავებას თითოეულ ინდივიდუალურ

n – მნიშვნელობების სრული რაოდენობა

რესპონდენტების სიმაღლის საშუალო

საშუალო - = 930 / 6 = 155

163 155 8 64 𝑆= √ 794 − 5=12.6

146 155 -8 81 დიდი სტანდარტული გადახრა ნიშნავს, რომ

70, 72, 75, 78, 80, 70, 72, 75, 78, 80

სტანდარტული გადახრის გამოსათვლელად, ამ ნაბიჯებს უნდა მივყვეთ:

1.გამოვთვალოთ საშუალო ქულა :

საშუალო=​(70 + 72 + 75 + 78 + 80 + 70 + 72 + 75 + 78 + 80) / 10 = 750 / 10 = 75

2. ინდივიდუალური მონაცემები კვადრატში ავიყვანოთ:

3. მიღებულ მონაცემებს ვაჯამებთ და ვყოფთ მნიშნელობების რაოდენას გამოკლებული 1 (n-1):

s = √(25 + 9 + 0 + 9 + 25 + 25 + 9 + 0 + 9 + 25) / 10 -1 = √ 136 / 9 = √15.1

4. მიღებული მონაცემის ფესვი გამოვთვალოთ:

ვარიაციის კოეფიციენტი (CV) არის სტატისტიკური საზომი, რომელიც გამოიყენება მონაცემთა

•პირველი ნაკრები: 45, 50, 55

•მეორე ნაკრები: 80, 85, 90

1. პირველ რიგში გამოვითვალოთ ამ ქულების ნაკრების საშუალო და სტანდარტული გადახრა

 პირველი ნაკრების ქულების საშუალო: (45+50+55)/3 = 50

 მეორე ნაკრების ქულების საშუალო: (80 + 85 + 90) / 3 = 85

2. გამოვთვალოთ ვარიაციის კოეფიციენტი

You might also like

საშუალო=(70 + 72 + 75 + 78 + 80 + 70 + 72 + 75 + 78 + 80) / 10 = 750 / 10 = 75