Professional Documents
Culture Documents
მონაცემთა გაფანტულობა
მონაცემთა გაფანტულობა
1
ცენტრალური ტენდენციის საზომები
მედიანა - მნიშვენლობა რომელიც განაწილებას ორ თანაბარ ნაწილად ყოფს, ისე რომ ერთ
ნახევარი მის ზემოთ მდებარეობს, ხოლო მეორე ნახევარი მის ქვემოთ
𝛴 𝑥
𝑥=
𝑛
2
მონაცემთა გაფანტულობის საზომები
მაგალითად:
3
მონაცემთა გაფანტულობის საზომები
ისე, იმის ნაცვლად, რომ შევადაროთ თითოეული ქულა განაწილების ყველა სხვა ქულას,
ერთი ქულა, რომელიც შეიძლება გამოყენებულ იქნას შედარებად არის - ეს მართალია -
საშუალო. ამრიგად, ცვალებადობა ხდება საზომი იმისა, თუ რამდენად განსხვავდება
თითოეული ქულა ქულების ჯგუფში საშუალოდან, ჩვეულებრივ, საშუალოდან .
4
მონაცემთა გაფანტულობის საზომები
დიაპაზონი (Range)
დისპერსია - (Variance)
5
დიაპაზონი (Range)
r – დიაპაზონი
98 – 48 = 50
6
ინტერკავრტილური დიაპაზონი - IQR
IQR - ნიშნავს ინტერკვარტულ დიაპაზონს, რომელიც არის სტატისტიკური დისპერსიის საზომი. ეს არის
დიაპაზონი პირველ მეოთხედს (Q1) და მესამე მეოთხედს (Q3) შორის მონაცემთა ბაზაში. კვარტლთაშორისი
დიაპაზონი იძლევა მონაცემების შუა 50%-ის გავრცელების განცდას და ნაკლებად მგრძნობიარეა გარედან,
ვიდრე სრული დიაპაზონი.
2 .იქოვეთ მედიანა (Q2), რომელიც არის მონაცემთა ნაკრების საშუალო მნიშვნელობა. თუ მონაცემთა ნაკრებს
აქვს ლუწი რაოდენობის მნიშვნელობები, მედიანა არის ორი შუა მნიშვნელობის საშუალო.
3 .იპოვეთ პირველი კვარტილი (Q1), რომელიც არის მონაცემთა ნაკრების ქვედა ნახევრის მედიანა (საერთო
მედიანას გამოკლებით, თუ მონაცემთა ნაკრებს აქვს კენტი რაოდენობის მნიშვნელობები).
4 .იპოვეთ მესამე კვარტილი (Q3), რომელიც არის მონაცემთა ნაკრების ზედა ნახევრის მედიანა (საერთო
მედიანას გამოკლებით, თუ მონაცემთა ნაკრებს აქვს კენტი რაოდენობის მნიშვნელობები).
IQR=Q3−Q1
7
განვიხილოთ შემდგომი მაგალთი:
8
მართკუთხა დიაგრამები (Box Plots)
მართკუთხა დიაგრამა (Box Plot) - ეს არის სტატისტიკური მონაცემების გრაფიკული წარმოდგენა ხუთ
რიცხვიან შეჯამებაზე: მინიმალური, პირველი მეოთხედი (Q1), მედიანა , მესამე მეოთხედი (Q3) და
მაქსიმალური. ეს არის მონაცემთა განაწილების ჩვენების სტანდარტიზებული გზა ხუთნომრიანი
შეჯამების საფუძველზე. აი, როგორ არის სტრუქტურირებული და გამოყენებული :
9
სტანდარტული გადახრა (SD)
10
მაგალითად, გვაინტერესებს ჩვენი რესპონდენტების სიმაღლის სტანდარტული
გადახრა
გვაინტერესებს მონაცემები საშუალოდან რამდენითა გაფანტული
ს 18 CM
ი 8 CM 6 CM
მ 155 სმ.
ა 8 CM 9 CM
15 CM
ღ
ლ
ე
11
მონაცემები რომელსაც
გამოვიყენებთ
173, 147, 140, 163, 146, 161
s
173 155 18 324
12
მაგალითად, სკოლის ადმინისტრაცია დაინტერესდა, თუ ბოლო 10 დღის განმავლობაში , მოსწავლეების სკოლაში
სიარულის რაოდენობაზე.
5, 8, 5, 4, 6, 7, 8, 8, 3, 6
საშუალო - = 60 / 10 = 6
s
8 6 8–6=2 4
8 6 8–6=2 4
s = = 1.76
8 6 8–6=2 4
7 6 7–6=1 1
6 6 6–6=0 0 სტუდენტების უმეტესობის
დასწრების რიცხვი საშუალოსთან
6 6 6–6=0 0
ახლოსაა, უმეტესობა ესწრება ±1,76
5 6 5 – 6 = -1 1 დღეს საშუალოდ. ეს მიუთითებს
5 6 5 – 6 = -1 1 სტუდენტების შედარებით
თანმიმდევრულ დასწრებაზე.
4 6 4 – 6 = -2 4
3 6 3 – 6 = -3 9
60 0 28
13
მაგალითი: დავუშვათ, რომ გვაქვს შემდეგი მონაცემთა ნაკრები, რომელიც წარმოადგენს სტუდენტების ქულებს
მათემატიკის ტესტში:
(70−75)2 = 25; (72−75)2 = 9; (75−75)2 = 0; (78−75)2 = 9, (80−75)2 = 25; (70−75)2 = 25; (72−75)2 = 9; (75−75)2 = 0, (78−75)2 = 9, (80−75)2 = 25;
s = √ 15.1.6≈3.88
ამრიგად, მოცემული მონაცემთა ნაკრების სტანდარტული გადახრა არის დაახლოებით 3.88 ეს მნიშვნელობა გაძლევს
წარმოდგენას იმის შესახებ, თუ რამდენად განსხვავდება ინდივიდუალური ქულები საშუალოდან. უფრო მცირე სტანდარტული
გადახრა მიუთითებს იმაზე, რომ ქულები უფრო ახლოსაა საშუალოსთან, ხოლო უფრო დიდი სტანდარტული გადახრა
მიუთითებს მონაცემთა ნაკრების დიდ ცვალებადობაზე.
14
დისპერისა - Variance
დისპერსია - არის სტატისტიკური საზომი, რომელიც აღწერს მონაცემთა პუნქტების
ნაკრების გავრცელებას ან დისპერსიას მონაცემთა ბაზაში. ის რაოდენობრივად
განსაზღვრავს, თუ რამდენად არის დაშორებული სიმრავლის თითოეული მონაცემთა
წერტილი საშუალოდან (საშუალოდან) და ამგვარად იძლევა მონაცემებში ცვალებადობის
ან გავრცელების ხარისხის მითითებას.
დისპერსიული (s2) გამოითვლება კვადრატული სხვაობების საშუალოს აღებით თითოეულ
მონაცემთა წერტილსა და საშუალოს შორის. დისპერსიის ფორმულა შემდეგია:
2
𝑠 =
∑ ( 𝑥 − 𝑥) 2
𝑛 −1
– დისპერსია;
E – მნიშვნელობათა ჯამი;
X – ინდივიდუალური მნიშვნელობა;
X – საშუალო
N – მნიშნელობათა რაოდენობა
15
ვარიაციის კოეფიციენტი - CV
𝑠
𝐶𝑣 = ⋅ 100 %
𝑥
CV - ვარიაციის კოეფიციენტი
ვარაციის კოეფიციენტი კარგია მაშინ, როდესაც ვადარებთ ერთ
s - სტანდარტული გადახრა მონაცემეს, მეორეთი ვადარებთ, განსაკუთრებით მაშინ,
როდესაც საშუალოები ერთმანეთისგან მნიშნელოვნად
განსხვავდება.
x - საშუალო ეს არის ეფექტური გზა მონაცემთა ცვალებადობის კონტექსტის
გასაგებად.
16
ვარიაციის კოეფიციენტი - CV
მაგალითი
წარმოიდგინე გვაქვს გამოცდის ქულების ორი ნაკრები:
17
მადლობა ყურადღებისთვის!
18