You are on page 1of 13

სტატისტიკის შესავალი

რა არის სტატისტიკა ?

სტატისტიკა ეს არის - მეთოდების ერთობლიობა, რომელთა გამოყენებითაც


შეგვიძლია ინფორმაციის თავმოყრა, განზოგადება და გადმოცემა.

ყველაზე ზოგადი გაგებით, სტატისტიკა აღწერს ინსტრუმენტებისა და ტექნიკის


ერთობლიობას, რომლებიც გამოიყენება ინფორმაციის ან მონაცემების აღწერისთვის,
ორგანიზებისა და ინტერპრეტაციისთვის. ეს მონაცემები შეიძლება იყოს ტესტის
ქულები, რომლებიც მონაწილეობენ მათემატიკის სპეციალურ სასწავლო გეგმაში,
პრობლემების გადაჭრის სიჩქარე, გვერდითი ეფექტების რაოდენობა, როდესაც
პაციენტები იყენებენ ერთი ტიპის წამალს, ვიდრე მეორეს, შეცდომების რაოდენობა
თითოეულ მნიშვნელობაში. მსოფლიო სერიების თამაში, ან სადილის საშუალო ფასი
სანტა ფეში, ნიუ-მექსიკოში მდებარე მაღალხარისხიან რესტორანში (არ არის იაფი )

მონაცემები ეს არის - რიცხვებით გამოსახული


ინფორმაცია და ფაქტები, რომელიც შეიძლება იყოს
სტატისტიკური ანალიზის ობიექტი.

მონაცემები ეს არის ინფორმაცია, როგორიცაა


ფაქტები და რიცხვები, რომლებიც გამოიყენება
რაღაცის გასაანალიზებლად ან გადაწყვეტილების
მისაღებად.

სამყაროში მრავალი ტიპის მონაცემი არსებობს.


მონაცემი არის ის, რაზეც საჭირო პასუხის მიღება გვჭირდება. ეს შეიძლება იყოს ,
მაღაზიებში საშუალო ხარჯი, კვირაში სპორტულ დარბაზში სიარულის სიხშირე ,
ამინდის პროგნოზი და ა.შ. მონაცემები ჩვენს ყოველდღიურ რუტინასაც ეხება.
მაგალითად, დილით გაღვიძება, აბაზანაში შესვლა, საუზმე, სამსახურში წასვლა,
სახლში დაბრუნება ან მეგობრებთან ერთად კაფეში ან ბარში გასვლა, ძილი და ა.შ.
ყოველივე ეს რაც ჩამოვთვალეთ, მონაცემებია. თუმცა, შეიძლება გაგიჩნდეთ შეკითხვა ,
თუ მონაცემი რაში გჭირდებათ? მონაცემები ჩვენს ცხოვრებაში ძალიან მნიშნელოვან
როლს ასრულებს. ჩვენი ყოველდღიურობის მაგალითს, რომ დავუბრუნდეთ,
მონაცემები გვეხმარება არჩევანის გადაწყვეტილების მიღებაში. მაგალითად ,
მეტეოროლოგებმა ინფორმაცია მოგვაწოდეს, რომ მომდევნო დღეს ტემპერატურა -1
გრადუსი იქნება, რაც იმას ნიშნავს, რომ გარეთ თუ გავალთ, აუცილებლად თბილად
უნდა ჩავიცვათ.

თუმცა, მონაცემების შესაგროვებლად სხვადასხვა ეტაპების გავლაა აუცილებელი .


პროცესს, რომლის მეშვეობითაც მონაცემებს ვიღებთ, კვლევა ეწოდება. კვლევის
პროცესი კი ეს საქმინობაა, რომლის მიხედვითაც მკვლევარები პასუხობენ საკვლევ
კითხვებს და ჰიპოთეზას ამოწმებენ.

ნაჩმიასის თანახმად, კვლევის პროცესი ხუთი საფეხურისგან შედგება :

1. კვლევის კითხვების დასმა


2. ჰიპოთეზის ფორმულირება
3. მონაცემების შეგროვება
4. მონაცემების ანალიზი
5. ჰიპოთეზის შეფასება

ჰიპოთეზა ეს არის მკვლევირს მიერ გამოთქმული ვარაუდი, რაზეც გვსურს მივიღოთ


პასუხი.

კვლევის მთელი არსი გარკვეული ჰიპოთეზების შემოწმებაა. ჰიპოთეზების


შემოწმებისთვის ერთმანეთთან ვაკავშრებთ გარკვეულ ცვლადებს.

სანამ სტატისტიკის ტიპებზე გადავალთ, აუცილებელია რომ ვიცოდეთ თუ რა არის


პოპულაცია, შერჩევა, პარამეტრი და სტატისტიკა.

პოპულაცია - ეს არის მკვლევრის სამიზნე ჯგუფის სრული შემადგენლობა.

შერჩევა - პოპულაციიდან გამოყოფილი ქვეჯგუფი. რომელიც გარკვეული წესების


მიხედვითაა დალაგებული.

პარამეტრი - ეს არის რიცხობრივად გამოხატული პოპულაციის მახასიათებელი.

სტატისტიკა - პარამეტრიდან გამოყოფილი ზოგადი რიცხვი, შერჩვეის


მახასიათებელი.

სტატისტიკის ტიპები

ორი ტიპის სტატისტიკა არსებობს: აღწერითი და დასკვნითი.

აღწერით სტატისტიკა საშუალებას გვაძლევს დავადგინოთ შერჩევის ძირითადი


მახასიათებელი. გვეხმარება მონაცემთა თავმოყრაშ და აღწერაში. მონაცემები
შესაძლოა გაანალიზდეს შერჩევით კვლევის საფუძველზე ან მთლიანი
ერთობლიოვიდან. მაგალითად, ჩვენ შეგვიძლია აღვწეროთ თბილისში მცხოვრები
რაიმე შერჩევის ოჯახის წევრების რაოდენობა, შემოსავალი, სტუდენტების მიერ
მიღებული ქულები და ა.შ.

აღწერითი სტატისტიკის მთავარი მიზანია შერჩევის მონაცემების სრული სიის


გამოკვლევა და ამ მონაცემთა ერთბლიობის თვალსაჩინოდ და კომპაქტურად
წარმოდგენა.

დასკვნითი სტატისტიკა - მთლიანი ერთობლიობის შესახებ დასკვნების (შესაძლო


პროგნოზირება) გაკეთების ლოგიკური ჯაჭვი, რომელიც მიიღება შერჩევით
ერთობლიობაზე დაკვირვებისა და ანალიზის შედეგად.

დასკვნითი სტატისტიკა გვეხმარება მთლიანი ერთობლიობის შესახებ


პრონოზირების ან დასკვნების გაკეთბაში. დასკვნითი სტატისტიკა ხშირად (მაგრამ არა
ყოველთვის) არის შემდეგი ნაბიჯი მონაცემების შეგროვებისა და შეჯამების შემდეგ .
დასკვნითი სტატისტიკის მეშვეობით შეგვიძლია უარყოთ ან მივიღოთ ჰიპოთეზა ან
განვსაზღვროთ რამდენად ზუსტია ანალიზის შედეგეად მიღებული დაკსვნები .
ცვლადი

ცვლადი - თითოეულ მახასიათებელს, რომელიც იცვლება შერჩევაში ან პოპულაციაში


ცვლადი ეწოდება. ცვლადების მაგალითებია სქესი, ასაკი, ოჯახში ბავშვების
რაოდენობა, აგრესიულობა, ტემპერატურა და ა.შ.

სხვანაირად რომ განვმარტოთ, ცვლადი - ადამიანების ან საგნების მახასიათებელია,


რომელმაც შეიძლება ორი ან მეტი მნიშვნელობა მიიღოს.

ცვლადი ეს არის ემპირიული თავისებურება, რომელსაც შეიძლება ჰქონდეს ორი ან


მეტი მნიშნელობა.

არსებობს ორი ტიპის ცვლადი: დისკრეტული და უწყვეტი ცვლადი.

ცვლადი

დისკრეტული უწყვეტი

დისკრეტულია ცვლადია რომელსაც გააჩნია მინიმალური საზომი ერთეული,


რომლის შემდგომი დაყოფაც შეუძლებელია. ითვლება, რომ თვისებრივი ტიპის
ცვლადები (სახელდების და ნომინალური) დისკრეტული ცვლადებია . მაგალითად ,
ოჯახში ბავშვების რაოდენობა, სქესი, რელიგია და ა.შ. შეუძლებელია, რომ ოჯახში 2.5
ბავშვი გყავდეს.

უწყვეტია ცვლადი, რომელსაც არ გააჩნია მინიმალური საზომი ერთეული, მათი


მნიშვნელობები შესაძლოა დაიყოს უსასრულოდ მცირე ნაწილებად. უწყვეტ ცვლად
შეუძლია მიიღოს, ნებისმიერი რიცხვითი მნიშვნელობა. მაგალითად, დრო, მანძლი,
სიგრძე, წონა.

ცვლადი შეიძლება იყოს დამოუკიდებელი და დამოკიდებული.

დამოუკიდებელი ცვლადი - მისი სიტყვიდან გამომდინარე, ცვლადი, რომლითაც


მანიპულირებენ ექპერიმენტში დამოკიდებულ ცვლადზე მისი გავლენის განსაზღვრის
მიზნით.

დამოკიდებული ცვლადი - ცვლადი ექსპერიმენტში, რომელიც დამოკიდებულია


დამოუკიდებელ ცვლადზე. ფსიქოლოგიურ კვლევებში შემთხვევათა უმრავლესობაში
დამოკიდებული ცვლადი ქცევის გარკვეული საზომია. ცვლადს, რომლის ახსნასაც
ცდილობს მკვლევარი, დამოკიდებული ცვლადია.

ცვლადი შეიძლება იყოს დიქოტომიური - რომელსაც მხოლოდ ორი მნიშვნელობა


აქვს. მაგალითად, კითხვები, რომლის პასუხებია მხოლოდ კი და არა.

გაზომვის დონეები
გაზომვა ნიშნავს გარკვეული წესების მიხედვით ცვლადებისთვის რიცხობრივი
მნიშნელობების მინიჭებას გაზომვა ეწოდება.

ცნება „გაზომვა“ ხელსაწყოსთან (სახაზავი, სასწორი) გაზომვის შედეგები კი, რიცხვებში


გამოხატულ გარკვეულ ზომასთან არის ასოცირებული.

სკალა - რიცხვთა სისტემა, რომელიც მიღებულია რაიმე სიდიდეთა გასაზომად,


სკალა .
შესაფასებლად ან განსასაზღვრად, სკალა ეწოდება

არსებობს ოთხი ტიპის სკალა

თვისებრივი რაოდენობრივი

ნომინალური - (იგივე სახელდების) გაზომვის დონე უბრალოდ განასხვავებს ცვლადის


ნომინალური რიგის ინტერვალის შეფარდების

მნიშვნელობებს ერთმანეთისაგან. მაგალითად: სქესი, საცხოვრებელი ქვეყანა ,


რელიგიური მრწამსი, ოჯახური მდგომარეობა და ა.შ. ცვლადის მნიშვნელობებს შორის
არ არსებობს მეტ-ნაკლებობის ცნება. ნომინალურ მონაცემებს არ აქვთ
თანდაყოლილი თანმიმდევრობა ან რიცხვითი მნიშვნელობა.

ორდინალური - (იგივე რიგის) გაზომვის დონეზე ცვლადის მნიშვნელობები


რანჟირებულია მეტ-ნაკლებობის გაგებით, თუმცა არ შეგვიძლია ვთქვათ რამდნეჯერ ან
რამდენით მეტია ცვლადის ერთი მნიშვნელობა მეორეზე. მაგალითად შემოსავლის
დონე: დაბალი, საშუალო და მაღალი. ამ სკალაზე მონაცემებს რიცხობრვ
მნიშვნელობებს ვანიჭებთ, როგორც ნომინალურ სკალაზე, მაგრამ ამ შემთხვევაში
სიმბოლოებს აქვს თავისი ახსნა. რიგითი სკალა აწესრიგებს ან ანაწილებს მონაცემებს
კატეგორიებად მნიშვნელოვანი ფარდობითი განსხვავებებით.

ინტერვალის - ცვლადები, რომელთა მნიშვნელობები საშუალებას გვაძლევს


განვსაზღვროთ, თუ რამდენით ან რამდნჯერ მეტია/ნაკლებია ერთი მნიშვნელობა
მეორეზე. თუმცა ინტერვალთა სკალას არ აქვს აბსოლიტური ნულის მნიშნელობა.
ინტერვალის სკალის მაგალითია ფარენჰაიტის და ცელსიუსის ტემპერატურის
სკალები. ნულოვანი მაჩვენებელი არცერთზე არ ნიშნავს ტემპერატურის საერთოდ
არქონას. არცერთ მათგანს არ აქვს აბსოლიტური ნულის მნიშვნელობა, რადგან
შეიძლება ტემპერატურა ნულზე დაბლა დაეცეს. მაგალითად: ტემპერატურა , გრადუსი
ცელსიუსში ან ფარენჰეიტში. სხვაობა 10°C-სა და 20°C-ს შორის იგივეა, რაც 20°C-დან
30°C-მდე, მაგრამ 0°C არ წარმოადგენს ტემპერატურის არარსებობას.
შეფარდების სკალა - ცვლადები, რომლებსაც აქვთ აბსოლიტური ნული (კერძოდ
წყლის გაყინვის მაჩვენებელი) შეიძლება გაიზომოს შეფარდების სკალაზე.
ინტერვალური სკალის მსგავსად მნიშვნელობა აქვს იგივე. ისეთ ცვლადებს
როგორიცაა, წონა, დრო, მანძილი და ფართობი აქვს აბსოლიტური ნული და იზომება
შეფარდების სკალაზე.

სიხშირული განაწილება

სიხშირული განაწილება - ცვლადის თითოეულ კატეგორიაში მოხვედრილი


დაკვირვებების რაოდენობა, წარმოდგენილი ცხრილის სახით (Frequencies).

კოეფიციენტი - ფარდობითი სიხშირე, რომელიც მიიღება თითოეული კატეგორიის


სიხშირის ფარდობით დაკვირვებათა რაოდენობაზე.

პროცენტი - ფარდობითი სიხშირე, რომელიც მიიღება თითოეული კატეგორიის


სიხშირის გაყოფით დაკვირვებათა რაოდენობაზე და 100-ზე გამრავლებით.

კუმულაციური განაწილება - საშუალებას გვაძლევს წარმოვიდგინოთ სიხშირეები


ცვლადის თითოეული კატეგორიისა და მისი წინა სიხშირეების საშუალებით .
კუმულაციური სიხშირეები გამოიყენება მხოლოდ ორდინალურ ცვლადებსა და
გაზომვის უფრო მაღალ დონეზე.

კუმულაციური განაწილება
რესპონდენტის ასაკი სიხშირე კუმულაციური სიხშირე
20-29 7 7
30-39 7 7 + 7 = 14
40-49 12 14 + 12 = 26
50-59 3 26 + 3 = 29
60+ 8 29 + 8 = 40
სულ 40

ცენტრალური ტენდენციის საზომები

ცენტრალური ტენდენცია არის სტატისტიკური კონცეფცია, რომელიც ეხება


ცენტრალურ ან ტიპურ მნიშვნელობას, რომლის ირგვლივ მიდრეკილია მონაცემთა
წერტილების ან დაკვირვებების ერთობლიობა. იგი გამოიყენება მონაცემთა ნაკრების
ყველაზე წარმომადგენლობითი ან საერთო მნიშვნელობის აღსაწერად. ცენტრალური
ტენდენციის რამდენიმე საერთო საზომი არსებობს, მათ შორის:

 მოდა,
 მედიანა
 საშუალო

საშუალო

საშუალო არის ყველაზე გავრცელებული ტიპის საშუალო, რომელიც გამოითვლება. ის


იმდენად პოპულარულია, რომ მეცნიერები ხანდახან დაუდევრად ექცევიან სიტყვას
საშუალოდ, თითქოს ეს ნიშნავს ცუდს, მაშინ როცა ის მხოლოდ ხანდახან ნიშნავს.
საშუალო უბრალოდ არის ჯგუფის ყველა მნიშვნელობის ჯამი, გაყოფილი ამ ჯგუფის
მნიშვნელობების რაოდენობაზე. ასე რომ, 30 მეხუთე კლასელისთვის რომ გქონდეთ
ორთოგრაფიული ქულა, თქვენ უბრალოდ დააგროვებდით ყველა ქულას, რომ
მიიღოთ ჯამი და შემდეგ გაყოფდით მოსწავლეთა რაოდენობაზე, რომელიც არის 30.

 საშუალო გამოითვლება ყველა მონაცემთა წერტილის შეჯამებით


ერთობლიობაში და გაყოფით მონაცემთა რაოდენობაზე. ის უზრუნველყოფს
მონაცემთა დაბალანსებულ წარმოდგენას, თუკი მონაცემები მიჰყვება
ნორმალურ განაწილებას.

Σx
x=
n

 ასო X მის ზემოთ ხაზით (ასევე ზოგჯერ უწოდებენ "X ზოლს") არის
საშუალოქულების ჯგუფის ღირებულება;
 ∑, ან ბერძნული ასო სიგმა, არის შემაჯამებელი ნიშანი, რომელიც
გეუბნებათ„შეაჯამეთ“ ან დაამატეთ ყველაფერი, რაც მას მოჰყვება;
 X არის თითოეული ინდივიდუალური ქულა ქულების ჯგუფში;
 n არის ნიმუშის ზომა, საიდანაც თქვენ გამოთვალეთ საშუალო, theქულების
რაოდენობა.

მაგალითად:

დავუშვათ, რომ 5 მოსწავლის გამოცდის ქულების ნაკრები გვაქვს: 85, 90, 78, 92 და 88.
საშუალო ქულის საპოვნელად მიჰყევით ამ ნაბიჯებს:

დაამატეთ ნაკრების ყველა რიცხვი:85 + 90 + 78 + 92 + 88 = 433

დაითვალეთ ნაკრების მნიშვნელობების საერთო რაოდენობა, რომელიც ამ


შემთხვევაში არის 5.

ჯამი (433) გაყავით მნიშვნელობების საერთო რაოდენობაზე (5): საშუალო = 433 / 5 = 86.6

საშუალო = (ყველა მნიშვნელობის ჯამი) / (მნიშვნელობების საერთო რაოდენობა)

მედიანა
მედიანა არის ცენტრალური ტენდენციის საზომი, რომელიც გამოიყენება სტატისტიკაში
მონაცემთა ნაკრების საშუალო მნიშვნელობის აღსაწერად, როდესაც მონაცემები
მოწესრიგებულია. ეს არის საშუალო მნიშვნელობა, რომელიც გამოყოფს მონაცემთა
ნაკრების უფრო მაღალ ნახევარს ქვედა ნახევრისგან. მედიანის მოსაძებნად , მიჰყევით
ამ ნაბიჯებს:

დაალაგე მონაცემები ზრდადი (ან კლებადი) თანმიმდევრობით უმცირესიდან ყველაზე


დიდამდე (ან დიდიდან უმცირესამდე).
თუ მონაცემთა ნაკრებს აქვს კენტი რაოდენობის მნიშვნელობები, მედიანა არის
საშუალო მნიშვნელობა. მაგალითად, თუ თქვენ გაქვთ მონაცემთა ნაკრები {3, 1, 4, 2, 5},
თანმიმდევრობით დალაგებისას, ის ხდება {1, 2, 3, 4, 5}, ხოლო მედიანა არის 3.

თუ მონაცემთა ნაკრებს აქვს ლუწი რაოდენობის მნიშვნელობები, მედიანა არის ორი


შუა მნიშვნელობის საშუალო. მაგალითად, თუ თქვენ გაქვთ მონაცემთა ნაკრები {6, 2, 1,
5, 3, 4}, თანმიმდევრობით დალაგებისას, ის ხდება {1, 2, 3, 4, 5, 6}, ხოლო მედიანა არის
საშუალო ორი შუა მნიშვნელობა, რომელიც არის 3 და 4. ასე რომ, მედიანა არის (3 + 4) /
2 = 3.5.

მოდა

მოდა არის მნიშვნელობა, რომელიც ყველაზე ხშირად ჩნდება მონაცემთა ნაკრებში .


მონაცემთა ნაკრები შეიძლება ჰქონდეს ერთი რეჟიმი (ერთმოდალური ), ერთზე მეტი
რეჟიმი (მულტიმოდალური) ან საერთოდ არ იყოს რეჟიმი. რეჟიმი სასარგებლოა
მონაცემთა ნაკრების ყველაზე ხშირი მნიშვნელობის აღწერისთვის , განსაკუთრებით
კატეგორიული ან დისკრეტული მონაცემებისთვის.

მაგალითად: 1, 2, 3, 1, 5, 6, 2;

მოდა: 1, 2;

გაფანტულობის საზომები

გაფანტულობა (ასევე უწოდებენ გავრცელებას ან დისპერსიას) შეიძლება ჩაითვალოს ,


როგორც საზომი იმისა, თუ რამდენად განსხვავებულია ქულები ერთმანეთისგან . კიდევ
უფრო ზუსტია (და შესაძლოა უფრო ადვილიც) ვიფიქროთ გაფანტულობაზე, თუ
რამდენად განსხვავებულია ქულები ერთი კონკრეტული ქულისგან.

ვარიაციის საზომები - რიცხვები, რომლებიც გამოიყენება ცვლადის განაწილების


მრავალფეროვნებისა და ვარიაციის დახასიათებისათვის .

დიაპაზონი

დიაპაზონი - ინტერვალურ-ფარდობითი ცვლადების ვარიაციის საზომი. ის არის


სხვაობა ცვლადის უდიდეს და უმცირეს მნიშვნელობებს შორის.

დიაპაზონი არის მონაცემთა გაფანტულობის მარტივი საზომი და ერთგვარი


ინტუიციური, ეს არის ყველაზე დიდი ქულის სხვაობა უმცირესი ქულისგან .

r=h–l

r – დიაპაზონი

h – უმაღლესი ქულა (Highest Score)

l – ყველაზე დაბალი ქულა (Lowest Score)

მაგალითად:

98, 86, 77, 56, 48


98 – 48 = 50

ინტერკავრტილური დიაპაზონი - IQR

ინტერკვარტილური დიაპაზონი (IQR) - გვიჩვენებს განაწილების შუაში მდგომი


მონაცემების 50%-ის საზღვრებს. ის გაიანგარიშება როგორც Q1 და Q3 კვარტილების
სხვაობა.

IQR - ნიშნავს ინტერკვარტულ დიაპაზონს, რომელიც არის სტატისტიკური დისპერსიის


საზომი. ეს არის დიაპაზონი პირველ მეოთხედს (Q1) და მესამე მეოთხედს (Q3) შორის
მონაცემთა ბაზაში. კვარტლთაშორისი დიაპაზონი იძლევა მონაცემების შუა 50%-ის
გავრცელების განცდას და ნაკლებად მგრძნობიარეა გარედან, ვიდრე სრული
დიაპაზონი.

ქვემოთ მოცემულია ნაბიჯები ინტერკვარტილური დიაპაზონის გამოსათვლელად :

1. დაალაგეთ მონაცემები ზრიდს მიხედვით.

2. იქოვეთ მედიანა (Q2), რომელიც არის მონაცემთა ნაკრების საშუალო


მნიშვნელობა. თუ მონაცემთა ნაკრებს აქვს ლუწი რაოდენობის მნიშვნელობები ,
მედიანა არის ორი შუა მნიშვნელობის საშუალო.

3. იპოვეთ პირველი კვარტილი (Q1), რომელიც არის მონაცემთა ნაკრების ქვედა


ნახევრის მედიანა (საერთო მედიანას გამოკლებით, თუ მონაცემთა ნაკრებს
აქვს კენტი რაოდენობის მნიშვნელობები).

4. იპოვეთ მესამე კვარტილი (Q3), რომელიც არის მონაცემთა ნაკრების ზედა


ნახევრის მედიანა (საერთო მედიანას გამოკლებით, თუ მონაცემთა ნაკრებს
აქვს კენტი რაოდენობის მნიშვნელობები).

5. გამოთვალეთ ინტერკვარტილური დიაპაზონი (IQR), როგორც სხვაობა Q3 და Q1


შორის:

IQR=Q3−Q1

მართკუთხა დიაგრამები (Box Plots)

მართკუთხა დიაგრამები (Box Plots) - Box Plot მოხერხებული ვიზუალური ინსტრუმენტია


ექსტრემუმებისა და განსხვავებული განაწილებების ერთმანეთთან შესადარებლად . ამ
შემთხვევაში, ერთ დიაგრამაზე წარმოდგენილია განაწილების ხუთი მახასიათებელი :
Q1, Q3, მედიანა, IQR და ამოვარდნილი მნიშვნელობები (ექსტრემუმები).

მართკუთხა დიაგრამა (Box Plot) - ეს არის სტატისტიკური მონაცემების გრაფიკული


წარმოდგენა ხუთ რიცხვიან შეჯამებაზე: მინიმალური, პირველი მეოთხედი (Q1),
მედიანა, მესამე მეოთხედი (Q3) და მაქსიმალური. ეს არის მონაცემთა განაწილების
ჩვენების სტანდარტიზებული გზა ხუთნომრიანი შეჯამების საფუძველზე . აი , როგორ
არის სტრუქტურირებული და გამოყენებული:

სტანდარტული გადახრა

სტანდარტული გადახრა - ვარიაციის საზომი ინტერვალურ-ფარდობითი


ცვლადებისთვის. ის უდრის კვადრატულ ფესვს დისპერსიიდან .

სტანდარტული გადახრა (SD) - რამდენადაა მონაცემები გაფანტული საშუალო


მნიშვნელობის გარშემო. წარმოადგენს ცვალებადობის საშუალო რაოდენობას
ქულების ერთობლიობაში. ეს არის თითოეული ქულის მანძილი საშუალოდან. რაც
უფრო დიდია სტანდარტული გადახრა და რაც უფრო დიდია საშუალო მანძილი
თითოეული მონაცემთა წერტილიდან განაწილების საშუალოდან, მით უფრო
ცვალებადია ქულების ნაკრები.


s ¿ ∑ ( x −x )
2

n−1
s – სტანდარტული გადახრა;

E – მონაცემთა ჯამი;

X – ინდივიდუალური ქულა;

X – საშუალო ქულა;

n – მნიშვნელობების სრული რაოდენობა

მონაცემები რომელსაც გამოვიყენებთ

173, 147, 140, 163, 146, 161

x საშუალო - Σx/n = = 930 / 6 = 155

x x x−x ( x−x )2

173 155 18 324

163 155 8 64

161 155 6 36

147 155 -8 64

146 155 -8 81
140 155 -15 225

930 0 794


s ¿ ∑n−1
2
( x −x )
S= √ 794−5=12.6

სტანდარტული გადახრის სიდიდე მკვლევრის ინტერპრეტაციაზეა


დამოკიდებული.

დიდი სტანდარტული გადახრა ნიშნავს, რომ მონაცემთა წერტილები უფრო


დიდზე გაფანტულია. ეს ნიშნავს, რომ მონაცემთა ნაკრებში მეტი ცვალებადობაა.

დისპერსია

დისპერსია - ვარიაციის საზომი ინტერვალურ-ფარდობითი ცვლადებისთვის . ის


საშუალოდან გადახრების კვადრატების საშუალოს წარმოადგენს .

დისპერსია - არის სტატისტიკური საზომი, რომელიც აღწერს მონაცემთა პუნქტების


ნაკრების გავრცელებას ან დისპერსიას მონაცემთა ბაზაში. ის რაოდენობრივად
განსაზღვრავს, თუ რამდენად არის დაშორებული სიმრავლის თითოეული მონაცემთა
წერტილი საშუალოდან (საშუალოდან) და ამგვარად იძლევა მონაცემებში
ცვალებადობის ან გავრცელების ხარისხის მითითებას.

დისპერსიული (s2) გამოითვლება კვადრატული სხვაობების საშუალოს აღებით


თითოეულ მონაცემთა წერტილსა და საშუალოს შორის. დისპერსიის ფორმულა
შემდეგია:
2
s=
∑ ( x−x )2
n−1

2
s – დისპერსია;
E – მნიშვნელობათა ჯამი;

X – ინდივიდუალური მნიშვნელობა;

X – საშუალო

N – მნიშნელობათა რაოდენობა

ვარიაციის კოეფიციენტი
ვარიაციის კოეფიციენტი (CV) - ვარიაციის საზომი ინტერვალურ- ფარდობითი
ცვლადებისთვის. ის არის ფარდობა სტანდარტულ გადახრასა და ცვლადის საშუალოს
შორის. ხშირად მას %-ში გამოსახავენ, რისთვისაც ამრავლებენ 100-ზე.

ვარიაციის კოეფიციენტი (CV) არის სტატისტიკური საზომი, რომელიც გამოიყენება


მონაცემთა ნაკრების ფარდობითი ცვალებადობის შესაფასებლად. ის გამოიხატება
პროცენტულად და გამოითვლება მონაცემთა ნაკრების სტანდარტული გადახრის
გაყოფით მის საშუალოზე, შემდეგ შედეგის 100-ზე გამრავლებით. ფორმულა არის:

s
Cv= ⋅100 %
x
CV - ვარიაციის კოეფიციენტი

s - სტანდარტული გადახრა

x - საშუალო

ვარაციის კოეფიციენტი კარგია მაშინ, როდესაც ვადარებთ ერთ მონაცემეს , მეორეთი


ვადარებთ, განსაკუთრებით მაშინ, როდესაც საშუალოები ერთმანეთისგან
მნიშნელოვნად განსხვავდება.

ეს არის ეფექტური გზა მონაცემთა ცვალებადობის კონტექსტის გასაგებად .

განაწილება

სიმეტრიული განაწილება - სიხშირეები განაწილების ორივე მხარეს იდენტურია.

გადახრილი განაწილება - გადახრილია განაწილება, თუ ერთ მხარეს რამოდენიმე


ექსტრემალური მნიშვნელობა მდებარეობს.

ნეგატიურად გადახრილი განაწილება - განაწილება მოიცავს რამდენიმე


ექსტრემალურად დაბალ მნიშვნელობას.

პოზიტიურად გადახრილი განაწილება - განაწილება მოიცავს რამდენიმე


ექსტრემალურად მაღალ მნიშვნელობას.

ნორმალური განაწილება

ნორმალური განაწილება არის ზარის ფორმის სიმეტრიული თეორიული განაწილება,


რომლის საშუალო, მედიანა და მოდა მის უმაღლეს წერტილში ერთმანეთს ემთხვევა ,
ხოლო სიხშირეები თანდათან მცირდება მრუდის ბოლოებისკენ.

ნორმალური განაწილების მრუდის ფორმა ცვალებადია და ყოველთვის არ


ემთხვევა ერთმანეთს. განაწილების ფორმა დამოკიდებულია საშუალოსა და
სტანდარტულ გადახრაზე.

ხშირად პრაქტიკული განაწილება უახლოვდება თეორიულ ნორმალურ განაწილებას ,


სწორედ ამიტომ არის მნიშვნელოვანი ვიცოდეთ თეორიული განაწილების
მახასიათებლები, რათა უკეთესად შევძლოთ ჩვენი პრაქტიკული განაწილების
თვისებების ახსნა.
არეები ნორმალური მრუდის ქვეშ

საშუალოსა და +/- 1 სტანდარტულ გადახრას შორის მოექცევა დაკვირვებების


(მონაცემების) დაახლოებით 68%

საშუალოსა და +/- 2 სტანდარტულ გადახრას შორის მოექცევა დაკვირვებების


(მონაცემების) დაახლოებით 95%

საშუალოსა და +/- 3 სტანდარტულ გადახრას შორის მოექცევა დაკვირვებების


(მონაცემების) დაახლოებით 99,7%

სტანდარტული Z ქულები

სტანდარტული (Z) ქულა - სტანდარტული გადახრების რაოდენობა, რომელიც


გვიჩვენებს მოცემული ნედლი ქულის საშუალოდან დაშორების ზომას ზემოთ ან
ქვემოთ.

Z ქულა გვიჩვენებს თუ რამდენი სტანდარტული გადახრით არის ნედლი ქულა


საშუალოზე მაღალი ან დაბალი.

ნედლი ქულის გადაყვანა Z ქულაში:


y− y
z=
Sy

Z ქულის ნედლ ქულაში გადაყვანა:

y= y+ z ( s y )

სტანდარტული ნორმალური განაწილება - სტანდარტული ქულებით (Z) წარმოდგენილი


განაწილება, სადაც საშუალო = 0-ს, ხოლო სტანდარტული გადახრა = 1-ს.

You might also like