Professional Documents
Culture Documents
სტატისტიკური ინფორმაციის დამუშავების პროგრამული უზრუნველყოფა - ნ. ოთხოზორია, PDF
სტატისტიკური ინფორმაციის დამუშავების პროგრამული უზრუნველყოფა - ნ. ოთხოზორია, PDF
oTxozoria
statistikuri informaciis
damuSavebis programuli
uzrunvelyofa
`teqnikuri universiteti”@
saqarTvelos teqnikuri universiteti
registrirebulia stu-s
saredaqcio-sagamomcemlo
sabWos mier
Tbilisi
2009
დამხმარე სახელმძღვანელო მოიცავს მოკლე თეორიულ
ცნობებს, სტატისტიკური ფუნქციების აღწერას და მათ პრაქტიკულ
გამოყენებას. დაწვრილებით არის განხილული მონაცემთა ანალი-
ზის მეთოდები და მათი გამოყენება Microsoft Excel-ისა და მონა-
ცემთა ანალიზის პაკეტის Statistica-ს მიხედვით. ის დახმარებას
გაუწევს როგორც სტუდენტებს სასწავლო გეგმით გათვალისწინე-
ბული პროგრამის შესრულებაში, გაანალიზებასა და მათ პრაქტი-
კულ გამოყენებაში, ასევე მომხმარებლებს მონაცემთა დამუშავები-
სა და ანალიზის სპეციფიკურ საკითხებში.
yvela ufleba daculia. am wignis arc erTi nawili (iqneba es teqsti, foto,
ilustracia Tu sxva) aranairi formiT da saSualebiT (iqneba es eleqtronuli Tu
meqanikuri), ar SeiZleba gamoyenebul iqnas gamomcemlis werilobiTi nebarTvis
gareSe.
saavtoro uflebebis darRveva isjeba kanoniT.
შინაარსი 2.2.პროცედურა Descriptive statistics (აღწერითი 63
სტატისტიკა)
შესავალი 4 2.3. რეგრესიული ანალიზი Multiple Regressions 70
1. სტატისტიკური ანალიზი Microsft Excel-ის მოდულის გამოყენებით
გამოყენებით 7 2.4. პროცედურა Correlation matrices (კორელაციური 81
1.1. ძირითადი სტატისტიკური მახასიათებლები 9 მატრიცები)
1.1.1. სტატისტიკური მახასითებლები და მათი გამოყენებული ლიტერატურა 85
შესაბამისი ფუნქციები Excel-ში 12
მდგომარეობის მაჩვენებლები 12
გაბნევის მაჩვენებლები 20
ასიმეტრიის მაჩვენებლები 25
განაწილების მაჩვენებლები 26
1.2.მონაცემთა ანალიზის სერვისის ჩართვა 27
1.2.1. აღწერითი სტატისტიკის რეჟიმი 28
1.2.2. ”ჰისტოგრამის” რეჟიმში მუშაობის
ტექნოლოგია 33
1.2.3. ”ამონარჩევის” რეჟიმში მუშაობის
ტექნოლოგია 37
1.2.4. რეგრესიული ანალიზი 41
1.2.5. ერთფაქტორიანი დისპერსიული ანალიზი 53
1.2.6. კორელაცია 55
1.2.7. კოვარიაცია 56
1.2.8. შემთხვევითი რიცხვების გენერირება 57
1.2.9. სტანდარტული ნორმალური განაწილება 58
2. სტატისტიკური ანალიზი მონაცემთა ანალიზის 60
პაკეტის Statistica გამოყენებით
2.1. კვლევის მონაცემების პირველადი დამუშავება 60
Basic Statistics / Tables მოდულის მხედვით
3 4
შესავალი მწკრივების, კორელაციურ-რეგრესიულ, ფაქტორულ და
კლასტერულ ანალიზზე. ამ პაკეტებიდან გავრცე-
საბაზრო რეჟიმის და მკაცრი კონკურენციის ლებულია ODA, WinSTAT, Statit , STADIA.
პირობებში კომერციული ფირმების, ბანკების, სტატისტიკურ პაკეტებს გააჩნიათ შემდეგი
სადაზღვევო კომპანიების და სხვა ორგანიზაციების შესაძლებლობები:
წარმატებული ფუნქციონირებისათვის საჭიროა • მონაცემთა საკმაოდ დიდი რაოდენობის
პროდუქციის წარმოების, ექსპლუატაციის, ასევე დამუშავება;
კონკურენტების შესახებ ინფორმაციის ანალიზი და • ამოცანების აღწერა ჩაშენებული პროგრამული ენის
საიმედო და დასაბუთებული დასკვნების მიღება. საშუალებით;
ამიტომაც მონაცემთა სტატისტიკური ანალიზის • მათ საფუძველზე ინფორმაციის დამუშავების
საშუალებებზე მოთხოვნა საკმაოდ მაღალია. სისტემის შექმნა მთელი საწარმოსათვის;
შესაბამისად სტატისტიკური პროგრამების ბაზარი • სპეციალიზირებული ანალიზის მეთოდების
მნიშვნელოვნად განვითარდა და დღეს ამ ბაზარზე გამოყენება.
წარმოდგენილია ათასზე მეტის სხვადასხვა პროგრამა, სტატისტიკური პაკეტის შერჩევა მონაცემთა
რომლებიც ერთმანეთისაგან განსხვავდებიან ანალიზისათვის დამოკიდებულია გადასაწყვეტი
სამომხმარებლო ინტერფეისით, გამოყენების ამოცანის ხასიათზე, დასამუშავებელი მონაცემების
შესაძლებლობებით, მოწყობილობებისადმი მოთხოვ- მოცულობასა და სპეციფიკაზე, მომხმარებლის
ნებით და ა.შ. სხვადასხვა კრიტერიუმებით. ძირითადი კვალიფიკაციაზე, არსებულ აპარატურულ რესურსებზე
ნაწილი ამ პროგრამებისა შეიძლება დავყოთ ორ და ა.შ.
ჯგუფად: უნივერსალური ანუ ზოგადი დანიშნულების ჩვენი მიზანია ჩავატაროთ გავრცელებული
სტატისტიკური პაკეტები და სპეციალიზირებული სტატისტიკური პაკეტების შესაძლებლობების ანალიზი,
პროგრამული პროდუქტები. რათა მომხმარებელს საკუთარი კომპეტენციის
უნივერსალური პაკეტები არ არის ფარგლებში გაუადვილდეს საჭირო პროგრამული
ორიენტირებული სპეციფიკურ სფეროზე. ამ ტიპის პაკეტის შერჩევა.
პაკეტებიდან ფართოდ არის გავრცელებული: BAS, SPSS,
Systat, Minilab, Statgraphics, STATISTICA.
სპეციალიზირებულ პაკეტებში, როგორც წესი
ხდება კონკრეტული მეთოდების რეალიზება
კონკრეტული სფეროსათვის. ყველაზე ხშირად ეს
პაკეტები ორიენტირებულნი არიან დროითი
5 6
1. სტატისტიკური ანალიზი Microsft Excel- პროგრამა Excel შეიცავს ასევე დაამტებით
მოდულს Analysis ToolPak, რომელშიც შედის შემდეგი
ის გამოყენებით კომპონენტები:
• დისპერსიული ანალიზის ინსტრუმენტები,
ელექტრონულ ცხრილებთან დაკავშირებული
ერთფაქტორიანი, ორფაქტორიანი პარალელური
პროგრამები წარმოადგენენ ყველაზე პოპულარულ და
დაკვირვებების გარეშე და პარალელური
გავრცელებულ პროგრამებს ტექსტური რედაქტორების
დაკვირვებების შემთხვევაში;
შემდეგ. ასეთი სახის პროგრამული უზრუნველყოფა
• კორელაციის და კოვარიაციის მატრიცის
საშუალებას აძლევს მომხმარებელს ერთ ანგარიშში ან
გამოსათვლელი ინსტრუმენტები;
ერთ სამუშაო წიგნში მოახდინოს მონაცემების,
• აღწერითი სტატისტიკის ცხრილები;
მათემატიკური ფორმულების, ტექსტების და
• ერთპარამეტრიანი ექსპონენციალური
გრაფიკების კომბინირება. ამიტომაც ელექტრონული
განაწილების ინსტრუმენტები;
ცხრილები გახდა არა მხოლოდ ბიზნესის წარმოების,
• ჰისტოგრამები;
არამედ სამეცნიერო გამოკვლევების ჩატარების
• შემთხვევითი რიცხვების გენერატორი
შეუცვლელი ინსტრუმენტი. პროგრამა Excel,
სხვადასხვა განაწილებისათვის;
გამოყენების სიმარტივის და ფართო შესაძლებლობების
• მრავლობითი წრფივი რეგრესიის
გამო ერთ-ერთი პოპულარული გახდა ამ ტიპის
ინსტრუმენტები;
პორგრამებს შორის.
• მონაცემთა შემთხვევითი შერჩევის
Excel მოიცავს 81 სტატისტიკურ და 59
ინსტრუმენტები;
მათემატიკურ ფუნქციას. ამის გარდა, არსებობს ასევე
• t-ტესტები ერთნაირი და განსხვავებული
მრავალი სპეციალური ფუნქცია, რომელიც ფართოდ
დისპერსიების შემთხვევაში;
გამოიყენება ინჟინრებისა და ბიზნესმენების მიერ. Excel-
• z-ტესტები.
ის ბაზისური სტატისტიკური ფუნქციები განეკუთვნება
აღწერით ფუნქციებს, მაგ. საშუალო, სტანდარტული
გადახრა, რანგი და ა.შ. დისკრეტული და უწყვეტი
განაწილების ფუნქციების აღსაწერად გათვალის-
წინებულია ინტეგრალური და ალბათობათა სიმკვრივის
ფუნქციები.
7 8
1. 1. ძირითადი სტატისტიკური საშუალო მნიშვნელობისაგან, იმ პირობით, რომ
მახასიათებლები განაწილების ტიპი უახლოვდება ნორმალურს.
გაქანება - მაქსიმალურ და მინიმალურ
საშუალო მნიშვნელობა - შემთხვევითი სიდიდის მნიშვნელობებს შორის სხვაობა;
საშუალო მნიშვნელობა წარმოადგენს მის ყველაზე ასიმეტრია - ახასიათებს ვარიაციული რიგის
ტიპიურ, ყველაზე ალბათურ მნიშვნელობას, თავისებურ წანაცვლების ხარისხს საშუალო მნიშვნელობიდან
ცენტრს, რომლის გარშემოც არის გაბნეული ნიშან- გარკვეული სიდიდით და მიმართულებით.
თვისებების ყველა მნიშვნელობა. სიმეტრიული მრუდის შემთხვევაში ასიმეტრიის
მედიანა - შემთხვევითი სიდიდის ის კოეფიციენტი ნულის ტოლია. 0,5-ზე ნაკლები
მნიშვნელობაა, რომელიც ამონარჩევის ყველა მნიშვნელობა ითვლება მცირე ასემეტრიად.
შემთხვევას ყოფს ორ ტოლ რიცხობრივ ნაწილად; ექსცესი - ახასიათებს საშუალო მნიშვნელობის
სტანდარტული გადახრა - შემთხვევითი სიდიდის ირგვლივ მნიშვნელობათა კონცენტრაციის ხარისხს და
სტანდარტული გადახრა წარმოადგენს ვარიაციის ზომას. წარმოადგენს მრუდის მახვილწვერიანობის ტავისებურ
ის გვიჩვენებს, საშუალოდ რა ერთეულით ხდება მახასიათებელს. ნორმალური განაწილების შემთხვევაში
გადახრა საშუალო მნიშვნელობიდან. განსაკუთრებულ ექსცესის მნიშვნელობა ნულის ტოლია. თუ ექსცესის
მნიშვნელობას იძენს ნორმალური განაწილების კვლევის მნიშვნელობა დადებითია, მაშინ განაწილების წირს
პროცესში. ნორმალური განაწილების შემთხვევაში მისი გააჩნია ნორმალურზე მაღალი, მახვილი წვერო,
მნიშვნელობათა 68% მოთავსებულია + საშუალოდან წინააღმდეგ შემთხვევაში, თუ უარყოფითია წვერო
ერთმაგი გადახრის ინტერვალში, 95% - + საშუალოდან შედარებით დაბალია და ბლაგვი. ექსცესის უარყოფითი
ორმაგი გადახრის ინტერვალში, 99,7% კი სამმაგი მნიშვნელობბის ზღვარს წარმოადგენს -2 სიდიდე, ხოლო
გადხრის ინერვალში. დადებითი მნიშვნელობის ზღვარი არ არსებობს.
დისპერსია - წარმოადგენს გაბნევის მახასიათებელს
და გვიჩვენებს საშუალო მნიშვნელობიდან გადახრის
კვადრატულ მნიშვნელობას. დისპერსია ეს არის
მოდელის ან პროცესის ერთ-ერთი არსებითი
მაჩვენებელი, ასევე ერთ-ერთი მნიშვნელოვანი
კრიტერიუმი არსებითი მოდელის შესაქმნელად;
საშუალო კვადრატული გადახრა - ეს არის
მნიშვნელობა რომლითაც განსხვავდება ამონარჩევის
საშუალო მნიშვნელობა გენერალური ერთობლიობის
9 10
აღწერითი სტატისტიკის მაჩვენებლები
11
12
ფუნქცია
1. ფუნქცია MIN
13 14
4. .ფუნქცია მაქსიმალური MAXA 5. ფუნქცია კვარტილი QUARTILE
MAXA (მასივი;K) QUARTILE (მასივი;K).
15 16
6. ფუნქცია AVERAGE - საშუალო არითმეტიკული 7. ფუნქცია AVERAGEA საშუალო გეომეტრიული
8. ფუნქცია MODA
17 18
გაბნევის მაჩვენებლები
∑ ( x − x)
i
2
S2 = i =1
n −1
9. ფუნქცია MEDIAN
19 20
2. ფუნქცია VARP დისპერსია 3. ფუნქცია STDV - საშუალო კვადრატული გადახრა
n S= i =1
∑ ( xi − x) 2
n −1
Dx = i =1
n
ზოგჯერ გენერალურ დისპერსიას აღნიშნავენ σ2.
21 22
4. ფუნქცია STDVP - საშუალო კვადრატული გადახრა 5. ფუნქცია AVEDEV - საშუალო წრფივი გადახრა
გადახრას. ∑| x − x |
i
d =± i =1
n
n
∑ ( x − x)
i
2
σ= i =1
n
23 24
ასიმეტრიის მაჩვენებლები განაწილების მაჩვენებლები
თუ მონაცემები ქმნიან არა ამორჩევით, არამედ თუ მონაცემები ქმნიან არა ამორჩევით, არამედ
გენერალურ ერთობლიობას, მაშინ ასიმეტრიულობა გენერალურ ერთობლიობას, მაშინ ექსცესი უნდა
უნდა გამოითვალოს სტანდარტული ფუნქციის გამოითვალოს სტანდარტული ფუნქციის მიხედვით.
მიხედვით.
μ4
μ3 Ex = −3
Ax = 3 σ4
σ
25 26
1.2. მონაცემთა ანალიზის სერვისის ჩართვა
ნახ. 2.3
ნახ. 2.1.1
27 28
სვეტების (Columns) თუ სტრიქონების სახით
(Rows);
3. Labels in First Rows - მოინიშნება იმ შემთხვევაში,
თუ მონაცემთა პირველი სტრიქონი შეიცავს
სათაურს;
4. Output Options - გამოსასვლელი ინტერვალი
(გამოსასვლელი სიდიდე) / New Worksheet Ply -
ახალი სამუშაო ფურცელი/ New WorkBook -
ახალი სამუშაო წიგნი - მიუთითეთ მისამართი
მონიშნულის გასწვრივ.
5. Summary Statistics – ამ ველის მონიშვნის
შემთხვევაში გამოითვლება აღწერითი
სტატისტიკის ყველა ძირითადი მაჩვენებელი;
6. Confidence Level for Mean - ნდობის ალბათობის
ველი მოინიშნება იმ შემთხვევაში, თუ მისი
მნიშვნელობა დასამუშავებელი მონაცემები–
ნახ. 2.1.2 სათვის განსხვავდება ავტომატურად
დაფიქსირებული (95%) მნიშვნელობისაგან;
ეკრანზე გამოჩნდება ფანჯარა (ნახ. 2.1.2) შემდეგი
7. Kth Largest, Kth Smallest - ეს ველი გააქტიურდება
პარამეტრებით :
იმ შემთხვევაში თუ შემაჯამებელ ცხრილში
1. ველი Input Range – მონაცემების მისამართი,
აუცილებელია K-ური მინიმალური ან
შესაძლებელია მონაცემები დაჯგუფებული იყოს
მაქსიმალური ელემენტის ჩვენება;
რამდენიმე სვეტად ან რამდენიმე სტრიქონად,
შესაბამისა აღწერითი სტატისტიკის მაჩვენებლები
ველებში შესაბამისი მონაცემების დაფიქსირების
გამოთვლილი იქნება თითოეული მწკრივისათვის
შემდეგ (ნახ. 2.1.3) დააჭირეთ Ok ღილაკს, ღილაკზე
ერთ ცხრილში ცალკეული სვეტების სახით.
დაჭერის შემდეგ სამუშაო ფურცელზე გამოჩნდება
2. გადამრთველი Grouped by: Columns
მითითებული მონაცემების მიხედვით სტატისტიკური
Rows;
ანალიზის შედეგები (ნახ. 2.1.4)
მოინიშნება იმის შესაბამისად, თუ რა სახით არის
განლაგებული გასაანალიზებელი მონაცემები
29 30
შემაჯამებელ ცხრილში მოყვანილია შემდეგი
მაჩვენებლები :
Mean - საშუალო არითმეტიკული
Standard Error - სტანდარტული ცდომილება -
საშუალო კვადრატული გადახრა μ
Median -მედიანა
Mode - მოდა
Standard Deviation - სტანდარტული გადახრა σx
Sample Variance - ამონარჩევის დისპერსია
Kurtosis - ექსცესი
Skewness - ასიმეტრია
Range - ინტერვალი - ვარიაციის გაქანება - R
Minimum - მინიმუმი
ნახ. 2.1.3 Maximum - მაქსიმუმი
Sum - ჯამი
ნახ. 2.1.3
Count -რაოდენობა
Largest(2) - სიდიდით მეორე მინიმალური ელემენტი
Confidence Level(95.0%) - ნდობის ალბათობა
31 32
მონაცემებში არ გვხვდება ერთნაირი მნიშვნელობის
ელემენტები. ამ შემთხვევაში მოდის მნიშვნელობად
მიიღება ის მნიშვნელობა, რონმელიც შეესაბამება
მაქსიმაურ ორდინატას განაწილების მრუდზე;
4. ექსცესის ან ასიმეტრიის გასწვრივ შეცდომის
ინდიკატორის გამოჩენა მიუთითებს, რომ შემაჯამებელ
ცხრილში სტანდარტული გადახრის მნიშვნელობა 0-ის
ტოლია ან შესასვლელი პარამეტრები მოიცავს 4-ზე
ნაკლებ ელემენტს.
33 34
Labels - მოინიშნება იმ შემთხვევაში, თუ მონაცემთა Bin Frequency Cumulative %
პირველი სტრიქონი შეიცავს სათაურს; 45.00 1 7.14%
Output Options - გამოსასვლელი ინტერვალი 2737.67 12 92.86%
(გამოსასვლელი სიდიდე) / New Worksheet Ply - 5430.33 0 92.86%
ახალი სამუშაო ფურცელი/ New WorkBook - ახალი
More 1 100.00%
სამუშაო წიგნი - მიუთითეთ მისამართი მონიშნულის
გასწვრივ.
ბ) ჰისტოგრამა
Histogram
15 120.00%
100.00%
Frequency
10 80.00%
Frequency
60.00%
Cumulative %
5 40.00%
20.00%
0 0.00%
45.00 2737.67 5430.33 More
Bin
ნახ. 2.1.8
ნახ. 2.1.7
35 36
1.2.3. ”ამონარჩევის” რეჟიმში მუშაობის
ტექნოლოგია
(საცნობარო ინფორმაცია)
ნახ. 2.1.11
გამოსულ დიალოგურ ფანჯარაში შევავსოთ
შესაბამისი ველები (ნახ. 2.1.11)
ნახ. 2.1.9
ნახ. 2.1.12
ნახ. 2.1.10
37 38
მიიღება შემდეგი მონაცემები:
მიღებული შედეგები მოცემულია ნახ. 2.1.15-ზე.
ნახ. 2.1.15
ნახ. 2.1.13
გამოვიძახოთ ისევ რეჟიმი ”ამონარჩევი” ( Sampling) და
დიალოგური ფანჯრის ველები შევავსოთ ნახ. 2.1.14-ზე
მოცემული სახით
ნახ. 2.1.14
39 40
1.2.4. რეგრესიული ანალიზი MS Excel-ის ანალიზთა პაკეტის მიხედვით
მეთოდური რეკომენდაციები რეგრესიული ანალიზის ჩატარების შესახებ საცნობარო
ინფორმაცია
რეგრესიული ანალიზის ჩასატარებლად და
პროგნოზირებისათვის აუცილებელია: 1. Tools მენიუში ვირჩევთ ბრძანებას Data
1. ავაგოთ გრაფიკი საწყისი მონაცემების მიხედვით Analisys - regression. (ნახ. 3.1 ნახ. 3.2)
და დაახლოებით განვსაზღვროთ დამოკიდე- 2. გამოსულ დიალოგურ ფანჯარაში ვირჩევთ
ბულების ხასიათი;
2. შევირჩიოთ რეგრესიის ფუნქციის სახე, რომელიც
შესაძლებელია აღწერდეს საწყის მონაცემებს
შორის კავშირს;
3. განვსაზღვროთ რეგრესიის ფუნქციის რიცხვითი
კოეფიციენტები უმცირეს კვადრატთა მეთოდით;
4. შეაფასეთ მოძებნილი რეგრესიული
დამოკიდებულების კავშირის სიძლიერე
დეტერმინაციი კოეფიციენტის საფუძველზე;
(როცა R ≥ 75% )
2
5. გააკეთეთ პროგნოზი ან
გამოიტანეთ დასკვნა მიღებული რეგრესიული
დამოკიდებულების მიხედვით პროგნოზირების
შეუძლებლობის შესახებ
ნახ. 3.1
41 42
1. Input Y Range - შესავალი სიდიდის Y-ის
მნიშვნელობები ;
2. Input X Range - შესავალი სიდიდის X-ის
მნიშვნელობები;
3. Labels - ჩანართის მონიშვნა საჭიროა იმ
შემთხვევაში, თუ პირველ სტრიქონში მოცემულია
სათაური;
4. Confidence Levels - ნდობის ალბათობის ველის
მონიშვნა საჭიროა იმ შემთხვევაში, თუ
ნახ. 3.2 აუცილებელია მითითებული ნდობის ალბათობის
მნიშვნელობის შეცვლა;
5. Constant is Zero - მონიშვნა აუცილებელია თუ
გამოსულ დიალოგურ ფანჯარაში (ნახ. 3.3) რეგრესიის ხაზმა უნდა გაიაროს კოორდინატთა
შევირჩიოთ შემდეგი პარამეტრები: სისტემის დასაწყისში (а0=0).
6. Output Options - გამოსასვლელი ინტერვალი
(გამოსასვლელი სიდიდე) / New Worksheet Ply -
ახალი სამუშაო ფურცელი/ New WorkBook - ახალი
სამუშაო წიგნი - მიუთითეთ მისამართი
მონიშნულის გასწვრივ.
7. ჯგუფში Residuals ალმის ჩართვის შემთხვევაში
შედეგების ცხრილში გამოჩნდება სხვაობების
შესაბამისი მნიშვნელობები და ასევე მივიღებთ
შესაბამის გრაფიკულ გამოსახულებას;
8. Normal Probability - ნორმალური განაწილების
ალბათური გრაფიკის ველის გააქტიურების
შემთხვევაში Y სიდიდის ავტომატურად
ფორმირებული ინტერვალების დამოკიდებუ-
ლების წერტილოვან გრაფიკს.
ნახ. 3.3
43 44
ამოცანა: ფირმა ახორციელებს სხვადასხვა ტიპის
ტვირთის გადატანას ქალაქის შიგნით. შეაფასეთ ასეთი
მომსახურების ღირებულება დახარჯული დროზე
დამოკიდებულებით. მნიშვნელოვან ფაქტორად,
რომელიც გავლენას ახდენს მიწოდების დროზე არის
გავლილი მანძილი.
3,5 2,4 4,9 4,2 3,0 1,3 1,0 3,0 1,5 4,1
დრო, წთ
16 13 19 18 12 11 8 14 9 16
45 46
სიდიდე R -კვადრატი (R Square), რომელსაც ასევე
უწოდებენ განსაზღვრულობის ზომას, ახასიათებს
მიღებული რეგრესიის წრფის ადეკვატურობას.
ადეკვატურობა გამოისახება საწყისი მონაცემებისა და
რეგრესიული მოდელის (განტოლებით ნაწინასწარ-
მეტყველევი მნიშვნელობები) შესაბამისობის ხარისხით.
განსაზღვრულობის ზომა გამოისახება მნიშვნელო-
ბებით ინტერვალში [0;1]. განხილულ ამოცანაში მისი
მნიშვნელობა ტოლია 0,918-ის, რაც მიგვითითებს
რეგრესიის წრფის საუკეთესო მიახლოებაზე საწყის
მონაცემებთან. ე.ი. წრფივი მოდელით განისაზღვრა
მიწოდების დროის ვარიაცია 91,8%, რაც ნიშნავს, რომ
ფაქტორი (მანძილი) შერჩეულია სწორად. მოდელი ვერ
ხსნის მოძრაობის დროის ვარიაციის
ნახ. 3.5 100% − 918%
, = 8,2% -ს, რომელიც განპირობებულია
სხვადასხვა ფაქტორებით, რომელიც გავლენას ახდენს
გავაანალიზოთ მიღებული მნიშვნელობები: მიწოდების დროზე, მაგრამ არ არის განხილული
მოცემულ მოდელში.
ცხრილი 3.1
მნიშვნელოვნობის საანგარიშო დონე αр=1,26E-
05<0,05 (F-კრიტერიუმის მნიშვნელობა) ამტკიცებს R2
SUMMARY OUTPUT
არსებითობას.
Regression Statistics მრავლობითი R (Multiple R) - მრავლობითი
Multiple R 0,958 კორელაციის კოეფიციენტი R - განსაზღვრავს
R Square 0,918 დამოუკიდებელი (X) ცვლადის და დამოკიდებული (Y)
Adjusted R ცვლადის დამოკიდებულებას და ტოლია
Square 0,908 დეტერმინაციის კოეფიციენტიდან კვადრატული ფესვის
Standard მნიშვნელობის, ეს სიდიდე ღებულობს მნიშვნელობებს
Error 1,118 0-დან ერთამდე. მარტივი წრფივი რეგრესიული
Observations 10
ანალიზის დროს მისი მნიშვნელობა (R) ტოლია
47 48
პირსონის კორელაციის კოეფიციენტის მნიშვნელობის, არსებითობაზე მიგვანიშნებს P-მნიშვნელობები,
რომელიც გამოითვლება ფორმულით: რომელიც მცირეა მნიშვნელოვნობის საწყის დონესთან
(α=0,05) შედარებით.
ცხრილი 3.3.
Standard
Residuals
Observation Predicted Y Residuals სტანდარტული
დაკვირვება ნაწინასწარმეტყველი Y სხვაობები სხვაობები
1 15,22241803 0,777581975 0,737641894
ცხრილში 3.2. მოცემულია რეგრესიის
2 12,29674618 0,703253823 0,667131568
კოეფიციენტები а1 (2,65970168) და ორდინატთა ღერძის 3 18,94600038 0,053999622 0,051225961
მიმართ წანაცვლება a0 (5,913462144). 4 17,0842092 0,915790799 0,868751695
5 13,89256718-1,892567185 -1,795356486
ცხრილი 3.2 6 9,371074328 1,628925672 1,545256778
7 8,573163824-0,573163824 -0,543723571
P-value 8 13,89256718 0,107432815 0,101914586
Standard Error
Coefficients t Stat P- 9 9,903014664-0,903014664 -0,8566318
სტანდარტული
კოეფიციენტები t-სტატისტიკა მნიშვნელობა 10 16,81823903-0,818239033 -0,776210624
ცდომილება
Y 5,913462144 0,884389599 6,686489927 0,00015485
X1 2,65970168 0,280497238 9,482095791 1,26072E-05
ცხრილში 3.3 მოცემული მონაცემებიდან ჩანს, რომ
გამოთვლებიდან გამომდინარე, შესაძლებელია სხვაობის უდიდესი აბსოლუტური მნიშვნელობა ჩვენს
განტოლების ჩაწერა შემდეგი სახით: შემთხვევაში ტოლია - 1,89256, უმცირესი - 0,05399. ამ
მონაცემების ინტერპრეტაციისათვის აგებულია
y ð = 5,91346 + 2,65970 x. რეგრესიის წრფე.
49 50
Y ღერძზე გადავზომოთ
р
(y )
i − y i გადახრები, X Variable 1 Line Fit Plot
ყოველი yi მნიშვნელობისათვის (ნახ.449). თუ
20
რეგრესიული მოდელის მიახლოებულია რეალურ
დამოკიდებულებასთან, მაშინ გადახრას ექნება 15
შემთხვევითი ხასითი და მათი ჯამი მიუახლოვდება 0-ს.
( )
n Y
р 10
Y
განხილულ მაგალითში ∑ y i − y i = 0,004 Predicted Y
i =1 5
0
0 2 4 6
X Variable 1 Residual Plot
X Variable 1
2,000
1,500 რეგრესიის ხაზი
1,000 ნახ. 3.5
0,500
Residuals
Y
X Variable 1
ნახ. 3.6 0
0 20 40 60 80 100
Sample Percentile
ნახ. 3.6
51 52
1.2.5. ერთფაქტორიანი დისპერსიული ანალიზი Anova: Single Factor
SUMMARY
Groups Count Sum Average Variance
Column 1 4 20 5 4.666667
Column 2 4 27 6.75 10.91667
Column 3 4 21 5.25 1.583333
Column 4 4 25 6.25 7.583333
ANOVA
Source of
Variation SS df MS F P-value F crit
Between
Groups 8.1875 3 2.729167 0.441077 0.727866 3.490295
Within
Groups 74.25 12 6.1875
Total 82.4375 15
53 54
1.2.6. კორელაცია 1.2.7.კოვარიაცია
Column Column
1 2
Column
1 1
Column
2 0.976634 1
55 56
1.2.9. სტანდარტული ნორმალური განაწილება
57 58
ველებში მიუთითეთ სასურველი მნიშვნელობები.
2. სტატისტიკური დამუშავება მონაცემთა
ანალიზის პაკეტის Statistica გამოყენებით
ნახ
2.1.2
59 60
პროცედურები. საწყის პანელზე გამოდის ამ მოდულის
სტატისტიკური პროცედურების ჩამონათვალი
შევიტანოთ მონაცემები დასამუშავებლად (ნახ.2.1.3). (ნახ.2.1.4).
ნახ 2.1.4
Descriptive statistics - აღწერითი სტატისტიკა;
Correlation matrices- კორეალციური მატრიცა;
t-test for independent samples - t-ტესტი
დამოუკიდებელი ამონარჩევისათვის
ნახ 2.1.3
მონაცემების დასამუშავებლად შევირჩიოთ t-test for dependent samples - t-ტესტი
დამუშავების სახე. მონაცემთა დამუშავება პარალელური დაკვირვებების შემთხვევაში და ა.შ.
ხორციელდება Basic Statistics / Tables მოდულით. ამ
მოდულში გაერთიანებულია მონაცემთა დამუშავების
საწყის ეტაპზე ყველაზე ხშირად გამოყენებული
61 62
2.2. პროცედურა Descriptive statistics Variables- ანალიზისათვის ცვლადების შერჩევა
(აღწერითი სტატისტიკა) (ნახ.2.2.2);
Summary Statistics – აღწერითი სტატისტიკის
მაჩვენებლების გამოთვლა. გამოსაანგარიშებელი
განვიხილოთ ამ პროცედურის შესაძლებლობები
მაჩვენებლების განსაზღვრა ხდება დამატებით Advanced
მაგალითის საფუძველზე.
ჩანართის გააქტიურებით (ნახ.2.2.3)
აღწერითი სტატისტიკის პროცედური შერჩევის
Summary: Graphs – გრაფიკული ანალიზის
შემდეგ ეკრანზე ჩნდება ანალოგური დასახელების
სერვისის ჩართვა;
დიალოგური ფანჯარა (ნახ.2.2.1)
Frequency tables – სიხშირული ცხრილის აგება
ინტერვალთა მეთოდით;
Histograms – ჰისტოგრამები;
Box @ Whisker plot for all variables - აღწერითი
სტატისტიკის მაჩვენებლების ვიზუალიზაცია ჩარჩო-
გრაფიკების გამოყენებით.
ნახ.2.2.1
ნახ 2.2.2
63 64
Minimum, maximum - მინიმალური და
მაქსიმალური მნიშვნელობა;
Lower, upper quartiles - ზედა და ქვედა კვარტილი;
Range - გაქანება;
Quartile range - ინტერკვარტილური გაქანება;
Skewness -ასიმეტრია;
Standard error of Skewness -ასიმეტრიის
სტანდარტული ცდომილება;
Kurtosis - ექსცესი;
Standard error of Kurtosis - ექსცესის სტანდარტული
ცდომილება;
Statistica პაკეტი არ იძლევა საშუალებას
გამოვთავალოთ ყველაზე ხშირად გამოყენებული
ნახ 2.2.3 სტატსიტიკური მნიშვნელობები ვარიაციის
კოეფიციენტი და საშუალო მნიშვნელობის ფარდობითი
Valid N - ამონარჩევის მოცულობა; ცდომილება (ცდის სიზუსტე).
Mean - საშუალო არითმეტიკული;
S tan dardDeviation
შემთხვევითი სიდიდის საშუალო მნიშვნელობა ვარიაციის კოეფიციენტი = ⋅ 100%
წარმოადგენს ყველაზე ტიპიურ, ალბათურ Mean
მნიშვნელობას, გარკვეულ თვისებურ ცენტრს, რომლის S tan dardErrorOfMean
ცდის სიზუსტე = ⋅ 100%
მიმართ გაბნეულია თვისების ყველა მნიშვნელობა. Mean
Sum - ჯამი;
Median - მედიანა; ჰისტოგრამისა და სიხშირეთა ცხრილის ასაგებად
Standard Deviation - სტანდარტული გადახრა; გამოიყენება Descriptive statistics ფანჯრის Distribution
Variance - დისპერსია; ჯგუფის ღილაკები. დაჯგუფებული მონაცემების
Standard error of mean -საშუალო მნიშვნელობის ინტერვალების (კლასების) რაოდენობა რეგულირდება
საშუალო ცდომილება; Number of intervals გადამრთველის დახმარებით.
95% confidence limits of mean - 95%-იანი ნდობითი Distribution ღილაკის მარჯვნივ მდებარეობს
ინტერვალი საშუალო მნიშვნელობისათვის; Categorization ჯგუფი, რომელიც საშუალებას იძლევა
65 66
ინტერვალის სიგრძე იყოს მთელი რიცხვით
გამოსახული Integer intervals (categories).
დაჯგუფების შედეგად მიღებული ინტერვალები
მოცემულია ცხრილში (ნახ.2.2.4) .
ჰისტოგრამის ასაგებად გამოვიყენოთ ღილაკი
Histograms. ჰისტოგრამაზე აუცილებლობის შემთხვევაში
შესაძლებელია დავამატოთ ნორმალური განაწილების
სიმკვრივის გრაფიკი და შევამოწმოთ მისი მიახლოება
განაწილების ნორმალურ სახესთან კოლმოგოროვ-
სმირნოვის, ლილიეფორსის კრიტერიუმების
გამოყენებით; ასევე შესაძლებელია შაპირო-უილკსის
სტატისტიკის გამოანგარიშება. მიღებული
მნიშვნელობები აისახება პირდაპირ ჰისტოგრამაზე
(ნახ.2.2.5).
ნახ 2.2.5
ნორმალური განაწილების შესახებ შეიძლება
ვიმსჯელოთ გრაფიკის მიხედვით. ამისათვის
გამოვიყენოთ Normal probability plots ღილაკი (ნახ.2.2.6).
რაც უფრო ახლოსაა განაწილება ნორმალური
განაწილების სახესთან, მით უფრო კარგად
განთავსდებიან მნიშვნელობები წრფეზე (ნახ.2.2.7).
შეფასების ეს ხერხი ფაქტობრივად წარმოადგენს
მხედველობით შეფასებას. საეჭვო შემთხვევებში საჭიროა
მახლოების შემოწმება სხვადასხვა სტატისტიკური
კრიტერიუმებით (კოლმოგოროვ-სმირნოვი, ომეგა-
კვადრატი). ამისათვის საჭიროა მონაცემთა
ნახ 2.2.4
მნიშვნელოვანი რაოდენობა (ზოგიერთი ავტორის
აზრით არანაკლებ 100-სა).
67 68
ნახ 2.2.6
ნახ 2.2.7
69
ibeWdeba avtorTa mier warmodgenili saxiT