You are on page 1of 9

ΠΑΛΙΝΔΡΟΜΗΣΗ ME TO ΜΙΝΙΤΑΒ 17

Tο φυλλάδιο αυτό έχει ως στόχο να βοηθήσει τους φοιτητές της ΘΕ ΔΙΠ 50 στην προσαρμογή προτύπων παλινδρόμησης με χρήση του ΜΙΝΙΤΑΒ 17. Η
συγγραφή του φυλλαδίου κρίθηκε απαραίτητη αφού στο ΜΙΝΙΤΑΒ 17 η προσαρμογή προτύπων παλινδρόμησης διαφέρει σε σχέση με προηγούμενες εκδόσεις
του (το εκπαιδευτικό υλικό της ΘΕ ΔΙΠ 50 έχει βασιστεί στις εκδόσεις 12 και 15 του ΜΙΝΙΤΑΒ). Στις επόμενες σελίδες παρουσιάζονται οι δύο βασικές
διαδικασίες της παλινδρόμησης
 Stat > Regression > Regression > Fit Regression Model
 Stat > Regression > Regression > Predict
με τη βοήθεια Παραδειγμάτων και Ασκήσεων Αυτοαξιολόγησης του εκπαιδευτικού υλικού.
1. Παράδειγμα 9.11, σελίδα 74, Τευχίδιο Β΄
Εξαγωγή της βασικής ανάλυσης της απλής γραμμικής παλινδρόμησης: Η εισαγωγή των δεδομένων γίνεται με τον τρόπο που αναφέρεται στην τελευταία
παράγραφο της σελίδας 76 του Τευχιδίου Β΄. Συνεχίζουμε με Stat > Regression > Regression > Fit Regression Model. Στο παράθυρο που εμφανίζεται
εισάγουμε y στο πεδίο Responses: και x στο πεδίο Continuous predictors:. Κάνουμε κλικ στο Options και στο παράθυρο που ανοίγει επιλέγουμε Sequential
(Type I) στην περιοχή με ένδειξη Sum of Squares for Tests. Πατάμε ΟΚ και ξανά ΟΚ.
Στην αριστερή στήλη του παρακάτω πίνακα δίνονται με διαφορετικά χρώματα τα 5 βασικά κομμάτια του πλαισίου της σελίδας 77 του Τευχιδίου Β΄. Στη δεξιά
στήλη δίνονται τα αποτελέσματα που προκύπτουν με την προαναφερθείσα διαδικασία του ΜΙΝΙΤΑΒ 17. Στη δεξιά στήλη έχουν χρωματιστεί, με χρώματα
ανάλογα της αριστερής τα κομμάτια της ανάλυσης που είναι ίδια. Με μαύρο χρώμα δηλώνονται αποτελέσματα της δεξιάς στήλης που δεν υπάρχουν στην
αριστερή, όπως R-sq(pred), VIF κ.ά.

Τευχίδιο Β΄, Σελίδα 97 (ΜΙΝΙΤΑΒ 16, 15, …) ΜΙΝΙΤΑΒ 17


Regression Analysis: y versus x Regression Analysis: y versus x
The regression equation is Analysis of Variance
y = 4,06 + 0,180 x
Source DF Seq SS Seq MS F-Value P-Value
Regression 1 1,2960 1,29600 22,09 0,018
Predictor Coef SE Coef T P x 1 1,2960 1,29600 22,09 0,018
Constant 4,0600 0,2200 18,45 0,000 Error 3 0,1760 0,05867
x 0,18000 0,03830 4,70 0,018 Total 4 1,4720

S = 0,242212 R-Sq = 88,0% R-Sq(adj) = 84,1% Model Summary

S R-sq R-sq(adj) R-sq(pred)


Analysis of Variance 0,242212 88,04% 84,06% 59,17%
Source DF SS MS F P
Regression 1 1,2960 1,2960 22,09 0,018 Coefficients
Residual Error 3 0,1760 0,0587
Total 4 1,4720 Term Coef SE Coef T-Value P-Value VIF
Constant 4,060 0,220 18,45 0,000
x 0,1800 0,0383 4,70 0,018 1,00
Predicted Values for New Observations

New Obs Fit SE Fit 98% CI 98% PI Regression Equation


1 5,140 0,115 (4,618; 5,662) (3,923; 6,357)
y = 4,060 + 0,1800 x

Values of Predictors for New Observations

New Obs x
1 6,00
Εξαγωγή διαστημάτων εμπιστοσύνης και πρόβλεψης: Ακολουθούμε τη διαδικασία Stat > Regression > Regression > Predict. Στο παράθυρο που εμφανίζεται
εισάγουμε y στο πεδίο Responses: και την τιμή 6 στα κελί που βρίσκονται αμέσως κάτω από το x. Κάνουμε κλικ στο Options και στο παράθυρο που ανοίγει
πληκτρολογούμε 98 στο πεδίο Confidence level:. Πατάμε ΟΚ και ξανά ΟΚ. Το MINITAB δίνει τα παρακάτω αποτελέσματα:

MINITAB 17
Prediction for y

Regression Equation

y = 4,060 + 0,1800 x

Variable Setting
x 6

Fit SE Fit 98% CI 98% PI


5,14 0,114891 (4,61831; 5,66169) (3,92273; 6,35727)

Σημείωση: Προκειμένου να ενεργοποιηθεί η διαδικασία Stat > Regression > Regression > Predict, θα πρέπει να προηγηθεί η εξαγωγή της βασικής ανάλυση
της απλής γραμμικής παλινδρόμησης της προηγούμενης παραγράφου.
2. Παράδειγμα 9.8, σελίδα 191, Τόμος Β΄
Εξαγωγή της βασικής ανάλυσης της πολλαπλής γραμμικής παλινδρόμησης: Η εισαγωγή των δεδομένων γίνεται με τον τρόπο που αναφέρεται στην πρώτη
παράγραφο της σελίδας 192 του Τόμου Β΄. Συνεχίζουμε με Stat > Regression > Regression > Fit Regression Model. Στο παράθυρο που εμφανίζεται εισάγουμε
Υ στο πεδίο Responses: και X1-X3 στο πεδίο Continuous predictors:. Κάνουμε κλικ στο Options και στο παράθυρο που ανοίγει επιλέγουμε Sequential (Type I)
στην περιοχή με ένδειξη Sum of Squares for Tests. Πατάμε ΟΚ και ξανά ΟΚ.
Στην αριστερή στήλη του παρακάτω πίνακα δίνονται με διαφορετικά χρώματα τα 5 βασικά κομμάτια του πλαισίου της σελίδας 192 του Τόμου Β΄. Στη δεξιά
στήλη δίνονται τα αποτελέσματα που προκύπτουν με την προαναφερθείσα διαδικασία του ΜΙΝΙΤΑΒ 17. Στη δεξιά στήλη έχουν χρωματιστεί, με χρώματα
ανάλογα της αριστερής τα κομμάτια της ανάλυσης που είναι ίδια. Με μαύρο χρώμα δηλώνονται αποτελέσματα της δεξιάς στήλης που δεν υπάρχουν στην
αριστερή, όπως R-sq(pred), VIF κ.ά..

Τόμος Β΄, Σελίδα 192 (ΜΙΝΙΤΑΒ 16, 15, …) ΜΙΝΙΤΑΒ 17


Regression Analysis: Y versus X1; X2; X3 Regression Analysis: Y versus X1; X2; X3

The regression equation is Analysis of Variance


Y = 21,5 - 0,929 X1 + 1,00 X2 + 0,582 X3
Source DF Seq SS Seq MS F-Value P-Value
Regression 3 597,1 199,026 21,70 0,000
Predictor Coef SE Coef T P X1 1 172,3 172,343 18,79 0,001
Constant 21,48 10,58 2,03 0,067 X2 1 270,0 270,005 29,44 0,000
X1 -0,9290 0,1331 -6,98 0,000 X3 1 154,7 154,730 16,87 0,002
X2 1,0009 0,2343 4,27 0,001 Error 11 100,9 9,172
X3 0,5824 0,1418 4,11 0,002 Total 14 698,0

S = 3,02861 R-Sq = 85,5% R-Sq(adj) = 81,6% Model Summary

S R-sq R-sq(adj) R-sq(pred)


Analysis of Variance 3,02861 85,54% 81,60% 74,44%

Source DF SS MS F P
Regression 3 597,08 199,03 21,70 0,000 Coefficients
Residual Error 11 100,90 9,17
Total 14 697,98 Term Coef SE Coef T-Value P-Value VIF
Constant 21,5 10,6 2,03 0,067
X1 -0,929 0,133 -6,98 0,000 1,36
Source DF Seq SS X2 1,001 0,234 4,27 0,001 1,17
X1 1 172,34 X3 0,582 0,142 4,11 0,002 1,41
X2 1 270,01
X3 1 154,73
Regression Equation

Y = 21,5 - 0,929 X1 + 1,001 X2 + 0,582 X3


3. Άσκηση Αυτοαξιολόγησης 9.11, σελ. 194, Τόμος Β΄
Εξαγωγή διαστημάτων εμπιστοσύνης και πρόβλεψης: Ακολουθούμε τη διαδικασία Stat > Regression > Regression > Predict. Στο παράθυρο που εμφανίζεται
εισάγουμε Υ στο Responses: και τις τιμές 8, 35 και 83 στα κελιά που βρίσκονται αμέσως κάτω από τα Χ1, Χ2, και Χ3, αντίστοιχα. Κάνουμε κλικ στο Options
και στο παράθυρο που ανοίγει πληκτρολογούμε 99 στο πεδίο Confidence level:. Πατάμε ΟΚ και ξανά ΟΚ. Το MINITAB δίνει τα παρακάτω αποτελέσματα:

MINITAB 17
Prediction for Y

Regression Equation

Y = 21,5 - 0,929 X1 + 1,001 X2 + 0,582 X3

Variable Setting
X1 8
X2 35
X3 83

Fit SE Fit 99% CI 99% PI


97,4180 2,34043 (90,1491; 104,687) (85,5304; 109,306)

Σημείωση: Προκειμένου να ενεργοποιηθεί η διαδικασία Stat > Regression > Regression > Predict, θα πρέπει να προηγηθεί η εξαγωγή της βασικής ανάλυση
της πολλαπλής γραμμικής παλινδρόμησης της προηγούμενης παραγράφου.

4. Παράδειγμα 9.10 σελ. 72, Τευχίδιο Β΄.


Βήμα προς βήμα διαδικασία παλινδρόμησης: Ακολουθούμε τη διαδικασία Stat > Regression > Regression > Fit Regression Model. Στο παράθυρο που
εμφανίζεται εισάγουμε Υ στο πεδίο Responses: και X1-X4 στο πεδίο Continuous predictors:. Κάνουμε κλικ στο Stepwise. Στο παράθυρο που ανοίγει
επιλέγουμε Stepwise στην επιλογή Method, και στην επιλογή Display the table of model selection details επιλέγουμε Include details for each step (αφήνουμε
τις προεπιλογές 0.15 στα πεδία Alpha to enter: και Alpha to remove:). Πατάμε ΟΚ και ξανά ΟΚ.
Ακολούθως δίνεται μέρος της ανάλυσης του ΜΙΝΙΤΑΒ 17, όπως επίσης και το πλαίσιο της σελίδας 72 του Τευχιδίου Β΄. Κάποια βασικά αριθμητικά
αποτελέσματα που συμπίπτουν στις δύο αναλύσεις έχουν χρωματιστεί με το ίδιο χρώμα (εκτός του μαύρου).
MINITAB 17
Regression Analysis: Y versus Χ1; Χ2; Χ3; Χ4
Stepwise Selection of Terms
Candidate terms: Χ1; Χ2; Χ3; Χ4
-----Step 1---- -----Step 2----- -----Step 3---- -----Step 4----
Coef P Coef P Coef P Coef P
Constant 117,57 103,10 71,6 52,58
Χ4 -0,738 0,001 -0,6140 0,000 -0,237 0,205
Χ1 1,440 0,000 1,452 0,000 1,468 0,000
Χ2 0,416 0,052 0,6623 0,000
S 8,96390 2,73427 2,30874 2,40634
R-sq 67,45% 97,25% 98,23% 97,87%
R-sq(adj) 64,50% 96,70% 97,64% 97,44%
R-sq(pred) 56,03% 95,54% 96,86% 96,54%
Mallows’ Cp 138,73 5,50 3,02 2,68
α to enter = 0,15; α to remove = 0,15
Τευχίδιο Β΄, Σελίδα 72 ((ΜΙΝΙΤΑΒ 16, 15, …)
Stepwise Regression: Y versus Χ1; Χ2; Χ3; Χ4
Alpha-to-Enter: 0,15 Alpha-to-Remove: 0,15
Response is Y on 4 predictors, with N = 13
Step 1 2 3 4
Constant 117,57 103,10 71,65 52,58
Χ4 -0,738 -0,614 -0,237
T-Value -4,77 -12,62 -1,37
P-Value 0,001 0,000 0,205
Χ1 1,44 1,45 1,47
T-Value 10,40 12,41 12,10
P-Value 0,000 0,000 0,000
Χ2 0,416 0,662
T-Value 2,24 14,44
P-Value 0,052 0,000
S 8,96 2,73 2,31 2,41
R-Sq 67,45 97,25 98,23 97,87
R-Sq(adj) 64,50 96,70 97,64 97,44
Mallows Cp 138,7 5,5 3,0 2,7
5. Παράδειγμα 9.13 σελ. 81, Τευχίδιο Β.
Προσαρμογή πολυωνύμου τρίτου βαθμού: Δεν είναι απαραίτητη η εφαρμογή της διαδικασίας Calc > Calculator για την κατασκευή των μεταβλητών tsq και
tcube που αναφέρονται στη σελίδα 89 του Τευχιδίου Β΄. Για την προσαρμογή του προτύπου ακολουθούμε τη διαδικασία Stat > Regression > Regression > Fit
Regression Model. Στο παράθυρο που εμφανίζεται εισάγουμε y στο πεδίο Responses: και t στο πεδίο Continuous predictors:. Κάνουμε κλικ στο Options και
στο παράθυρο που ανοίγει επιλέγουμε Sequential (Type I) στην περιοχή με ένδειξη Sum of Squares for Tests. Πατάμε ΟΚ. Κάνουμε κλικ στο Μodel. Στο
παράθυρο που ανοίγει επιλέγουμε 3 στην επιλογή Terms through order, και κάνουμε κλικ στο διπλανό Add (προσέξτε το περιεχόμενο του πεδίου Terms in the
model). Πατάμε ΟΚ και ξανά ΟΚ. Το MINITAB δίνει τα παρακάτω αποτελέσματα:

MINITAB 17
Regression Analysis: y versus t

Analysis of Variance

Source DF Seq SS Seq MS F-Value P-Value


Regression 3 65,6835 21,8945 173,28 0,000
t 1 63,8616 63,8616 505,43 0,000
t*t 1 1,7665 1,7665 13,98 0,010
t*t*t 1 0,0554 0,0554 0,44 0,532
Error 6 0,7581 0,1264
Total 9 66,4416

Model Summary

S R-sq R-sq(adj) R-sq(pred)


0,355459 98,86% 98,29% 96,91%

Coefficients

Term Coef SE Coef T-Value P-Value VIF


Constant 0,103 0,323 0,32 0,760
t -3,191 0,657 -4,86 0,003 70,42
t*t 0,460 0,351 1,31 0,238 439,10
t*t*t -0,0339 0,0512 -0,66 0,532 184,00

Regression Equation

y = 0,103 - 3,191 t + 0,460 t*t - 0,0339 t*t*t


Διάγραμμα των υπολοίπων ως προς τις προσαρμοσμένες τιμές: Για την εξαγωγή του διαγράμματος των υπολοίπων του παραβολικού προτύπου (ερώτημα (ε))
ως προς τις προσαρμοσμένες τιμές ακολουθούμε τη διαδικασία Stat > Regression > Regression > Fit Regression Model. Στο παράθυρο που εμφανίζεται
εισάγουμε y στο πεδίο Responses: και t στο πεδίο Continuous predictors:. Κάνουμε κλικ στο Μodel. Στο παράθυρο που ανοίγει επιλέγουμε 2 στην επιλογή
Terms through order και κάνουμε κλικ στο διπλανό Add (εναλλακτικά διαγράφουμε τον όρο t*t*t που υπάρχει στο πεδίο Terms in the model αν συνεχίσουμε
μετά την εφαρμογή της ανάλυσης της προηγούμενης παραγράφου). Πατάμε ΟΚ. Κάνουμε κλικ στο Graphs και τσεκάρουμε το Residuals versus fits. Πατάμε
ΟΚ και ξανά ΟΚ. To MINITAB δίνει το ακόλουθο διάγραμμα.

6. Άσκηση Αυτοαξιολόγησης 9.13, σελ. 91, Τευχίδιο Β΄


Προσαρμογή προτύπου πολλαπλής γραμμικής παλινδρόμησης δεύτερης τάξης: Αφού εισάγουμε τα δεδομένα στο φύλλο εργασίας του ΜΙΝΙΤΑΒ (εισάγουμε
τις μετρήσεις του πάχους Υ στη στήλη C1 και τις κωδικοποιημένες τιμές των παραγόντων Χ1, Χ2 και Χ3 στις στήλες C2, C3, C4), για το ερώτημα (α)
εργαζόμαστε ως εξής: Ακολουθούμε τη διαδικασία Stat > Regression > Regression > Fit Regression Model. Στο παράθυρο που εμφανίζεται εισάγουμε Υ στο
πεδίο Responses: και X1-X3 στο πεδίο Continuous predictors:. Κάνουμε κλικ στο Options και στο παράθυρο που ανοίγει επιλέγουμε Sequential (Type I) στην
περιοχή με ένδειξη Sum of Squares for Tests. Πατάμε ΟΚ. Στη συνέχεια κάνουμε κλικ στο Μodel. Στο παράθυρο που ανοίγει επιλέγουμε και τις τρεις
μεταβλητές που εμφανίζονται στο πεδίο Predictors: και κάνουμε κλικ στο Add που αντιστοιχεί στο πεδίο Terms through order (αφήνοντας την προεπιλογή 2).
Οι όροι του προτύπου εμφανίζονται στο πεδίο Terms in the model, όχι όμως με τη σειρά που θέλουμε. Αφού επιλέξουμε μια μεταβλητή του πεδίου Terms in
the model μπορούμε να αλλάξουμε τη σειρά της με τα διαθέσιμα βελάκια. Βάζουμε τους όρους με τη σειρά που θέλουμε και πατάμε δύο φορές ΟΚ. Το
MINITAB δίνει τα παρακάτω αποτελέσματα:
MINITAB 17
Regression Analysis: Y versus X1; X2; X3
Analysis of Variance
Source DF Seq SS Seq MS F-Value P-Value
Regression 9 972979 108109 71,77 0,000
x1 1 921750 921750 611,96 0,000
x2 1 3323 3323 2,21 0,168
x3 1 1784 1784 1,18 0,302
x1*x2 1 1526 1526 1,01 0,338
x1*x3 1 113 113 0,08 0,789
x2*x3 1 68 68 0,05 0,836
x1*x1 1 38362 38362 25,47 0,001
x2*x2 1 4541 4541 3,02 0,113
x3*x3 1 1511 1511 1,00 0,340
Error 10 15062 1506
Lack-of-Fit 5 7602 1520 1,02 0,492
Pure Error 5 7460 1492
Total 19 988041

Model Summary
S R-sq R-sq(adj) R-sq(pred)
38,8101 98,48% 97,10% 93,33%

Coefficients
Term Coef SE Coef T-Value P-Value VIF
Constant 295,1 13,3 22,12 0,000
x1 303,6 12,3 24,74 0,000 1,00
x2 18,2 12,3 1,49 0,168 1,00
x3 -13,4 12,3 -1,09 0,302 1,00
x1*x2 13,8 13,7 1,01 0,338 1,00
x1*x3 3,8 13,7 0,27 0,789 1,00
x2*x3 -2,9 13,7 -0,21 0,836 1,00
x1*x1 56,2 23,4 2,40 0,037 1,82
x2*x2 28,9 23,4 1,23 0,245 1,82
x3*x3 23,4 23,4 1,00 0,340 1,82

Regression Equation
y = 295,1 + 303,6 x1 + 18,2 x2 - 13,4 x3 + 13,8 x1*x2 + 3,8 x1*x3 - 2,9 x2*x3 + 56,2 x1*x1
+ 28,9 x2*x2 + 23,4 x3*x3

Fits and Diagnostics for Unusual Observations


Obs y Fit Resid Std Resid
18 597,6 654,9 -57,3 -2,07 R
R Large residual

You might also like