You are on page 1of 6

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

ΣΧΟΛΗ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΠΟΛΙΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ


ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Εργασία στο μάθημα:


Στατιστική ΙΙ

Ενότητες: Διαστήματα εμπιστοσύνης


Έλεγχοι στατιστικών υποθέσεων
Έλεγχος κανονικότητας
Έλεγχος ανεξαρτησίας
Ανάλυση συσχέτισης

Ονοματεπώνυμο/Εξάμηνο/ΑΕΜ

Διδάσκοντες
Νικόλαος Ταμπάκης – Μάττας Ανδρέας

Θεσσαλονίκη / ημερομηνία
Α.Π.Θ. : Σχολή Οικονομικών & Πολιτικών Επιστημών
Τμήμα Οικονομικών Επιστημών

Άσκηση 1η
Στατιστική ανάλυση (Διαστήματα εμπιστοσύνης - Έλεγχοι υποθέσεων με τη στατιστική
t-Student για ένα δείγμα και για δυο ανεξάρτητα δείγματα)
Σε μια περιβαλλοντολογική έρευνα εξετάζεται αν η ανάπτυξη ενός είδους φυτού
επηρεάζεται από τη γεωγραφική θέση της περιοχής, όπου συναντάται το συγκεκριμένο
είδος. Τα δεδομένα που υπάρχουν στο αρχείο PlantHeight.sav αναφέρονται σε διάφορες
περιοχές της Ελλάδος, όπου ευδοκιμεί το φυτό και περιλαμβάνουν το ύψος του φυτού σε
cm και την περιοχή (1=Βόρεια Ελλάδα, 2=Νότια Ελλάδα), όπως ενδεικτικά φαίνεται στον
επόμενο πίνακα, όπου εμφανίζονται οι πρώτες και οι τελευταίες παρατηρήσεις (συνολικά
υπάρχουν 1474 παρατηρήσεις).
α/α Περιοχή Υψος
1 1 15,00
2 2 16,30
3 2 16,00
4 1 14,80
5 2 17,00
…… …… ……
…… …… ……
…… …… ……
1472 2 17,00
1473 1 13,00
1474 2 16,50

Δεδομένα
Αρχείο PlantHeight.sav
Μεταβλητές
Περιοχή (1=Βόρεια Ελλάδα, 2=Νότια Ελλάδα)
Υψος = ύψος φυτού συγκεκριμένου είδους (σε cm)
α) Να βρείτε ορισμένα βασικά περιγραφικά μέτρα της μεταβλητής «Υψος» για το σύνολο
των παρατηρήσεων και να κατασκευάσετε το 95% διάστημα εμπιστοσύνης για το μέσο
ύψος των φυτών.
Υπόδειξη: Να χρησιμοποιήσετε την επιλογή Explore (Analyze/Descriptive Statistics/
Explore) στο SPSS, όπου μόνο στο πεδίο Dependent List θα εισάγετε τη μεταβλητή
«Υψος». Στη συνέχεια, μέσω της επιλογής Statistics, θα επιλέξετε την ένδειξη Descriptives.
β) Σε επίπεδο σημαντικότητας 5% και χρησιμοποιώντας το σύνολο των παρατηρήσεων, να
ελέγξετε τις ακόλουθες υποθέσεις:
i) Το μέσο ύψος των φυτών είναι 14 cm με εναλλακτική ότι αυτό είναι διαφορετικό από
τα 14 cm.
ii) Το μέσο ύψος των φυτών είναι 15,5 cm με εναλλακτική ότι αυτό είναι διαφορετικό
από τα 15,5 cm.

Νικόλαος Ταμπάκης ③ Ακαδημαϊκό έτος: 2017-18


Α.Π.Θ. : Σχολή Οικονομικών & Πολιτικών Επιστημών
Τμήμα Οικονομικών Επιστημών

Υπόδειξη: Να χρησιμοποιήσετε την επιλογή One-sample T test (Analyze/Compare Means/


One-sample T test) στο SPSS, όπου στο πεδίο Test Value θα εισάγετε τις τιμές που σας
ενδιαφέρουν.
γ) Να βρείτε ορισμένα βασικά περιγραφικά μέτρα της μεταβλητής «Yψος» ξεχωριστά για
τη Βόρεια και Νότια Ελλάδα και να κατασκευάσετε το 95% διάστημα εμπιστοσύνης για το
μέσο ύψος των φυτών ανά περιοχή.
Υπόδειξη: Να χρησιμοποιήσετε την επιλογή Explore στο SPSS, όπου στο πεδίο Dependent
List θα εισάγετε τη μεταβλητή «Υψος» και στο πεδίο Factor List θα εισάγετε τη μεταβλητή
«Περιοχή».
δ) Σε επίπεδο σημαντικότητας 5% να ελέγξετε αν το μέσο ύψος των φυτών στις δυο
περιοχές (Βόρεια και Νότια Ελλάδα) είναι ίσα μεταξύ τους.
Υπόδειξη: Να χρησιμοποιήσετε την επιλογή Independent-Samples T Test (Analyze/Compare
Means/Independent-Samples T Test) στο SPSS, όπου στο πεδίο Grouping Variable θα
εισάγετε τη μεταβλητή «Περιοχή». Θα πρέπει όμως να δικαιολογήσετε γιατί
χρησιμοποιείτε το συγκεκριμένο τεστ και να αναφερθείτε στον έλεγχο ισότητας των
διακυμάνσεων.
Σημειώνεται ότι θα πρέπει να ερμηνεύσετε τα αποτελέσματα δίνοντας έμφαση στα
διαστήματα εμπιστοσύνης και στους ελέγχους υποθέσεων. Για να ερμηνεύσετε σωστά τα
περιγραφικά μέτρα θα πρέπει να θυμηθείτε όσα είχαν αναφερθεί στη Στατιστική Ι. Οι
ερμηνείες για τα περιγραφικά μέτρα αρκεί να δοθούν μία μόνο φορά π.χ. για το σύνολο των
παρατηρήσεων. Στο ερώτημα (γ), όπου θα βρείτε τα περιγραφικά μέτρα και τα διαστήματα
εμπιστοσύνης ξεχωριστά για τη Βόρεια και Νότια Ελλάδα, έχει νόημα να κάνετε και τις
ανάλογες συγκρίσεις.

Άσκηση 2η
Στατιστική ανάλυση (Έλεγχος κανονικότητας - Διαστήματα εμπιστοσύνης - Έλεγχοι
υποθέσεων με τη στατιστική t-Student για δυο εξαρτημένα δείγμα-
τα: ζευγαρωτές παρατηρήσεις)
Στον επόμενο πίνακα παρουσιάζονται οι μετρήσεις βάρους 30 ατόμων πριν από την
εφαρμογή μιας συγκεκριμένης δίαιτας και μετά από αυτήν.
α/α ΒάροςΠριν ΒάροςΜετά α/α ΒάροςΠριν ΒάροςΜετά
1 71 70 16 69 66
2 75 76 17 58 54
3 74 75 18 82 80
4 81 78 19 86 83
5 85 83 20 80 78
6 88 90 21 70 67
7 82 79 22 60 56
8 80 78 23 50 45
9 70 67 24 59 56
10 60 56 25 71 67
11 50 45 26 90 89

Νικόλαος Ταμπάκης ④ Ακαδημαϊκό έτος: 2017-18


Α.Π.Θ. : Σχολή Οικονομικών & Πολιτικών Επιστημών
Τμήμα Οικονομικών Επιστημών

12 59 56 27 89 87
13 71 67 28 69 66
14 90 89 29 58 54
15 89 87 30 82 80

Δεδομένα
Αρχείο WeightDiet.sav
Μεταβλητές
ΒάροςΠριν = το βάρος πριν την εφαρμογή της δίαιτας (σε Kgr)
ΒάροςΜετά = το βάρος μετά την εφαρμογή της δίαιτας (σε Kgr)
α) Να ελέγξετε αν οι μεταβλητές «ΒάροςΠριν» και «ΒάροςΜετά» ακολουθούν την
κανονική κατανομή και να κατασκευάσετε το 95% διάστημα εμπιστοσύνης για το μέσο
βάρος πριν και μετά την εφαρμογή της δίαιτας.
Υπόδειξη: Να χρησιμοποιήσετε την επιλογή Explore (Analyze/Descriptive Statistics/
Explore) στο SPSS, όπου στο πεδίο Dependent List θα εισάγετε τις μεταβλητές
«ΒάροςΠριν» και «ΒάροςΜετά». Στη συνέχεια, μέσω της επιλογής Statistics, θα επιλέξετε
την ένδειξη Descriptives, ενώ μέσω της επιλογής Plots, θα επιλέξετε την ένδειξη Normality
plots and tests.
β) Σε επίπεδο σημαντικότητας 5% να ελέγξετε αν το μέσο βάρος πριν και μετά την
εφαρμογή της δίαιτας είναι ίσα μεταξύ τους.
Υπόδειξη: Να χρησιμοποιήσετε την επιλογή Paired-Samples T Test (Analyze/Compare
Means/ Paired-Samples T Test) στο SPSS, όπου στο πεδίο Paired Variables θα εισάγετε τις
μεταβλητές «ΒάροςΠριν» και «ΒάροςΜετά». Θα πρέπει όμως να δικαιολογήσετε γιατί
χρησιμοποιείτε το συγκεκριμένο τεστ.
Σημειώνεται ότι θα πρέπει να ερμηνεύσετε τα αποτελέσματα δίνοντας έμφαση στα
διαστήματα εμπιστοσύνης και στους ελέγχους υποθέσεων.

Άσκηση 3η
Στατιστική ανάλυση (Έλεγχος ανεξαρτησίας - Ανάλυση συσχέτισης)
Το Τμήμα Μάρκετινγκ της εταιρείας «ΑΒΓ» προκειμένου να διερευνήσει την
καταναλωτική συμπεριφορά των πελατών της σχεδίασε ένα ερωτηματολόγιο με τη βοήθεια
του οποίου συνέλεξε, με τη μέθοδο της τυχαίας δειγματοληψίας, δεδομένα. Στη συνέχεια
παρουσιάζεται το ερωτηματολόγιο και η σχετική κωδικοποίηση που χρησιμοποιήθηκε.

ΕΡΕΥΝΑ ΤΟΥ ΤΜΗΜΑΤΟΣ ΜΑΡΚΕΤΙΝΓΚ ΤΗΣ ΕΤΑΙΡΕΙΑΣ «ΑΒΓ»


1. Φύλο: Άνδρας (1) Γυναίκα (2)

2. Επίπεδο εκπαίδευσης:
Δημοτικό (1) Γυμνάσιο-Λύκειο (2) ΑΕΙ (3)

3. Μηνιαίο εισόδημα (σε ευρώ): __________


4. Δαπάνη για αγορά τροφίμων τον τελευταίο μήνα (σε ευρώ): __________
Νικόλαος Ταμπάκης ⑤ Ακαδημαϊκό έτος: 2017-18
Α.Π.Θ. : Σχολή Οικονομικών & Πολιτικών Επιστημών
Τμήμα Οικονομικών Επιστημών

5. Άποψη για τις τιμές των προϊόντων της εταιρίας «ΑΒΓ»:


Αρνητική (1) Ουδέτερη (2) Θετική (3)

6. Άποψη για την ποιότητα των προϊόντων της εταιρίας «ΑΒΓ»:


Αρνητική (1) Ουδέτερη (2) Θετική (3)

Δεδομένα
Αρχείο CompanyABC.sav
Μεταβλητές
Φύλο (1=Άνδρας, 2=Γυναίκα)
Εκπαίδευση (1=Δημοτικό, 2=Γυμνάσιο-Λύκειο, 3=ΑΕΙ)
Εισόδημα = Μηνιαίο εισόδημα (σε ευρώ)
Δαπάνη = Δαπάνη για αγορά τροφίμων τον τελευταίο μήνα (σε ευρώ)
ΑποψηΓιαΤιμές (1=Αρνητική, 2=Ουδέτερη, 3=Θετική)
ΑποψηΓιαΠοιότητα (1=Αρνητική, 2=Ουδέτερη, 3=Θετική)

α) Να ελέγξετε σε επίπεδο σημαντικότητας 0,05 τις υποθέσεις:


i) H άποψη για τις τιμές των προϊόντων είναι ανεξάρτητη από το φύλο.
ii) H άποψη για τις τιμές των προϊόντων είναι ανεξάρτητη από το επίπεδο εκπαίδευσης.
iii) H άποψη για την ποιότητα των προϊόντων είναι ανεξάρτητη από το φύλο.
iv) H άποψη για την ποιότητα των προϊόντων είναι ανεξάρτητη από το επίπεδο εκπαί-
δευσης.
Υπόδειξη: Να χρησιμοποιήσετε την επιλογή Crosstabs (Analyze/Descriptive Statistics/
Crosstabs) στο SPSS, όπου στα πεδία Rows και Columns θα εισάγετε τις ανάλογες
μεταβλητές.
β) Να βρείτε τον κατάλληλο συντελεστή συσχέτισης μεταξύ των μεταβλητών «Εισόδημα»
και «Δαπάνη» και να ελέγξετε, σε επίπεδο σημαντικότητας 5%, τη στατιστική
σημαντικότητά του.
Υπόδειξη: Να χρησιμοποιήσετε την επιλογή Bivariate (Analyze/Correlate/Bivariate) στο
SPSS, όπου στο πεδίο Variables θα εισάγετε τις μεταβλητές «Εισόδημα» και «Δαπάνη».
Για το ερώτημα (α) να διατυπώσετε τη μηδενική και εναλλακτική υπόθεση, να γράψετε
την τιμή της στατιστικής ελέγχου και να δικαιολογήσετε το συμπέρασμα στο οποίο θα
καταλήξετε. Επίσης, να σημειώσετε αν το συμπέρασμα μπορεί να θεωρηθεί αξιόπιστο. Τέλος,
στην περίπτωση που απορριφθεί η μηδενική υπόθεση να βρείτε το συντελεστή V του Cramer
και το συντελεστή συνάφειας C του Pearson.
Για το ερώτημα (β) να διατυπώσετε τη μηδενική και εναλλακτική υπόθεση, να γράψετε
την τιμή της στατιστικής ελέγχου και να δικαιολογήσετε το συμπέρασμα στο οποίο θα
καταλήξετε. Επίσης να αιτιολογήσετε για πιο λόγο στην περίπτωση των μεταβλητών
«Εισόδημα» και «Δαπάνη» βρίσκουμε το συντελεστή συσχέτισης και δεν χρησιμοποιούμε τον
έλεγχο ανεξαρτησίας προκειμένου να διαπιστώσουμε ότι οι εν λόγω μεταβλητές συσχετίζονται
μεταξύ τους.

(Ως εξώφυλλο για την εργασία να χρησιμοποιήσετε αυτό που υπάρχει στην πρώτη σελίδα)

Νικόλαος Ταμπάκης ⑥ Ακαδημαϊκό έτος: 2017-18

You might also like