You are on page 1of 10

Aufgabe 1 | t-Test für unabhängige Stichproben

Verwenden Sie bitten den Datensatz "Beispieldatensatz.sav".

Das Beispiel beschäftigte sich mit der Frage, wie der Unterschied zwischen den Verarbeitungs-
bedingungen „strukturell“ und „bildhaft“ in der Erinnerungsleistung zu Stande gekommen ist. Han-
delt es sich vermutlich um einen zufälligen Unterschied, oder gibt es Grund zu der Annahme,
dass sich die beiden Gruppen systematisch unterscheiden?
Gehen Sie in SPSS zu „Analysieren“ →„Mittelwerte vergleichen“ →„t-Test bei unabhängigen Stich-
proben“. Dort können Sie auswählen, für welche Variable(n) SPSS einen t-Test durchführen soll
(„Gesamtzahl erinnerter Adjektive“). Sie können eine oder mehrere abhängige Variablen eingeben.
Im letzteren Fall rechnet SPSS mehrere t-Tests simultan. Außerdem müssen Sie spezifizieren,
welche beiden Gruppen das Verfahren miteinander vergleichen soll. Dazu bewegen Sie die Vari-
able „Verarbeitungsbedingung“ in das Feld „Gruppenvariable“. Das Experiment beinhaltete ins-
gesamt drei unterschiedliche Verarbeitungsbedingungen. Mit den bislang vorgenommenen An-
gaben weiß SPSS noch nicht, zwischen welchen Gruppen es den Unterschied auf Signifikanz
testen soll. Daher müssen die beiden betreffenden Gruppen definiert werden. Die Verarbeitungs-
bedingung ist für jede Versuchsperson eindeutig durch eine von drei Zahlen festgelegt. Jede Zahl
steht für eine Versuchsbedingung. In der Variablenansicht von SPSS können Sie unter „Wertela-
bels“ nachvollziehen, welche Zahl für welche Verarbeitungsbedingung steht. Sie erkennen, dass
die strukturelle Bedingung durch eine Eins kodiert ist. Alle Personen, die während des Experi-
mentes die präsentierten Wörter strukturell verarbeiten sollten, haben an dieser Stelle eine Eins.
Eine Zwei symbolisiert die bildhafte Verarbeitungsbedingung. Folglich bilden diese beiden Zahlen
die erforderliche Definition der beiden Gruppen in dem angestrebten t-Test. Das vollständige Be-
fehlsfenster sieht aus wie folgt:
SPSS Output:

In den Gruppenstatistiken sehen Sie die Anzahl Versuchspersonen in jeder der beiden beteiligten
Gruppen, die jeweiligen Mittelwerte, Standardabweichungen und Standardfehler des Mittelwer-
tes.
Im zweiten Teil sehen Sie die Statistiken für zwei statistische Tests: zum einen der Levene-Test
auf Varianzgleichheit, zum anderen der t-Test. Der Levene-Test prüft, ob die Varianzen in beiden
Gruppen gleich sind. Dies ist eine Voraussetzung für die Durchführung des t-Tests. Aus der ersten
Tabelle können wir entnehmen, dass sich die Standardabweichungen deskriptiv unterscheiden
(Die Varianz ist das Quadrat der Standardabweichung). Ist dieser Unterschied so groß, dass die
Varianzen als nicht homogen gelten müssen? Der Levene-Test nutzt die F-Verteilung, um diese
Frage zu überprüfen. Der p-Wert im Feld „Signifikanz“ zeigt ein marginal signifikantes Ergebnis
an. Wir müssen also davon ausgehen, dass die Varianzen tendenziell inhomogen sind. Das be-
deutet, dass wir bei der Frage der Signifikanz des Ergebnisses besonders auf die Werte in der
Zeile „Varianzen sind nicht gleich“ achten werden, denn wenn die Voraussetzung der Varianzho-
mogenität verletzt ist, korrigiert SPSS auf diese Weise eigenständig für die Verletzung. Die Resul-
tate für den t-Test sind also in zwei Versionen ausgegeben: für den Fall der Annahme gleicher
Varianzen und für den konträren Fall. In beiden Fällen finden wir natürlich identische Werte für die
mittlere Differenz von –3.8. Die Standardfehler unterscheiden sich nicht auf den ersten drei Nach-
kommastellen, aber offenbar danach. Das können wir aus den leicht unterschiedlichen Konfiden-
zintervallen schließen. Auch der empirische t-Wert von 5.16 ist in beiden Fällen angenommener
gleicher und ungleicher Varianzen identisch. Pro Gruppe gibt es einen Freiheitsgrad weniger als
Versuchspersonen. Im Fall der Annahme ungleicher Varianzen korrigiert SPSS diese Freiheits-
grade nach unten. Auf diese Weise liefert ein t-Test noch immer zuverlässige Ergebnisse, selbst
wenn die Gleichheit der Varianzen nicht gewährleistet sein sollte. Eine Freiheitsgradkorrektur kann
die Auftretenswahrscheinlichkeit eines empirischen t-Werts unter Annahme der Nullhypothese
entscheidend beeinflussen. Im vorliegenden Fall macht dies allerdings keinen Unterschied. In bei-
den Fällen ist das Ergebnis hoch signifikant. Die Interpretation lautet also: Es ist sehr unwahr-
scheinlich, dass die beiden Mittelwerte der Gruppen „strukturell“ und „bildhaft“ Populationen mit
demselben Mittelwert entspringen. Die Nullhypothese wird verworfen und die Alternativhypothese
angenommen.
Offenbar gibt es einen systematischen Unterschied zwischen den beiden Gruppen, der die Mit-
telwertsdifferenz mit verursacht hat.
Achtung: SPSS gibt exakte Wahrscheinlichkeiten für das Auftreten des empirischen t-Wertes un-
ter Annahme der Nullhypothese an. Allerdings erfolgen diese Angaben standardmäßig nur auf
drei Nachkommastellen. Diese Präzision reicht auch vollkommen aus. Eine Folge ist aber, dass –
wie in unserem Fall – auch Darstellungen einer Wahrscheinlichkeit von 0.000 erfolgen. Diese An-
gabe soll nicht ausdrücken, dass die Wahrscheinlichkeit für diesen t-Wert wirklich Null ist. Sie ist
nur sehr, sehr klein. In einer wissenschaftlichen Arbeit finden Sie deshalb für ein solches Ergebnis
keine exakte Wahrscheinlichkeitsangabe, sondern p < .001.
Aufgabe 2 | t-Test bei einer Stichprobe

Mit dem t-Test für eine Stichprobe lässt sich der Mittelwert einer Variable gegen einen bestimmten
Testwert vergleichen. Eine Frage für dieses Verfahren in Verbindung mit dem Gedächtnisexperi-
ment könnte z. B. lauten: Haben die Versuchspersonen im Schnitt signifikant mehr als 9 Adjektive
erinnert? Um einen t-Test für eine Stichprobe durchzuführen gehen Sie im normalen Beispielda-
tensatz in das Menü „Analysieren“ → „Mittelwerte vergleichen“ → „t-Test bei einer Stichprobe“.
Dort klicken Sie die interessierende Variable (in diesem Fall "Gesamtzahl erinnerter Adjektive“)
in das Feld „Testvariable(n)“ und legen den Testwert fest, gegen den der Mittelwert der Variable
getestet werden soll.

SPSS Output:

Im ersten Teil des Outputs erkennen Sie den Mittelwert der Variable sowie dessen Standardab-
weichung und den Standardfehler des Mittelwertes.
Der zweite Teil zeigt nun, gegen welchen Testwert der obere Mittelwert verglichen wurde und
präsentiert den resultierenden t-Wert, die Freiheitsgrade, die mittlere Differenz zwischen Mittel-
wert und Testwert sowie das Konfidenzintervall der Differenz. Dieses liegt ausschließlich im posi-
tiven Bereich, was bedeutet, dass die Differenz zwischen der Variable und dem Testwert in der
Population mit 95%iger Sicherheit im Bereich zwischen .37 und 1.78 (ausgehend vom Testwert
9, d. h. zwischen 9.37 und 10.78) liegt. In Übereinstimmung mit diesen Beobachtungen ist der t-
Wert von 3.01 hochsignifikant (p < .01). Die Versuchspersonen haben also signifikant mehr als
neun Adjektive erinnert. Die Nullhypothese H0 ist abzulehnen und die Alternativhypothese H1 an-
zunehmen.
Aufgabe 3: t-Test bei einer Stichprobe

Öffnen Sie den Beispieldatensatz "survey_sample.sav".


Die Datei enthält Ergebnisse einer in den U.S.A. durchgeführten Befragung.

Sachverhalt: Sie wollen mithilfe eines t-Tests einer Stichprobe Rückschlüsse auf den Mittelwert
einer Variablen in der Grundgesamtheit ziehen. Hat eine Variable beispielsweise in der Stichprobe
den Mittelwert 2.9, können Sie mit einem t-Test überprüfen, ob Sie zum Beispiel mit einer 95%i-
gen Wahrscheinlichkeit davon ausgehen können, dass diese Variable auch in der Grundgesamt-
heit einen Mittelwert von mind. 2.75 aufweist.
Um einen einfachen t-Test (hier für die Variable "tvhours") den Mittelwert einer Variablen in der
Grundgesamtheit einzuschätzen, gehen Sie folgendermaßen vor:

Wählen Sie den Menübefehlt "Analysieren >> Mittelwerte vergleichen >> t-Test bei einer Stich-
probe".

Wählen Sie in der li. Variablenliste die Variable aus, für die der t-Test durchgeführt werden soll,
und verschieben Sie sie mit der Pfeil-Schaltfläche in Feld "Testvariable(n):".
Mit dem Testwert 2.75 wird untersucht, ob aus dem in der Stichprobe beobachteten Mittelwert
von 2.9 geschlossen werden kann, dass der Mittelwert in der Grundgesamtheit mind. 2.75 be-
trägt.
SPSS Output und Interpretation:

Der obere Teil fasst lediglich noch einmal die Beobachtungen aus der Stichprobe zusammen. So
ist dort u. a. abzulesen, dass die Variable "tvhours" in 2,337 Fällen einen gültigen Wert aufweist.
Der Mittelwert dieser Variablen in der Stichprobe und damit der durchschnittliche Fernsehkonsum
der Befragten beträgt 2.86.

Mittelwert und Signifikanz:


Die eigentlichen Ergebnisse werden in der zweiten Tabelle angeführt. Dort ist zunächst in der
Spalte "Mittelwertdifferenz" bzw. ("Mittlere Differenz") zu lesen, dass der beobachtete Mittelwert
der Variablen "tvhours" um .108 größer ist als der Testwert (2.75).
Das zentrale Ergebnis steht daneben in der Spalte "Sig. (2-seitig)". Der dort ausgewiesene Wert
von .020 ist die Irrtumswahrscheinlichkeit für die Hypothese, (die Variable "tvhours" habe in der
Grundgesamtheit einen Mittelwert über 2.75).
Wenn Sie also davon ausgehen, dass die Probanden (in diesem Fall Menschen in den U.S.A. (im
Jahr der Befragung)) im Durchschnitt mind. 2.75 Stunden am Tag vor dem Fernseher sitzen,
liegen Sie nur mit einer Wahrscheinlichkeit von .02 beziehungsweise 2 % falsch – das ist doch
ein tolles Ergebnis, oder J

Konfidenzintervall des Mittelwerts:


SPSS berechnet autom. auch das Konfidenzintervall für den Mittelwert – also den Wertebereich,
in dem der Mittelwert in der Grundgesamtheit mit einer bestimmten Wahrscheinlichkeit (meist 95
%) liegt.
Der hier angegebene untere und obere Wert besagen, dass der Mittelwert der Variablen "tvhours"
in der Grundgesamtheit mit einer Wahrscheinlichkeit von 95 % zwischen .02 und .20 größer ist
als der Testwert. Der Testwert ist 2.75. Der Mittelwert in der Grundgesamtheit ist nun wahrschein-
lich .02 bis .20 größer als der Testwert, d. h., er liegt wahrscheinlich in dem Bereich zwischen
2.77 und 2.95. Mit einer Wahrscheinlichkeit von 95 % verbringen die Menschen in den U.S.A.
damit im Durchschnitt zwischen 2.77 und 2.95 Stunden pro Tag vor dem Fernseher.

Aufgabe 4: t-Test bei unabhängigen Stichproben

• Versuchen Sie nun mit dem gleichen Datensatz "survey_sample.sav" einen t-Test für un-
abhängige Stichproben durchzuführen

• Verwenden Sie die Variable "tvhours" (Wie viele Stunden Fernsehen am Tag) und die Va-
riable "marital" (Familienstand), um zu untersuchen, ob verheiratete und geschiedene Per-
sonen (signifikant) unterschiedlich viel Zeit vor dem Fernseher verbringen.

Output:

• versuchen Sie nun auch herauszufinden, ob sich verheiratete von allen übrigen Gruppen
im Fernsehkonsum unterscheiden
Tipp: Sie müssen hier mit Trennwert arbeiten!

Output:
Interpretation der Ergebnisse:
Die obere Tabelle gibt noch einmal die beobachteten Werte für die beiden Fallgruppen wieder.
Miteinander verglichen werden die Gruppe der unverheirateten (mit einem Wert >= 2 in der Vari-
ablen für den Familienstand) und die Gruppe der verheirateten Personen (Codierung 1 und damit
< 2 in der Variablen Familienstand). Die erste umfasst in der Stichprobe 1,216 Personen (mit
einem gültigen Wert in den beiden Variablen "marital" und "tvhours", die im Durchschnitt 3.05
Stunden am Tag vor dem Fernseher verbringen. Die Gruppe der verheirateten Befragten ist da-
gegen 1,121 Personen groß, die im Mittel 2.65 Stunden am Tag fernsehen.

Mit der zweiten Tabelle hat SPSS wesentlich mehr Testergebnisse geliefert als eigentlich ange-
fordert waren. So enthält die Tabelle nicht ein, sondern zwei Ergebnisse eines t-Tests, die in den
beiden Zeilen der Tabelle untereinander aufgeführt werden. Zusätzlich hat SPSS einen weiteren
Test durchgeführt, den sog. Levene-Test, der untersucht, ob die Varianz der Testvariablen
(tvhours) in den beiden Fallgruppen gleich groß ist. Dies hat folgenden Hintergrund: Es gibt zwei
Varianten des t-Test bei unabhängigen Stichproben. Eine liefert korrekte Ergebnisse, wenn die
Varianz der Testvariablen in den beiden Fallgruppen gleich groß ist, die andere Variante ist dage-
gen richtig, wenn die Varianz der Testvariablen in den beiden Fallgruppen unterschiedlich ist. Der
Levene-Test untersucht nun, ob die Varianz der Testvariablen in beiden Fallgruppen gleich ist.
Das Ergebnis des Levene-Tests ist in der Spalte "Signifikanz" unter der Überschrift "Levene-Test
der Varianzgleichheit" ausgewiesen. Der Signifikanzwert von .000 besagt, dass die Varianz der
Variablen "tvhours" nur mit einer Wahrscheinlichkeit von 0.0 % in den beiden betrachteten Fall-
gruppen identisch ist. Man kann in diesem Fall also getrost davon ausgehen, dass dies nicht der
Fall ist, und zur Untersuchung der eigentlich interssierenden Fragestellung die in der unteren Zeile
der Tabelle (Varianzgleicheit nicht angenommen) ausgewiesenen Ergebnisse des t-Tests heran-
ziehen.

Mittelwert und Signifikanz:


In der vorliegenden Stichprobe schauen die Personen der zweiten Fallgruppe (die verheirateten
Personen) im Durchschnitt 0.4 Stunden weniger fern als die nicht verheirateten Personen, die die
erste Vergleichsgruppe bilden. Dieser beobachtete Unterschied wird in den Testergebnissen in
der Spalte "Mittelwertdifferenz" bzw. "Mittlere Differenz" ausgewiesen.
Daneben in der Spalte "Sig. (2-seitig)" steht die Antwort auf die Frage, ob aus dieser Beobachtung
geschlossen werden kann, dass verheiratete und unverheiratete Personen auch in der Grundge-
samtheit unterschiedlich viel fernsehen. Der ausgewiesene Signifikanzwert von 0.000 besagt,
dass dies mit einer Irrtumswahrscheinlichkeit von 0.0 % der Fall ist. Ganz korrekt formuliert lautet
das Testergebnis: "Wenn Sie die Hypothese, verheiratete und unverheiratete Personen würden
in der Grundgesamtheit im Durchschnitt gleich viel Zeit vor dem Fernseher verbringen, als falsch
zurückweisen, begehen Sie mit einer Wahrscheinlichkeit von 0.0 % einen Irrtum". Im Klartext heißt
das: Die Daten in der Stichprobe lassen auch für die Grundgesamtheit die Schlussfolgerung zu,
dass verheiratete Menschen weniger fernsehen als unverheiratete Menschen.

Konfidenzintervall der Mittelwertdifferenz:


Der Signifikanzwert lässt zunächst nur den Schluss zu, dass das Fernsehverhalten von verheira-
teten und unverheirateten Menschen unterschiedlich ist. Daraus lässt sich jedoch noch nicht ab-
lesen, in welchem Ausmaß sich die beiden Gruppen voneinander unterscheiden. Es wäre falsch,
einfach davon auszugehen, der in der Stichprobe beobachtete Unterschied von 0.4 Stunden (die
ein Unverheirateter mehr fernsieht als ein Verheirateter) würde so auch in der Grundgesamtheit
gelten. In den Spalten "95 % Konfidenzintervall der Differenz" finden Sie die Antwort auf diese
Frage J. Die dort angegebenen unteren und oberen Werte besagen, dass in der Grundgesamt-
heit mit einer Wahrscheinlichkeit von 95 % die unverheirateten Menschen je Tag zwischen 0.219
und 0.580 Stunden mehr vor dem Fernseher verbringen (also zwischen 3.269 und 3.63 Stunden).