Inhalt

Übersicht: Wortbedeutung, Methoden und Bereiche der Statistik

Kapitel 1

Grundlagen: Untersuchungseinheit, Merkmal, Datenmatrix Skalen Deskriptive Statistik: Aussagen und Häufigkeiten, Häufigkeitstabellen, grafische Darstellungen

Daten, Merkmale, Häufigkeiten

Department of Statistics and Mathematics – WU Wien c 2008

Statistik – 1 – Daten, Merkmale, Häufigkeiten – 0 / 44

Department of Statistics and Mathematics – WU Wien c 2008

Statistik – 1 – Daten, Merkmale, Häufigkeiten – 1 / 44

Wortbedeutung Statistik
Der Begriff Statistik findet Verwendung für: Erhebung von Daten, z.B. statistische Ämter

[ Daten, Merkmale, Häufigkeiten ]

Übersicht

Auswerten von Daten −→ Wissenschaftliche Disziplin, siehe z.B. Wikipedia http://en.wikipedia.org/wiki/Statistics,

http://de.wikipedia.org/wiki/Statistik
Ergebnis einer Datenanalyse z.B. Tabellen, Diagramme, Maßzahlen

Department of Statistics and Mathematics – WU Wien c 2008

Statistik – 1 – Daten, Merkmale, Häufigkeiten – 2 / 44

Department of Statistics and Mathematics – WU Wien c 2008

Statistik – 1 – Daten, Merkmale, Häufigkeiten – 3 / 44

Google Google verwendet einen statistischen Algorithmus (PageRank-Verfahren) zum Ermitteln der relevanten Seiten! Amazon Amazon verwendet statistische Methoden (im wesentlichen Assoziationsregeln) zur Produktempfehlung! Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. Microsoft Excel Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. Merkmale.SPSS.org/) . Merkmale..R-project. Häufigkeiten – 6 / 44 Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. Häufigkeiten – 7 / 44 . Microsoft Excel SPSS/PASW (http://www. Merkmale. Die technische Umsetzung dieser Methoden erfolgt durch Computerprogramme. Häufigkeiten – 4 / 44 Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. Merkmale. Häufigkeiten – 5 / 44 Methoden Die Statistik verwendet mathematische Methoden.com/) R (http://www..

Häufigkeiten – 10 / 44 Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten.a. auch Java. oder Apache). In dieser Statistik-LV wird die Interpretation von Computeroutput anhand von R-Output unterrichtet.B. WWW. Grafiken Induktive Statistik (Schließende Statistik) Theorien über das Zustandekommen der empirischen Daten Erklärungsmodelle für empirische Daten Wahrscheinlichkeitsrechnung Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. Weiters werden die Beispiele der Aufgabensammlung und die Prüfungen mit R generiert.SPSS/PASW R Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. R ist durch benutzerdefinierte Funktionen und Zusatzpakete leicht erweiterbar. Merkmale. die den ACM Award gewonnen hat (wie bspw. Windows and Macintosh Betriebssysteme entwickelt. durch Maßzahlen. Häufigkeiten – 9 / 44 R R ist eine interaktive Computerumgebung für Datenanalyse und Grafik. R wird von einem internationalen Team (u. Merkmale. Tabellen. an der WU Wien) für Unix/Linux. Bereiche der Statistik nach Erkenntniszielen Deskriptive Statistik Beschreibung von empirischen Daten z. Merkmale. R basiert auf der Sprache S. Ähnlich dem Open-Source Betriebssystem Linux ist R frei erhältlich unter der GPL (General Public License). Häufigkeiten – 11 / 44 . Häufigkeiten – 8 / 44 Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. Merkmale.

Merkmale. Merkmale. Häufigkeiten – 14 / 44 Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. Häufigkeiten – 13 / 44 Erklärungsmodelle Lineares Regressionsmodell: Der Preis von Gebrauchtwagen hängt von der Anzahl an gefahrenen Meilen ab. Erklärungsmodelle Exponentieller Trend: Umsatzentwicklung eines Souvenirgeschäfts q q q q 5600 q q q q q q qq q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q qq q qq qq q q qq q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q Umsatz q q q Preis 5200 qq 4800 q 200 250 300 350 400 450 500 0e+00 4e+04 8e+04 q q q q q q 1988 1990 1992 Zeit 1994 1996 gefahrene Meilen Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten.Deskriptive Statistik Beispiel Deskriptive Statistik Beispiel Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. Häufigkeiten – 15 / 44 . Merkmale. Häufigkeiten – 12 / 44 Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. Merkmale.

980. erhoben). Das Ergebnis sind dann Daten (Beobachtungen. Merkmale..Bereiche der Statistik nach Anwendungsgebieten Marketing: Marktsegmentierung (Clusterung). Häufigkeiten – 16 / 44 Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten.6000 48 male Angestellt Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. An den Untersuchungseinheiten werden die Werte (Ausprägungen.6875 73 male Pensionist 1550.2000 51 male Angestellt 264. Datenmatrix: Touristen in Kärnten Ausschnitt aus der Gästebefragung Österreich.2857 65 male Angestellt 349. Merkmale. Häufigkeiten – 18 / 44 Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. Geschlecht und Beruf 1 2 3 4 5 6 7 8 9 10 expenditure age gender occupation 925. Algorithmen für Suchmaschinen Bioinformatik: Analyse von Genexpressionen Medizin: Wirksamkeitsforschung von Medikamenten und Therapien Psychologie: Konstruktion von Testbatterien . Häufigkeiten ] Grundlagen Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. Datenmatrix mit 10 Personen (Untersuchungseinheiten) und den 4 Merkmalen: durchschnittliche Ausgaben pro Tag in ATS. Häufigkeiten – 17 / 44 Untersuchungseinheiten und Merkmale Die Grundbegriffe der Statistik sind Untersuchungseinheit (unit) und Merkmal (variable). Merkmale. Alter.4762 52 male Angestellt 777.Angest. in der die Zeilen den Untersuchungseinheiten und die Spalten den Variablen entsprechen. Warenkorbanalysen Web Mining: Analyse des Surfverhaltens. observations). Realisierungen) der Merkmale festgestellt (gemessen. Häufigkeiten – 19 / 44 . Merkmale. Statistische Daten haben daher meist die Struktur einer rechteckigen Datenmatrix (data frame). [ Daten.0000 42 male Angestellt 338.5000 68 male Pensionist 571.0000 66 male Pensionist 568.0000 55 female Leit.. Präferenzanalysen von Angebotsbündeln Finance: Modellierung von Aktienkursen Business Intelligence/Data Mining: Prädiktion von Käufern.0000 74 male Pensionist 954. Merkmale.

Merkmale. Häufigkeiten – 21 / 44 Totalerhebung Volkszählung: (Quelle: Statistik Austria) Totalerhebung Inventur: Geschäft Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. Häufigkeiten – 22 / 44 Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. Häufigkeiten – 20 / 44 Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. Merkmale. Häufigkeiten – 23 / 44 . Stichprobenerhebungen (samples) Experimenten (experimental studies) Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. und zwar aus Totalerhebung (population studies). Merkmale. Merkmale.Untersuchungseinheiten und Merkmale Es stellen sich zwei Fragen: Woher kommen die Untersuchungseinheiten? Was für Arten von Variablen kann es geben? Woher kommen die Untersuchungseinheiten? Statistische Untersuchungseinheiten kommen aus: Datenerhebungen (observational studies).

die sich in der Höhe der jährlichen Grundgebühr. im Zinssatz und im Kreditlimit unterscheiden. Häufigkeiten – 26 / 44 Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten.at) Stichprobenerhebung Meinungsumfrage: (Quelle: News. Häufigkeiten – 27 / 44 . Häufigkeiten – 25 / 44 Stichprobenerhebung Weitere Stichprobenerhebungen: Marktforschung Hochrechnung Inventur auf Basis einer Stichprobe Wahltagsbefragung (exit polls) Experimente Beispiele für Experimente: Untersuchung der Wirksamkeit von medizinischen Behandlungsmethoden: Beispiel: Einer Gruppe von Patienten wird ein neues. Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. Häufigkeiten – 24 / 44 Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. Merkmale. einer weiteren Gruppe ein Standardmedikament und einer dritten Gruppe ein Placebo verabreicht. Sie gibt den Befragen Karten zur Bewertung. Merkmale. Gibt es Unterschiede in der Wirksamkeit? Geplante Untersuchungen im Marketing: Beispiel: Eine Bank möchte die Wichtigkeit von drei Attributen von Kreditkarten in einer Konsumentenbefragung feststellen. Merkmale. rechts NRW 2002) 35 25 30 20 10 15 0 5 0 10 20 30 40 SPOe OeVP FPOe Gruene BZOe HPM KPOe sonstige OeVP SPOe Gruene FPOe Liste Martin BZOe Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. Merkmale.Totalerhebung Wahlergebnis Nationalratswahl 2006 (Quelle: ORF.at) Gallup Sonntagsfrage (links Umfrage.

Häufigkeiten – 29 / 44 Skalen Unter einer numerischen Kodierung eines Merkmals versteht man eine Belegung der Ausprägungen des Merkmals durch Zahlen. beliebig teilbaren Einheiten 1 2 3 4 5 6 7 8 9 10 Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten.2000 51 male Angestellt 264.2857 65 male Angestellt 349.Arten von Variablen Qualitative Variable Ausprägungen sind Kategorien Kategorien überschneiden einander nicht (alternativ) und erfassen alle Möglichkeiten (vollständig) dichotom: 2 Kategorien polytom: mehr als 2 Kategorien Arten von Variablen: Touristen in Kärnten expenditure age gender occupation 925. Häufigkeiten – 31 / 44 .0000 66 male Pensionist 568. Merkmale. Merkmale. 980.0000 55 female Leit. Häufigkeiten – 28 / 44 Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. Merkmale.Angest.6875 73 male Pensionist 1550.6000 48 male Angestellt Quantitative Variable Ausprägungen sind Ergebnisse von Zählen oder Messen diskret: Zählen von natürlich unteilbaren Einheiten stetig: Messen von willkürlichen.4762 52 male Angestellt 777. [ Daten.5000 68 male Pensionist 571. Ordinalskala Intervallskala Quotientenskala Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten.0000 42 male Angestellt 338. Häufigkeiten – 30 / 44 Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. Merkmale. Merkmale. bei der bestimmte Eigenschaften der Zahlenwerte mit Eigenschaften der Ausprägungen korrespondieren. Häufigkeiten ] Skalen Eine Skala ist eine numerische Kodierung eines Merkmals.0000 74 male Pensionist 954.

Häufigkeiten – 34 / 44 Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. die Quotienten) den inhaltlich definierten Unterschieden der Ausprägungen entsprechen. Merkmale. Beispiel: Güteklasse Falsch: Autonummern. Unterschied von Preisen [ Daten. Steuerklasse Intervallskala numerische Kodierung eines quantitativen Merkmals. Merkmale.Ordinalskala numerische Kodierung eines qualitativen Merkmals. Häufigkeiten – 33 / 44 Quotientenskala numerische Kodierung eines quantitativen Merkmals. Häufigkeiten – 35 / 44 . bei der die Reihenfolge der Zahlen einer inhaltlich definierten Reihenfolge der Ausprägungen entspricht. Häufigkeiten ] Deskriptive Statistik Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. gleiche Quotienten zwischen Zahlenwerten entsprechen inhaltlich gleich großen Unterschieden Quotientenskalen haben nur nichtnegative Werte Beispiele: Renditen. Merkmale. Merkmale. Merkmale. Häufigkeiten – 32 / 44 Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. bei der die relativen (prozentuellen) Unterschiede der Zahlen (bzw. bei der die Abstände der Zahlen den inhaltlich definierten Unterschieden der Ausprägungen entsprechen gleiche Differenzen zwischen den Zahlenwerten entsprechen inhaltlich gleich großen Unterschieden Beispiel: Punkte bei Prüfungsergebnissen Falsch: Noten Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten.

bei denen die Variable X den Wert a hat. .0000 66 male Pensionist 568. Merkmale. Merkmale. Merkmale. . Die Häufigkeit für Mann oder selbständig beträgt 343. Die Häufigkeit für weibliche leitende Angestellte oder weibliche Selbständige beträgt 39. Bei 111 Personen betragen die durchschnittlichen Ausgaben pro Tag mehr als ATS 1000: h(expenditure > 1000) = 111. Häufigkeiten – 37 / 44 1 2 3 4 5 6 n ist die Anzahl der Untersuchungseinheiten im Datensatz Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. Häufigkeiten – 39 / 44 . am Summe Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten.0000 74 male Pensionist 954.233.6875 73 male Pensionist 1550. am Häufigkeitstabelle: Ausprägung h h1 h2 . . Das entspricht einem Anteil von f (male) = 332/477 = 0. Häufigkeiten – 36 / 44 Logische Verknüpfungen: Touristen in Kärnten Die folgende Tabelle gibt absolute Häufigkeiten für die Variablen Geschlecht und Berufsgruppe an: Angestellt Leit. · · · . Absolute Häufigkeit: h(X = a) Relative Häufigkeit: f (X = a) = h(X =a) n Häufigkeiten: Touristen in Kärnten expenditure age gender occupation 925.696. 332 der Personen sind männlich: h(male) = 332. a1 a2 . Pensionist Selbstaendig male 120 83 89 40 female 69 28 37 11 Qualitative Merkmale Merkmal X mit Kategorien a1 . Das entspricht einem Anteil von f (expenditure > 1000) = 111/477 = 0. hm n f f1 f2 .Angest. . 980. In Formeln: xi = a Statistische Beschreibung von Daten: Wir interessieren uns nur für die Anzahl oder für den Anteil (Prozentsatz) der Daten. fm 1 Die Häufigkeit für Mann und selbständig beträgt 40. Merkmale.5000 68 male Pensionist . .Aussagen und Häufigkeiten Individuelle Beschreibung von Daten: Die Variable X hat bei der Untersuchungseinheit i den Wert a. a2 . . Häufigkeiten – 38 / 44 Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten.0000 55 female Leit.Angest. . Der Datensatz enthält n = 477 Personen.4762 52 male Angestellt 777. .

Ausnahme: Mehrheiten von Segmentkombinationen. Wahlergebnis. z. Balkendiagramme und Tortendiagramme sind zweidimensionale Darstellungen. Angestellt Leit. Merkmale. Selbstaendig Pensionist Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. 0 50 100 150 Angestellt Leit. Merkmale.42 Selbstaendig 51 10. Grafische Darstellungen Da Längen einfacher abzulesen sind als Winkel. Häufigkeiten – 41 / 44 Tortendiagramm: Touristen in Kärnten Im Tortendiagramm (pie chart) werden die Häufigkeiten durch die Größe der Segmente dargestellt. Häufigkeiten – 40 / 44 Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. Merkmale.Angest.Angest. absolut relativ Angestellt 189 39. Häufigkeiten – 43 / 44 .62 Leit. 111 23. Häufigkeiten – 42 / 44 Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten.27 Pensionist 126 26.B. Pensionist Selbstaendig Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten.69 Die Summe der absoluten Häufigkeiten beträgt 477.Häufigkeitstabelle: Touristen in Kärnten Häufigkeitstabelle für das Merkmal Berufsgruppe: Balkendiagramm: Touristen in Kärnten Im Balkendiagramm (bar chart) werden die Häufigkeiten durch die Höhen der Balken dargestellt. Dreidimensionale Darstellungen erschweren das Ablesen. sind Balkendiagramme meist Tortendiagrammen vorzuziehen.Angest. Merkmale. die Summe der relativen Häufigkeiten (in Prozent) beträgt 100.

1 −2 −1 0 x 1 2 3 Department of Statistics and Mathematics – WU Wien c 2008 Statistik – 1 – Daten. Häufigkeiten – 44 / 44 .4 f(x) 0.841 0. Merkmale.3 0. 0.Übungsaufgaben Die Übungsaufgaben zu diesem Kapitel sind Wiederholungen der Wahrscheinlichkeitsrechnung aus der Mathematik-Vorlesung.2 0. Als Vorbereitung für die kommenden Kapitel soll das Ablesen von Wahrscheinlichkeiten und Quantilen aus der Normalverteilungstabelle und der Tabelle der Quantile der Normalverteilung wiederholt werden.0 −3 0.

Sign up to vote on this title
UsefulNot useful