You are on page 1of 6

Statystyka

Historia seryjnego mordercy Harolda Shipmana, lekarza rodzinnego, który sfałszował testament
jednej ze swoich ofiar, której córka była prawnikiem. Shimann wstrzykiwał swoim ofiarom śmiertelną
dawkę opiatu.

Czy mogło być więcej ofiar oraz czy można było tego uniknąć- na te pytania odpowie statystyka.

Statystyka w tym kontekście jako nauka o poznaniu świata na podstawie danych.

Przedmiot zainteresowania statystyki:

Statystyka nauka zajmująca się danymi liczbowymi dotyczącymi zjawisk masowych.

Jest obecna w dziedzinach:

 Medycynie – skuteczność leków, eksperymenty,


 sądownictwo
 badania marketingowe
 biologia – szacowanie ilości osobników
 ekonomia – wzrosty cen
 socjologia

Badania korelacyjne a badania eksperymentalne, różnica – możliwość wnioskowania w kategorii


przyczynowo skutkowych, taką możliwość dają jedynie badania eksperymentalne.

Na dane statystyczne składają się duże zbiory liczb z których staramy się wydobyć informację.
Nasz umysł nie radzi sobie zbyt dobrze z przyswajaniem danych w takiej formie (przykładowy
zbiór danych na prezentacji)

Populacja – zbiór wszystkich możliwych jednostek pomiaru, które są przedmiotem padania

Próba – zazwyczaj niewielka część populacji będącej przedmiotem badania

Badania statystyczne mogą mieć charakter :

Wyczerpujący – gdy objęta jest cała populacja

Cząstkowy- gdy jest przeprowadzone na próbie, dobranych zwykle losowo reprezentantów


polulacji

Etapy badania statystycznego

 Problem – zrozumienie i zdefiniowanie


 Plan – co i w jaki sposób mierzyć ( konceptualizacja i operacjonalizacja)
 Dane – gromadzenie, zarządzanie, porządkowanie
 Analiza- Przeglądanie danych, tabele wykresy, poszukiwanie wzorów
 Wnioski – interpretacja, wnioski, propozycje, upowszechnienie

Statystyka nauka o gromadzeniu i organizacji danych liczbowych w celu odkrycia


prawidłowości występujących w zjawiskach masowych.

Statystyki – to konkretne dane liczbowe o zdarzeniach i zjawiskach


Podstawowe pojęcia

 Populacja – zbiorowość generalna, zbiór wszystkich możliwych jednostek, obiektów lub


pomiarów
 Próba – zazwyczaj niewielka cześć populacji, która jest poddana badaniu aby móc
wnioskować o zjawiskach w danej populacji

Badania statystyczne mogą mieć charakter:

 Wyczerpujący – gdy objęta jest nimi cała populacja


 Cząstkowy – gdy jest przeprowadzone na konkretnej próbie ( dobranych zwykle losowo
reprezentantach populacji/zbiorowości będącej przedmiotem zainteresowania badacza)

Dwa podejścia w statystyce:

W zależności od celu jaki nam przyświeca w trakcie pomiaru danych wyróżniamy dwa główne
podejścia statystyczne:

 Statystyka opisowa – metody służące do organizacji i opisu i syntetycznej prezentacji danych


liczbowych dotyczących pewnej zbiorowości
 Wnioskowanie statystyczne – metody służące do wnioskowania na temat cech populacji na
podstawie pomiaru tych cech w wylosowanej próbie.

Badania na podstawie prób losowych czyli tzw, badania metodą reprezentacyjną są powszechne w
wielu dziedzinach w oparciu o próby stanowiące znikomą cześć badanej populacji, ( 1000 -2000 sztuk)

Możliwe jest dość precyzyjne oszacowanie rzeczywistych charakterystyk badanej populacji pod
warunkiem przestrzegania metodologii.

Aby można było wnioskować na podstawie próby o populacji muszą być spełnione warunki:

 Próba musi być dobrana według specjalnej procedury zwanej – doborem losowym.
 Dobór musi zapewniać jednostce jednakowe lub różne ale znane szanse na uczestnictwo w
próbie (gdy prawdopodobieństwo nie jest jednakowe muszą zostać zastosowane techniki
ważenia)

Wnioskowanie na podstawie próby zawsze obarczone jest ryzykiem popełnienia błędu przy
szacowaniu wartości cech populacji.
Badania na próbach są powszechne min, ze względu na wysokie koszty badań
wyczerpujących, krótszy czas realizacji

Zmienna – cecha/ właściwość jednostek

Zmienna niezależna – wpływa na zmienną zależną – domniemana przyczyna

Zmienna zależna – domniemany skutek

Poziomy pomiaru
Dane gromadzone w trakcie badań- zestaw jakościowych i ilościowych charakteryzujących każdą
jednostkę analizy.

W trakcie badań dokonujemy pomiaru tych cech

Pomiar polega na sprawdzeniu jaką własność lub ilość danej cechy posiada badana jednostka analizy

Przypisanie określonej kategorii zmiennej do każdej kategorii jednostki analizy, np. :

- kobieta (zmienna – płeć)

- mieszkanka województwa

- zarobki

- głosuje na partie

Zróżnicowanie cech

Zróżnicowanie narzędzi pomiaru

Możliwe do zastosowania analizy statystyczne

Zmienne – poziomy pomiaru

 Zmienne jakościowe
- nominalne
- porządkowe

 Zmienne ilościowe:
- interwałowe ( przedziałowe)
- ilorazowe ( stosunkowe – posiadają bezwzględne 0)

a) Zmienne nominalne – Najniższy poziom pomiaru, przypisujemy jednostkę analizy do


określonej kategorii zmiennych, przy czym kategorie opisują właściwości zmiennej

Podział na kategorie –

 Wyczerpujący i rozłączny

- każdą jednostka analizy należy przypisać do określonej kategorii – warunek wyczerpujący


- jednostka analizy powinna być przyporządkowana tylko do jednej kategorii – warunek
rozłączności

Ponadto:
- kolejność kategorii jest obojętna i nie odzwierciedla natężenia danej cechy
- przypisywane im liczby pełnią role symboliczną i nie można wykonywać na nich działań
arytmetycznych

Zmienne, które mają tylko dwie cechy to zmienne dychotomiczne.

Zmienne porządkowe – nie tylko przypisujemy jednostki analizy do określonej kategorii ale do
kategorii pozostających w pewnym porządku. Porządek odzwierciedla natężenie cechy.

Jeśli zburzymy porządek logiczny kategorii następuje obniżenie poziomu pomiaru.

Punktowanie całkowito liczbowe – system punktowania kategorii zmiennych porządkowych


kolejnymi liczbami całkowitymi.

Zmienne przedziałowe (interwałowe) i zmienne ilorazowe ( stosunkowe)

Każdej jednostce przypisywana jest wartość liczbowa. Na zmiennej można wykonywać działania
algebraiczne.

Na skali interwałowej punkt zerowy jest przyjęty arbitralnie.

Na poziomie ilorazowym występuje 0 absolutne jeśli zmienna przybiera wartość 0 to oznacza brak
występowania danej cechy.

Poziomy interwałowy/ ilorazowy – poziomy silnie ilościowe

Sposób zapisu

Analiza jednej zmiennej

Sposoby prezentacji danych

Szereg statystyczny – wymieniamy każdą kategorie zmiennej oraz jej liczebność.

W odniesieniu to kategorii zmiennych porządkowych ważne jest zachowanie odpowiedniego


porządku kategorii zmiennej. Od największego natężenie lub odwrotnie, zmiana logicznego
porządku powoduje obniżenie pomiaru cechy
Skala Likerta-
 Zdecydowanie się zgadzam
 Zgadzam się
 Trudno powiedzieć
 Nie zgadzam się
 Zdecydowanie się nie zgadzam

Każdy przedział ma ustaloną dolną granice na tym przedziale to 10,15,20,25 i górną


14,99, 19,99, 24,99, 29,99.
Różnica między górną i dolną granicą to rozpiętość przedziału lub rozwartość

X1 N1

10-14.99 15

15-19,99 5

20-24,99 4

25-29,99 6

Szereg statystyczny w którym kategorie tworzą przedziały wartości zachowuje charakter


zmiennej ilościowej pod warunkiem:

- rozpiętość przedziału jest jednakowa w powyższym przykładzie to 4,9


- przedziały powinny być domknięte dla każdego przedziału musi być ustalona wartość górna
i dolna. Nie zależnie od tego, który przedział jest nie domknięty zmienna traci swój ilorazowy
charakter – staje się zmienną porządkową
- dolna i górna granica powinny być określone na tyle precyzyjnie aby możliwe było
przypisanie każdej jednostki analizy, która przybiera odpowiednią wartość liczbową do
jednego z przedziałów.

Ostry nawias- dana wartość zawiera się w przedziale


Okrągły nawias- dana wartość nie zawiera się w przedziale

Statystyki opisowe:

Miara tendencji centralnej – jaka wartość lub kategoria jest typowa?


Miary rozproszenia – jak bardzo dana wartość lub kategoria jest typowa?
Miara symetrii rozkładu- czy rozkład wartości odbiega od wzorca jakim jest rozkład
nominalny?

Dominanta- - dla zmiennych nominalnych – kategoria występująca z największą częstością


Mediana – centrum rozkładu zmiennej porządkowej, mediana dla zmiennych ilościowych,
wartość takiej obserwacji od której co najmniej połowa obserwacji ma wartości większe i
równocześnie połowa ma wartości mniejsze
Inne kwartyle –

Średnia arytmetyczna
Rozstęp - X max – X min
Odchylenie standardowe –
Wariancja i odchylenie standardowe –

Miary symetrii rozkładu –

Liczone dla zmiennych ilościowych


Wyrażają odstępstwa od rozkładu normalnego w dwóch wymiarach
- brak symetrii względem pionowej osi – skośność
- odstępstwa od wysokości „garba” – kurtoza

Graficzny opis zmiennych –

Wykres słupkowy – na osi X przedstawione wszystkie wartości w zbiorze, Y liczba osób


Histogram – ukazuje częstości tzw „przedziałów klasowych” Wartości zmiennej grupowane q
przedziały o równej rozpiętości i liczba osób, których wartości należą do danych przedziałów
prezentowana jest w postaci słupków

Wykres skrzynkowy – opiera się na statystykach dla zmiennych porządkowych – kwartkach,


pokazuje odstępstwa od skośności rozkładu oraz przypadki, które odstają od pozostałych

Wykres

You might also like