You are on page 1of 3

Analiza staystyczna i wizualizacja danych – wykład 1, 24.02.2022r.

nauka vs metoda naukowa

wyjaśnienie skuteczność badań

wnioskowanie dedukcyjne wnioskowanie indukcyjne wnioskowanie statystyczne


Kopernik Mendel wszyscy współcześnie

Wnioskowanie dedukcyjne, które przedstawiał Kopernik uważa, że każda obserwacja jest


tak samo cenna. Sprawdza się w wypadku matematyki, astronomii czy geografii. Nie działa
jednak w biologii, ponieważ w tej dziedzinie występują zmienności. Gdy zaczęto badać
biologię mając do dyspozycji wnioskowanie dedukcyjne, okazało się, że dużo faktów do
siebie nie pasuje przez obecnie zmienności.

Wnioskowanie indukcyjne pozwoliło na inny posób badania dla przyrodników.


Prekursorem był Grzegorz Mendel, którego geniusz polegał na tym, że znalazł sposób,
poprzez wnioskowanie indukcyjne, odrzucania niepasujących pomiarów do jego teorii.
Wnioskowanie to trwało przez wiele lat w nauce (do początków XX wieku) do momentu, w
którym przyrodnicy mieli tak dużo danych, że wnioskowanie indukcyjne przestało być
skuteczne.

Wnioskowanie statystyczne rozpoczęło się od Rolanda Fishera, który wprowadził pojęcie


analizy wariancji. Wnioskowanie to polega na wyciąganiu prawidłowości z szumu
informacyjnego z otaczającej nas rzeczywistości.

hipotezy naukowe ≠ hipotezy statystyczne

Czym jest zmienność?


Bez odwoływania się do definicji biologicznych czy statystycznych, zmienność to zakresy
cech, które determinowane są genetycznie. Np.: każdy ze studentów na wykładzie jest tym
samym gatunkiem, ale każdy ma inne cechy (kolor, struktura włosów, kolor i ułożenie
tęczówki, ułożenie kości twarzoczaszki itp.).

Na podstawie zmienności można zidentyfikować jak działa dobór naturalny.


Na przykładzie jajka kurzego – składa się ono z dwóch wymiarów, długości i
szerokości. Analizując na przykładzie jednego gatunku różnice w długości,
szerokości jajek dla poszczególnej samicy możemy określić jak działa dobór
naturalny. Na przykładzie 100 samic zauważono, że długość ma znacznie
większą zmienność w porównaniu do szerokości, która jest w miarę stała.
Dlaczego tak się dzieje? Wiadomo, że w obrębie gatunku z większych jajek
wykluwają się większe, zdrowsze, silniejsze pisklęta, ponieważ w dużym jajku mają więcej
materiałów odżywczych. Z pokolenia na pokolenie dobór naturalny odpowiada za
zwiększanie znosznych jaj i preferuje te geny, które warunkują coraz większe jajka. W
pewnym momencie jednak dochodzi do ściany, którą są ograniczenia fizjologiczne samicy –
szerokość kości łonowych. Dobór naturalny w tym wypadku ma tylko jedną opcję na
zwiększenie jaj – wydłużać je bez zwiększania szerokości. Stąd znaczne różnice w
zmienności długości jaj. Jak długo jajka mogą się wydłużać? Tak długo, jak pozwolą mu na
to ograniczenia samicy w dostarczaniu substancji na produkcję tego jajka. Ma na to wpływ
zdolność samicy w zdobywaniu pokarmu oraz zasobność środowiska głównie w wapń, który
jest najbardziej pożądanym składnikiem przy tworzeniu jajka.
Statystyka to dział matematyki stosowanej, zajmujący się zbieraniem, analizą, wizualizacją,
prezentacją i predykcją danych.

POZWALA NA: NIE POZWALA NA:


- badanie układów złożonych - „wróżenie”, zgadywanie wyników na
- upraszczanie otaczającej nas podstawie irracjonalnych założeń
rzeczywistości
- predykcje

Podstawową funkcją statystyki jest uporządkowanie faktów i dostarczenia wiarygodnych,


weryfikowalnych danych, które umożliwiają podjęcie decyzji. Nigdy nie ma 100% pewności,
czy zinterpretowane przez nas dane są takie, jak zakładamy, ani cyz podejmujemy dobrą
recyzję. Statystyka zapewnia oszacowanie błędu wnioskowania i pozwala na wyłowienie
pojedynczych sygnałów z szumu.

Metoda statystyczna to uzyskiwanie wniosków o pewnych zbiorach elementów zwanych


populacją na podstawie podzbiorów zwanych próbami. Np. chcąc zmierzyć średni wzrost
populacji Ziemi statystyk nie zmierzy każdej dorosłej osoby z osobna, ponieważ jego to
niewykonalne. Zamiast tego będzie pracował na wystarczająco dużej próbie i uogólni wyniki
na całą populację.

Główne zasady wykorzystania metody statystycznej:


1. Znalezienie problemu i poprawne sformułowanie pytania.
2. Zebranie danych umożliwiających weryfikację hipotezy.
3. Podawanie estymowanych parametrów z miarą błędów.
4. Sceptycyzm dotyczący wyników testów statystycznych.
5. Istotność statystyczna a istotność biologiczna.
6. Istnieją problemy, których rozwiązanie na obecnym etapie wiedzy nie jest możliwe.

Wyróżniamy dwa duże działy statystyki opisowa i indukcyjna.

Statystyka opisowa – duże zbiory danych są zastępowane pojedynczymi wartościami, które


są interpretowane i odzwierciedlają rozkład cechy.

Pytanie naukowe: Ile ssaki mają nóg?


Próba: 1 człowiek, 1 pies
Uogólnienie: (2+4)/2 = 3
Odpowiedź: Ssaki mają trzy nogi.

Podanie jednej miary może prowadzić do błędów!!!


„Święty gral” statystyki opisowej to wyliczenia do średniej – w biologii mogą dawać
irracjonalne wyniki, więc podanie samej średniej to żadna informacja – zawsze musi być
dołączona informacja o błędzie wnioskowania. W powyższym wypadku należy uwzględnić
odchylenie standardowe równe +/- 1.

Statystyka indukcyjna – wyciąganie wniosków o cechach populacji na podstawie


znajomości prób. Cechą charakterystyczną tego działu statystyki jest to, że ona się opiera o
rachunek prawdopodobieństwa. Ten dział dzieli się na dwa kolejne poddziały:
→ teoria estymacji – dotyczy estymatorów, czyli jak oszacować błąd, że średnia
uzyskana z danej próby jest średnią z całej populacji;
→ teoria testowania hipotez – najbarsziej skomplikowany dział statystyki, jaki poznamy
na tym przedmiocie, będzie o niej więcej na innym wykładzie.
Model to układ, który w przybliżony i uproszczony sposób pozwala opisywać to, co nas
otacza, np. modelem Ziemi jest globus. Pozwala stawiać falsyfikowane hipotezy (czyli takie,
które można testować). Natomiast metoda statystyczna ułatwia podejmowanie decyzji co do
tych hipotez naukowych. Zapisanie modelu w języku matematyki nie jest obowiązkowe, ale
pozwala na jego empiryczne doświadczenie.
→ Do jego budowy nie jest potrzebne używanie statystyki
→ Każdy model jest inny
→ Żaden model nie jest bezbłędny

You might also like