You are on page 1of 2

Organizacja badań i ok.

q*100% danych, a na prawo około Zdarzenia to pewne podzbiory


zbieranie danych (1-q)*100% danych. przestrzeni próbkowej.
-Pełne – obejmuje całą populację Kwantyl rzędu 0.15
(wyników nie uogólnia się; znaczy, że na lewo od niego

nie używa się metod znajduje się ok. 15% danych, ω ∈Ω
wnioskowania statystycznego). a na prawo 85% danych.
-Reprezentacyjne – dysponujemy Mediana to kwantyl rzędu 0.50 A⊂Ω
danymi (drugi kwartyl - Q2)
dla części populacji co znaczy, że dzieli dane Działania na zdarzeniach
(metoda reprezentacyjna). na połowy (w uporządkowanej i relacje pomiędzy zdarzeniami:
-Poddaną badaniu część populacji próbce jest to ta liczba A’ = Ω - A (dopełnienie) „nie zaszło A”
nazywamy od której około połowa danych A B (połączenie) „zaszło A lub B”
próbką wybieramy losowo. jest mniejsza a połowa większa) A B (przecięcie) „zaszło A i B”
-Wnioskowanie o całej populacji Kwantyl rzędu 0.75 (górny kwartyl Ω zdarzenie pewne
na podstawie losowej próbki wymaga Q3). Ø zdarzenie niemożliwe
znajomości Medianą jest wartość środkowa A B= zdarzenia A i B wykluczają się
metod rachunku prawdopodobieństwa. w uporządkowanej próbce nieparzystej. A B jeśli zajdzie A, to musi zajść B
Badania w zakresie nauk W uporządkowanej próbce parzystej Przestrzeń probabilistyczna
biomedycznych: medianą jest wartość -Przestrzeń probabilistyczna są to para
-Badania podstawowe średniej arytmetycznej z dwóch czyli przestrzeń próbkowa
(w oparciu o model badawczy) środkowych danych. wyposażona w rozkład
-Badania populacyjne i kliniczne Decyle – podział danych na porcje 10%, prawdopodobieństwa P
-Badania kohortowe czyli kwantyl -Rozkład prawdopodobieństwa to
(z jednej populacji rzędu 0.1 to 1 decyl przyporządkowanie pewnej klasie
jednych osobników Średnia jest bardzo wrażliwa zdarzeń
kwalifikujemy do grupy kontrolnej na ekstremalne wartości losowych liczb z przedziału [0,1
a innych danych (wyjątkowo duże lub małe). -Rozkład prawdopodobieństwa musi
kwalifikujemy Mediana jest „bardziej odporna” spełniać szereg warunków
do narażonych/chorych. na ekstremalne wartości (własności prawdopodobieństwa)
-Badania kliniczno kontrolne Moda (dominanta) Rozkład prawdopodobieństwa
(populacja dzieli się na dwie Modą ciągu liczb x1, x2, …, xn Rozkład prawdopodobieństwa to
podpopulacje: nazywamy taką wartość m, przyporządkowanie wszystkim
chorych /narażonychi grupa kontrola. która powtarza się zdarzeniom liczb.
Z każdej podpopulacji niezależnie w tym ciągu najwięcej razy.
pi ≥ 0 Σi=1 pi = 1
n
wybieramy próbkę. xmax +xmin
Elementy planowania eksperymentu 2 Zdarzenie losowe jest to podzbiór
-Typ danych: dwuwartościowe Miary położenia przestrzeni probabilistyczne
(prawda, fałsz),porządkowe, ciągłe. Średnia (arytmetyczna) (dla dyskretnych przestrzeni
-Wybór próbki Mediana probabilistycznych)
(kliniczno-kontrolne, kohortowe). Moda
-Projekt porównań Środek zakresu P ( A) = ∑p pi ≥ 0
(sparowane, nie sparowane) Miary rozproszenia (rozrzutu danych) ωi ∈ A n
i

Cechy (zmienne) Wariancja Σ i =1


pi = 1
Ilościowe – wielkości liczbowe Odchylenie standardowe
-ocena z biostatystyki, wiek, Odchylenie przeciętne
masa ciała(wielkości liczbowe Rozstęp międzykwartylowy Klasyczna definicja
dotyczące jednostek) Zakres danych prawdopodobieństwa
dyskretne - skończona liczba Wariancja jest średnią kwadratów zakłada, że wszystkie możliwe wyniki
wartości odchyleń od średniej są jednakowo prawdopodobne
(liczba posiadanych dzieci) (rozkład prawdopodobieństwa
ciągłe - dochody, wskaźnik BMI równomierny,jednostajny,
~ 1
Jakościowe – opisowo zdefiniowane S 2 = [( x1 − x) 2 + ( x2 − x) 2 + ⋅ ⋅ ⋅ + ( xn − x) 2 ] Ω dyskretne i skończone)

[x ]
n 1
własności jednostek ~ 2 Kombinatoryka
- płeć, oddział, kolor, stan cywilny S2 = 2
1 + x22 + ⋅ ⋅ ⋅ xn2 − x Permutacja zbioru {1,2,3...,n}
(opisowo zdefiniowane własności jednost n standardowe
Odchylenie jest to uporządkowanie
nominalne (podział na kategorie) Odchyleniem standardowym wszystkich elementów tego zbioru
Mierzone w kategoriach nazywamy Przykład. Permutacje zbioru {1,2,3}
zaklasyfikowania pierwiastek z wariancji 23 213 312
do jednej z rozróżnialnych kategorii 132 231 321
(w ramach kategorii nie klasyfikuje się ~ ~ Twierdzenie. Liczba permutacji
i nie nadaje się rang).
S = S2 zbioru n- elementowego jest równa
Przykład Zmienna A typ antropoidalny Odchylenie przeciętne n! = 1 2 3 ... n
(rasa nordycka lub negroidalna) Wariacja z powtórzeniami
S = [ x1 − m + x2 − m + ⋅ ⋅ ⋅ + xn − m ]
porządkowe ~ 1 k-wyrazowa ze zbioru {a1, a2,…,an}
Pozwalają na rangowanie n jest to ciąg (uporządkowany=zapamiętane
(ustawianie w określonym porządku) miejsca) k elementów
np. stopień otyłości tego zbioru (dozwolone powtórzenia).
Statystyka opisowa Rozstęp międzykwartylowy Twierdzenie. Liczba k-wyrazowych
Scharakteryzować badaną grupę Rozstępem międzykwartylowym wariacji z powtórzeniami ze zbioru
Charakterystyki podstawowe nazywamy liczbę - n-elementowego jest równa nk .
- Miary położenia ξ 0.75 - ξ 0.25
- Miary rozproszenia Inne oznaczenie kwartyli: Q3 - Q1
Szeregi proste i przedziałowe Zakres danych Wariacja bez powtórzeń
Współczynnik zmienności Różnica między największą k-wyrazowa ze zbioru {a1, a2,…,an}
Współczynnik asymetrii i najmniejszą wartością danych jest to ciąg (uporządkowany)
Próbka losowa -Jeżeli do wszystkich danych k różnych elementów tego zbioru.
próbka reprezentacyjna dodamy jakąś liczbę, Twierdzenie. Liczba k-wyrazowych
dobór jednostek z populacji do próbki to średnia wyliczona z danych wariacji bez powtórzeń ze zbioru
różne modele losowania zwiększy się o tą samą liczbę. n-elementowego jest równa
ŚREDNIA (wartość przeciętna) Wariancja i odchylenie standardowe n*(n-1)*(n-2)*…*(n-k+1)= n! / (n-k)!
- średnia arytmetyczna pozostaną takie same. Kombinacja (bez powtórzeń)
-średnia geometryczna -Jeżeli pomnożymy wszystkie Kombinacja k-wyrazowa ze zbioru
- średnia harmoniczne nasze dane przez stałą a {a1, a2,…,an} jest to podzbiór
-średnia ważona to średnia będzie równa a razy średnia, (zapominamy o kolejności)
x1 + x2 + ⋅ ⋅ ⋅ + xn n
n x = ∑ xi Wariancja zmieni się a2 razy. złożony z k (różnych)
x=
n i =1
Odchylenie standardowe zmieni się a elementów tego zbioru.
razy tak jak średnia Twierdzenie. Liczba kombinacji
∑ (x i − x) = 0 Porównanie wielu próbek k-elementowych ze zbioru
Średnia ważona Współczynnik zmienności: n-elementowego jest równa
~
S
w x + w2 x2 + ⋅ ⋅ ⋅ + wk xk
V = ⋅100% = n! / (k!(n-k)!)
xw = 1 1 x
Miary asymetrii Schemat Bernoulliego
w1 + w2 + ⋅ ⋅ ⋅ + wk Powtarzamy wielokrotnie (n razy)
Współczynnik skośności
niezależnie (wynik następnego
Częstość względna x−D doświadczenia nie zależy od
wsk = ~ wyników poprzednich) doświadczenie
S współczynnik asymetrii
Klasyczny
n = ∑ ni losowe, w którym możliwe są
ni
wi = n
dwa wyniki umownie nazwane
Średnia ważonan na podstawie ∑ (x − x)
i =1
i
3 „sukces” i „porażka”.
Prawdopodobieństwo sukcesu
częstości w próbce: w pojedynczym doświadczeniu
A1 = n
n1 x1 + n2 x2 + ⋅ ⋅ ⋅ + nk xk n1 n ~ oznaczymy przez p, porażki q=1-p
xw = = x1 + ⋅ ⋅ ⋅ + k xk S3
n1 + n2 + ⋅ ⋅ ⋅ + nk n n Twierdzenie.W schemacie Bernoulliego,
Średnia geometryczna PRAWDOPODOBIENSTWO prawdopodobieństwo otrzymania
Doświadczenie losowe to dokładnie k sukcesów (i n-k porażek)
x g = x1 ⋅ x2 ⋅ ⋅ ⋅ ⋅xn
n doświadczenie, którego jest równe
wyniku nie umiemy
Średnia harmoniczna w pełni przewidzieć. n 
P(k ) =   p k (1 − p ) n − k
n Możemy oceniać z jakim k 
xh = n prawdopodobieństwem wystąpią n!
1
∑x
i =1
różne wyniki doświadczenia.
Przestrzeń próbkowa zbiór wszystkich
P(k ) =
k!(n − k )!
p k (1 − p) n − k
i Rozkład prawdopodobieństwa
możliwych wyników doświadczenia opisany tym wzorem
losowego nazywa się dwumianowy
(W-omega), jego elementy to punkty Prawdopodobieństwo warunkowe
próbkowe (nazywane również Prawdopodobieństwo zajścia zdarzenia
zdarzeniami A pod warunkiem, że zdarzenie B zaszło.
MEDIANA I KWANTYLE elementarnymi).
Zdarzenia losowe to wypowiedzi P( A ∩ B)
Kwantylem rzędu q nazywamy P( A | B) =
taką liczbę ξq, dotyczące P( B)
że na lewo od tej liczby znajduje się wyniku doświadczenia.
na zbiorze liczb
rzeczywistych R wzorem:

Najważniejsze własności dystrybuanty\


Zakładamy przy tym, że P(B)>0. F ( a) = P ( X ≤ a ) = P ({ω : X (ω ) ≤ a})
Wzór na prawdopodobieństwo Wariancją D2X zmiennej losowej
całkowite 0 ≤ F ( x) ≤ 1
jest liczbą
F (−∞) = 0, F (∞ ) = 1 charakteryzującą rozrzut zbioru jej
P ( B ) = ∑ P( B | Ci ) P (Ci ) wartości wokół średniej EX
Niezależność
i zdarzeń losowych (drugi moment centralny)
Dwa zdarzenia są niezależne jeżeli dystrybuanta jest funkcją niemalejącą,
informacja o jednym nie ma wpływu prawostronnie ciągłą ∑ ( xi − EX ) 2 pi
P(X>b) =1 - F(b) 
na wystąpienie drugiego. D2 X =  2

∫
( x − EX ) f ( x )dx
Zdarzenia A i B są niezależne, jeśli
P{a < X ≤ b} = F (b) − F ( a)
P ( A ∩ B) = P ( A) ⋅ P ( B) Rozkład Poissona
Mówimy, że zmienna losowa X ma D 2 X = Var ( X )
Trzy równoważne drogi rozkład Poissona
sprawdzenia niezależności Po(λ) (P(λ)) z parametrem λ (lambda), Odchylenie standardowe DX
P (A |B) = P(A) λ>0jeśli jej funkcja prawdopodobieństwa zmiennej losowej X jesta liczbą
P (B |A) = P(B) jest postaci charakteryzującą rozrzut zbioru
P(A i B) = P (A) × P(B) jej wartości wokół wartości średniej
Zmienne losowe λ k
EX
P (k , λ ) = e −λ
dla
k =0,1,2,…. k ∈ N D ( X ) = Var ( X )
Zmienną losową nazywamy funkcję k! = N ∪ {0}
o wartościach rzeczywistych, 0
D 2 X = Var ( X )
określoną na przestrzeni Kwantyl rzędu p zmiennej losowej X
probabilistycznej: B (n, p ) → Po(λ ) n→∞ to taka liczba xp że
X:Ω R p→0 F (xp ) = p
X interpretujemy jako
„zmienną której wartość zależy np → λ
Zmienne losowe ciągłe Frakcja. Jeżeli A jest danym
od wyniku doświadczenia losowego”.
Gęstość rozkładu prawdopodobieństwa podzbiorem zbioru wartości zmiennej
Zmienna losowa dyskretna (skokowa)
Funkcja f(x) jest gęstością losowej X, to frakcją nazywamy liczbę
jest to zmienna, której zbór wartości
prawdopodobieństwa zmiennej
jest skończony lub przeliczalny.
losowej X jeśli
p = P{ X ∈ A)
Jeżeli x1 i x2 są kolejnymi
wartościami zmiennej losowej dyskretnej, P (a < X < b) =
b Asymetria (skośność). Liczba
to nie przyjmuje ona żadnych
wartości między P((a, b)) = F (b) − F (a) = ∫ f ( x)dx charakteryzująca „niejednakowość”
x1 i x2. Charakterystyki liczbowe a rozproszenia wartości zmiennej
Zmienna losowa ciągła jest to zmiennych losowych losowej wokół wartości oczekiwanej
zmienna przyjmująca Wartość przeciętna (oczekiwana, Własności wartości przeciętnej i
wszystkie wartości z pewnego średnia) wariancji.
przedziału (najczęściej EX zmiennej Niech a będzie liczbą , zaś X i Y
zbioru liczb rzeczywistych). losowej X jest liczbą charakteryzująca zmiennymi losowymi
Jeżeli x1 i x2 są dwiema położenie zbioru jej wartości E(X+a) = E(X)+a
wartościami zmiennej losowej E(X+Y) = E(X)+E(Y)
ciągłej, to może ona przyjąć  n E(aX) = aE(X)
dowolną wartość między ∑ xi pi Var(X+a) = Var(X-a)=Var(X)
EX =  i =1
x1 i x2. Var(aX) = a2Var(X)
 x f ( x )dx
Dystrybuanta rozkładu ∫ D(aX) = |a|D(X)
zmiennej losowej X jeśli zmienne są niezależne to
jest to funkcja F określona Var(X+Y)= Var(X) + Var(Y)