You are on page 1of 8

Wydział Informatyki Politechniki

Białostockiej data: 03.04.2023 r.


Metody Probabilistyczne i Statystyka
Estymatory i ich własności
grupa: PS prowadzący:
zespół: mgr inż. Joanna Gościk
Adam Niczyporuk
Jakub Świetliczny ocena:
Tomasz Jarmoc

Zadanie 1
Przeanalizować zmienność rozkładu chi-kwadrat i t-Studenta w zależności od liczby
stopni swobody.

A. Wyznaczyć wykresy gęstości zmiennych losowych o rozkładzie chi-kwadrat z liczbą


stopni swobody 1, 2, 3, 10.
B. Wyznaczyć wykresy gęstości zmiennej losowej o rozkładzie t-Studenta z liczbą stopni
swobody 1, 10, 100.

Wykresy funkcji gęstości i dystrybuanty zmiennej losowej o rozkładzie chi-kwadrat z liczbą


stopni swobody 1, 3, 6, 9, 12, 15.

y=chi2(x,1) p=ichi2(x,1)
1.0
0.16
0.14 0.8
0.12
0.10 0.6
0.08
0.4
0.06
0.04 0.2
0.02
0.00 0.0
0 2 4 6 8 10 12 14 16 18 20 22 24 0 2 4 6 8 10 12 14 16 18 20 22 24

y=chi2(x,3) p=ichi2(x,3)
1.0
0.16
0.14 0.8
0.12
0.10 0.6
0.08
0.4
0.06
0.04 0.2
0.02
0.00 0.0
0 2 4 6 8 10 12 14 16 18 20 22 24 0 2 4 6 8 10 12 14 16 18 20 22 24
Wraz z wzrostem liczby stopni swobody maksimum wykresu rozkładu chi-kwadrat przesuwa
się w prawo, w kierunku większych argumentów, natomiast wartość tego maksimum maleje.
Przyrost wartości funkcji gęstości przed maksimum, a także spadek jej wartości po osiągnięciu
maksimum jest coraz wolniejszy, zatem wykres staje się coraz bardziej spłaszczony i rozciągły.
Wykresy funkcji gęstości i dystrybuanty zmiennej losowej o rozkładzie t-Studenta z
liczbą stopni swobody 1, 5, 15, 20, 25, 30.

y=student(x,1) p=istudent(x,1)
0.5 1.0

0.4 0.8

0.3 0.6

0.2 0.4

0.1 0.2

0.0 0.0
-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3

y=student(x,5) p=istudent(x,5)
0.5 1.0

0.4 0.8

0.3 0.6

0.2 0.4

0.1 0.2

0.0 0.0
-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3

y=student(x,15) p=istudent(x,15)
0.5 1.0

0.4 0.8

0.3 0.6

0.2 0.4

0.1 0.2

0.0 0.0
-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3

y=student(x,20) p=istudent(x,20)
0.5 1.0

0.4 0.8

0.3 0.6

0.2 0.4

0.1 0.2

0.0 0.0
-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3
y=student(x,25) p=istudent(x,25)
0.5 1.0

0.4 0.8

0.3 0.6

0.2 0.4

0.1 0.2

0.0 0.0
-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3

y=student(x,30) p=istudent(x,30)
0.5 1.0

0.4 0.8

0.3 0.6

0.2 0.4

0.1 0.2

0.0 0.0
-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3

Wraz z wzrostem liczby stopni swobody zwiększa się maksimum i zmniejsza się
odchylenie standardowe wykresu rozkładu t-Studenta, dlatego jego kształt zbliża się do kształtu
dzwonu. Rozkłady t-Studenta są symetryczne względem prostej pionowej x = 0. Na podstawie
tych informacji można zaobserwować, że wraz z wzrostem liczby stopni swobody rozkład t-
Studenta dąży do standardowego rozkładu normalnego N(0, 1).

Liczba stopni swobody (df - degrees of freedom) – różnica liczby obserwacji i liczby
parametrów estymowanych przy pomocy tych obserwacji lub różnica liczby niezależnych
wyników obserwacji i liczby związków, które łączą te wyniki ze sobą.

Rozkład chi-kwadrat – rozkład zmiennej losowej który powstał w wyniku przekształcenia


rozkładu normalnego. Zmienna losowa rozkładu chi-kwadrat o k stopniach swobody jest sumą
kwadratów k niezależnych zmiennych losowych o standardowym rozkładzie normalnym
N(0,1). Służy do analizy wariancji, testów zgodności i testów niezależności.

Rozkład t-Studenta – ciągły rozkład prawdopodobieństwa stosowany często w statystyce


w procedurach testowania hipotez statystycznych, przy ocenie błędów pomiaru i do
konstruowania przedziałów ufności.
Zadanie 2
Wygenerować próbkę o liczności 500 z rozkładu N(0,1). Z początkowych elementów
wygenerowanej próby, utworzyć próby o licznościach 10, 20, 30, 40, 50, 100, 200, 300, 400.
Stworzyć zbiór danych zawierający następujące kolumny, zawierające statystyki wyliczone
dla utworzonych wcześniej dziesięciu prób:

1. liczność próby
2. mediana
3. estymator wartości oczekiwanej (średnia arytmetyczna)
4. dolny i górny kraniec 90% przedziału ufności dla wartości oczekiwanej
5. estymator wariancji
6. estymator odchylenia standardowego
7. dolny i górny kraniec 90% przedziału ufności dla odchylenia standardowego

Utworzyć dwa wykresy:

1. wykres zależności wyliczonych estymatorów wartości oczekiwanej (pkt. 2-4) od


liczności próby
2. wykres zależności wyliczonych estymatorów wariancji (pkt. 5-7) od liczności próby

A. Przeanalizować zależność powyższych statystyk od liczności próbek.


B. Jak zmieniłyby się wykresy dla prób z rozkładów N(0; 0.1), N(0, 10)?

W kolumnach tabeli znajdują się wartości pomiarów cen akcji pewnej firmy paliwowej
na giełdzie(zmiennej losowej) w pewnym miejscu w początkowych 10, 20, 30, 40, 50, 100,
200, 300, 400, 500 dniach czasu trwania pomiarów. Wybrane wartości parametrów rozkładu
wynoszą: średnia – 699.4439, odchylenie standardowe – 6.160. Wśród wartości pomiarów nie
ma wartości mocno odbiegających od średniej.

N.10 N.20 N.30 N.40 N.50 N.100 N.200 N.300 N.400 N.500
708,83 708,83 708,83 708,83 708,83 708,83 708,83 708,83 708,83 708,83
696,21 696,21 696,21 696,21 696,21 696,21 696,21 696,21 696,21 696,21
692,94 692,94 692,94 692,94 692,94 692,94 692,94 692,94 692,94 692,94
692,58 692,58 692,58 692,58 692,58 692,58 692,58 692,58 692,58 692,58
692,85 692,85 692,85 692,85 692,85 692,85 692,85 692,85 692,85 692,85
706,75 706,75 706,75 706,75 706,75 706,75 706,75 706,75 706,75 706,75
696,47 696,47 696,47 696,47 696,47 696,47 696,47 696,47 696,47 696,47
696,13 696,13 696,13 696,13 696,13 696,13 696,13 696,13 696,13 696,13
705,54 705,54 705,54 705,54 705,54 705,54 705,54 705,54 705,54 705,54
697,05 697,05 697,05 697,05 697,05 697,05 697,05 697,05 697,05 697,05
699,13 699,13 699,13 699,13 699,13 699,13 699,13 699,13 699,13
703,02 703,02 703,02 703,02 703,02 703,02 703,02 703,02 703,02
694,76 694,76 694,76 694,76 694,76 694,76 694,76 694,76 694,76
707,66 707,66 707,66 707,66 707,66 707,66 707,66 707,66 707,66
699,68 699,68 699,68 699,68 699,68 699,68 699,68 699,68 699,68
697,32 697,32 697,32 697,32 697,32 697,32 697,32 697,32 697,32
704,51 704,51 704,51 704,51 704,51 704,51 704,51 704,51 704,51
694,54 694,54 694,54 694,54 694,54 694,54 694,54 694,54 694,54
… … … … … … … … …

Kolumny tabeli zawierają statystyki obliczone dla 10, 20, 30, 40, 50, 100, 200, 300,
400, 500 początkowych wartości pomiarów. Poziomy ufności średniej i odchylenia
standardowego są równe 95%.

DOLNA GÓRNA
DOLNA GRANICA GÓRNA GRANICA
GRANICA - GRANICA - ODCHYLENIE
LICZNOŚĆ MEDIANA ŚREDNIA WARIANCJA - ODCHYLENIE - ODCHYLENIE
WARTOŚĆ WARTOŚĆ STANDARDOWE
STANDARDOWE STANDARDOWE
ŚREDNIA ŚREDNIA
10 696,3421 698,5351 694,9763 702,0939 37,69018 6,139233 4,477631 10,10025
20 698,2074 699,5806 697,4922 701,6691 29,17607 5,401488 4,288379 7,40225
30 699,1135 699,5910 698,0056 701,1764 26,11845 5,110621 4,218785 6,54009
40 699,1432 699,7842 698,1746 701,3938 36,50643 6,042055 5,107768 7,44371
50 699,5405 700,3452 698,8704 701,8200 38,69075 6,220189 5,345869 7,47494
100 700,3646 700,6177 699,5978 701,6376 37,73009 6,142483 5,505690 6,96283
200 699,9930 699,7314 699,0254 700,4374 36,50502 6,041938 5,584793 6,58834
300 699,9930 699,7739 699,1914 700,3564 37,38772 6,114550 5,731276 6,55781
400 699,9213 699,6205 699,1079 700,1332 38,67382 6,218828 5,878251 6,60508
500 700,1629 699,8979 699,4439 700,3519 37,95378 6,160664 5,857049 6,50044

Mediana, średnia oraz górna i dolna granica wartości średniej gwałtownie maleją w
przedziale liczności od 10 do 30 prób. Następnie w przedziale od 30 do 100 prób statystyki
rosną: górna granica wartości średniej - powoli, a pozostałe - znacząco. Od 100 do 200 prób
statystyki jeszcze nieco maleją, a po przekroczeniu granicy 200 prób pozostają już na względnie
stałym poziomie.

Wariancja gwałtownie maleje w przedziale liczności od 10 do 30 prób. Następnie


gwałtownie rośnie do liczby prób równej 50. Od 100 do 200 prób wariancja jeszcze nieznacznie
spada, a po przekroczeniu 200 prób pozostaje na względnie stałym poziomie. W przedziale od
10 do 30 prób odchylenie standardowe, jego dolna granica i górna granica maleje w podobnym
stopniu. Po przekroczeniu 30 prób te trzy statystyki utrzymują się na stałym i zbliżonym do
siebie poziomie.

a) Jak zmieniłyby się zależności dla odchylenia standardowego k razy mniejszego?

Dla odchylenia standardowego k razy mniejszego od 6.160 mediana, średnia oraz górna
i dolna granica wartości średniej ulegają znacznie mniejszym wahaniom dla małej liczby prób
(od 10 do 40). Osiągają znaczną zbieżność do ostatecznych wartości już dla 40 - 50 prób,
podczas gdy dla odchylenia standardowego 6.160 zachodzi to dopiero w pobliżu 200 prób. W
obydwu przypadkach, zbliżając się do 500 prób, statystyki osiągają bardzo podobne wartości.

Dla odchylenia standardowego k razy mniejszego od 6.160 wariancja przyjmuje


wartości około k^2 razy mniejsze. Wartości wariancji, odchylenia standardowego oraz górnej i
dolnej granicy odchylenia standardowego również ulegają o wiele mniejszym wahaniom wraz
ze wzrostem liczby prób niż przy początkowo przyjętym odchyleniu standardowym.
Te zmiany wynikają z faktu, że w zbiorze danych o mniejszym odchyleniu
standardowym dane są bardziej skupione wokół średniej.

b) Jak zmieniłyby się zależności dla odchylenia standardowego m razy większego?

Dla odchylenia standardowego m razy większego od 6.160 mediana, średnia oraz górna
i dolna granica wartości średniej ulegają znacznie mniejszym wahaniom w szerokim przedziale
liczby prób (od 10 do 300). Osiągają zbieżność dopiero przy dużej liczbie prób, jednak nawet
przy 500 próbach różnica między medianą i średnią jest dużo większa niż przy początkowo
przyjętym odchyleniu standardowym.

Dla odchylenia standardowego m razy większego od 6.160 wariancja przyjmuje


wartości około m^2 razy większe. Powoduje to, że wartości wariancji, odchylenia
standardowego oraz górnej i dolnej granicy odchylenia standardowego również ulegają
znacznie większym wahaniom niż dla oryginalnego odchylenia standardowego.

Te zmiany wynikają z faktu, że w zbiorze danych o większym odchyleniu standardowym


dane są mniej skupione wokół średniej i częściej występują wśród nich wartości od niej
odbiegające.

You might also like