You are on page 1of 11

ĆWICZENIA 1 – STATYSTYKA OPISOWA 1

MGR RAFAŁ WALASEK


rwalasek@wne.uw.edu.pl
Zaliczenie ćwiczeń uzyskuje się na podstawie wyników:
a) trzech testów zaliczanych zdalnie (3x20% = 60%):
▪ odbędą się na platformie moodle w terminach określonych przez
wykładowców, czyli: 27.03, 24.04, 29.05 o 13:00,
▪ zadania z lukami do uzupełnienia,
▪ rozwiązania załączane na moodle.
b) prac domowych (20%):
▪ w ciągu semestru udostępnię 10 prac domowych,
▪ czas na rozwiązanie : tydzień (do kolejnych ćwiczeń),
▪ rozwiązania będę przyjmował na swoją skrzynkę mailową.
c) aktywności podczas zajęć (20%)
Punkty za aktywność podczas zajęć wypracowuje się w ramach pracy w zespołach. Uczestnicy
każdej grupy ćwiczeniowej zostaną podzieleni na zespoły trzyosobowe. W wyjątkowych
sytuacjach zespół może liczyć dwie lub cztery osoby. Przed każdymi zajęciami prowadzący
przydzieli wybranym zespołom zadanie do rozwiązania na kolejnych zajęciach. Punkty za
aktywność otrzymuje zespół, który zaprezentował poprawne rozwiązanie swojego zadania, przy
czym punktację dla poszczególnych osób proponują członkowie zespołu. Domyślna punktacja
to 50% dla osoby prezentującej oraz po 25% dla pozostałych osób. Brak poprawnego
rozwiązania powoduje utratę punktów za tę aktywność w całym zespole.

Aby zaliczyć ćwiczenia łącznie należy uzyskać co najmniej 50%.


OBECNOŚCI W TEORII WYKŁADU:
Uczestniczenie w ćwiczeniach jest obowiązkowe, obecność jest weryfikowana. Niespełnienie
kryterium obecności, czyli przekroczenie liczby trzech nieusprawiedliwionych nieobecności
uniemożliwia zaliczenie ćwiczeń oraz całego przedmiotu.
OBECNOŚCI W PRAKTYCE ĆWICZEŃ:
Uczestniczenie w ćwiczeniach NIE JEST OBOWIĄZKOWE. Obecność na ćwiczeniach nie będzie
przeze mnie weryfikowana. Do egzaminu uprawnia min. 50%. z ćwiczeń.
Ćwiczenia będą nagrywane, więc łącząc się na nie akceptujemy tę opcję.

1
MATERIAŁY Z WYKŁADU:
a) wykład dr Ogonek: http://coin.wne.uw.edu.pl/mogonek/
b) wykład dr Boratyńskiej: http://web.sgh.waw.pl/~aborata/wne_sm_2010-2011.php
ZBIÓR ZADAŃ NA ĆWICZENIA:
http://web.sgh.waw.pl/~aborata/ekonomia/Zadsek2.pdf
ROZKŁAD MATERIAŁU:

TERMIN TEMAT
1 2021-02-26 Statystyka opisowa 1
2 2021-03-05 Statystyka opisowa 2
3 2021-03-12 Indeksy statystyczne
4 2021-03-19 Podstawowe rozkłady prawdopodobieństwa
5 2021-03-26 Estymacja punktowa 1
6 2021-03-31 Estymacja punktowa 2
7 2021-04-09 Estymacja przedziałowa
8 2021-04-16 Przedziały ufności
9 2021-04-23 Testowanie hipotez statystycznych 1 - własności testów
10 2021-04-30 Testowanie hipotez statystycznych 2 – testy oparte na ilorazie wiarogodności
11 2021-05-14 Testowanie hipotez statystycznych 3 – porównanie z normą
12 2021-05-21 Testowanie hipotez statystycznych 4 – porównanie dwóch i więcej populacji
13 2021-05-28 Testowanie hipotez statystycznych 5 – testy zgodności i niezależności
14 2021-06-11 Podsumowanie materiału

2021-03-27 statystyka opisowa


2021-04-24 estymacja
2021-05-29 przedziały i testy statystyczne

2
ZADANIE 1 (ZZ 1.1)
W grupie 25 studentów zbadano oceny pracy kontrolnej ze statystyki. Otrzymano wyniki:
3.5; 4; 3; 3.5; 4.5; 3; 3; 3; 2.5; 4; 2; 3.5; 2; 2.5; 3.5; 4; 5; 2.5; 3; 2; 5; 4; 2; 3; 3. Przedstaw dane
w szeregu rozdzielczym. Podaj częstości dla poszczególnych ocen. Wyznacz i narysuj
dystrybuantę empiryczną oraz wykres słupkowy częstości. Wyznacz podstawowe miary
położenia i rozproszenia (wartość średnią, medianę, modę, wariancje próbkową).

Ocena Liczebność Częstość Częstość skumulowana


2 4 // 4 0,16 0,16
2,5 3 // 7 0,12 0,28
3 7 // 14 0,28 0,56
3,5 4 0,16 0,72
4 4 0,16 0,88
4,5 1 0,04 0,92
5 2 0,08 1
25 1

ŚREDNIA ARYTMETYCZNA
∑𝑛𝑖=1 𝑋𝑖
DANE SUROWE 𝑋̅ =
𝑛

∑𝑘𝑖=1 𝑛𝑖 𝑋𝑖 81
SZEREG PUNKTOWY 𝑋̅ = = = 3.24
𝑛 25

1; 3; 5; 7; 9

Med = X1(25+1):25 = X13:25 = 3


2

25% 25% 25% 25%

Mod = 3
MEDIANA

DANE SUROWE X1(n+1):n dla n nieparzystego


2
Med = {1
(X1n:n + X1(n+2):n ) dla n parzystego
SZEREG PUNKTOWY 2 2 2

3
ZADANIE 2 (ZZ 1.2)
W pewnym instytucie zbadano liczbę wyjazdów pracowników do krajów UE. Otrzymano wyniki:

Liczba
Liczba wyjazdów
pracowników
𝑥𝑖 𝑛𝑖
0 50
1 80
2 38
3 15
4 10
5 5
6 2
SUMA 200 = 𝑛

Jaki odsetek pracowników wyjeżdża rzadziej niż raz w roku a jaki częściej niż raz w roku? Ile razy
pracownicy łącznie wyjeżdżali do krajów UE? Ile razy pracownik przeciętnie wyjeżdża do UE?
Jaka jest moda, a jaka mediana (zinterpretuj wyniki)? Wyznacz wykres słupkowy.

4
ZADANIE 3 (ZZ 1.3)
W grupie 25 osób piszących pracę kontrolną ze statystyki zbadano czas pisania tej pracy.
Otrzymano wyniki w minutach: 83; 85; 89; 63; 75; 82; 88; 81; 65; 88; 83; 74;52; 85; 71; 60; 87;
81; 88; 59; 82; 78; 86; 78; 89. Przedstaw dane w szeregu rozdzielczym przyjmując liczbę 4 klas
równej szerokości. Wyznacz dystrybuantę empiryczną (dla danych surowych) i histogram
częstości. Wyznacz średnią, medianę, wariancję próbkową, odchylenie przeciętne, rozstęp
międzykwartylowy.
Dla ułatwienia wyniki uszeregujemy rosnąco:
52; 59; 60; 63; 65; 71; 74; 75; 78; 78; 81; 81; 82; 82; 83; 83; 85; 85; 86; 87; 88; 88; 88; 89; 89
89 − 52
4≈
𝑏
𝑏 ≈ 9.25 ≈ 10

Czas pisania pracy Częstość Środek


Liczebności Częstość
w minutach skumulowana przedziału
[50;60) 2 0,08 0,08 55
[60;70) 3 0,12 0,2 65
[70;80) 5 0,2 0,4 75
[80;90) 15 0,6 1 85
25
ŚREDNIA ARYTMETYCZNA
∑𝑛𝑖=1 𝑋𝑖 1952
DANE SUROWE ̅
𝑋= = = 78.08 𝑚𝑖𝑛.
𝑛 25
∑𝑘𝑖=1 𝑛𝑖 𝑐̅𝑖 55 ∗ 2 + 65 ∗ 3 + 75 ∗ 5 + 85 ∗ 15 1955
SZEREG 𝑋̅ ≈ = =
𝑛 25 25
PRZEDZIAŁOWY
= 78.2 𝑚𝑖𝑛

5
MEDIANA

DANE SUROWE X1(n+1):n dla n nieparzystego


2
Med = {1
(X1n:n + X1(n+2):n ) dla n parzystego
SZEREG PUNKTOWY 2 2 2

𝑚−1 𝑚−1
0
𝑛 ℎ𝑚 0
1 ℎ𝑚
SZEREG PRZEDZIAŁOWY 𝑀𝑒𝑑 ≈ 𝑥𝑚 + ( − ∑ 𝑛𝑖 ) = 𝑥𝑚 + ( − ∑ 𝑓𝑖 )
2 𝑛𝑚 2 𝑓𝑚
𝑖=1 𝑖=1

52; 59; 60; 63; 65; 71; 74; 75; 78; 78; 81; 81; 82; 82; 83; 83; 85; 85; 86; 87; 88; 88; 88; 89; 89

Med = X1(25+1):25 = 82 𝑚𝑖𝑛.


2

Czas pisania pracy Częstość Środek


Liczebności Częstość
w minutach skumulowana przedziału
[50;60) 2 // 2 0,08 0,08 55
[60;70) 3 // 5 0,12 0,2 65
[70;80) 5 // 10 0,2 0,4 75
[80;90) Med 15 //25 0,6 1 85
25

Med = X1(25+1):25 = 82 𝑚𝑖𝑛.


2

25 10
𝑀𝑒𝑑 ≈ 80 + ( − (2 + 3 + 5)) = 81.67 min.
2 15

25% 25% 25% 25%

6
KWARTYL PIERWSZY

DANE SUROWE 𝑋[𝑛/4]+1:𝑛 𝑑𝑙𝑎 𝑛/4 > [𝑛/4]


𝑄1 = {1
(𝑋 + 𝑋(𝑛/4+1):𝑛 ) 𝑑𝑙𝑎 𝑛/4 = [𝑛/4]
SZEREG PUNKTOWY 2 𝑛/4:𝑛

𝑞1−1 𝑞1−1
SZEREG PRZEDZIAŁOWY 0
𝑛 ℎ𝑞1 0
1 ℎ𝑞1
𝑄1 ≈ 𝑥𝑞1 + ( − ∑ 𝑛𝑖 ) = 𝑥𝑞1 + ( − ∑ 𝑓𝑖 )
4 𝑛𝑞1 4 𝑓𝑞1
𝑖=1 𝑖=1

52; 59; 60; 63; 65; 71; 74; 75; 78; 78; 81; 81; 82; 82; 83; 83; 85; 85; 86; 87; 88; 88; 88; 89; 89

𝑋[25/4]+1:25 = 𝑋7:25 = 74 𝑚𝑖𝑛.


Czas pisania pracy Częstość Środek
Liczebności Częstość
w minutach skumulowana przedziału
[50;60) 2 // 2 0,08 0,08 55
[60;70) 3 //5 0,12 0,2 65
[70;80) Q1 5 //10 0,2 0,4 75
[80;90) 15 0,6 1 85
25
𝑋[25/4]+1:25 = 𝑋7:25 = 74 𝑚𝑖𝑛.
25 10
𝑄1 ≈ 70 + ( − (2 + 3)) = 72.5 min.
4 5

25% 25% 25% 25%

7
KWARTYL TRZECI

DANE SUROWE 𝑋[3𝑛/4]+1:𝑛 𝑑𝑙𝑎 3𝑛/4 > [3𝑛/4]


𝑄3 = {1
(𝑋 + 𝑋(3𝑛/4+1):𝑛 ) 𝑑𝑙𝑎 3𝑛/4 = [3𝑛/4]
SZEREG PUNKTOWY 2 3𝑛/4:𝑛

𝑞3−1 𝑞3−1
0
3𝑛 ℎ𝑞3 0
3 ℎ𝑞3
SZEREG PRZEDZIAŁOWY 𝑄3 ≈ 𝑥𝑞3 + ( − ∑ 𝑛𝑖 ) = 𝑥𝑞3 + ( − ∑ 𝑓𝑖 )
4 𝑛𝑞3 4 𝑓𝑞3
𝑖=1 𝑖=1

52; 59; 60; 63; 65; 71; 74; 75; 78; 78; 81; 81; 82; 82; 83; 83; 85; 85; 86; 87; 88; 88; 88; 89; 89

𝑋[3∗25/4]+1:25 = 𝑋19:25 = 86 𝑚𝑖𝑛.


Czas pisania pracy Częstość Środek
Liczebności Częstość
w minutach skumulowana przedziału
[50;60) 2 // 2 0,08 0,08 55
[60;70) 3 //3 0,12 0,2 65
[70;80) 5 // 10 0,2 0,4 75
[80;90) Q3 15 //25 0,6 1 85
25
𝑋[3∗25/4]+1:25 = 𝑋19:25 = 86 𝑚𝑖𝑛
3 ∗ 25 10
𝑄3 ≈ 80 + ( − (2 + 3 + 5)) = 85.83 min.
4 15

25% 25% 25% 25%

𝐼𝑄𝑅 = 𝑄3 − 𝑄1 = 86 − 74 = 12 𝑚𝑖𝑛.
𝐼𝑄𝑅 = 𝑄3 − 𝑄1 = 85.83 − 72.5 = 13.33 𝑚𝑖𝑛.

25% 25%

8
ZADANIE 4 (ZZ 1.4)
Badanie 50 kandydatów na maklerów papierów wartościowych ze względu na czas
przygotowywania się do egzaminu dostarczyło następujących danych (czas w godzinach):
15 15 15 17 19 20 20 24 25 27
27 27 30 32 34 34 34 35 36 36
37 37 39 40 41 42 42 43 43 44
44 44 46 47 47 48 48 49 49 49
49 50 50 52 53 53 53 54 54 54

Zbuduj szereg rozdzielczy przyjmując jednakowe rozpiętości przedziałów klasowych. W oparciu


o szereg rozdzielczy przedstaw histogram i dystrybuantę empiryczną (skumulowana łamana
częstości). Na podstawie wykresu określ w przybliżeniu jaki odsetek kandydatów poświęca na
przygotowanie do egzaminu od 28 do 45 godzin. Przedstaw wykres ramkowy (pudełkowy).
Wyznacz średnią, na podstawie danych i na podstawie szeregu przedziałowego wyjaśnij źródło
różnic.

9
DODATEK:
▪ Dla cechy skokowej zwykle wyznacza się szereg punktowy, a dla ciągłej – szereg
przedziałowy.
▪ Liczba klas 𝑘 spełnia jeden z warunków:
3
• 4 √𝑛 ≤ 𝑘 ≤ √𝑛
𝑋𝑚𝑎𝑥 −𝑋𝑚𝑖𝑛
• 𝑘≈ 𝑏

ŚREDNIA ARYTMETYCZNA
∑𝑛𝑖=1 𝑋𝑖
DANE SUROWE 𝑋̅ =
𝑛
𝑘
∑𝑘𝑖=1 𝑛𝑖 𝑋𝑖
SZEREG PUNKTOWY ̅
𝑋= = ∑ 𝑓𝑖 𝑋𝑖
𝑛
𝑖=1
𝑘
∑𝑘𝑖=1 𝑛𝑖 𝑐̅𝑖
SZEREG PRZEDZIAŁOWY 𝑋̅ ≈ = ∑ 𝑓𝑖 𝑐̅𝑖
𝑛
𝑖=1

MEDIANA

DANE SUROWE X1(n+1):n dla n nieparzystego


2
Med = {1
(X1n:n + X1(n+2):n ) dla n parzystego
SZEREG PUNKTOWY 2 2 2

𝑚−1 𝑚−1
0
𝑛 ℎ𝑚 0
1 ℎ𝑚
SZEREG PRZEDZIAŁOWY 𝑀𝑒𝑑 ≈ 𝑥𝑚 + ( − ∑ 𝑛𝑖 ) = 𝑥𝑚 + ( − ∑ 𝑓𝑖 )
2 𝑛𝑚 2 𝑓𝑚
𝑖=1 𝑖=1

DOMINANTA

DANE SUROWE
Najczęściej powtarzająca się wartość w próbie, z wykluczeniem
wartości najmniejszej i największej.
SZEREG PUNKTOWY

𝑛𝑑 − 𝑛𝑑−1
𝑀𝑜𝑑 ≈ 𝑥𝑑0 + ℎ
2𝑛𝑑 − 𝑛𝑑−1 − 𝑛𝑑+1 𝑑
SZEREG PRZEDZIAŁOWY
𝑓𝑑 − 𝑓𝑑−1
= 𝑥𝑑0 + ℎ
2𝑓𝑑 − 𝑓𝑑−1 − 𝑓𝑑+1 𝑑

10
KWANTYLE

𝑋[𝑛𝑝]+1:𝑛 𝑑𝑙𝑎 𝑛𝑝 > [𝑛𝑝]


̂
𝑄𝑝 = {1
(𝑋 + 𝑋(𝑛𝑝+1):𝑛 ) 𝑑𝑙𝑎 𝑛𝑝 = [𝑛𝑝]
2 𝑛𝑝:𝑛

KWARTYL PIERWSZY

DANE SUROWE 𝑋[𝑛/4]+1:𝑛 𝑑𝑙𝑎 𝑛/4 > [𝑛/4]


𝑄1 = {1
(𝑋 + 𝑋(𝑛/4+1):𝑛 ) 𝑑𝑙𝑎 𝑛/4 = [𝑛/4]
SZEREG PUNKTOWY 2 𝑛/4:𝑛

𝑞1−1 𝑞1−1
SZEREG PRZEDZIAŁOWY 0
𝑛 ℎ𝑞1 0
1 ℎ𝑞1
𝑄1 ≈ 𝑥𝑞1 + ( − ∑ 𝑛𝑖 ) = 𝑥𝑞1 + ( − ∑ 𝑓𝑖 )
4 𝑛𝑞1 4 𝑓𝑞1
𝑖=1 𝑖=1

KWARTYL TRZECI

DANE SUROWE 𝑋[3𝑛/4]+1:𝑛 𝑑𝑙𝑎 3𝑛/4 > [3𝑛/4]


𝑄3 = {1
(𝑋 + 𝑋(3𝑛/4+1):𝑛 ) 𝑑𝑙𝑎 3𝑛/4 = [3𝑛/4]
SZEREG PUNKTOWY 2 3𝑛/4:𝑛

𝑞3−1 𝑞3−1
0
3𝑛 ℎ𝑞3 0
3 ℎ𝑞3
SZEREG PRZEDZIAŁOWY 𝑄3 ≈ 𝑥𝑞3 + ( − ∑ 𝑛𝑖 ) = 𝑥𝑞3 + ( − ∑ 𝑓𝑖 )
4 𝑛𝑞3 4 𝑓𝑞3
𝑖=1 𝑖=1

11

You might also like