You are on page 1of 7

Statystyka Analiza struktury

STATYSTYKA
ANALIZA STRUKTURY ZBIOROWOŚCI STATYSTYCNYCH
Analizą struktury nazywamy opis zbiorowości statystycznej za pomocą odpowiednich charakterystyk,
zwanych parametrami statystycznymi, a pozwalającymi na uchwycenie podobieństw oraz różnic
pomiędzy jednostkami badanej zbiorowości.
Wśród parametrów statystycznych wyróżniamy:
- miary podobieństwa,
- miary zmienności,
- miary asymetrii,
- miary koncentracji.

1. KLASYCZNE MIARY PODOBIEŃSTWA


Spośród klasycznych miar podobieństwa, służących ukazaniu przeciętnego poziomu badanego zjawiska,
wyróżniamy:
1.1. Średnia arytmetyczna
Najprostszą i najczęściej stosowną średnią klasyczną jest średnia arytmetyczna, rozumiana jako suma
wartości cechy zmiennej wszystkich jednostek badanej zbiorowości podzielona przez sumę jednostek
badanej zbiorowości – jej liczebność (N):
x + x2 + ... + xn 1 n
x= 1 = ∑ xi .
N N i =1
Dla szeregu rozdzielczego jednopunktowego miara ta jest obliczana według wzoru:
1 n
x = ∑ x i ni .
N i =1
Dla szeregu rozdzielczego przedziałowego stosuje się wzór:
1 n
x = ∑ x ' i ni .
N i =1
Przykład 1:
Tabela 1. Sprzedaż najpopularniejszych marek samochodów osobowych w Europie w 2010 r. (I-IX)
Sprzedaż (w tys. szt.)
Marka
(xi)
Volkswagen 1 187
Ford 888
Renault 877
Peugeot 776
Opel 766
Fiat 659
Citroen 648
Audi 472
Toyota 458
BMW 455
RAZEM
Źródło: ACEA European Automobile Manufacturers' Association.

-1-
Statystyka Analiza struktury

Średnia arytmetyczna: x =
Interpretacja:

Przykład 2:
Tabela 2. Plany prokreacyjne Polaków w wieku 18-39 lat.
Planowana Wskazania
liczba dzieci (xi) w % (ni)
Żadne 2,1
Jedno 10,6
Dwoje 53,2
Troje 24,5
Czworo 6,4
Pięcioro i więcej 3,2
RAZEM 100
Źródło: Komunikat CBOS, Postawy Prokreacyjne Polaków, styczeń 2010.

Średnia arytmetyczna: x =
Interpretacja:

Przykład 3:
Tabela 3. Długości skoków w zawodach Pucharu Świata, Zakopane 21.01.2011 r.
Długość skoku Liczba skoków
w metrach (xi) (ni)
109-114 3
114-119 12
119-124 28
124-129 20
129-134 12
134-139 5
RAZEM 80
Źródło: Zestawienie własne.

Średnia arytmetyczna: x =
Interpretacja:

-2-
Statystyka Analiza struktury

Właściwości średniej arytmetycznej:


- należy do miar tendencji centralnej,
- jest miarą abstrakcyjną,
- nie jest reprezentatywna dla szeregu o dużej asymetrii,
- prosta w interpretacji,
- wrażliwa na wpływ wartości odstających,
- xmin < średnia < xmax
- możliwa do zastosowania w szeregach rozdzielczych zamkniętych i o równych klasach.
1.2. Średnia geometryczna
W sytuacjach, kiedy w szeregu pojawiają się wartości odstające, stosuje się średnią geometryczną:
n
x g = n x1 ⋅ x2 ⋅ ... ⋅ xn = n ∏ xi .
i =1

Przykład 4:
Tabela 4. Produkcja ropy naftowej w państwach OPEC (w tysiącach baryłek dziennie) w 2009 roku.
Produkcja ropy naftowej
Kraje OPEC
(xi)
Ekwador 495
Katar 1345
Libia 1652
Angola 1784
Algieria 1811
Nigeria 2061
Wenezuela 2437
Kuwejt 2481
Irak 2482
ZEA 2599
Iran 4216
Arabia Saudyjska 9713
RAZEM 33076
Źródło: BP statistical Review of World Energy 2010.

Średnia arytmetyczna: x =
Średnia arytmetyczna: x g =

Interpretacja:

1.3. Średnia harmoniczna


Średnia harmoniczna jest wykorzystywana do określania przeciętnego poziomu badanej zmiennej
statystycznej, która jest wielkością stosunkową. Gdy problem badawczy jest tak sformułowany, że
zmienia się mianownik badanej wielkości, to stosujemy średnią harmoniczną:
N N
xh = n
lub xh = n
.
1 1
∑x
i =1

i =1 xi
ni
i

-3-
Statystyka Analiza struktury

Przykład 5:
Pewien kierowca wybrał się z Wrocławia do Budapesztu (650km). Drogę na Węgry pokonał ze średnią
prędkością 81,25 km/h. W drodze powrotnej nie spieszył się tak bardzo i osiągnął średnią prędkość
50 km/h. Z jaką przeciętną prędkością kierowca przebył trasę Wrocław – Budapeszt – Wrocław?

1.4. Średnia chronologiczna


Średni poziom zjawiska obrazowanego szeregiem dynamicznym okresów obliczamy za pomocą średniej
arytmetycznej, to w przypadku szeregów dynamicznych momentów niejednokrotnie posługujemy się
średnią chronologiczną:
1 x1 + x2 + ... + x n−1 + 12 xn
xch = 2
.
N

2. POZYCJNE MIARY PODOBIEŃSTWA


W przypadku szeregów otwartych, alternatywą dla klasycznych miar podobieństwa są tzw. miary
pozycyjne. Warunkiem zastosowania miar pozycyjnych jest utworzenie szeregu statystycznego, czyli
posortowanie jednostek statystycznych według badanej cechy zmiennej (rosnąco lub malejąco).

2.1. Mediana
Medianą (Me) nazywamy taką wartość badanej cechy statystycznej, która dzieli interesującą nas
zbiorowość jednostek statystycznych na pół. Mówimy, że połowa jednostek badanej zbiorowości
statystycznej przyjmuje wartości nie większe niż mediana, a połowa nie mniejsze.
Wyznaczanie mediany w szeregu prostym polega na wskazaniu wartości środkowej jednostki
statystycznej w przypadku, gdy ich liczba (N) jest nieparzysta. W sytuacji parzystej liczby obserwacji,
mediana jest obliczana jako średnia arytmetyczna z wartości dwóch środkowych jednostek szeregu.
Wyznaczenie mediany w szeregu rozdzielczym jednopunktowym wymaga obliczenia liczebności
skumulowanej. Następnie należy wskazać ten wariant cechy zmiennej, na który przypada środkowa
obserwacja (N/2).
Wyznaczenie mediany w szeregu rozdzielczym przedziałowym również wymaga obliczenia
liczebności skumulowanej. W kolejnym kroku należy wskazać ten przedział (klasę), na który przypada
środkowa obserwacja (N/2) oraz zastosować odpowiedni wzór interpolacyjny:
N k −1 c
M e = x0 + ( − ∑ ni ) 0 .
2 i =1 n0
Przykład 6:
Patrz: Tabela 1. Sprzedaż najpopularniejszych marek samochodów …
Mediana: M e =

Interpretacja:

-4-
Statystyka Analiza struktury

Przykład 7:
Tabela 2.2 Plany prokreacyjne Polaków w wieku 18-39 lat.
Planowana Wskazania
liczba dzieci (xi) w % (ni)
Żadne 2,1
Jedno 10,6
Dwoje 53,2
Troje 24,5
Czworo 6,4
Pięcioro i więcej 3,2
RAZEM 100
Źródło: Komunikat CBOS, Postawy Prokreacyjne Polaków, styczeń 2010.

Mediana: M e =

Interpretacja:

Przykład 8:
Tabela 3.2 Długości skoków w zawodach Pucharu Świata, Zakopane 21.01.2011 r.
Długość skoku Liczba skoków
w metrach (xi) (ni)
109-114 3
114-119 12
119-124 28
124-129 20
129-134 12
134-139 5
RAZEM 80
Źródło: Zestawienie własne.

Mediana: M e =

Interpretacja:

Właściwości mediany:
- należy do miar tendencji centralnej,
- niezależna od wartości krańcowych szeregu, można ją stosować w szeregu otwartym,
- nie jest reprezentatywna dla szeregu o dużej asymetrii,
- nie nadaje się do przekształceń algebraicznych.
2.2. Kwartyl 1 i kwartyl 3
Kwartylem 1 nazywamy taką wartość badanej cechy statystycznej, która dzieli interesującą nas
zbiorowość jednostek statystycznych w stosunku 1/4 i 3/4. Mówimy, że 25% jednostek badanej
zbiorowości statystycznej przyjmuje wartości nie większe niż kwartyl 1, a 75% nie mniejsze.

-5-
Statystyka Analiza struktury

Kwartylem 3 nazywamy z kolei taką wartość badanej cechy statystycznej, która dzieli interesującą nas
zbiorowość jednostek statystycznych w stosunku 3/4 i 1/4. Mówimy, że 75% jednostek badanej
zbiorowości statystycznej przyjmuje wartości nie większe niż kwartyl 3, a 25% nie mniejsze.
Wyznaczanie kwartyli przebiega analogicznie jak wyznaczanie mediany. W przypadku szeregu
rozdzielczego przedziałowego stosuje się następujące wzory interpolacyjne:
N l −1 c0 3N l −1 c
Q1 = x0 + ( − ∑ ni ) oraz Q3 = x0 + ( − ∑ ni ) 0 .
4 i =1 n0 4 i =1 n0
Przykład 9:
Patrz: Tabela 2.2 Plany prokreacyjne Polaków...
Kwartyl 1: Q1 =

Interpretacja:

Kwartyl 3: Q3 =

Interpretacja:

Przykład 10:
Patrz: Tabela 3.2 Długości skoków…
Kwartyl 1: Q1 =

Interpretacja:

Kwartyl 3: Q3 =

Interpretacja:

2.3. Modalna (moda, dominanta)


Modalną (Mo) nazywamy taką wartość (wariant) cechy zmiennej, który pojawia się w szeregu
statystycznym najczęściej – jest to tzw. wartość dominująca.
Wyznaczanie modalnej w szeregu prostym polega na wskazaniu tego wariantu badanej cechy
statystycznej, który powtarza się najczęściej.
Wyznaczenie modalnej w szeregu rozdzielczym jednopunktowym również sprowadza się do
wskazania wariantu cechy zmiennej o największej liczebności.

-6-
Statystyka Analiza struktury

Wyznaczenie modalnej w szeregu rozdzielczym przedziałowym wymaga spełnienia warunku, aby


przedział najliczniejszy oraz przedziały z nim sąsiadujące miały taką samą rozpiętość. Dla obliczenia
przybliżonej wartości mody stosuje się wzór interpolacyjny:
nd − nd −1
M o = x0 + c0 .
(nd − nd −1 ) + (nd − nd +1 )
Właściwości modalnej:
- należy do miar tendencji centralnej,
- niezależna od wartości krańcowych szeregu, można ją stosować w szeregu otwartym,
- do jej wyznaczenia wystarczy znajomość trzech przedziałów o jednakowej rozpiętości,
- nie wyznacza się jej w szeregach wielomodalnych,
- posiada małą wartość poznawczą przy niewielkiej liczbie obserwacji,
- nie nadaje się do przekształceń algebraicznych.
W szeregach lub łagodnie asymetrycznych modalną można wyznaczyć z zależności:
M o = x − 3( x − M e ) .
W szeregach symetrycznych prawdziwy jest związek:
x = Mo = Me .
Przykład 11:
Patrz: Tabela 2.2 Plany prokreacyjne Polaków…
Modalna: M o =

Interpretacja:

Przykład 12:
Patrz: Tabela 3.2 Długości skoków…
Modalna: M o =

Interpretacja:

2.4. Percentyle i decyle


Oprócz Mo, Me, Q1 i Q3 wyróżnia się w statystyce decyle, czyli wartości dziesiętne, które dzielą badaną
zbiorowość statystyczną na 10 równych części oraz percentyle, dzielące zbiorowość na 100 równych
części.

-7-

You might also like