You are on page 1of 7

2023. 09. 06.

STATISZTIKA Mintavétel fogalmai


I. A mintavételt meg kell tervezni
A sokaság elemei: X1, X2…XN…, lehet véges
és végtelen
Mintaelemek: x1, x2…xn, mindig véges
2. Előadás Véletlen minta = a minta elemek véletlen
Mintavétel, mintavételi kiválasztása
technikák, adatbázis
Kiválasztási arány :
n
N

Mintavételi hiba Statisztikai adatgyűjtés


Abból adódik, hogy nem Részleges Teljes körű
a teljes sokaságot
adatfelvétel (cenzus)
figyeljük meg.
A sokaság heterogén.
Kísérletek Reprezentatív
(ellenőrzött) megfigyelés

Véletlen Nem véletlen


mintavétel mintavétel

Nem véletlenen alapuló


Véletlen mintavétel kiválasztás
• Homogén sokaság esetén • Szisztematikus
• FAE: független azonos eloszlású minta • Kvótás
• EV: egyszerű véletlen minta
• Hólabda
• Heterogén sokaság esetén
• R: rétegzett mintavétel • Koncentrált
• Cs: csoportos (egylépcsős) mintavétel • Önkényes
• TL: többlépcsős mintavétel • Egyéb

1
2023. 09. 06.

Reprezentatív minta
A kísérlet tulajdonságai tulajdonságai
• Jó kísérlet
• Kezeléshatások
• Tükrözi az alapsokaság jellemzőit (lehet
általánosítani)
• Véletlen hiba
• Csak a mintavételi hibát tartalmazza
• Rossz kísérlet • Meghatározható a mintavételi hiba
nagysága
• Kezeléshatások
• Szisztematikus hiba
• Véletlen hiba

NEM reprezentatív minta Véletlen mintavétel,


tulajdonságai szisztematikus hiba
• Nem lehet belőle általánosítani • Minden elem egymástól függetlenül és
azonos valószínűséggel kerül a
• A mintavételi hiba mellett szisztematikus
mintába (véletlen számok)
hibát is tartalmaz
• Előnye: a belőle származtatott
• A levont következtetések kizárólag a
statisztikai mutatók csak a véletlen
megfigyelt egyedekre vonatkoznak eltérést mutatják az alapsokaság
mutatójához képest
• Szelekció szisztematikus hiba
• Reprezentativitás

Véletlen minta előállítása Statisztikai becslés


Valamely paraméter ismeretlen
• Véletlen szám generátor (feltételezett) tényleges értékének közelítő
megadása egy statisztikai függvénnyel.
• Pszeudó véletlen szám generátor
• Rnd() függvény 0  x  1 Elvileg bármelyik statisztikai függvény
tekinthető becslésnek, valójában csak azokat
• Excel Vél() függvénye használjuk, amelyeknek megvannak a jó
becslés legfontosabb tulajdonságai
• VÉL()*(b-a)+a

2
2023. 09. 06.

Torzítatlan és konzisztens
A jó becslés kritériumai
becslés
• Olyan becslés, amelynek várható értéke az
• Kis minta tulajdonságai igazi paraméter (torzítatlan)

• Torzítatlanság (becsült várható érték = valódi érték)


• Hatásosság (variancia) • Olyan becslés, amely a minta n
elemszámának növekedésével (n  ) a
paraméter igazi értékéhez konvergál
• Nagy minta tulajdonságai sztochasztikusan (erős konzisztencia
• Konzisztencia esetén 1 valószínűséggel)

n  , paraméter  igazi érték

Torzítatlan és hatásos Torzított és hatásos


becslés becslés

Torzítatlan, de nem hatásos Torzított és nem hatásos


becslés becslés

3
2023. 09. 06.

Mi az adatbázis Adatbázis tervezés


• Egy témakör vagy cél köré csoportosuló
információ. • Milyen információt akarunk kinyerni?
• Jó tervezés = hatékony adattárolás és • Milyen elkülönülő tématerületeken kell
információkinyerés tárolni az adatokat?
• Célorientált adatbázisok • Hogyan kapcsolódnak ezek egymáshoz?
• Az egyes területeken belül milyen adatokat
kell tárolni?

A mértékegységek
Mi az adat?
többszörösei
• kilo- k 103
Minden információ, amit tárolni kell.
 szám • mega- M 106
 szöveg
 dátum • giga- G 109
 hang
 kép, stb.
• tera- T 1012

• peta- P 1015

• exa- E 1018
SI (Systém International d’Unités)

Tábla
Adatbázis felépítése

• Tábla (table)
• Ismérv, tulajdonság, változó, Mező (field)
• Megfigyelési egység, szubjektum, Rekord
(record)

• Oszlop = változó
• Sor = megfigyelési egység, rekord

4
2023. 09. 06.

A jó adatbázis A jó adatbázis
(kritériumok) 1. (kritériumok) 2.
• minden mezőnek egyedi neve van
3.nem lehet két egyforma sora
• a mezők elemi információt tartalmaznak
4.a sorok és oszlopok sorrendje tetszőleges

ID Év Hely Tömeg Hosszúság ID Év Hely Tömeg Hosszúság


1
2
3
4
5

A jó adatbázis (kritériumok) 3. Rossz adatbázis


5.ne tartalmazzon származtatott, ID Kérdés Válasz1 Válasz2 Válasz3 Válasz4 Helyes
kiszámított adatot (redundancia) 1 Hol? Itt Ott Amott Emitt 2

6.egy mező megváltoztatása nem hathat ki


más mezőkre

ID Év Nettó ÁFA Bruttó


1
2
3
4
5

A jó adatbázis (kritériumok) 4. Gyakorlat adatbázisa


7.minden szükséges adatot tartalmaz
8.van elsődleges kulcsa

ID Év Hely Tömeg Hosszúság


1
2
3
4
5

5
2023. 09. 06.

Sorba rendezés Szűrés


• Eseteket választhatunk ki az
• Az adatmátrix sorai csökkenő vagy adatbázisból. Négy lehetőség közül
növekvő sorrendbe rendezhetők. választhatunk:
• Meg kell határozni az elsődleges kulcsot, • Minden eset részt vegyen az analízisben.
ami szerint a rendezés történjen • Ha valamilyen feltétel teljesül (if then)
• Véletlen minta az esetekből
• Egymásba ágyazott rendezés: • Kijelölhetjük az esetek bizonyos tartományát, az
elsődleges, másodlagos, harmadlagos első és utolsó eset megjelölésével
stb. kulcs szerint. • Használhatunk szűrő változót
• Mi legyen a ki nem választott esetek
sorsa? Lehet megjelölni és törölni őket az
adatbázisból.

Aggregálás Transzponálás
• Valamilyen ismérv, csoportképző változó • Az adatmátrix sorainak és oszlopainak
vagy változók szerint különböző felcserélése, ezzel az esetek és változók
algoritmusok (számítások) szerint szerepei is felcserélődnek. A régi
tömöríthetjük az adatokat változók nevei a legelső új változó esetei
• Algoritmusok: átlag, összeg, szórás, stb. lesznek, a többi új változó neve case_1,
case_2, … stb. lesznek.
• Az aggregált adatok további elemzése
• Nagy jelentősége van a többváltozós
statisztikai eljárásoknál az Q és R-
technika alkalmazásakor

Fontosabb statisztikai
Adatbázis bővítése adatbázisok
Magyar Statisztikai Évkönyv
• Új megfigyelésekkel Magyar Statisztikai Zsebkönyv
Gazdaságstatisztikai Évkönyv (1990-től)
• Feltétel: a két adatbázisban a változók
nevei, típusa, stb. tökéletesen egyezzenek Élelmiszeripari Statisztikai Zsebkönyv
Külkereskedelmi Statisztikai Évkönyv
Magyarország
• Új változókkal Demográfiai évkönyv
• Feltétel: a két adatbázisban legalább egy Ipari és építőipari statisztikai évkönyv
azonos változó szerepeljen, amely a Mezőgazdasági statisztikai évkönyv
kulcsváltozó, kapcsoló mező szerepét tölti
Területi statisztikai évkönyv
be
Nemzetközi Statisztikai Évkönyv
FAO Trade Yearbook
FAO Production Yearbook
EUROSTAT kiadványok

6
2023. 09. 06.

ELŐADÁS Felhasznált
Jelentősebb kiadványok
forrásai
Legfrissebb adatok • Lothar Sachs.: Statisztikai módszerek.
A KSH gyorsjelentések Mezőgazdasági Kiadó, Budapest, 1985.
Statisztikai havi közlemények • Baráth Cs.-né. - Ittzés A. - Ugrósdy Gy.:
1996. Biometria: módszertan és a MINITAB
Statisztikai Szemle programcsomag alkalmazása. Mezőgazda
Kiadó, Budapest
Gazdaság és Statisztika
• G.U. Yule – M.G. Kendall: Bevezetés a
Területi Statisztika statisztika elméletébe. Közgazdasági és Jogi
Demográfia könyvkiadó, Budapest. 1964.
• Sváb J.: Biometriai módszerek a kutatásban.
Módszertani Füzetek Mezőgazdasági Kiadó, Budapest, 1973.
(második, átdolgozott, bővített kiadás)

KÖSZÖNÖM A FIGYELMÜKET

KÖVETKEZŐ
ELŐADÁS CÍME
Az adatok mérési szintjei,
jellemző értékek
meghatározása, adatábrázolások

You might also like