You are on page 1of 8

Tema 4 i 5

TEMA 4: ESTADÍSTICA: DEFINICIÓ I CONCEPTES PRINCIPALS. ESTADÍSTICA DESCRIPTIVA I


ESTADÍSTICA INFERENCIAL. ANÀLISI TEMPORAL I ATEMPORAL. DISTRIBUCIÓ DE
FREQÜÈNCIES. VALORS REPRESENTATIUS D’UNA DISTRIBUCIÓ ESTADÍSTICA
UNIDIMENSIONAL: LA MITJANA ARITMÈTICA, LA MODA, LA MEDIANA. MESURES DE
DISPERSIÓ D’UNA DISTRIBUCIÓ UNIDIMENSIONAL. EL RANG, EL PERCENTIL, LA VARIÀNCIA
I LA DESVIACIÓ TIPUS.

TEMA 5: EL CONCEPTE DE PROBABILITAT. LA PROBABILITAT CONDICIONADA. CONCEPTE


DE VARIABLE ALEATÒRIA. VARIABLES ALEATÒRIES DISCRETES I CONTÍNUES. LA
DISTRIBUCIÓ NORMAL. CONCEPTE DE MOSTRA D’UNA POBLACIÓ. TIPUS DE MOSTREIG.
COS SUPERIOR DE
ESTADÍSTICA PÚBLICA:

• L’estadística pública a Catalunya depèn de la Generalitat:


• Enquestes polítiques CEO
• Resta IDESCAT
• Cada 4 anys Pla estadístic aprovat pel Parlament
• Cada any programa anual estadístic per desenvolupar el pla
COS SUPERIOR DE LA GENERALITAT
DEFINICIONS

• Estadística descriptiva: l’encarregada de la recollida, resum i presentació de les dades.


• Estadística inferencial o inferència estadística: fase en la que, a partir d’una mostra de dades, es
realitzen estimacions o prediccions sobre el conjunt. Està subjecta a error en els resultats, menys
nivell de confiança. (parlar una mica de la mostra, sondeig electoral, israelites...)
• Estadística primària: les que s’obtenen directament de les observacions.
• Fenomen aleatori o d’atzar o estadístic: és el fenomen el resultat del qual no es pot determinar per
lleis exactes EX: si llencem d’una moneda mai podrem tenir la seguretat de surti cara o creu.
• Fenomen determinista: són els que donen sempre un resultat fix. Ex: en una màquina d’escriure
quan piquem la lletra p sempre donarà p.
COS SUPERIOR DE LA GENERALITAT
Exemple: volem fer un estudi del salari mitjà dels habitants de la província de Barcelona:

• Població o univers: conjunt d’elements (objectes, persones) dels quals volem estudiar les
característiques o propietats; al nostre exemple tots els ciutadans de la província de Barcelona.
• Subpoblació: el subconjunt de la població formada pels elements de la població que comparteixen
una determinada característica
• Mostra: subconjunt de la població que s’utilitza per fer l’estudi. ÉS IMPORTANT QUE SIGUI AMB
VARIABLES ALEATÒRIES I INDEPENDENTS
• Individu: cadascun dels elements de la població
• Cens: si la mostra = univers, aleshores tenim un cens.
COS SUPERIOR DE LA GENERALITAT
TIPUS DE MOSTREIG (EXEMPLE AEROPORT)

• No aletori o de judici: un expert decideix la mostra

• Aleatori o probabilístic: agafem a l’atzar:


 Aleatori simple: agafem estrictament a l’atzar

1/8
Tema 4 i 5

 Sistemàtic: agafem seguint una pauta


 Proporcional: agafem per grups:
- Per conglomerats: tots els individus d’una família
- Per etapes: aleatòriament dintre d’un grup

VARIABLES

VARIABLES: cada una de les característiques o propietats d’una població sotmesa a estudi, al nostre
exemple: nom, salari... Les variables es classifiquen segons siguin:

• Variables quantitatives o mètriques: donen valors numèrics (ex. edat, quantitat d’accidents,
temperatura...)
 Discretes: números enters Ex: número de fills
 Contínues: qualsevol valor Ex: temperatura ambient

• Variables qualitatives: adopten valors que es corresponen amb qualitats Ex: color

També podem parlar de:

•Variables dicotòmiques: només poden prendre dos valors Ex: (SI/NO)….


•Variables transversals: fan referència a diferents individus en un mateix instant de temps.
•Variables longitudinals: fan referència a un individu al llarg del temps.

FREQÜÈNCIES

• Freqüència absoluta: nombre de vegades que apareix un element a una sèrie.


• Freqüència relativa: és la freqüència absoluta dividida entre el nombre total d’elements de la sèrie.

Exemple: tenim la sèrie b b c c b d d c d b


Freqüència absoluta de b= 4
Freqüència relativa de b = 4/10

*Recordeu: la suma de totes les freqüències relatives = 1


COS SUPERIOR DE LA GENERALITAT
• DISTRIBUCIONS UNIDIMENSIONALS: són les referides a una única variable o atribut.
• MESURES DE CENTRALIZACIÓ Ó ESTADÍSTICS DE POSICIÓ: tenen com a objectiu determinar el
valor al voltant del qual s’agrupen les dades. Aquest valors de centralització són representatius si les
dades estan poc disperses i per determinar això existeixen les mesures de dispersió.
• MESURES DE DISPERSIÓ: determinen la separació de les dades respecte a les mesures de
centralització.

ESTADÍSTICS DE CENTRALITZACIÓ I DE DISPERSIÓ


COS SUPERIOR DE LA GENERALITAT
Objectiu: analitzar si només estudiant el valors d’una mostra tenim suficient per extrapolar aquests
valors a la resta de la població.

MESURES DE CENTRALIZACIÓ O ESTADÍSTICS DE POSICIÓ

2/8
Tema 4 i 5

• Mitjana aritmètica: La mitjana aritmètica o mitjana aritmètica simple es calcula sumant el valor
de totes les dades i dividint pel nombre total d’aquestes (PROMEDIO – EXCEL)

Ex: 1 2 5 7 2 3 8 mitjana aritmètica = (1+2+5+7+2+3+8)/7 = 4MESTADÍSTICA- 24

• Mediana: Mediana: valor que ocupa el punt central en una sèrie

Ex: 1 1 1 2 2 Mediana = 1.
Ex: 1 2 4 6 Mediana = 2+4= 6/2=3
Si no hi ha punt central s’agafen els dos centrals i es fa la mitjana aritmètica.

Ex: 1 1 2 2 3 3 Mediana = (2+2)/2


Si el números no estan ordenats, cal ordenar-los.

• Moda: el valor que més es repeteix a una sèrie

Ex: 1 1 1 2 2 Moda = 1

Si n’hi ha dos que es repeteixen el màxim nombre de vegades, es diu multimodal. No cal que es tracti
de números
S SUPERIOR DE LA GENERALITAT
• Asimetria: l’asimetria d’una distribució es mesura mitjançant el concepte de biaix. Tenim una relació
directa entre el valor de la mitjana aritmètica i la mediana amb el de biaix:

 Cas A: Mediana=Mitjana aritmètica

En aquesta situació tenim que el biaix=0 i la distribució és completament simètrica a banda i banda del
valor de la mitjana aritmètica i la mediana

 Cas B: Mediana<Mitjana aritmètica

Tenim una distribució de dades asimètrica, amb biaix>0, és a dir, esbiaixada cap a la dreta.

 Cas C: Mediana>Mitjana aritmètica

Tenim una distribució de dades asimètrica, amb biaix<0, és a dir, esbiaixada cap a l’esquerra.

• Un valor de zero (o gairebé zero) indica que els valors són relativament distribuïts de forma
uniforme a banda i banda de la mitjana.

• Un biaix positiu indica que la cua en el costat dret és més llarga que el costat esquerre i la major
part dels valors es troben a l'esquerra de la mitjana.

• Qualitativament, un biaix negatiu indica que la cua en el costat esquerre de la funció de densitat de
probabilitat és més llarg que el del costat dret i la major part dels valors (que poden incloure la
mitjana) es troben a la dreta de la mitjana.

Recordeu, i podem fer la prova, que:

3/8
Tema 4 i 5

Si els valors d’una variable son multiplicats o dividits per un mateix número la seva mitjana aritmètica
queda multiplicada o dividida pel mateix número. SUPERIOR DE LA GENERALITAT

MESURES DE DISPERSIÓ:

En un conjunt de dades s’entén per dispersió la separació de les dades respecte de les mesures de
centralització. Com més separades estiguin les dades de les mesures de centralització, més dispersa
serà la distribució. Si la dispersió és petita, les dades estaran agrupades, essent representatius els
valors de les mesures de centralització. En canvi, resultats alts de dispersió ens portaran a la
conclusió que les mesures de centralització no són suficients per caracteritzar les nostres dades,
essent necessari acompanyar-les de mesures de dispersió.

Per mesurar la dispersió s’utilitzen, entre altres, la desviació, el rang, la variància i la desviació típica.

• Rang: diferència entre el valor major i el menor d’un interval

EX: -1 -1 0 3 4 5 Rang= 5 – (-1) = 6

• Desviació: la diferència de cadascun dels valors de la variable respecte a la mitjana


aritmètica.

• Quartil: divideix la sèrie en 4 parts. Amb aquest valor puc veure si la mostra està agrupada o
separada (exemple salaris país 1er mon i 3er mon)

• Quantils: divideix sèrie en n parts

PODEM AFEGIR ALGUN CONCEPTE MÉS COM ELS DECILS I ELS PERCENTILS

• Variància: La variància és la mitjana aritmètica dels quadrats de les desviacions de les dades
respecte de la mitjana aritmètica.

La variància s’expressa en unitats al quadrat i, freqüentment, això és un inconvenient, per la qual cosa
és útil definir una altra mesura de dispersió que s’expressi en les mateixes unitats que les dades.

• Desviació típica: La desviació típica o desviació estàndard es defineix com l’arrel quadrada de
la variància. La desviació típica es mesura en les mateixes unitats que les dades. Com més
gran és la desviació típica més dispersa és la distribució.

• Coeficient de variació: El coeficient de variació és una mesura de dispersió que permet comparar
distribucions diferents d’una mateixa variable, encara que tinguin mesures i desviacions diferents. Es
defineix com el quocient entre la desviació típica i la mitjana aritmètica. Com més petit sigui
aquest coeficient més agrupades estaran les dades al voltant de la mitjana. Únicament ha d’utilitzar-se
amb variables que no tinguin valors negatius i les mitjanes dels quals no siguin pròximes a zero.

Recordeu, i podem fer la prova, que:

• La suma de desviacions dels elements respecte a la mitjana aritmètica és 0.


• En sumar una constant a totes les dades d’una distribució la desviació típica no varia.

4/8
Tema 4 i 5

• En multiplicar totes les dades d’una distribució per una constant la desviació típica queda
multiplicada per aquesta constant.
• En el cas que les dades es divideixin per la seva desviació típica la nova desviació típica és
igual a 1.
• Si totes les dades d’una mostra es multipliquen per una constant diferent de zero la variància
queda multiplicada pel quadrat de la constant. (PREGUNTA TEST)

LLEI NORMAL

• DISTRIBUCIÓ NORMAL:

La distribució normal es caracteritza per la seva mitjana aritmètica, m, i la seva desviació estàndard, s.
Els valors es distribueixen simètricament al voltant de la mitjana. La desviació típica indica la dispersió
més o menys gran de les dades al voltant de la mitjana.

La distribució normal s’estén entre - ∞ i + ∞ . En ser contínua i simètrica al voltant de la seva mitjana
m, la mitjana, el mode i la mediana són iguals. A més, la mitjana divideix l’àrea compresa entre la
corba normal i l’eix d’abscisses en dues meitats exactament iguals.

En l’estudi de molts problemes en camps tant diversos com la biologia, la psicologia, l’economia, les
ciències socials, etc., la distribució normal de probabilitat és el model matemàtic que millor l’explica.

La seva gràfica és coneguda per la seva característica forma de campana (campana de Gauss).
• Apuntament o curtosi: mesura si la distribució és apuntada o és aplanada en relació a una
distribució normal posant el focus en la forma de les cues laterals.

Com més alta sigui la curtosi d'una distribució significarà que la variància és menor, fet que significa
que els successos s'esdevenen prop la mitjana.

• Una distribució amb coeficient de curtosi de 0 (o gairebé) s'anomena mesocúrtica

• Una distribució amb valors negatius indica un pic baix i unes cues amples en ambdós costats,
s'anomena platicúrtica

• Una amb valors positius indica un apuntament del pic i unes cues estretes, s'anomena leptocúrtica.

Les mesures d'asimetria, juntament amb les mesures de apuntament o curtosi s'utilitzen per contrastar
si es pot acceptar que una distribució estadística segueix la distribució normal. Això és necessari per
realitzar nombrosos contrastos estadístics en la teoria d'inferència estadística.

PROBABILITAT

• PROBABILITAT NO CONDICIONADA:

• La probabilitat és una mesura de la possibilitat que esdevingui qualsevol succés associat a un


determinat experiment aleatori.

5/8
Tema 4 i 5

• La probabilitat d’un succés es el quocient que resulta de dividir els casos favorables pel casos
possibles:
P=n/N
Exemple: probabilitat de que surti cara: 1/2

• La probabilitat és un número comprès entre 0 i 1, encara que és habitual expressar la probabilitat en


tants per cent, assenyalant el nombre de vegades que podem esperar un resultat quan realitzem cent
proves.

•Probabilitat total: la probabilitat de dos successos incompatibles és igual a la suma de probabilitats de


cadascun

P(A ó B)= PA + PB

Per exemple, si al tirar un dau volem que surti un resultat parell, estarem esperant que surti 2, 4 o 6
(successos elementals).

P(parell)= P(treure 2)+P(treure 4)+P(treure 6)= 1/6 + 1/6 + 1/6 = 0,5

• Probabilitat composta: la probabilitat de dos successos compatibles i independents es igual al


producte de probabilitats de cadascun

P(A i B)= PA . PB
Per exemple, si al tirar un dau volem que surti un resultat parell, i múltiple de 3 estarem esperant que:

1) Surti parell 2, 4 o 6 (successos elementals).


P(parell)= P(treure 2)+P(treure 4)+P(treure 6)= 1/6 + 1/6 + 1/6 = 3/6

2) Surti múltiple de 3
P(múltiple 3)= P(treure 3)+P(treure 6)= 1/6 + 1/6 = 2/6
P(parell i múltiple 3)=3/6*2/6=6/36=1/6 (semblava obvi al principi¡¡¡)

Probabilitat unió: la probabilitat del succés unió de dos successos qualsevol, A i B, és igual a la suma
de les seves probabilitats menys la probabilitat del succés intersecció.

P (A ó B) = PA + PB - P (A i B)

Per exemple, si al tirar un dau volem que surti un resultat parell ó múltiple de 3 estarem esperant que:

1) Surti parell 2, 4 o 6 (successos elementals).

P(parell)= P(treure 2)+P(treure 4)+P(treure 6)= 1/6 + 1/6 + 1/6 = 3/6

2) Surti múltiple de 3

P(múltiple 3)= P(treure 3)+P(treure 6)= 1/6 + 1/6 = 2/6

3) P(parell i múltiple 3)=3/6*2/6=6/36=1/6

6/8
Tema 4 i 5

4) P(parell ó múltiple 3)= 3/6+2/6-1/6=4/6

• PROBABILITAT CONDICIONADA:

Quan es realitzen dues o més experiències pot succeir que la probabilitat d’una experiència es vegi
afectada pel resultat de les experiències anteriors o no. En el primer cas direm que la probabilitat està
condicionada.

Siguin A i B dos successos condicionats. La probabilitat del succés B condicionada pel succés A,
P(B/A), és igual al quocient de la probabilitat del succés intersecció entre A i B, i la probabilitat del
succés condicionant A.

PREGUNTES TEST ESTADÍSTICA:

1) Segons les dades de l’Institut d’Estadística de Catalunya corresponents als anys 2006 i 2007
sobre equipaments i ús de les TIC al sector empresarial català, quina afirmació és falsa:
a) el 98% de les empreses tenen correu electrònic
b) el 35% de les empreses tenen intranet
c) el 96% de les empreses tenen connexió a Internet
d) el 55% de les empreses tenen web pròpia

2) Quines característiques han de complir els elements d’una mostra perquè sigui
representativa de la població que es vol analitzar?
a) Que siguin complementaris
b) Que es distribueixin tots segons una distribució normal
c) Ésser aleatoris i amb error quadràtic màxim
d) Ésser aleatoris i independents

3) El subconjunt d’una població que s’utilitza per explicar característiques del conjunt
d’aquesta població és:
a) Mostra
b) Moda
c) Permutació
d) Mediana

4) Una variable qualitativa també es pot anomenar:


a) Variable discreta
b) Variable contínua
c) Variable discontínua
d) Atribut

5) En estadística, les dades són de tall transversal quan:


a) Ens referim a diferents individus en un mateix instant del temps.
b) Considerem un únic individu en un únic instant del temps.
c) Per a cada instant disposem d’un conjunt d’individus i per a cada individu tenim dades de diferents
moments del temps.
d) Considerem un únic individu i l’evolució de la variable al llarg de diferents instants del temps.

7/8
Tema 4 i 5

6) El nombre de vegades que es presenta un o més valors de la variable o una o més


modalitats dels atributs dividit pel total d’unitats observades es denomina?
a) Freqüència relativa
b) Coeficient de repetició
c) Moda
d) Freqüència absoluta

7) En estadística, quan una distribució es presenta en quantils vol dir que:


a) Els valors estan agrupats de manera que contenen una desena part de les observacions.
b) Els valors estan agrupats per intervals que contenen el mateix nombre d’observacions.
c) Els valors estan agrupats per intervals que contenen una quarta part de les observacions.
d) Els valors estan agrupats per intervals que contenen diferent nombre d’observacions.

8) Quan es parla de mesura de dispersió en la ciència estadística es fa referència:


a) Al valor de la variable que es repeteix més vegades i, per tant, el que té la freqüència absoluta més
alta.
b) Al quocient entre la suma dels valors obtinguts i el nombre total dels elements observats.
c) Al valor central a l’entorn del qual s’agrupen les dades quantitatives.
d) Al valor que mesura la desviació dels valors respecte a un de central que, generalment, és la
mitjana aritmètica.

9) Quins conceptes defineixen la distribució normal de probabilitat en termes estadístics?


a) Les variables aleatòries i el tipus de mostreig.
b) La probabilitat condicionada i la freqüència.
c) El valor mig i la seva desviació típica.
d) El valor de la variable i el percentil.

10) De quins paràmetres depèn la distribució normal en l’àmbit de l’estadística?


a) Mitjana d’esdeveniments ocorreguts i unitat de temps.
b) Nombre de proves independents i probabilitat d’èxit.
c) Probabilitat d’èxit i fracàs.
d) Esperança matemàtica i desviació estàndard de la variable.

8/8

You might also like