Professional Documents
Culture Documents
• Població o univers: conjunt d’elements (objectes, persones) dels quals volem estudiar les
característiques o propietats; al nostre exemple tots els ciutadans de la província de Barcelona.
• Subpoblació: el subconjunt de la població formada pels elements de la població que comparteixen
una determinada característica
• Mostra: subconjunt de la població que s’utilitza per fer l’estudi. ÉS IMPORTANT QUE SIGUI AMB
VARIABLES ALEATÒRIES I INDEPENDENTS
• Individu: cadascun dels elements de la població
• Cens: si la mostra = univers, aleshores tenim un cens.
COS SUPERIOR DE LA GENERALITAT
TIPUS DE MOSTREIG (EXEMPLE AEROPORT)
1/8
Tema 4 i 5
VARIABLES
VARIABLES: cada una de les característiques o propietats d’una població sotmesa a estudi, al nostre
exemple: nom, salari... Les variables es classifiquen segons siguin:
• Variables quantitatives o mètriques: donen valors numèrics (ex. edat, quantitat d’accidents,
temperatura...)
Discretes: números enters Ex: número de fills
Contínues: qualsevol valor Ex: temperatura ambient
• Variables qualitatives: adopten valors que es corresponen amb qualitats Ex: color
FREQÜÈNCIES
2/8
Tema 4 i 5
• Mitjana aritmètica: La mitjana aritmètica o mitjana aritmètica simple es calcula sumant el valor
de totes les dades i dividint pel nombre total d’aquestes (PROMEDIO – EXCEL)
Ex: 1 1 1 2 2 Mediana = 1.
Ex: 1 2 4 6 Mediana = 2+4= 6/2=3
Si no hi ha punt central s’agafen els dos centrals i es fa la mitjana aritmètica.
Ex: 1 1 1 2 2 Moda = 1
Si n’hi ha dos que es repeteixen el màxim nombre de vegades, es diu multimodal. No cal que es tracti
de números
S SUPERIOR DE LA GENERALITAT
• Asimetria: l’asimetria d’una distribució es mesura mitjançant el concepte de biaix. Tenim una relació
directa entre el valor de la mitjana aritmètica i la mediana amb el de biaix:
En aquesta situació tenim que el biaix=0 i la distribució és completament simètrica a banda i banda del
valor de la mitjana aritmètica i la mediana
Tenim una distribució de dades asimètrica, amb biaix>0, és a dir, esbiaixada cap a la dreta.
Tenim una distribució de dades asimètrica, amb biaix<0, és a dir, esbiaixada cap a l’esquerra.
• Un valor de zero (o gairebé zero) indica que els valors són relativament distribuïts de forma
uniforme a banda i banda de la mitjana.
• Un biaix positiu indica que la cua en el costat dret és més llarga que el costat esquerre i la major
part dels valors es troben a l'esquerra de la mitjana.
• Qualitativament, un biaix negatiu indica que la cua en el costat esquerre de la funció de densitat de
probabilitat és més llarg que el del costat dret i la major part dels valors (que poden incloure la
mitjana) es troben a la dreta de la mitjana.
3/8
Tema 4 i 5
Si els valors d’una variable son multiplicats o dividits per un mateix número la seva mitjana aritmètica
queda multiplicada o dividida pel mateix número. SUPERIOR DE LA GENERALITAT
MESURES DE DISPERSIÓ:
En un conjunt de dades s’entén per dispersió la separació de les dades respecte de les mesures de
centralització. Com més separades estiguin les dades de les mesures de centralització, més dispersa
serà la distribució. Si la dispersió és petita, les dades estaran agrupades, essent representatius els
valors de les mesures de centralització. En canvi, resultats alts de dispersió ens portaran a la
conclusió que les mesures de centralització no són suficients per caracteritzar les nostres dades,
essent necessari acompanyar-les de mesures de dispersió.
Per mesurar la dispersió s’utilitzen, entre altres, la desviació, el rang, la variància i la desviació típica.
• Quartil: divideix la sèrie en 4 parts. Amb aquest valor puc veure si la mostra està agrupada o
separada (exemple salaris país 1er mon i 3er mon)
PODEM AFEGIR ALGUN CONCEPTE MÉS COM ELS DECILS I ELS PERCENTILS
• Variància: La variància és la mitjana aritmètica dels quadrats de les desviacions de les dades
respecte de la mitjana aritmètica.
La variància s’expressa en unitats al quadrat i, freqüentment, això és un inconvenient, per la qual cosa
és útil definir una altra mesura de dispersió que s’expressi en les mateixes unitats que les dades.
• Desviació típica: La desviació típica o desviació estàndard es defineix com l’arrel quadrada de
la variància. La desviació típica es mesura en les mateixes unitats que les dades. Com més
gran és la desviació típica més dispersa és la distribució.
• Coeficient de variació: El coeficient de variació és una mesura de dispersió que permet comparar
distribucions diferents d’una mateixa variable, encara que tinguin mesures i desviacions diferents. Es
defineix com el quocient entre la desviació típica i la mitjana aritmètica. Com més petit sigui
aquest coeficient més agrupades estaran les dades al voltant de la mitjana. Únicament ha d’utilitzar-se
amb variables que no tinguin valors negatius i les mitjanes dels quals no siguin pròximes a zero.
4/8
Tema 4 i 5
• En multiplicar totes les dades d’una distribució per una constant la desviació típica queda
multiplicada per aquesta constant.
• En el cas que les dades es divideixin per la seva desviació típica la nova desviació típica és
igual a 1.
• Si totes les dades d’una mostra es multipliquen per una constant diferent de zero la variància
queda multiplicada pel quadrat de la constant. (PREGUNTA TEST)
LLEI NORMAL
• DISTRIBUCIÓ NORMAL:
La distribució normal es caracteritza per la seva mitjana aritmètica, m, i la seva desviació estàndard, s.
Els valors es distribueixen simètricament al voltant de la mitjana. La desviació típica indica la dispersió
més o menys gran de les dades al voltant de la mitjana.
La distribució normal s’estén entre - ∞ i + ∞ . En ser contínua i simètrica al voltant de la seva mitjana
m, la mitjana, el mode i la mediana són iguals. A més, la mitjana divideix l’àrea compresa entre la
corba normal i l’eix d’abscisses en dues meitats exactament iguals.
En l’estudi de molts problemes en camps tant diversos com la biologia, la psicologia, l’economia, les
ciències socials, etc., la distribució normal de probabilitat és el model matemàtic que millor l’explica.
La seva gràfica és coneguda per la seva característica forma de campana (campana de Gauss).
• Apuntament o curtosi: mesura si la distribució és apuntada o és aplanada en relació a una
distribució normal posant el focus en la forma de les cues laterals.
Com més alta sigui la curtosi d'una distribució significarà que la variància és menor, fet que significa
que els successos s'esdevenen prop la mitjana.
• Una distribució amb valors negatius indica un pic baix i unes cues amples en ambdós costats,
s'anomena platicúrtica
• Una amb valors positius indica un apuntament del pic i unes cues estretes, s'anomena leptocúrtica.
Les mesures d'asimetria, juntament amb les mesures de apuntament o curtosi s'utilitzen per contrastar
si es pot acceptar que una distribució estadística segueix la distribució normal. Això és necessari per
realitzar nombrosos contrastos estadístics en la teoria d'inferència estadística.
PROBABILITAT
• PROBABILITAT NO CONDICIONADA:
5/8
Tema 4 i 5
• La probabilitat d’un succés es el quocient que resulta de dividir els casos favorables pel casos
possibles:
P=n/N
Exemple: probabilitat de que surti cara: 1/2
P(A ó B)= PA + PB
Per exemple, si al tirar un dau volem que surti un resultat parell, estarem esperant que surti 2, 4 o 6
(successos elementals).
P(A i B)= PA . PB
Per exemple, si al tirar un dau volem que surti un resultat parell, i múltiple de 3 estarem esperant que:
2) Surti múltiple de 3
P(múltiple 3)= P(treure 3)+P(treure 6)= 1/6 + 1/6 = 2/6
P(parell i múltiple 3)=3/6*2/6=6/36=1/6 (semblava obvi al principi¡¡¡)
Probabilitat unió: la probabilitat del succés unió de dos successos qualsevol, A i B, és igual a la suma
de les seves probabilitats menys la probabilitat del succés intersecció.
P (A ó B) = PA + PB - P (A i B)
Per exemple, si al tirar un dau volem que surti un resultat parell ó múltiple de 3 estarem esperant que:
2) Surti múltiple de 3
6/8
Tema 4 i 5
• PROBABILITAT CONDICIONADA:
Quan es realitzen dues o més experiències pot succeir que la probabilitat d’una experiència es vegi
afectada pel resultat de les experiències anteriors o no. En el primer cas direm que la probabilitat està
condicionada.
Siguin A i B dos successos condicionats. La probabilitat del succés B condicionada pel succés A,
P(B/A), és igual al quocient de la probabilitat del succés intersecció entre A i B, i la probabilitat del
succés condicionant A.
1) Segons les dades de l’Institut d’Estadística de Catalunya corresponents als anys 2006 i 2007
sobre equipaments i ús de les TIC al sector empresarial català, quina afirmació és falsa:
a) el 98% de les empreses tenen correu electrònic
b) el 35% de les empreses tenen intranet
c) el 96% de les empreses tenen connexió a Internet
d) el 55% de les empreses tenen web pròpia
2) Quines característiques han de complir els elements d’una mostra perquè sigui
representativa de la població que es vol analitzar?
a) Que siguin complementaris
b) Que es distribueixin tots segons una distribució normal
c) Ésser aleatoris i amb error quadràtic màxim
d) Ésser aleatoris i independents
3) El subconjunt d’una població que s’utilitza per explicar característiques del conjunt
d’aquesta població és:
a) Mostra
b) Moda
c) Permutació
d) Mediana
7/8
Tema 4 i 5
8/8