Professional Documents
Culture Documents
TIPUS D’ESTADÍSTICA:
Estadística Descriptiva:
- A partir d’un subconjunt de dades, aquest tipus d’estadística cerca descriure
les característiques fonamentals de les dades i se solen utilitzar indicadors,
gràfics i taules. És la més subjectiva i agafa mostres focalitzada respecte la
població que s’observa.
CONCEPTES BÀSICS:
Exemples:
- Alçada dels estudiants de Psicologia: Quantitativa, Contínua
- Número de ciutats de Catalunya: Quantitativa, Discreta
- Consum de tabac: Qualitativa
- Nota final d’Anàlisi de Dades 1: Quantitativa, Contínua
- Nacionalitat: Qualitativa
QUÈ ÉS MESURAR?
- Utilitzat nombres com a model abstracte per representar la realitat.
Construim una escala (questionaris) de mesura quan fem correspondre un
número (i només un) a cada modalitat d’una variable. Les escales de mesura
són doncs models per mesurar.
A l’hora d’ordenar les observacions de més petita a més gran denotem el nou
conjunt de quantitats amb els símbols X(1), X(2), X(3), etc.., fins a X(n). Per tant,
X(1) és el valor més baix i X(n) és el més alt. En el nostre exemple X(1) =2 i
X(27)=17.
Diagrama de sectors
Diagrama de barres:
Hi ha una altre diferència molt important entre el diagrama de barres i l’histograma.
Al primer només es representen els valors de les variables que hem observat en
fer l’estudi. No obstant això, l’histograma, va molt més enllà, ja que representa tots
els valors possibles que hi ha dins dels intervals. Permet així calcular la probabilitat
que es representi qualsevol valor de la distribució, per això es representa en
tant per cent. Cosa que és de gran importància si volem fer inferència i estimar els
valors de la població a partir dels resultats de la nostra mostra.
Com que les puntuacions 9 i 14 són dos dels valors empíricament observats, els
seus centils correspontents s’obtenen calculant l’expressió 100·Pa per a cadascun:
EXERCICI:
Calculem el C16,C31 C38,5 I C80 de la següent distribución de freqüències
C16=9; C31=28; C38,5=35; C80=40 (FET A PAPER)
EXERCISI A PAPER: Resultat 65/10 = 6.5 (1ra taula) ; 24,5 (2na taula) ; 245,5
(3ra taula)
Mitjana ponderada:
La mitjana ponderada es una mesura de tendència central que es apropiada quan
en un conjunt de dades cadascun té una importància relativa.
- EX: Imaginem que hem fet una recerca i tenim tres grups diferents de
persones. Ens interessa calcular la Mitjana tenint en compte els valors de les
variables dels diferents grups.
Mitjana total: ( Fórmula + solució exercisi)
Valor de 8 està 1,5 punts per sota de la mitjana del grup o mostra.
MEDIANA:
La Mediana és aquella mesura de tendència central,la qual representa el terme que
supera la primera meitat de les observacions, però no la segona meitat.
Terme que està al mig = Mediana
- 1er pas: Ordenar el conjunt de dades de petit a gran
- Si hi han dos valors al mig fem la mitjana entre els dos del centre
- EX: 0 1 2 3 4 8 12 17 20 3032 67 78, per tant = 17+12/ 2 = 14,5=
MEDIANA
LA MODA:
La moda és la tercera mesura de tendència central que basa el seu concepte en la
freqüència que planteja cert fet u observació. En altres paraules, la moda és
representada per l’objecte amb major repetició.
És utilitzada també per dades qualitatices com les lletres.
- EX: 20 4 0 30 12 17 0 30 30 78 0 8 8 , per tant hi han dos números
consecutius que tenen la mateixa freqüència, tots dos són presos com a
moda 0 i 30
- EX: 20 4 0 1 12 17 0 1 1 78 0 8 8 , per tant, com hi ha dos números
consecutius que tnen la mateix freqüència, apliquem mitjana aritmètica.
1+0/2 = 0,5= MODA.
LA VARIANÇA
Què és la Variaça?
És una mesura de dispersió que representa la variabilitat d’una sèrie de dades
respecte a la mitjana
Mitjana de les desviacions al quadrat respecte a la MItjana. La variància (S2)
mesura la dispersió de les dades d’una mostra (X1,X2….XN) respecte a la mitjana
(x), calculant la mitjana dels quadrats de les distàncies de totes les dades.
EXERCISI PAPER
DESVIACIÓ TÍPICA
La desviació típica es defineix com l’arrel quadrada de la variança.
És una mesura de la dispersió de les dades. Com més gran sigui la dispersió més
gran és la desviació típica. Així, si no hi hagués cap variació en les dades, és a dir,
si tots fossin iguals, aleshores la desviació estàndard seria zero. EXEMPLE
PAPER.
COEFICIENT DE VARIACIÓ
El coeficient de variació compara la desviació típica amb la mitjana. És un índex de
representativitat de la Mitjana que permet comparar la dispersió de diferents grups.
El coeficient de variació pren valors entre 0 i 1. Si el coeficient és proper al 0 ,
significa que hi ha poca variabilitat de dades i n’és una mostra molt compacta.
En canvi, si tendeixen a 1, és una mostra molt i dispersa i la mitjana perd
confiança. De fet, quan el coeficinet de variació supera el 30% (0,3) , es diu que la
mitjana és poc representativa. EXERCISI PAPER
Estadística PARAMÈTRICA :
Fa referència a una part de la inferèncència estadística que utilitza estadístics i
criteris de resolució fonamentats en distribuacions conegudes.
- EX: Proces T-test, correlació de pearson, regressions.
Estadística NO PARAMÈTRICA:
Es tracta d’una branca de la inferència estadística els càlculs i procediments de la
qual estan fomentats en distribucions desconegudes.
- EX: Xi quadrat, Prova de Mann Whitney, correlació de spearman.
ESTADÍSTICA PARAMÈTRICA
- Relació entre dues variables
Si la covariança és positiva, indica que les dues variables tenen una relació
directa: quan una augmenta, l’altra també ho fa. Si la covarància és negativa,
indica que tenen una relació inversa: quan una augmenta, l’altre disminueix. Si la
covariància és propera a 0, indica que no hi ha relació clara entre elles.
Característiques de la COVARIÀNCIA
- Si la relació es directa, la covariància serà positiva
- Si la relació és inversa, la covariància serà negativa.
CORRELACIÓ
- La correlació és una mesura estadística que indica la força i la direcció de la
relació lineal entre dues variables quantitatives, per tant es mesuren
mitjançant una escala numérica. En altres paraules, la correlació mostra com
es relacionen dos conjunts de dades entre si.
- La correlació pot ser positiva, negativa o neutra. Una correlació positiva
vol dir que quan una variable agumenta, l’altre variable també ho fa. Una
correlació negativa vol dir que quan una variable augmenta, l’altra disminueix.
Una correlació neutre vol dir que no hi ha relació entre les dues variables.
EXERCICIS:
SOLUCIÓ:
INTRODUCCIÓ A L’ESTADÍSTICA INFERENCIAL (II):
ESTADÍSTICA NO PARAMÈTRICA
→ Relació entre dues o més variables ordinals o quan no es compleix supòsit de
normalitat.
El coeficient de correlació de Spearman és una prova no paramètrica quan es vol
mesurar la relació entre dues variables i no es compleix el supòsit de normalitat en
la distribució de tals valors.
Correlació de Spearman = rs
Quan s’utilitza:
1. Les variables estan mesurades a escala ordinal
2. Quan 1 variable és ordinal i 1 altra quantitativa, s’analitzen les dades com si
totes dues fossin ordinals.
3. Quan les variables estan mesurades en escala d’interval, però no es
compleixen els supòsits de normalitat (alguna de les dues variables o
ambdues no presenten normalitat).
Com es calcula? Aplicar la fórmula del coeficient de Pearson a l’ordre dels valors.
1. Primer cal convertir els valors registrats en ordres.
Convertim aquest valors en ordres, assignant a cada variables un 1 al valor més
petit i un 2 al següent, i així successivament fins a arribar al valor més gran, al que
en aquest cas li assignem un 5 (per haver-hi només 5 parells de valors)
EXEMPLE:
Un cop hem calcular les freq esperades ja podem calcular l’índex Xi-quadrat.
Solució
Com s’interpreta?
El valor de C mai serà major que 1.
Si s’allunya de 0 → + associació entre les variables
Independència completa entre variables → freq observades i esperades coincideixen,
per tant, X² = 0 i el coeficient de contingència també serà C = 0.
Per contra, com més gran sigui l'associació entre les variables més gran serà la
discrepància entre les freq esperades i observades, per tant, més grans seran els valors de
X² i C.