Welcome to Scribd, the world's digital library. Read, publish, and share books and documents. See more
Download
Standard view
Full view
of .
Look up keyword
Like this
1Activity
0 of .
Results for:
No results containing your search query
P. 1
capu13

capu13

Ratings: (0)|Views: 8|Likes:

More info:

Published by: Manuel Alejandro Arias on Jun 18, 2013
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

12/13/2013

pdf

text

original

 
 
CAPITOLO XIII
TRASFORMAZIONI DEI DATI CON TEST PER NORMALITA’ E PER OUTLIER 
13.1. Motivi delle trasformazione dei dati 113.2. Alcune trasformazioni dei dati 413.3. Altri effetti delle trasformazioni 1813.4. La scelta della trasformazione idonea: il metodo di Box-Cox 1713.5. Effetti delle trasformazioni sui risultati dell’ANOVA 2513.6. Test per la verifica di normalita’, simmetria e curtosi, con i metodi proposti da Snedecor-Cochran 3313.7
.
Metodi grafici e altri test (Lilliefors, D’Agostino-Pearson) per normalita’, simmetria e curtosi(cenni dei test di Geary e di Shapiro-Wilk) 4613.8. Cenni del test di Cramer-Von Mises per un campione e per due campioni indipendenti 6713.9. L’outlier: dato anomalo o dato sbagliato? definizioni di outlier 7613.10. Identificazione degli outlier con il metodi grafici: il box-and-whiskers di Tukey 8313.11. Metodi statistici per grandi campioni: la distribuzione di Chebyshev e la distribuzione normale;the huge rule 8713.12. Verifica degli outlier o gross error per campioni piccoli con distribuzione normale: il test diGrubbs o extreme studentized residual; il test q di Dixon 9313.13. La extreme studentized deviate e la median absolute deviation 10313.14. Trattamento degli outlier: eliminarli o utilizzarli? come? 115
 
 1
C A P I T O L O XIIITRASFORMAZIONI DEI DATI;TEST PER NORMALITA’ E PER OUTLIER 13.1
.
MOTIVI DELLE TRASFORMAZIONE DEI DATI
Per essere applicati nel rispetto pieno delle condizioni di validità, i test di
statistica parametrica
giàillustrati (il test
t
e il test
F
nelle loro svariate modalità) e quelli che saranno presentati nei capitoli prossimi (la regressione, la correlazione e la covarianza) richiedono che la distribuzione delleosservazioni sperimentali rispetti
- condizioni di carattere formale,- condizioni di carattere sostanziale
.Senza la dimostrazione che i dati rilevati sono in accordo con questi presupposti,
qualunqueconclusione raggiunta con un test parametrico può essere posta in discussione
e i risultati esserecontestati.
Le condizioni di carattere formale
sono fondamentalmente tre.a) La completezza dei dati nei disegni sperimentali rigidi, come i blocchi randomizzati e i quadratilatini:
se mancano uno o più dati
occorre procedere alla loro integrazione. b) La
presenza di dati uguali a zero o indefiniti
, che determinano l’impossibilità di ricavare lasomma e quindi la media. Ad esempio, in caso di trasformazione in logaritmi un dato uguale a 0 (zero)determina un valore uguale a -
(meno infinito); quando si misurano tempi di risposta a uno stimolo ela cavia non reagisce, il tempo diventa infinito o indeterminato. Questi problemi devono essere risolticon trasformazioni adeguate.c) Una
diversa attendibilità dei risultati.
Percentuali e rapporti, calcolati alcuni su campioni di poche unità e altri su campioni grandi, non hanno la stessa attendibilità. Misure rilevate con precisionee altre indicate come
> X
oppure
X
determinano una condizione insanabile per l’uso della statistica parametrica. Con questi dati è necessario ricorrere a test di statistica non parametrica, in quanto l’unicavera informazione è quella di rango.
Le condizioni di carattere sostanziale
che un test parametrico deve rispettare sonofondamentalmente quattro e riguardano:a) gli
effetti del trattamento,
che devono essere
additivi
; b) gli
errori e le osservazioni,
che devono essere
indipendenti
;c) la
distribuzione
degli errori e quella delle osservazioni, che devono essere
normali
;
 
 2
d) se i dati sono suddivisibili in gruppi, le loro
varianza
devono essere
omogenee
.A - Gli
effetti di due o più trattamenti possono combinarsi tra loro per addizione o permoltiplicazione
. L’argomento è stato presentato nell’analisi dell’interazione, con la rappresentazionegrafica e il confronto tra tabelle di medie osservate e medie attese. In un trattamento a blocchirandomizzati senza repliche, occorre verificare se gli effetti sono indipendenti dalla media dei blocchi.Quando si hanno effetti moltiplicativi, si può ritornare al modello additivo mediante la trasformazionelogaritmica dei dati, utilizzando le proprietà matematiche dei logaritmi.
B - L'indipendenza delle osservazioni
è realizzata quando una rilevazione non è influenzata daquella precedente o comunque vicina. La dipendenza risulta più spesso da una correlazione nel tempoche nello spazio, per un trascinamento dell'informazione; può succedere quando lo strumento dimisura viene alterato o semplicemente influenzato dall'osservazione precedente oppure un individuo può essere più simile a quelli vicini.Si ha
indipendenza degli errori
quando i termini che definiscono la varianza d'errore sono distribuitiin modo casuale. Invece quando si evidenziano lunghe successioni di scarti positivi e di scarti negativioppure scarti positivi e negativi tendono ad alternarsi con regolarità, sorgono forti sospetti sullacorrettezza del campionamento. Le metodologie statistiche per evidenziare la presenza di questi fattorisono già presentate in alcuni test non parametrici.
La probabilità che una osservazione presenti un certo errore non deve dipendere né dal segno nédalla sua grandezza, ma essere assolutamente casuale
.Per ottenere l’indipendenza delle osservazioni e degli errori, è necessario che nella sperimentazione ilricercatore tenga in considerazione l’
effetto random
, l’
effetto ambiente
e l’
effetto trattamento,
 attenendosi ai seguenti principi:- la randomizzazione o scelta casuale del campione dalla popolazione dei dati possibili deve esserefondata su elementi obiettivi, come l’estrazione di numeri casuali da una tabella o da un sacchetto, per generazione casuale dal calcolatore; non deve mai essere lasciata all’arbitrio di un individuo (
effettorandom
);- ogni dato deve avere le stesse possibilità di essere influenzato da varie circostanze di tempo e diluogo (
effetto ambiente
);- tutti gli individui del campione devono avere le stesse possibilità di essere sottoposti a untrattamento qualunque (
effetto trattamento
).
 
C - I test parametrici sono validi se
la distribuzione dei dati è normale e quindi quella degli erroriè normale intorno alla media
. La verifica avviene con il controllo della simmetria e della curtosi. Le

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->