Welcome to Scribd. Sign in or start your free trial to enjoy unlimited e-books, audiobooks & documents.Find out more
Download
Standard view
Full view
of .
Look up keyword
Like this
2Activity
0 of .
Results for:
No results containing your search query
P. 1
Agnoli - Il teorema di Bayes una introduzione critica

Agnoli - Il teorema di Bayes una introduzione critica

Ratings: (0)|Views: 81|Likes:
Published by api-19623993

More info:

Published by: api-19623993 on Dec 03, 2009
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

03/18/2014

pdf

text

original

Il teorema di Bayes: una introduzione critica
Roma, dicembre 2002
Paolo Agnoli
Premessa

Questo breve scritto \u00e8 stato redatto come tesina per l\u2019esame di Psicologia Generale presso l\u2019Universit\u00e0 di Roma 2 Tor Vergata nell\u2019anno accademico 2002-2003 (prof. Vetrone). Lo studio si propone di introdurre i fondamenti filosofici della cosiddetta statistica Bayesiana e discuterne le implicazioni riguardanti l\u2019interpretazione dell\u2019attivit\u00e0 scientifica.

1. Introduzione
Se volete apprendere qualcosa [dagli scienziati] sui metodi che essi usano, vi consiglio di tener fermo un solo
principio: non ascoltate le loro parole in proposito ma fissate la vostra attenzione su ci\u00f2 che fanno.
A. Einstein

An effect may be produced by the cause a or by the cause b
The effect has just been observed. We ask the probability that
it is due to the cause a. This is an \u00e0 posteriori
probability of cause. But I could not calculate it, if
a convention more or less justified did not tell me in advance
what is the \u00e0 priori probability for the cause a
to come into play. I mean the probability of this event to
some one who had not observed the effect.

Henri Poincar\u00e9
I nuovi sviluppi della teoria della misura sono basati sul concetto di probabilit\u00e0 soggettiva e sul
teorema di Bayes. Per introdurre quest\u2019ultimo cercher\u00f2 di evitare il pi\u00f9 possibile i formalismi,
nondimeno dovremo familiarizzare con un minimo di terminologia sulle variabili casuali (nel
linguaggio della probabilit\u00e0 soggettiva).
Una variabile casuale, o numero aleatorio, \u00e8 qualsiasi numero rispetto al quale si \u00e8 in stato di
incertezza. Facciamo due esempi nel contesto delle misure:

1. Pongo un chilogrammo campione su una bilancia di laboratorio con indicazione (digitale) dei centesimi. Che valore legger\u00f2 (in grammi)? 1000.00, 999.95, 1000.03 ...?

2. Leggo su una bilancia di laboratorio 2.315 g. Quanto vale il valore vero della
massa del corpo? 2.311, 2.312, ... 2.315, ... 2.319, ...?

Nel primo caso la variabile \u00e8 la letturax (subordinatamente ad un certo valore vero); nel secondo caso la variabile \u00e8 il valore vero, che ora indicher\u00f2 con \u03bc (subordinatamente ad un certo valore letto) .

Ai possibili valori della grandezza viene associata una funzionef(x) che quantifica il grado di
fiducia ad essi assegnato. Quindi scrivere che f(x1) > f(x2) sta ad indicare che si crede pi\u00f9 ax1 che a
x2. A seconda che la variabile xsia discretao continua, f(x) ha l'accezione di funzione di probabilit\u00e0
o di funzione densit\u00e0 di probabilit\u00e0.
1

Tutte le propriet\u00e0 dif(x) apprese nei corsi convenzionali ( basati cio\u00e8 sui concetti convenzionali di probabilit\u00e0) rimangono valide nell'approccio soggettivista. In particolare si ricorda che la deviazione standard \u03c3 fornisce la dispersione di valori che \u00e8 possibile attendersi dalla variabile.

Tutte le distribuzioni di variabile casuale sono subordinate ad un certo stato di informazione.
Utilizzando i due esempi precedenti possiamo perci\u00f2 scrivere
f(x) \u2192 f (x|\u03bc = 1000.00)
f(\u03bc) \u2192 f (\u03bc|x = 2.315),
ove "|" si legge "dato", "subordinatamente a", etc.

L'intero stato di incertezza sui valori della grandezza di interesse \u00e8 espresso daf(\u03bc). Da questa funzione \u00e8 possibile calcolare la probabilit\u00e0 che la grandezza abbia un valore compreso in un certo intervallo.

Ogni misura \u00e8 eseguita allo scopo di accrescere la conoscenza di chi la esegue, si tratti di uno scienziato, un ingegnere che deve valutare/collaudare un prodotto o un apparato, un medico che ha prescritto una certa analisi. E' anche chiaro che la necessit\u00e0 stessa di eseguire misure indica che ci si trovava in uno stato di incertezza su qualcosa di interesse. Questo "qualcosa" pu\u00f2 essere una

costante fisica o una teoria sull'origine dell'universo, l\u2019affidabilit\u00e0 di una apparecchiatura per trasmissione dati, lo stato di salute di un paziente, etc\u2026 In tutti i casi la misura ha lo scopo di modificare un certo stato di conoscenza.

Si sarebbe tentati di dire addirittura "acquisire", anzich\u00e9 "modificare", lo stato di conoscenza, come ad indicare che la conoscenza possa essere creata dal nulla nell'atto della misura. Non \u00e8 difficile convincersi, invece, che nella maggior parte dei casi si tratta invece soltanto di un aggiornamento alla luce di fatti nuovi e di un certo raziocinio. Prendiamo ad esempio la misura della temperatura di una stanza, effettuata con un termometro digitale tanto per escludere contributi soggettivi alla. lettura dello strumento - e supponiamo di ottenere 21.7\u00b0C. Anche se si potr\u00e0 dubitare del decimo di grado, indubbiamente la misura \u00e8 servita a restringere l'intervallo di temperature ritenute plausibili prima della misura - quelle compatibili con la sensazione di "ambiente confortevole". In base alla conoscenza del termometro usato, o dei termometro in generale, ci saranno valori di temperatura in un certo intervallo intorno a 21.7\u00b0C ai quali crediamo di pi\u00f9 e valori al di fuori ai quali crediamo di meno.

E' per\u00f2 altres\u00ec chiaro che se il termometro avesse indicato, a parit\u00e0, di sensazione fisiologica, 17.3\u00b0C si sarebbe tentati a ritenere che esso non funzioni bene. Non si avrebbero invece dubbi sul suo malfunzionamento se avesse indicato 2.5\u00b0C!

I tre casi corrispondono a tre diversi gradi di aggiornamento della conoscenza. Nell'ultimo caso, in particolare,
l'aggiornamento \u00e8 nullo.(D\u2019Agostini, Gennaio 1999, 32)
Molto spesso si pensa che l'unico metodo scientifico valido sia quello della falsificazione. Ma non
\u00e8 sempre cos\u00ec.

Non ci sono dubbi che, se una teoria non \u00e8 in grado di descrivere i risultati di un esperimento, essa vada scartata o modificata. Ma poich\u00e9 non \u00e8 possibile dimostrare la certezza di una teoria, diventa impossibile decidere fra tutte le (infinite) ipotesi non falsificate. Il metodo probabilistico permette di fornire una scala di credibilit\u00e0 a tutte le ipotesi considerate (o rapporti di credibilit\u00e0 fra ogni coppia di ipotesi). Un caso in cui il metodo di falsificazione \u00e8 completamente inadeguato \u00e8 quello relativo alle incertezze di misura. Infatti, prendendo alla lettera tale metodo, si sarebbe autorizzati soltanto a verificare se il valore osservato sullo strumento \u00e8 compatibile o no con un valore vero, niente di pi\u00f9. Si capisce come, con queste premesse, non si possa fare molta strada.(Ibidem)

In generale, non si pu\u00f2 applicare il metodo della falsificazione alle ipotesi statistiche, l\u2019area in cui
peraltro la metodologia \u00e8 di maggior importanza per gli scienziati praticanti.

Many scientific theories are explicity probabilistic and, for this reason, have no logical consequences of a verifiable character. An example is Mendel\u2019s theory of inheritance. This states the probabilities with which certain combinations of genes occur during reproduction; but, strictly speaking, the theory does not categorically rule out, nor predict, any particular genetic configuration. Nevertheless, Mendel obtained impressive confirmation from the results of his

2
plantgrowing trials, results which this theory did not entail but stated to be relatively probable.( Howson, Urbach, 1993,
7)

In altre parole, i principi sui quali si basa Popper sono troppo deboli per ristringere sufficientemente il campo di ipotesi alternative, laddove, in pratica, gli scienziati hanno un sistema di classificazione delle ipotesi secondo la loro eleggibilit\u00e0 per una seria considerazione Tale sistema \u00e8 stato tradizionalmente caratterizzato come uno spettro di probabilit\u00e0.

Have we any right, for istance, to enunciate Newton\u2019s Law? No doubt numerous observations are in agreement with it, but is not that a simple fact of chance? And how do we know, besides, that this law which has been true for so many generations will not be untrue in the next? To this objection the only answer you can give is: It is very improbable[\u2026] From this point of view all the sciences would only be unconscious applications of the calculus of probabilities. And if this calculus be condemned, then the whole of the sciences must also be condemned.( Poincar\u00e9, 1952, 186; cited in Howson, Urbach, 1993, 9)

Per formalizzare il discorso intrapreso, occorre associare variabili casuali sia ai possibili valori delle grandezze fisiche che ai valori osservabili sullo strumento. Fatto ci\u00f2, si tratter\u00e0 di imparare come inferire la distribuzione di probabilit\u00e0 del valore vero, ossia come valutare, per ogni possibile valore della grandezza, un corrispondente grado di fiducia.

2. Il teorema di Bayes
Our knowledge is the amassed thought and experience of innumerable minds.
Ralph Waldo Emerson
Come appena introdotto,
f(x|\u03bc)

sta per la funzione densit\u00e0 di probabilit\u00e0 (x \u00e8 una variabile continua, dal punto di vista pratico) di osservare un certo valorex, dato un determinato valore vero \u03bc. Tutti i possibili valori di \u03bc possono essere visti come le infinitecause responsabili del valorex osservato (il loroeffetto).

La funzionef (x|\u03bc) ci d\u00e0 la verosimiglianza che \u03bc possa causarex e per questo \u00e8 chiamata semplicementeverosimiglianza. Essa va stimata dalla conoscenza del comportamento dello strumento e, pi\u00f9 in generale, dell'insieme di tutte le procedure di misura. Molto spesso si utilizza per la verosimiglianza un modello gaussiano, giustificato dalle aspettative teoriche basate sul teorema del limite centrale (vedi per esempio Severi, 1986 ).

Una volta fissata la funzione di verosimiglianza e un valore osservatox, si tratta di costruire laf(\u03bc|
x). Per arrivare in modo euristico alla formula generale, consideriamo soltanto due possibili valori

di \u03bc. Se, in base alle nostre conoscenze, riteniamo i due valori ugualmente probabili, ci sembrer\u00e0 naturale protendere per il valore per il quale la verosimiglianza di osservarex \u00e8 maggiore. Ad esempio, se \u03bc1 = -1, \u03bc2 = 10 e x = 2, si \u00e8 tentati a credere che l'osservazione sia dovuta pi\u00f9 verosimilmente alla causa \u03bcl che alla causa \u03bc2. Se per\u00f2 la grandezza di interesse \u00e8 definita positiva, la causa \u03bcl crolla da causa pi\u00f9 probabile a causa impossibile. Ci sono poi casi intermedi in cui, per motivi legati all'esperienza precedente, si tende a credere a priori pi\u00f9 ad una causa che all'altra. Ne segue che il grado di fiducia risultante di un certo valore di \u03bc sar\u00e0 proporzionale sia alla verosimiglianza che esso produca il valore osservato che al grado di fiducia che si attribuiva a \u03bc prima dell'osservazione:

(
)
(
)
)
(
|
|
0\u00b5
\u00b5
\u00b5
f
x
f
x
f
\u22c5
\u221d
3

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->