Welcome to Scribd. Sign in or start your free trial to enjoy unlimited e-books, audiobooks & documents.Find out more
Download
Standard view
Full view
of .
Look up keyword
Like this
3Activity
0 of .
Results for:
No results containing your search query
P. 1
(Bio)informatika in Bayesovska statistika - seminar

(Bio)informatika in Bayesovska statistika - seminar

Ratings: (0)|Views: 268|Likes:
Published by Gregor Gorjanc
(Bio)informatika in Bayesovska statistika - seminarska naloga
(Bio)informatika in Bayesovska statistika - seminarska naloga

More info:

Published by: Gregor Gorjanc on Feb 10, 2009
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF or read online from Scribd
See more
See less

05/10/2014

pdf

 
UNIVERZA V LJUBLJANIBIOTEHNIˇSKA FAKULTETAODDELEK ZA ZOOTEHNIKOGregor GORJANC
1
(Bio)informatika in Bayesovska statistika
Seminarska naloga pri metodoloˇskem predmetu “Bioinformatika”Podpiplomski ˇstudij genetikeLjubljana, 2006
1
 
Gorjanc G. (Bio)informatika in Bayesovska statistika.Semin. naloga. Ljubljana, Univ. v Ljubljani, Biotehniˇska fakulteta, 2006
2KAZALO VSEBINEstr.
3
3
5
6
10
16
16
 
Gorjanc G. (Bio)informatika in Bayesovska statistika.Semin. naloga. Ljubljana, Univ. v Ljubljani, Biotehniˇska fakulteta, 2006
3
1 UVOD
Od odkritja zapisa molekule DNA do danes se je kolcina informacij pri raziskavah v biologiji moˇcno pove-ˇcala. Tako kot so prepleteni pojavi, ki jih preuˇcujejo raziskovalci, so prepletena tudi podroˇcja raziskovanja.Prepletenost raziskav se v zadnjih letih vse bolj stopnjuje. Slednje je posledica do sedaj zbranega znanjain v veliki meri dostop do novih tehnologij, ki omogoˇcajo vse laˇzje pridobivanje podatkov v velikih koliˇci-nah in na razliˇcnih podroˇcjih/nivojih. Na drugi strani se s tem poveˇcuje tudi kompleksnost analiz zbranihpodatkov.ˇCe so bila casih posamezna podroˇcja raziskav“dobro”loˇcena, se te meje vse bolj briˇsejo. Spogledom na analizo podatkov lahko posamezna podroˇcja zdruˇzimo pod izrazom bioinformatika.Pri preuˇcevanju naravnih zakonitosti/pojavovje potrebno podatke tudi analizirati. Za statisitiˇcno analizopodatkov je na razpolago veˇc pristopov k t.i. statistiˇcnem sklepanju. Najbolj pogosta je uporaba klascneoz. frekvencistiˇcne statistike, ki je, kot ˇze ime pove, dobro poznana in uveljavljena. Na drugi strani lahkoizberemo Bayesovskipristop, ki jo zagovorniki predstavljajo kot bolj naravni naˇcin pristopa k statistiˇcnemsklepanju. Namen tega prispevka je najprej orisati Bayesovsko statistiko in podati izhodiˇce za osrednjitemi in sicer:
 
poizkus primerjalne ocene uporabe Bayesovske statistike v na podroˇcju bioloˇskih ved po letih spomoˇcjo novo razvitih orodij in
 
preuˇcitev ter prikaz uporabe teorije informatike pri izbiri apriorne porazdelitve za analizo podatkovz Bayesovskim pristopom.
2 ORIS BAYESOVSKE STATISTIKE
Raziskovalci ob procevanju naravnih zakonitosti spremljajo pojave/dogodke. Pojav lahko matematiˇcnozapiˇsemo kot skupno porazdelitev
p
(
θ
,
y
), kjer
θ
predstavlja vektor neznanih parametrov, ki so temaprouˇcevanja, in
y
vektor zbranih podatkov. Ker te skupne porazdelitve pravzaprav nikoli ne poznamo,skuˇsamo pri raziskavah oceniti neznane parametre na osnovi zbranih podatkov in znanja, ki je na voljo.Slednje matematiˇcno zapsemo kot
p
(
θ
|
y
). Bayesovska statistika za izraˇcun te koliˇcine uporabi Bayesovizrek, ki ga v obliki za kontinuirane spremenljivke lahko zapiˇsemo kot:
 p
(
θ
|
y
) =
p
(
y
|
θ
)
×
 p
(
θ
)
 p
(
y
)
,
(1)kjer
p
(
θ
|
y
) predstavlja
posteriorno
porazdelitev neznanih parametrov, ki nam nudi vse informacije zasklepanje o parametrih glede na podatke in ostale predpostavke. Zbrani podatki za analizo so zastopaniv
p
(
y
|
θ
). Ta ˇclen predstavlja model vzorˇcenja oz. nastajanja podatkov in je kot funkcija neznanihparametrov obiˇcajno zapisan tudi kot
L
(
θ
|
y
). V tej obliki ga imenujemo
verjetje
(ang. likelihood) inpredstavlja osrednji del Bayesovega izreka.ˇSe veˇc, princip verjetja predstavlja v statistiki pristop, kiga lahko vmestimo med frekvencistiˇcno in Bayesovsko ˇsolo statistike. Metoda najveˇcjega verjetja (ang.maximum likelihood - ML) je najpogosteje uporabljena metoda za ocenjevanje parametrov. Predhodnoznanje o neznanih parametrih je v Bayesov izrek vkljuˇceno preko
apriorne
porazdelitve,
p
(
θ
). Delitelj,
 p
(
y
), predstavlja robno porazdelitev podatkov. Ta del ni odvisen od neznanih parametrov, saj predstavlja

Activity (3)

You've already reviewed this. Edit your review.
1 thousand reads
1 hundred reads
vupulepe liked this

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->