Professional Documents
Culture Documents
hiedelemmel
Michael Evans 2015
Előszó
A statisztikai bizonyítékok fogalma kissé megfoghatatlan. A statisztikai következtetés szinte
minden megközelítése a statisztikai bizonyítékokra vagy a bizonyítékokra vonatkozik, hogy
valami igaz vagy hamis. De tudomásunk szerint egyetlen létező elmélet sem határozza meg
egyértelműen, hogy mi ez a bizonyíték, vagy legalábbis előírja, hogyan kell mérni. Itt azzal
érvelnek, hogy a bizonyítékok mérésének nem meghatározása jelentős hiba a statisztikai
következtetés bármely javasolt elméletében. Végtére is, a statisztikai elemzés célja, hogy
összefoglalja, mit mondanak a statisztikai bizonyítékok az érdekes kérdésekről. Paradoxnak
tűnik, hogy ezt anélkül kell megtenünk, hogy egyértelművé tennénk a statisztikai bizonyítékok
mérését.
Ennek a szövegnek az a célja, hogy áttekintést nyújtson a statisztikai következtetések
elméletének kidolgozásával kapcsolatos közelmúltbeli munkáról, amely a statisztikai
bizonyítékok mérésén alapul. Természetesen felmerülhet a kérdés, hogy miért van szükség erre
azon túl, hogy talán elégedettek vagyunk egy ilyen alapkoncepcióval őszinte elmélettel.
A statisztikai elméletek számos megközelítése létezik a spektrum egyik végén lévő Bayes-
elméletektől a tiszta valószínűségelméletig és a különböző frekvenciaalapú megközelítésekig.
Sok statisztikus kényelmesen illeszkedik valahol ezen a skálán, és figyelmen kívül hagyja a
statisztikai bizonyítékok megfelelő kezelésének elmulasztása. Mások még erényt látnak abban,
hogy különböző megközelítéseket fogadnak el a különböző problémákra, mint például a bayesi
kalap viselése ma és a holnapi frequentista kalap. Bizonyos mértékig ezek az attitűdök
gyakorlati kérdéseken alapulnak, mivel végül egy gyakorló statisztikusnak tovább kell mennie
a statisztikai elemzések készítésének üzletével. Bár ez érthető, ez figyelmen kívül hagyja a
statisztika alapvető kérdésének megválaszolását: mi a helyes statisztikai elemzés? A kérdés
megválaszolásának elmulasztása mély és elfogadhatatlan szakadék a statisztikák tárgyában. Ez
szinte biztosan aláássa a bizalmat a témában, és bizonyos mértékig elősegíti a "szinte bármi
megy" hozzáállás.
Ennek a könyvnek az a célja, hogy bemutassa, hogy a statisztikai bizonyítékok mérésének
egyértelműsége lehetővé teszi számunkra, hogy válaszoljunk arra az alapvető kérdésre, hogy
mikor helyes a statisztikai elemzés. Valójában egy ilyen meghatározás előírja, hogy a
következtetési lépésnek hogyan kell eljárnia. Ahogy azonban várható, több van a történetben,
mint egyszerűen egy meghatározás. Az alkalmazott megközelítést teljes egészében el kell
bírálni. Az elméletnek logikus, koherens keretet kell biztosítania a gyakorlati jelentőségű
problémákban megvalósítható statisztikai elemzések elvégzéséhez. Továbbá, az elméletet úgy
kell tekinteni, hogy olyan tulajdonságokkal rendelkezik, amelyek növelik az alkalmasságával
kapcsolatos meggyőződést.
Van néhány alapvető kérdés, amely számos vita és nézeteltérés alapjául áll a statisztikákban.
Ezek közé tartoznak az olyan dolgok, mint a valószínűség jelentése, a szubjektivitás szerepe,
az objektivitás jelentése, a végtelenség és a folytonosság szerepe és a hasznosság fogalmának
relevanciája. Ebben a szövegben mindegyikről meglehetősen erős álláspontot foglalunk el.
Például azzal érvelnek, hogy a statisztikák alapvetően szubjektívek, egyszerűen azért, mert a
statisztikusok mindig választanak a statisztikai elemzés elvégzése során. Az objektivitás
azonban kulcsszerepet játszik az adatokon keresztül e döntések relevanciájának értékelésében.
Lényegében a szubjektivitás soha nem kerülhető el, de hatásai értékelhetők és bizonyos
mértékig ellenőrizhetők. Kétségtelen, hogy a szerző szubjektivitással és objektivitással
kapcsolatos álláspontja nem ért egyet azokkal, akik a tiszta szubjektivitást támogatják, és
azokkal, akik úgy vélik, hogy van egy objektív statisztikai elmélet. Állításunk szerint a relatív
meggyőződésből származó következtetések, valamint a modell ellenőrzése és az adatok
összevetése sokkal szilárdabb logikai alapokra helyezi a statisztikákat, amelyek nagyobb
jelentőséggel bírnak a tudományos alkalmazások szempontjából.
Meg kell fogalmazni egy kikötést a javasolt javaslatra. A szöveg fejleményei kísérletet
jelentenek arra, hogy aranystandardot állapítsanak meg a statisztikai elemzés folytatására. Az
aranystandard olyan dolog, amelyet törekedni kell egy alkalmazás elérésére, de különböző okok
miatt elmaradhatunk. Egy ilyen hiba eredménye nem érvényteleníti teljesen az elemzést, de azt
sugallja, hogy az eredményeket megfelelően kell minősíteni. A statisztikusok már ismerik az
ilyen kompromisszumokat. Tekintsük a statisztikai vizsgálat első, és talán legfontosabb részét,
nevezetesen az adatok gyűjtését. Az aranystandard itt véletlenszerű mintavétel a populációkból
és a prediktor változók értékeinek ellenőrzött elosztása, de ez gyakran nem valósul meg. Ennek
ellenére statisztikai elemzéseket végeznek, és a hiányosságok ellenére hasznos információkat
szereznek. A levont következtetéseket azonban megfelelően kell minősíteni, ha az
adatgyűjtésben nem sikerül elérni a legmagasabb színvonalat. Az elmélet alkalmazásához
szükséges összes összetevő biztosításával járó nehézségek nem indokolják azt a hozzáállást,
hogy egy ilyen elmélet létezése irreleváns.
Az 1. fejezet átfogó jövőképünk néhány alapvető jellemzőját tárgyalja, mint például a
szubjektivitás, az objektivitás, a végtelenség és a hasznosság szerepét a statisztikai
elemzésekben. A statisztikai következtetés elméletének kidolgozásakor gondosan meg kell
határozni azokat a problémákat, amelyekre az elméletet alkalmazni kell. Mint ilyen, az elmélet
alkalmazási területe rendelkezésre áll, nevezetesen, hogy mi minősül statisztikai problémának,
és melyek azok az összetevők, amelyeket a statisztikusnak meg kell határoznia a statisztikai
elemzés elvégzéséhez. Ebben a fejezetben egy egyszerű példát mutatunk be egy statisztikai
elemzésre, amely megfelel a kritériumoknak. A 2. fejezet a valószínűség jelentését és a
valószínűségre vonatkozó különböző álláspontokat veszi figyelembe. Ez a téma áll a
középpontjában sok nézeteltérések a statisztikákban, és a szerző azt állítja, hogy számos ésszerű
módon gondolkodni valószínűségét. Valójában nincs olyan állítás, amely a valószínűség egyik
megközelítésének helyességére vonatkozna a többiekkel szemben. Az itt bemutatott statisztikai
következtetés elmélete alapvetően független ezektől az értelmezéstől, bár a valószínűségeket
hozzárendelve, a hit mérésének tekintik őket. A 3. fejezet az ügy lényegének megvitatását kezdi
meg, nevezetesen a statisztikai bizonyítékok fogalmának kezelésére tett kísérleteket. Ez a
fejezet azt mutatja, hogy bár számos következtetési elmélet említést tesz a statisztikai
bizonyítékokról, nem határozzák meg megfelelően, hogy mi az, vagy ami még fontosabb,
hogyan kell mérni. Továbbá, ez a kudarc vezet anomáliák ezeket az elméleteket. A 4. fejezetben
a statisztikai bizonyítékok mérésére módszert dolgoznak ki, és e módszer alapján kidolgoznak
egy következtetéselméletet. Ez az elmélet azon a feltételezésen alapul, hogy a statisztikai
elemzéshez kiválasztott összetevők helyesek. Az 5. fejezet azt tárgyalja, hogy a statisztikus
hogyan kell kiválasztani a statisztikai probléma összetevőit, és hogyan kell ellenőrizni ezeket a
választásokat, hogy azok helyesek-e egy alkalmazásban. Természetesen a helyesség jelentése
ebben az összefüggésben jelentős vitát igényel. Fejlődésünk egyik kulcspontja, hogy a
következtetés elmélete és alkalmazása logikailag elkülönül az ellenőrzési fázistól, és ezeket
nem szabad megzavarni, mivel a problémák meglehetősen eltérőek. A gyakorlati alkalmazások
esetében az 5. fejezetnek meg kell előznie a 4. fejezetet, de ebben a szövegben a hangsúly a
statisztikai bizonyítékok mérésén van. A 6. fejezet összefoglalja a szöveget, és rámutat a
további lehetséges fejleményekre.
Természetesen, amit itt támogatnak, az nem teljesen elválik attól, amit mások megvitattak.
Valójában a szerző úgy írná le a statisztikai következtetés relatív hitbeli megközelítésének
lényegét, hogy egyszerűen óvatos a Bayes-tényező meghatározásával és használatával
kapcsolatban. Továbbá, sok hasonlóság van a tiszta valószínűség elmélettel, és a relatív hit úgy
írható le, mint a szerző szempontjából az elmélet logikai hiányosságainak kitöltése. A
frequentista megközelítés kulcsszerepet játszik, nem a következtetések meghatározásában,
hanem az összetevők alkalmasságának ellenőrzésében, valamint a következtetések optimális
tulajdonságainak biztosításában.
A szerző kizárólagosan felelős minden hibáért és mulasztásért. Köszönet jár sokaknak.
Különösen Luai Al-Labadi, Zeynep Baskurt, Shelly Cao, Zvi Gilula, Irwin Guttman, Gun Ho
Jang, Shaocheng Liu, Hadas Moshonov, Saman Muthuku- marana, Mohammed Shakhatreh,
Tim Swartz és Tianli Zou voltak a szöveg tartalmával kapcsolatos kiadványok társszerzői, és
kulcsfontosságú hozzájárulásokat tettek. Irwin Guttman bemutatott a Bayes-i következtetésnek,
és ez nagy hatással volt rám. Gun Ho Jang számos ötletes megoldáshoz járult hozzá a technikai
problémákra. A kézirat számos olvasója értékes inputot nyújtott, köztük Stephen Marsh és Yang
Guan Jian Guo diákok. Keith O'Rourke sok hasznos javaslatot tett. A bírálók értékes
visszajelzéseket is adtak, és a szerző különösen szeretne köszönetet mondani Jay Kadane-nak
és David Nott-nak. A statisztikai következtetés alapjaival kapcsolatos problémák iránti
érdeklődésemet D. A. S. Fraser professzor ösztönözte, és hálás vagyok ezért, és azért is, hogy
bennem tápláltam azt a hitet, hogy ezek a problémák megoldhatók.
1. Statisztikai problémák
1.1. Bevezetés
Ez a könyv a statisztikai bizonyítékok méréséről szól. Pontosabban a statisztikai bizonyítékok
meghatározását a statisztikai probléma összetevői alapján javasolják a statisztikus által
meghatározottak szerint. Ennek a meghatározásnak a közvetlen következménye a statisztikai
következtetés elmélete, amely néhány egyedi és vonzó tulajdonságot tartalmaz.
A laikus olvasó számára meglepő lehet, hogy a tudományos szakirodalom nem oldja meg, hogy
pontosan hogyan kell mérni a statisztikai bizonyítékokat. A legtöbb ésszerűen számmal
rendelkező egyén találkozott a p-értékek, a standard hibák stb. fogalmával, és megérti, hogy
ezek a fogalmak központi szerepet játszanak a statisztikai problémák érvelésében, és hogy
valami közük van a statisztikai bizonyítékok jellemzéhez. Mégis tény, hogy a tapasztalt, profi
statisztikusok meglehetősen drámaian nem értenek egyet a statisztikai összefüggésekben az
érvelés helyes módjáról.
A következtetés különböző megközelítéseinek vizsgálatakor látni fogjuk, hogy általában nem
határozzák meg pontosan, hogy mi a statisztikai bizonyíték. Ez jelentős mulasztásnak
tekinthető. Valójában véleményünk szerint a statisztikai következtetés bármely érvényes
elméletének pontosan meg kell határoznia, hogy mit jelent a statisztikai bizonyíték. A
statisztikai bizonyítékok meghatározásának a statisztikai következtetés elméletének magjaként
kell szolgálnia, és alapvetően meg kell határoznia a statisztikai problémák megoldásának
módját, nevezetesen a statisztikai bizonyítékoknak meg kell mondaniuk, hogy mi a probléma
megoldása.
A statisztikai bizonyítékok meghatározására vonatkozó javaslatunkat a 4. Minden ilyen
meghatározás egy statisztikus által meghatározott statisztikai probléma összetevőin alapul.
Tehát a jelenlegi fejezet arra foglalkozik, hogy megvitassák, hogy pontosan mit jelent a
statisztikai probléma, és milyen összetevőket kell meghatároznia a statisztikusnak. Ez arra
késztet minket, hogy kizárjunk bizonyos problémákat és összetevőket, amelyeket mások inkább
belefoglalnak. Azzal védekezünk, hogy megközelítésünk a gyakorlatilag értelmes statisztikai
problémák túlnyomó többségét lefedi, és hogy a kirekesztőség miatt sok felesleges bonyolultság
és kétértelműség megszűnik. Mindenekelőtt célunk a statisztikai következtetés logikus és teljes
elmélete, amelynek gyakorlati jelentősége van, nem pedig valamiféle matematikai általánosság.
Valójában az a véleményünk, hogy a matematikai általánosságra tett kísérletek gyakran
félrevezetik a megfelelő statisztikai érvelést.
A valószínűség kulcsfontosságú fogalom a statisztikai következtetés bármely elméletében. Ez
olyan fontos, hogy a 2.
1.2. Statisztikai problémák
Az első megválaszolandó kérdés: mi a statisztikai probléma? A következő példa az archetipikus
statisztikai problémának nevezhető problémát jellemzi. Az ebben a szövegben szereplő vita az
ilyen problémák és közeli hozzátartozók megfontolására korlátozódik. Azzal érvelünk, hogy
ilyen korlátozásokra van szükség, sőt, a kérelmek túlnyomó többségében érvényesek.
1.2.1. példa. Az archetipikus statisztikai probléma.
Tegyük fel, hogy van egy #(Ω) <∞ Ω populáció, ahol a #(A) az A halmaz számosságát jelöli.
Tehát Ω csak egy véges objektumhalmaz. Továbbá tegyük fel, hogy van egy X:Ω→X mérés.
Az X mérés az X halmaz értékeit figyelembe vevő Ω definiált függvény. Tehát X(ω)X a Ω
ωtárgy mérése. Például, Ω lehet a készlet az összes diák beiratkozott egy adott iskolában
és X ( ω ) a magassága centiméterben a diákok ω . Tehát ebben az esetben az X az R1
részhalmaza. Egy másik példaként Ω lehet az adott iskolába beiratkozott összes tanuló
halmaza, és X ( ω ) = (X1(ω ) ,X 2 (ω ) ) , ahol X1(ω ) a t a n u l ó i ω centiméterben és X 2 ( ω )
a hallgatói ω neme, így ebben az esetben X az R1×{ M , F } részhalmazának tekinthető.
Ha figyelembe vesszük a változó, mint a magasság, gyakori, hogy kezelje ezt, mint esetleg
figyelembe egy folyamatos értéktartományban, és lehetővé teszi a halmaz lehetséges értékek
határtalan. Bár ez ártalmatlannak tűnhet, amint azt az 1.4. szakasz is érvelte, óvatosnak kell
lennünk, amikor a végtelenségeket használjuk a statisztikai problémák megvitatására. Mint
ilyen, mivel a véges Ω, a véges pontosság, amellyel a magasság méréseket végeznek, és az a
tény, hogy a mérések fordulnak elő az ismert határokon belül, X lehet venni, hogy a halmaz az
összes lehetséges értékek X ( ω ) , és ez egy véges halmaz. A végtelen halmazokat az 1.4.
szakasz mutatja be a statisztikai problémák közelítésekor.
A statisztikai probléma alapvető célja az X relatív frekvenciaeloszlása Ω felett. Az A⸦X
részhalmaz esetében az A relatív gyakoriságát a
relatív frekvenciaeloszlás, vagy talán más jellemző fX. Természetesen nincs semmi baj
összpontosítva néhány jellemzője fX,de tudva fX jelent teljes statisztikai információkat. Mint
ilyen, ki fogjuk fejezni a vitát szempontjából ismeri az igazi fX .
A statisztika alapvető kérdése tehát a valódi f X-rőlszóló részleges információkalapján, hogyan
következtethetünk az igazi fX-re? Természetesen egyértelművé kell tenni, hogy mit jelent a
részleges információ, és a későbbi szakaszok ezt megteszik, de minden statisztikai probléma
részeként ott vannak a megfigyelt adatok x1=X(ω 1 ),... ,xn=X(ωn) ahol {ω 1 ,... ,ωn}⸦Ω
valamilyen módon a lakosságból választják ki.
Ne feledje, hogy az 1.2.1 példában nincsenek végtelenségek, és mindent egyszerűen a számolás
szempontjából határoz meg. A valószínűségről sincs szó. Van azonban egy nagy
bizonytalanság, hogy fX ismeretlen anélkül, hogy a népszámlálás. Ez az az alapvető
bizonytalanság, amely minden statisztikai probléma középpontjában áll.
Kétségtelen, hogy az 1.2.1. példa nagyon korlátozónak tűnik, de számos módja van annak
általánosítására anélkül, hogy megsértené annak alapvető jellemzőjét, hogy minden véges és
számlálással elérhető. Például több véges populációt tekinthetünk 1 Ω,... ,Ωm megfelelő
mérésekkel X 1 ,... ,Xm és relatív frekvenciafüggvények fX1,... ,fXm, majd megvitatják, hogy
összehasonlítások közöttük. Az úgynevezett mérési hibaproblémáknak az 1.2.1. példához való
viszonyát, valamint a végtelenség és a folytonosság használatát a statisztikai modellezésben az
1.4. szakasz vizsgálja.
Talán a legfontosabb, hogy az 1.2.1. példa általánosításaként merülnek fel olyan problémák,
amelyekben az érdeklődés a változók közötti kapcsolatokkal kapcsolatos. A változók közötti
kapcsolat fogalma a feltételes relatív frekvenciaeloszlás fogalmán alapul. Tegyük fel, hogy egy
populáción két X és Y mérés van meghatározva, Ω (X( ω ) , Y ( ω ) ) X . Az Y feltételes
relatív gyakoriságfüggvénye X=x-re van meghatározva, majd (x,y) X-re
amikor #({ω:X ( ω ) = x } ) = 0 vagy ezzel egyenértékű f X ( x ) ≠ 0. Figyeld meg ezt. fY| X ismét
egyszerű számlálással nyerhető, és az f(X,Y) elágazás és az fX marginális relatív
frekvenciafüggvény együttes relatív frekvenciájábólnyerhető. Az alábbiak a feltételes relatív
gyakoriságot használják, és a statisztikák legfontosabb alkalmazását jelentik.
1.2.2. példa. Változók közötti kapcsolatok.
Tegyük fel, hogy van egy mérés ( X , Y ):Ω→X ésaz érdeklődésünk az, hogy van-e kapcsolat az
X és Y változók között. Van egy alapvető meghatározása, hogy mit jelent a változók, hogy
kapcsolódnak.
1.2.1. meghatározás. Az X és Y változók, amelyeket a populációs Ω határoznak meg, akkor
rokon változók, ha egyesek esetében. x2 olyan, hogy fX(x 1 )≠0 és f X (x2)≠0, majd fY| X(∙|x1)≠fY|
X(∙| x2).
Most tegyük fel, hogy ahelyett, hogy a modell eloszlásait θ indexelnénk, ψ=Ψ(θ)=θ2-
t
használunk. A ψ valószínűségi sűrűsége pψ(ψ)=1/(2√ψ), ha ψ[0,1] és 0 egyébként. Gyakran
állítják, hogy ez ellentmondást jelent a valószínűség kezdeti hozzárendelése szempontjából,
mivel a ψ eloszlása már nem egységes, de a ψ ismerete egyenértékű a θ ismeretével. De fontolja
meg a véges eloszlás közelítését. Természetesen ψΨN={0,1/N2,22/N2,(N−1)2/N2,1} és vegye
figyelembe, hogy ezek a pontok már nem egyenlőek-egymástól el vannak határva, és 0 felé
tömörülnek. De azt is vegye figyelembe, hogy
és egyértelműen hasonló képlet áll rendelkezésre tetszőleges n≤N. Ebből, ha n<<#(Ω), akkor
x=(x1,...,xn) avalószínűségi eloszlásból származó hozzávetőleges i.i.d. (függetlenül és azonosan
elosztott) minta, f X által megadott valószínűségi függvénylel. Ez az érv az alapja annak a
feltételezésnek, hogy az adatok egy eloszlásból vett i.i.d. mintaként keletkeznek.
Természetesen, ha n nagy képest # (Ω), akkor ez a feltételezés nem lehet tenni, és be kell építeni
a függetlenség hiánya az elemzésbe.
Tekintsük most az 1.4.2.
Példa 1.5.1 Érme dobás.
Tegyük fel, hogy X:Ω→{0,1} és #(Ω)=N nagyon nagy az n-hez képest. Ezután egyértelmű,
hogy az x=(x1,... modellje ,xn) közelíthető meg azzal a modellel, ahol feltételezzük, hogy az x i
i.i. Bernoulli(θ) ésígy
Ismét ez egy választás, nevezetesen, hogy átlagosan a kritériumot, és valami mást lehetett volna
tenni. Például a ( T ( x ) − θ)2 eloszlásának mediánja használható az egyes sorozatokban, és ez
nem egyenlő az MSEθ( T ) .
Most az MSEθ(T) használatával a becslés összehasonlítására a frequentizmus elve magában
foglalja a T-kielégítő M S E θ ( T ) < M S E θ ( T " ) k e r e s é s é t minden θR1, bármely más
b e c s l é s r e T " . De könnyű belátni, hogy ez kudarcra van ítélve. A becslő ^( x ) =θ
MSEθ(T)=0, ami azt jelenti, hogy az optimális T kielégíti az MSEθ(T)=0 minden θ. Ez azt
jelenti, hogy T ( x ) = θ minden θ , és ilyen T nem létezik.
Tehát most egy másik, kissé önkényes választásra van szükség, és ez általában az identitáson
alapul
Az egyik aggodalomra ad okot, hogy az adatokban van egy lehetséges időbeli tendencia,
nevezetesen, hogy az eloszlás a mintavétel során változhatott volna, és így a modell helytelen
lenne. Ennek értékelésére az egyik lehetséges módszer a D ( x ) =n1xˉ1−n2xˉ2 eltérési statisztikán
keresztül történik, ahol n1xˉ1 az első n1 mintaértékben szereplő értékek száma, n2xˉ2 pedig az
utolsó n2 mintaértékben szereplő értékek száma. Mint ilyen, D ( x ) összehasonlítja a minta két
részében lévők számát. Itt n1=n2=10 értéket veszünk, és megkapjuk a megfigyelt értéket
D ( x ) =2−6=−4 az adatokhoz (1.3). Az 1.1. ábra a szimulációval kiszámított D feltételes
valószínűségi függvényének ábrázolása. Az (1.2) értéke 0,17, így a megfigyelt érték nem túl
meglepő, és így nem mond ellent a modellnek.
Természetesen más eltérési statisztikákat is alkalmazni lehetne. A modellellenőrzéssel
kapcsolatos további kérdéseket az 5.
1.9.2. Előzetes adatütközés ellenőrzése
Az előzetes adatütközés ellenőrzése itt a valószínűség kiszámítását igényli
ahol c0,95(x) a k állandók infimumának van meghatározva úgy, hogy a halmaz hátsó
valószínűségi tartalma {θ:R B ( θ | x ) ≤ k } legalább 0,05. Közlemény, hogy x ˉ {θ :R B ( θ |
x ) ≥ k } ha k < R B ( θ | θ x ) . A C0mérete. 9 5 ( x ), amely ebben az esetben a hosszúság, mint
egy intervallum, akkor kell tekinteni, mint az értékelés pontosságát x becslésként. A
C0formája. 95 .95x ) a bizonyítékok meghatározása szerint, ha θ1C0. 9 5 ( x ) és
RB,θ2|x)>R B , θ 1 | x ) , akkorlogikailag szükséges, hogy θ2C0. 95( x ) is.
Amikor RΒ(θ0| x ) < 1. és (1.5.) kicsi, akkor erős bizonyíték van a H 0 ellen, mert nagy a
valószínűsége annak, hogy a valós értéknek nagyobb relatív hitaránya van. Amikor a z R B ( θ 0 |
x ) > 1. és 1.5. nagy, akkor erős bizonyíték van a H 0 javára, mert kicsi a valószínűsége annak,
hogy a valós értéknek nagyobb relatív hitaránya van, és θ0-nak van a legtöbb bizonyítéka a
javára {θ : R B ( θ | x ) ≤ R B ( θ 0 | x)}.
Az adatok (1.3.) és a választás α 0 =β0=4, a relatív hitarány releváns értéke R B ( 1 / 2 | x ) = 1,421,
és mivel ez nagyobb, mint 1, bizonyíték van a H0javára. Az (1.5) érték esetében
kapnak, és így a bizonyíték mellett H0 csak mérsékelt, mivel van egy hátsó valószínűsége
0,691, hogy a valódi értéke θ nagyobb relatív hit arány.
A bizonyítékok erősségének értékelésekor és különösen az (1.5) kiszámításánál a
folytonossággal kapcsolatos kérdések merülnek fel. Ezt a 4.4.1.
1.9.4. Az előzetes elfogultság ellenőrzése
Mint korábban említettük, azt is fel kell mérni, hogy a kiválasztott előzetes indukál-e
elfogultságot a problémában. Abban az esetben, az egységes előtt tűnhet nyilvánvaló, hogy
nem, de ez a kérdés általában bonyolultabb és finomabb. Itt a Savage-Dickey arány eredménye,
amint azt a 4. fejezet mutatja, amely azt mutatja, hogy a relatív hitarány
ahol az MT(∙| θ0) a T korábbi eloszlását jelöli, ha a valós érték 0 θ. Ha (1.6) nagy, akkor
elfogultság van a H0-valszemben, mint ismeretes, még az adatgyűjtés előtt is, hogy valószínűleg
bizonyítékot szerez a H0ellen. Ehhez a problémához M T ( ∙ | θ0) a binomiális(n,θ0) eloszlás.
A H0={θ0} melletti torzítást az előző valószínűség alapján mérjük, amikor θ = θ * ≠θ0 igaz,
akkor a H0 mellett bizonyítékokat kapunk, nevezetesen:
és ezek a szimmetria miatt egyenlőek. Tehát van némi elfogultság mellett H 0={1/2} által
kiváltott béta(4,4) előtt.
Az elfogultságot némileg az előző, de elsősorban a minta méretének megválasztása
szabályozhatja. Az elfogultság ellenőrzése és a korábbi adatok ütközésének ellenőrzése
hatékony eszközöket biztosít a priorok használatával gyakran kiegyenlített kritikák kezelésére.
1.10. Záró megjegyzések
Ez a fejezet arról szólt, hogy hátteret biztosítsunk a statisztikai következtetés elméletének
későbbi fejleményeihez, amelyek a statisztikai bizonyítékok relatív meggyőződésen alapuló
mérésén alapulnak. Minden következtetés elméletéhez világossá kell tenni, hogy milyen
problémákat kell alkalmazni, és milyen összetevők az elméletben. Ezekkel a kérdésekkel itt
foglalkoztunk. Tekintettel arra, hogy a relatív hitelmélet különbözik a következtetés más
elméleteitől, meg kell vitatni, hogy miért van szükség valami más fejlesztésére. A 3. fejezet a
statisztikai bizonyítékok fogalmának más elméleti megközelítéseinek vizsgálata, a 4. fejezet
pedig magát a relatív hitelméletet fejleszti ki.