Measuring Statistical Evidence Using Relative Belief - 1

Statisztikai bizonyítékok mérése relatív
hiedelemmel
Michael Evans 2015
Előszó
A statisztikai bizonyítékok fogalma kissé megfoghatatlan. A statisztikai következtetés szinte
minden megközelítése a statisztikai bizonyítékokra vagy a bizonyítékokra vonatkozik, hogy
valami igaz vagy hamis. De tudomásunk szerint egyetlen létező elmélet sem határozza meg
egyértelműen, hogy mi ez a bizonyíték, vagy legalábbis előírja, hogyan kell mérni. Itt azzal
érvelnek, hogy a bizonyítékok mérésének nem meghatározása jelentős hiba a statisztikai
következtetés bármely javasolt elméletében. Végtére is, a statisztikai elemzés célja, hogy
összefoglalja, mit mondanak a statisztikai bizonyítékok az érdekes kérdésekről. Paradoxnak
tűnik, hogy ezt anélkül kell megtenünk, hogy egyértelművé tennénk a statisztikai bizonyítékok
mérését.
Ennek a szövegnek az a célja, hogy áttekintést nyújtson a statisztikai következtetések
elméletének kidolgozásával kapcsolatos közelmúltbeli munkáról, amely a statisztikai
bizonyítékok mérésén alapul. Természetesen felmerülhet a kérdés, hogy miért van szükség erre
azon túl, hogy talán elégedettek vagyunk egy ilyen alapkoncepcióval őszinte elmélettel.
A statisztikai elméletek számos megközelítése létezik a spektrum egyik végén lévő Bayes-
elméletektől a tiszta valószínűségelméletig és a különböző frekvenciaalapú megközelítésekig.
Sok statisztikus kényelmesen illeszkedik valahol ezen a skálán, és figyelmen kívül hagyja a
statisztikai bizonyítékok megfelelő kezelésének elmulasztása. Mások még erényt látnak abban,
hogy különböző megközelítéseket fogadnak el a különböző problémákra, mint például a bayesi
kalap viselése ma és a holnapi frequentista kalap. Bizonyos mértékig ezek az attitűdök
gyakorlati kérdéseken alapulnak, mivel végül egy gyakorló statisztikusnak tovább kell mennie
a statisztikai elemzések készítésének üzletével. Bár ez érthető, ez figyelmen kívül hagyja a
statisztika alapvető kérdésének megválaszolását: mi a helyes statisztikai elemzés? A kérdés
megválaszolásának elmulasztása mély és elfogadhatatlan szakadék a statisztikák tárgyában. Ez
szinte biztosan aláássa a bizalmat a témában, és bizonyos mértékig elősegíti a "szinte bármi
megy" hozzáállás.
Ennek a könyvnek az a célja, hogy bemutassa, hogy a statisztikai bizonyítékok mérésének
egyértelműsége lehetővé teszi számunkra, hogy válaszoljunk arra az alapvető kérdésre, hogy
mikor helyes a statisztikai elemzés. Valójában egy ilyen meghatározás előírja, hogy a
következtetési lépésnek hogyan kell eljárnia. Ahogy azonban várható, több van a történetben,
mint egyszerűen egy meghatározás. Az alkalmazott megközelítést teljes egészében el kell
bírálni. Az elméletnek logikus, koherens keretet kell biztosítania a gyakorlati jelentőségű
problémákban megvalósítható statisztikai elemzések elvégzéséhez. Továbbá, az elméletet úgy
kell tekinteni, hogy olyan tulajdonságokkal rendelkezik, amelyek növelik az alkalmasságával
kapcsolatos meggyőződést.
Van néhány alapvető kérdés, amely számos vita és nézeteltérés alapjául áll a statisztikákban.
Ezek közé tartoznak az olyan dolgok, mint a valószínűség jelentése, a szubjektivitás szerepe,
az objektivitás jelentése, a végtelenség és a folytonosság szerepe és a hasznosság fogalmának
relevanciája. Ebben a szövegben mindegyikről meglehetősen erős álláspontot foglalunk el.
Például azzal érvelnek, hogy a statisztikák alapvetően szubjektívek, egyszerűen azért, mert a
statisztikusok mindig választanak a statisztikai elemzés elvégzése során. Az objektivitás
azonban kulcsszerepet játszik az adatokon keresztül e döntések relevanciájának értékelésében.
Lényegében a szubjektivitás soha nem kerülhető el, de hatásai értékelhetők és bizonyos
mértékig ellenőrizhetők. Kétségtelen, hogy a szerző szubjektivitással és objektivitással
kapcsolatos álláspontja nem ért egyet azokkal, akik a tiszta szubjektivitást támogatják, és
azokkal, akik úgy vélik, hogy van egy objektív statisztikai elmélet. Állításunk szerint a relatív
meggyőződésből származó következtetések, valamint a modell ellenőrzése és az adatok
összevetése sokkal szilárdabb logikai alapokra helyezi a statisztikákat, amelyek nagyobb
jelentőséggel bírnak a tudományos alkalmazások szempontjából.
Meg kell fogalmazni egy kikötést a javasolt javaslatra. A szöveg fejleményei kísérletet
jelentenek arra, hogy aranystandardot állapítsanak meg a statisztikai elemzés folytatására. Az
aranystandard olyan dolog, amelyet törekedni kell egy alkalmazás elérésére, de különböző okok
miatt elmaradhatunk. Egy ilyen hiba eredménye nem érvényteleníti teljesen az elemzést, de azt
sugallja, hogy az eredményeket megfelelően kell minősíteni. A statisztikusok már ismerik az
ilyen kompromisszumokat. Tekintsük a statisztikai vizsgálat első, és talán legfontosabb részét,
nevezetesen az adatok gyűjtését. Az aranystandard itt véletlenszerű mintavétel a populációkból
és a prediktor változók értékeinek ellenőrzött elosztása, de ez gyakran nem valósul meg. Ennek
ellenére statisztikai elemzéseket végeznek, és a hiányosságok ellenére hasznos információkat
szereznek. A levont következtetéseket azonban megfelelően kell minősíteni, ha az
adatgyűjtésben nem sikerül elérni a legmagasabb színvonalat. Az elmélet alkalmazásához
szükséges összes összetevő biztosításával járó nehézségek nem indokolják azt a hozzáállást,
hogy egy ilyen elmélet létezése irreleváns.
Az 1. fejezet átfogó jövőképünk néhány alapvető jellemzőját tárgyalja, mint például a
szubjektivitás, az objektivitás, a végtelenség és a hasznosság szerepét a statisztikai
elemzésekben. A statisztikai következtetés elméletének kidolgozásakor gondosan meg kell
határozni azokat a problémákat, amelyekre az elméletet alkalmazni kell. Mint ilyen, az elmélet
alkalmazási területe rendelkezésre áll, nevezetesen, hogy mi minősül statisztikai problémának,
és melyek azok az összetevők, amelyeket a statisztikusnak meg kell határoznia a statisztikai
elemzés elvégzéséhez. Ebben a fejezetben egy egyszerű példát mutatunk be egy statisztikai
elemzésre, amely megfelel a kritériumoknak. A 2. fejezet a valószínűség jelentését és a
valószínűségre vonatkozó különböző álláspontokat veszi figyelembe. Ez a téma áll a
középpontjában sok nézeteltérések a statisztikákban, és a szerző azt állítja, hogy számos ésszerű
módon gondolkodni valószínűségét. Valójában nincs olyan állítás, amely a valószínűség egyik
megközelítésének helyességére vonatkozna a többiekkel szemben. Az itt bemutatott statisztikai
következtetés elmélete alapvetően független ezektől az értelmezéstől, bár a valószínűségeket
hozzárendelve, a hit mérésének tekintik őket. A 3. fejezet az ügy lényegének megvitatását kezdi
meg, nevezetesen a statisztikai bizonyítékok fogalmának kezelésére tett kísérleteket. Ez a
fejezet azt mutatja, hogy bár számos következtetési elmélet említést tesz a statisztikai
bizonyítékokról, nem határozzák meg megfelelően, hogy mi az, vagy ami még fontosabb,
hogyan kell mérni. Továbbá, ez a kudarc vezet anomáliák ezeket az elméleteket. A 4. fejezetben
a statisztikai bizonyítékok mérésére módszert dolgoznak ki, és e módszer alapján kidolgoznak
egy következtetéselméletet. Ez az elmélet azon a feltételezésen alapul, hogy a statisztikai
elemzéshez kiválasztott összetevők helyesek. Az 5. fejezet azt tárgyalja, hogy a statisztikus
hogyan kell kiválasztani a statisztikai probléma összetevőit, és hogyan kell ellenőrizni ezeket a
választásokat, hogy azok helyesek-e egy alkalmazásban. Természetesen a helyesség jelentése
ebben az összefüggésben jelentős vitát igényel. Fejlődésünk egyik kulcspontja, hogy a
következtetés elmélete és alkalmazása logikailag elkülönül az ellenőrzési fázistól, és ezeket
nem szabad megzavarni, mivel a problémák meglehetősen eltérőek. A gyakorlati alkalmazások
esetében az 5. fejezetnek meg kell előznie a 4. fejezetet, de ebben a szövegben a hangsúly a
statisztikai bizonyítékok mérésén van. A 6. fejezet összefoglalja a szöveget, és rámutat a
további lehetséges fejleményekre.
Természetesen, amit itt támogatnak, az nem teljesen elválik attól, amit mások megvitattak.
Valójában a szerző úgy írná le a statisztikai következtetés relatív hitbeli megközelítésének
lényegét, hogy egyszerűen óvatos a Bayes-tényező meghatározásával és használatával
kapcsolatban. Továbbá, sok hasonlóság van a tiszta valószínűség elmélettel, és a relatív hit úgy
írható le, mint a szerző szempontjából az elmélet logikai hiányosságainak kitöltése. A
frequentista megközelítés kulcsszerepet játszik, nem a következtetések meghatározásában,
hanem az összetevők alkalmasságának ellenőrzésében, valamint a következtetések optimális
tulajdonságainak biztosításában.
A szerző kizárólagosan felelős minden hibáért és mulasztásért. Köszönet jár sokaknak.
Különösen Luai Al-Labadi, Zeynep Baskurt, Shelly Cao, Zvi Gilula, Irwin Guttman, Gun Ho
Jang, Shaocheng Liu, Hadas Moshonov, Saman Muthuku- marana, Mohammed Shakhatreh,
Tim Swartz és Tianli Zou voltak a szöveg tartalmával kapcsolatos kiadványok társszerzői, és
kulcsfontosságú hozzájárulásokat tettek. Irwin Guttman bemutatott a Bayes-i következtetésnek,
és ez nagy hatással volt rám. Gun Ho Jang számos ötletes megoldáshoz járult hozzá a technikai
problémákra. A kézirat számos olvasója értékes inputot nyújtott, köztük Stephen Marsh és Yang
Guan Jian Guo diákok. Keith O'Rourke sok hasznos javaslatot tett. A bírálók értékes
visszajelzéseket is adtak, és a szerző különösen szeretne köszönetet mondani Jay Kadane-nak
és David Nott-nak. A statisztikai következtetés alapjaival kapcsolatos problémák iránti
érdeklődésemet D. A. S. Fraser professzor ösztönözte, és hálás vagyok ezért, és azért is, hogy
bennem tápláltam azt a hitet, hogy ezek a problémák megoldhatók.
1. Statisztikai problémák
1.1. Bevezetés
Ez a könyv a statisztikai bizonyítékok méréséről szól. Pontosabban a statisztikai bizonyítékok
meghatározását a statisztikai probléma összetevői alapján javasolják a statisztikus által
meghatározottak szerint. Ennek a meghatározásnak a közvetlen következménye a statisztikai
következtetés elmélete, amely néhány egyedi és vonzó tulajdonságot tartalmaz.
A laikus olvasó számára meglepő lehet, hogy a tudományos szakirodalom nem oldja meg, hogy
pontosan hogyan kell mérni a statisztikai bizonyítékokat. A legtöbb ésszerűen számmal
rendelkező egyén találkozott a p-értékek, a standard hibák stb. fogalmával, és megérti, hogy
ezek a fogalmak központi szerepet játszanak a statisztikai problémák érvelésében, és hogy
valami közük van a statisztikai bizonyítékok jellemzéhez. Mégis tény, hogy a tapasztalt, profi
statisztikusok meglehetősen drámaian nem értenek egyet a statisztikai összefüggésekben az
érvelés helyes módjáról.
A következtetés különböző megközelítéseinek vizsgálatakor látni fogjuk, hogy általában nem
határozzák meg pontosan, hogy mi a statisztikai bizonyíték. Ez jelentős mulasztásnak
tekinthető. Valójában véleményünk szerint a statisztikai következtetés bármely érvényes
elméletének pontosan meg kell határoznia, hogy mit jelent a statisztikai bizonyíték. A
statisztikai bizonyítékok meghatározásának a statisztikai következtetés elméletének magjaként
kell szolgálnia, és alapvetően meg kell határoznia a statisztikai problémák megoldásának
módját, nevezetesen a statisztikai bizonyítékoknak meg kell mondaniuk, hogy mi a probléma
megoldása.
A statisztikai bizonyítékok meghatározására vonatkozó javaslatunkat a 4. Minden ilyen
meghatározás egy statisztikus által meghatározott statisztikai probléma összetevőin alapul.
Tehát a jelenlegi fejezet arra foglalkozik, hogy megvitassák, hogy pontosan mit jelent a
statisztikai probléma, és milyen összetevőket kell meghatároznia a statisztikusnak. Ez arra
késztet minket, hogy kizárjunk bizonyos problémákat és összetevőket, amelyeket mások inkább
belefoglalnak. Azzal védekezünk, hogy megközelítésünk a gyakorlatilag értelmes statisztikai
problémák túlnyomó többségét lefedi, és hogy a kirekesztőség miatt sok felesleges bonyolultság
és kétértelműség megszűnik. Mindenekelőtt célunk a statisztikai következtetés logikus és teljes
elmélete, amelynek gyakorlati jelentősége van, nem pedig valamiféle matematikai általánosság.
Valójában az a véleményünk, hogy a matematikai általánosságra tett kísérletek gyakran
félrevezetik a megfelelő statisztikai érvelést.
A valószínűség kulcsfontosságú fogalom a statisztikai következtetés bármely elméletében. Ez
olyan fontos, hogy a 2.
1.2. Statisztikai problémák
Az első megválaszolandó kérdés: mi a statisztikai probléma? A következő példa az archetipikus
statisztikai problémának nevezhető problémát jellemzi. Az ebben a szövegben szereplő vita az
ilyen problémák és közeli hozzátartozók megfontolására korlátozódik. Azzal érvelünk, hogy
ilyen korlátozásokra van szükség, sőt, a kérelmek túlnyomó többségében érvényesek.
1.2.1. példa. Az archetipikus statisztikai probléma.
Tegyük fel, hogy van egy #(Ω) <∞ Ω populáció, ahol a #(A) az A halmaz számosságát jelöli.
Tehát Ω csak egy véges objektumhalmaz. Továbbá tegyük fel, hogy van egy X:Ω→X mérés.
Az X mérés az X halmaz értékeit figyelembe vevő Ω definiált függvény. Tehát X(ω)X a Ω
ωtárgy mérése.  Például, Ω lehet a készlet az összes diák beiratkozott egy adott iskolában
és X ( ω ) a magassága centiméterben a diákok ω . Tehát ebben az esetben az X az R1
részhalmaza. Egy másik példaként Ω lehet az adott iskolába beiratkozott összes tanuló
halmaza, és X ( ω ) = (X1(ω ) ,X 2 (ω ) ) , ahol X1(ω ) a t a n u l ó i ω centiméterben és X 2 ( ω )
a hallgatói ω neme, így ebben az esetben X az R1×{ M , F } részhalmazának tekinthető.
Ha figyelembe vesszük a változó, mint a magasság, gyakori, hogy kezelje ezt, mint esetleg
figyelembe egy folyamatos értéktartományban, és lehetővé teszi a halmaz lehetséges értékek
határtalan. Bár ez ártalmatlannak tűnhet, amint azt az 1.4. szakasz is érvelte, óvatosnak kell
lennünk, amikor a végtelenségeket használjuk a statisztikai problémák megvitatására. Mint
ilyen, mivel a véges Ω, a véges pontosság, amellyel a magasság méréseket végeznek, és az a
tény, hogy a mérések fordulnak elő az ismert határokon belül, X lehet venni, hogy a halmaz az
összes lehetséges értékek X ( ω ) , és ez egy véges halmaz. A végtelen halmazokat az 1.4.
szakasz mutatja be a statisztikai problémák közelítésekor.
A statisztikai probléma alapvető célja az X relatív frekvenciaeloszlása Ω felett. Az A⸦X
részhalmaz esetében az A relatív gyakoriságát a
Tehát r X ( A ) csak azoknak az elemeknek az aránya Ω, amelyek X mérése A-ban van.

Nyilvánvaló, hogy a relatív frekvenciaeloszlás ismerete egyenértékű a relatív
frekvenciafüggvény ismeretével
xX esetében, mivel az egyik a másikból nyerhető. Figyelje meg, hogy a frekvenciaeloszlás az

X halmaztól függetlenül van meghatározva.
Ha el tudjuk végezni a népszámlálást, ahol X - e t ( ω ) kapunk minden egyes ω Ω,  akkor
a z f X pontosanismert, és statisztikai szempontból nincs mit tenni. Természetesen a statisztikák
pontosan azért léteznek témaként, mert legalább általában gazdaságtalan a népszámlálás
lefolytatása, és általában lehetetlen ezt megtenni. Néha a statisztikai problémákat úgy fejezik
ki, hogy az f X bizonyos aspektusáról akarnak tudni, nem pedig magáról az fX-ről. Ha például X
valós értékű, akkor érdekelheti az átlagos
relatív frekvenciaeloszlás, vagy talán más jellemző fX. Természetesen nincs semmi baj
összpontosítva néhány jellemzője fX,de tudva fX jelent teljes statisztikai információkat. Mint
ilyen, ki fogjuk fejezni a vitát szempontjából ismeri az igazi fX .
A statisztika alapvető kérdése tehát a valódi f X-rőlszóló részleges információkalapján, hogyan
következtethetünk az igazi fX-re? Természetesen egyértelművé kell tenni, hogy mit jelent a
részleges információ, és a későbbi szakaszok ezt megteszik, de minden statisztikai probléma
részeként ott vannak a megfigyelt adatok x1=X(ω 1 ),... ,xn=X(ωn) ahol {ω 1 ,... ,ωn}⸦Ω
valamilyen módon a lakosságból választják ki.
Ne feledje, hogy az 1.2.1 példában nincsenek végtelenségek, és mindent egyszerűen a számolás
szempontjából határoz meg. A valószínűségről sincs szó. Van azonban egy nagy
bizonytalanság, hogy fX ismeretlen anélkül, hogy a népszámlálás. Ez az az alapvető
bizonytalanság, amely minden statisztikai probléma középpontjában áll.
Kétségtelen, hogy az 1.2.1. példa nagyon korlátozónak tűnik, de számos módja van annak
általánosítására anélkül, hogy megsértené annak alapvető jellemzőjét, hogy minden véges és
számlálással elérhető. Például több véges populációt tekinthetünk 1 Ω,... ,Ωm megfelelő
mérésekkel X 1 ,... ,Xm és relatív frekvenciafüggvények fX1,... ,fXm, majd megvitatják, hogy
összehasonlítások közöttük. Az úgynevezett mérési hibaproblémáknak az 1.2.1. példához való
viszonyát, valamint a végtelenség és a folytonosság használatát a statisztikai modellezésben az
1.4. szakasz vizsgálja.
Talán a legfontosabb, hogy az 1.2.1. példa általánosításaként merülnek fel olyan problémák,
amelyekben az érdeklődés a változók közötti kapcsolatokkal kapcsolatos. A változók közötti
kapcsolat fogalma a feltételes relatív frekvenciaeloszlás fogalmán alapul. Tegyük fel, hogy egy
populáción két X és Y mérés van meghatározva, Ω (X( ω ) , Y ( ω ) ) X . Az Y feltételes
relatív gyakoriságfüggvénye X=x-re van meghatározva, majd (x,y) X-re 
amikor #({ω:X ( ω ) = x } ) = 0 vagy ezzel egyenértékű f X ( x ) ≠ 0. Figyeld meg ezt. fY| X ismét
egyszerű számlálással nyerhető, és az f(X,Y) elágazás és az fX marginális relatív
frekvenciafüggvény együttes relatív frekvenciájábólnyerhető. Az alábbiak a feltételes relatív
gyakoriságot használják, és a statisztikák legfontosabb alkalmazását jelentik.
1.2.2. példa. Változók közötti kapcsolatok.
Tegyük fel, hogy van egy mérés ( X , Y ):Ω→X ésaz érdeklődésünk az, hogy van-e kapcsolat az
X és Y változók között. Van egy alapvető meghatározása, hogy mit jelent a változók, hogy
kapcsolódnak.
1.2.1. meghatározás. Az X és Y változók, amelyeket a populációs Ω határoznak meg, akkor
rokon változók, ha egyesek esetében. x2 olyan, hogy fX(x 1 )≠0 és f X (x2)≠0, majd fY| X(∙|x1)≠fY|
X(∙| x2).
Tehát két változó kapcsolódik egymáshoz, ha a kondicionáló változó megváltoztatása a másik

változó feltételes eloszlásának megváltozását eredményezheti. Ne feledje, hogy egyértelműen
az a helyzet, hogy nincs kapcsolat, ha az összes feltételes eloszlás azonos; valójában ez
egyenértékű a változók statisztikai függetlenségével. Általánosságban elmondható, hogy a
kapcsolat formáját az adja meg, hogy fYhogyan | X(∙| x) x-ként változik. Gyakorlati szempontból
legalábbis formálisan a legtöbb változó ezzel a meghatározással kapcsolódik, mivel
valószínűtlennek tűnik, hogy ezek a feltételes eloszlások mindig azonosak lesznek. De az X és
Y közötti kapcsolat nagyon gyenge lehet, és a változások irrelevánsnak tekinthetők a szóban
forgó alkalmazás szempontjából.
Gyakori a statisztikai alkalmazásokban, hogy különböző feltételezéseket kell tenni az fY|
formájáról X(∙| x). Például egy regressziós feltételezés azt mondja, hogy egy real
felbecsülhetetlen értékű Yesetében legfeljebba feltételes
változnak, ahogy változik x. Gyakran lineáris regressziós feltételezést is feltételeznek, ha

feltételezzük, hogy μY az x függvények bizonyos véges lineáris fesztávjában van,
nevezetesen azYLμ,ahol a vi {X (,..., ω ): ω Ω}. Természetesen ezek feltételezések, és az 5.
fejezet módszereire van szükség annak megállapításához, hogy van-e értelme ezeknek egy
alkalmazásban. Valójában a regressziós feltételezések akkor a legértelmesebbek, ha az Y az
1.4.
Bár gyakran kifejezzük a fogalmakat az archetipikus statisztikai probléma szempontjából, látni
fogjuk, hogy ezek sokkal általánosabban alkalmazandók. Az 1.3. szakasz különösen fontos e
tekintetben.
1.3. Statisztikai modellek
A statisztikák alapvető problémája abból adódik, hogy a népszámlálás nem végezhető el, így
az olyan relatív gyakorisági eloszlások, mint az fX az 1.2.1. Ne feledje, hogy mivel Ω véges,
és mivel az X minden egyes összetevője véges pontossággal van határolva és mérve, csak
végesen sok lehetőség van az fX-re. Ha például #(Ω)=104, X( ω ) centiméterben rögzített
magasság, és minden magasság (0300], akkor az fX véges többségű, lényegesen kevesebb, mint
10 4×300. A lényeg itt az, hogy az fX lehetőségei végesek.
Számos statisztikai probléma esetén a statisztikus hajlandó feltételezni, hogy az fX korlátozott
relatív gyakorisági függvényekben van. Ezeket a lehetséges függvényeket egy változó θ,az
úgynevezett modellparaméterrel indexeljük, amely egy halmazértékeket vesz fel, Θ, az
úgynevezett modellparaméter-teret, hogy megkapjuk a {fθ:θΘ}statisztikai modellt. Tehát
fX{fθ:θΘ} és vegye figyelembe, hogy ezen a ponton Θ véges. Ennek megfelelően a valódi
relatív frekvenciafüggvény helyett a modellparaméter valós értékéről beszélhetünk, mivel
feltételezve, hogy van egy egyedi érték θtrueΘ, hogy fθtrue=fX.
Általánosságban elmondható, hogy a modell paraméter ψ ψ=Ψ ( θ ) néven definiálhatjuk,
ahol Ψ:Θ→ a Ψ, és a kényelem érdekében a Ψ szimbólumot használjuk mind a funkcióhoz,
mind a tartományhoz. Tehát van egy igaz érték ψ, amit ψtrue=Ψ ad m e g . ( θ igaz).
Általánosságban szeretnénk következtetéseket lekötni egy érdekes paraméterről ψ (ami θ
lehet, ha Ψ vesszük, hogy az identitás), és a θ minden olyan aspektusára hivatkozunk, amely
megkülönbözteti az értékeket a Ψ−1{ψ} értékeket kellemetlen paraméterekként. Egy egyszerű
példát mutatunk be.
1.3.1. példa
Tekintsük a választásra jogosultak Ω, ahol #(Ω)=csille. Berc2021+
20 000 és X ( ω ) = 1, ha ω a következő választáson szavaz, és X ( ω ) = 0, egyébként. Tehát
összesen pontosan 20 001 különböző lehetőség van az f Xs z á m á r a . Tegyük fel azonban, hogy
ismert, hogy legalább 5000 és legfeljebb 15 000 választópolgár fog valóban szavazni, ahol ez
az információ a választások múltbeli nyilvántartásán alapul. Tehát megjegyezve, hogy az
1/20,000=5×10−5statisztikai modellt {f θ :θ  Θ}
θ  Θ={0,25000,0,25005,0,25010,...,0,75000} adja meg, ahol f θ ( 1 ) = θ és f θ ( 0 ) = 1−θ .
A θ modellparaméter helyett a ψ = Ψ ( θ ) = θ / ( 1 − θ ) szorzóparaméter érdekelheti, ahol a
tartomány {0,25/(1−0,25),0,25005/(1−0,25005) ,... ,0,75/(1−0,75)}. Ebben az esetben Ψ 1-1,
így nincsenek kellemetlen paraméterek.
Számos következtetési kísérlet merül fel, amikor önkényes ψ= Ψ(θ)következtetéseket
kellfelhozni. Ezt a kellemetlen paraméter problémájának nevezik.
Fontos megjegyezni egy statisztikai modell, hogy ha nem tartalmazza az összes lehetséges
eloszlást, {fθ:θΘ} egy feltételezés, és mint ilyen, helytelen lehet, mert fX/{fθ:θΘ}. Ahogy
az várható volt, amikor a statisztikai elemzés helytelen feltételezéseken alapul, akkor meg kell
kérdőjeleznünk az elemzés érvényességét. Ha igen, miért nem mindig {f θ:θΘ} kell az összes
lehetséges eloszlás halmaza? Természetesen az 1.3.1. példában egyszerűnek tűnik elkerülni a
feltételezéseket.
Számos oka van annak, hogy a modell feltételezések készülnek. Az első és legfontosabb az,
hogy lehet határozott információ formájáról fX, és ez az információ vezet jobb
következtetéseket, ha igaz. Másodszor, és talán a leggyakoribb az, hogy nagyon bonyolult
helyzetekben modellfeltevéseket tesznek az elemzés egyszerűsítésére, és úgy érzik, hogy az
ilyen egyszerűsítések által bevezetett hiba nem lesz lényeges hatással a levont
következtetésekre. Például az 1.2.2. példában nagyon valószínűtlennek tűnik, hogy a
regressziós feltételezés valaha is pontosan megállja a helyét. De talán az eltérés ettől a
feltételezéstől olyan kicsi, hogy lényegtelen, míg a hozzáadott egyszerűség csak a feltételes
középút vizsgálata a kapcsolat nagy haszonnal jár.
Fennáll azonban annak a lehetősége, hogy az {f θ:θΘ} modell súlyosan hibás lehet. Ezért meg
kell fontolni, hogyan lehet ezt egy statisztikai elemzés részeként értékelni és kezelni. Ezt
részben az 1.5. szakasz tárgyalja, és az 5.
1.4. Végtelenség és folytonosság a statisztikában
Eddig minden bevezetett készlet véges volt. Meggyőződésünk, hogy ez a végesség a statisztikák
gyakorlati alkalmazásában is jelen van. Végtelen készletek lehet használni részeként
egyszerűsítő közelítés, de annak tudatában, hogy ez hozhat magával értelmezési problémákat,
amelyek vezethet minket tévútra, ha nem vagyunk óvatosak. Tekintsük a következő példát.
1.4.1. példa. Valószínűségi függvények.
Az f θ valószínűségi sűrűség az f θreleváns halmazok fölé történő integrálásával Ρθ
valószínűségi mérést eredményez X-en. Tegyük fel, hogy az xX adat az {f θ:θ Θ}modell
egyikvalószínűségi eloszlásábólszármazik. Most szeretnénk következtetni az igazi θ Θ.
Ilyen helyzetben általában a valószínűségi függvényen alapuló módszerek ajánlottak.
1.4.1. meghatározás. Az x megfigyelt adatok és a {fθmodellesetében aθΘ}, a valószínűségi
függvény az L függvény ( ∙ | x):Θ→[0,∞) L(θ|x)=k f θ ( x ) bármely rögzített k>0 esetében.
A valóságban a valószínűségi függvény a függvények ekvivalenciaosztálya, mivel a k állandó
tetszőleges, és a kényelem érdekében választható. Ez a határozatlanság nem okoz problémát,
mert a valószínűségi következtetések csak a valószínűségi értékek arányától függenek.
A valószínűségi függvény figyelembe vételének motivációja abban rejlik, hogy azt mondjuk,
hogy az1. θlegalább olyan előnyös (a θ valós értékére vonatkozó tipp vagy következtetés), mint
a2. θ, amikor az L valószínűségi arány (θ1| x)/L(θ2|x)≥1. Ez teljes preferenciarendelést ír elő a
Θ. Ez a valószínűségi preferencia-rendelés akkor természetes, ha az egyes eloszlások
diszkrétek, mert
az x megfigyelés valószínűségének aránya, ha θ1 igaz az x megfigyelésének valószínűségére,

ha θ2 igaz. Tekintettel arra, hogy x-et figyeltünk meg, természetes, hogy előnyben részesítjük
azokat a θ értékeket, amelyek nagyobb valószínűséggel adnak nagyobb valószínűséget a
megfigyelt adatoknak.
Abban a helyzetben, amikor folyamatos valószínűségi eloszlásokat alkalmazunk, tegyük fel,
hogy jelenleg X euklideszi, Nε(x) egy nyitott golyó, körülbelül x sugarú ε és f folyamatos és
pozitív x minden θ. Ha vol(A) az A⸦X euklideszi térfogatát jelöli, akkor
0. ε→,mivel P θ( N ε ( x ) ) / f θ ( x ) V o l ( N ε ( x ) ) → 1, mint ε → 0. Így a kis ε

és ismét a valószínűségi arány tekinthető az x megfigyelésének valószínűségének
összehasonlítására. Mint ilyen, a valószínűség preferencia rendelés van értelme a folyamatos
összefüggésben is.
De vegye figyelembe a fő feltételezés ebben az érvben, nevezetesen, hogy f θ folyamatos x
minden θ. Ha gθ egy másik integrábilis függvény, amelylegfeljebb a 0 térfogatmérő
halmazoneltér az fθ- tól, akkor Ρθ(Α)=∫Afθ(z)dz=∫Αgθ(z)dz minden A Borel halmazra. Tehát a gθ
ugyanolyan könnyen szolgálhat a Ρ θ sűrűségeként. Mint ismeretes, az f θ megszámlálhatóan
sok ponton módosítható, hogy érvényes g θ sűrűséget kapjunk, és nem szükséges minden x-nél
folyamatos sűrűséget használni, legalábbis a valószínűségek kiszámításához.
Most ez az anomália tekinthető kisebb irritáció, de fontolja meg a gyakorlati összefüggésben.
Ilyen helyzetben az X értékét véges pontossággal mérik, és mint ilyen, minden x-es koordináta
racionális szám. A racionális koordinátákkal rendelkező x e X halmaz szükségszerűen
megszámlálható, így a gsűrűség θ Ρθ úgy választható, hogy gθ(z)=0 (vagy más állandó) minden
racionális koordinátával rendelkező z-re. ['Ezért, ha ilyen g θ használunk a valószínűségi
függvény meghatározásában, minden ténylegesen megfigyelt adat esetében x esetében a
valószínűség azonosan 0, és a valószínűségi sorrend nem tesz különbséget a θ között.
Nyilvánvaló, hogy ez abszurd, hacsak nem hisz a valószínűségi preferencia-sorrend
relevanciájában.\n']
Az 1.4.1. példában a folytonos modellekkel kapcsolatos dilemmából az egyik kiút az, ha
egyszerűen azt követeli, hogy a valószínűség meghatározásában a sűrűségek minden xX-nél
folyamatosak legyenek. De az alkalmazás milyen aspektusa jelent ilyen korlátozást?
Számunkra ezt a korlátozást az a tény szabja meg, hogy egy statisztikai alkalmazásban minden
halmaz véges, és végtelen halmaz használata esetén ez egy véges objektumhoz való közelítés.
Ha ezt a közelítési szempontot figyelmen kívül hagyják, akkor abszurditások merülhetnek fel,
mint az 1.4.1. Haf θ(x) tetszőlegesen meghatározható a 0-s mérőszám halmazán, ami
matematikailag minden bizonnyal elfogadható, ha a sűrűségeket ugyanúgy matematikai
objektumokként vesszük figyelembe, akkor a közelítés fogalma elvész.
A statisztikai elmélet különböző kezelései végtelen készleteket kezelnek a valóságot képviselő
alapvető összetevőkként. Az itteni fejleményekhez azonban, miközben a végtelen halmazokkal
rendelkezésre álló hasonlatokat szeretnénk kihasználni, feltételeket kell szabni az ilyen
objektumokra annak biztosítása érdekében, hogy azok megfelelően viselkedjenek a valójában
véges entitásokhoz való közelítésként. Ezért a sűrűséget határértékként fθ meghatározni. Az
1.4.1. példában például minden xX esetében
mivel ez biztosítja, hogy Ρθ(Νε(x))≈fθ(x)Vol(Nε(x)) kis ε. A sűrűség meghatározását

általánosabban az A. függelék tárgyalja, de meg kell jegyezni, hogy ha létezik f θ x-nél
folyamatos változata, akkor azt az (1.1) adja meg. Ez a szokásos reprezentatív sűrűséghez vezet,
és általában az eloszlásfüggvény megkülönböztetésével kiszámított sűrűség kielégíti (1.1.).
Minden alkalommal, amikor sűrűséget használnak, feltételezzük, hogy ez egy sűrűség az adott
tér térfogatméréséhez képest (a számlálási mérték diszkrét halmazokon mért térfogat), és hogy
a sűrűség az (1.1) határértékként keletkezik; lásd az A. függeléket.
Ébernek kell lennünk annak biztosítása érdekében, hogy a matematikailag általánossá
esztendősségre tett kísérletek ne vezessenek be abszurditásokat a következtetések vitáiba. A
matematikának úgy kell szolgálnia fejlődésünket, hogy lehetővé teszi számunkra, hogy
pontosak legyünk a fogalmakkal kapcsolatban, ahelyett, hogy elvont halmazelméleti
koncepciót erőltetünk arról, hogy mi a statisztika mint tantárgy. Mint ilyen, ha olyan ellenmintát
mutatnak be, amely belsőleg a végtelentől függ, akkor az ellenminta relevanciája
megkérdőjelezhetőnek tűnik. A következő egy hírhedt példa, amelyet gyakran említenek a
bayesi következtetési módszertan paradoxonaként.
1.4.2. példa. Egyenruhás perjelek.
Tegyük fel, hogy van egy populáció Ω, ahol #(Ω)=N nagyon nagy, és egy X mérés úgy, hogy
X(ω)=1, ha ω rendelkezik valamilyen érdekességgel és X(ω)=0 egyébként. Ezután X={0,1} és
fX(1) azoknak az egyéneknek az aránya Ω, amelyek rendelkeznek a jellemzővel. Ha θ az
ismeretlen arányt jelöljük, akkor fX(x)=fθ(x) írhatunk, ahol fθ(x)=θx(1−θ)1−x xX esetén. Most
már világos, hogy θ az m/N alak töredéke. Ennek a helyzetnek a statisztikai modellje tehát
{fθ:θΘΝ} aholΘΝ={0,1/N,(N−1)/N,1} és ez tartalmazza az egyetlen megfigyelt x=X(ω)
összes lehetőséget. Az 1.5.1. példában egynél több megfigyelés modelljét tárgyaljuk.
Amint azt megvitatjuk, a θ valódi értékével kapcsolatos bizonytalanság azt eredményezheti,
hogy valószínűségi eloszlást helyezünk el Θ N-en, amely hiedelmeket fejez ki arról, hogy mi a
valódi érték. Ez lehet például egy N ∏ egyenletes eloszlás az N Θ, hogy minden lehetséges θ
1/(N+1) valószínűséggel rendelkezik. Mivel N nagy, úgy gondolhatjuk, hogy ezt az eloszlást a
Θ=[0,1] intervallumban Π egyenletes eloszlással közelítjük meg. Tehát a modell kibővül olyan
eloszlásokkal, amelyekről ismert, hogy helytelenek, de ez nem érzékelhető jelentős hibák
létrehozására az elemzésben, ha N nagy. i{0,1,...,N} akkor
Most tegyük fel, hogy ahelyett, hogy a modell eloszlásait θ indexelnénk, ψ=Ψ(θ)=θ2-
t
használunk. A ψ valószínűségi sűrűsége pψ(ψ)=1/(2√ψ), ha ψ[0,1] és 0 egyébként. Gyakran
állítják, hogy ez ellentmondást jelent a valószínűség kezdeti hozzárendelése szempontjából,
mivel a ψ eloszlása már nem egységes, de a ψ ismerete egyenértékű a θ ismeretével. De fontolja
meg a véges eloszlás közelítését. Természetesen ψΨN={0,1/N2,22/N2,(N−1)2/N2,1} és vegye
figyelembe, hogy ezek a pontok már nem egyenlőek-egymástól el vannak határva, és 0 felé
tömörülnek. De azt is vegye figyelembe, hogy
és az 1/(2√ψ) tényező pψ egyszerűen igazodik az a tényhez, hogy az átalakulási Ψ a

hosszúságokat különböző ütemben módosítja az intervallumban [0,1]. Más szóval, a folyamatos
ψ egységességének hiánya egyszerűen egy olyan műtárgy, amely a diszkrét eloszlást egy
folyamatossal közelíti meg. Ha a közelítést figyelembe vesszük, nincs ellentmondás vagy
paradoxon.
Természetesen ez a magyarázat megköveteli, hogy a korábbi valószínűségek kezdeti
hozzárendelése megfeleljen a valódi hiedelmeknek. Következtetésünk az, hogy amikor a
modell véges természetét figyelembe vesszük, a hiedelmek megfelelően átalakulnak az
átalakulások során.
Az 1.4.2. példában az egységes előzmény meghatározásával kifejezett aggodalom egyszerűen
a végtelen halmazok statisztikai kontextusba való helytelen alkalmazásával kapcsolatos.
Lényegében abból adódik, hogy egy végtelen tárgyat a statisztikai alkalmazás alapvető
aspektusának tekintünk, és az itt folytatott vitánkhoz ez nem helyes. Természetesen számos más
kifogás is felmerült a korábbi forgalmazások alkalmazásával kapcsolatban. Ezek közül
néhányat a következő szakaszban tárgyalunk.
A folytonos szóközökkel rendelkező modellek megfontolása mellett gyakran adott érv a
következő példán alapul.
1.4.3.példa . Mérési modellek.
Fontolja meg egy objektum hosszának mérését. Ebből a célból van egy mérőeszköz, amely az
X mérést előírt pontossággal biztosítja. Tegyük fel, hogy ez a pontosság centiméterben van.
Minden mérőeszköznek vannak határai az általa rögzíthető értékeken, így az X lehetséges
értékeinek X halmaza véges.
Most, mint egy gondolatkísérlet, képzeld el, hogy N méréseket az objektum, ahol N nagyon
nagy, sokkal nagyobb számú méréseket, mint valaha is elképzelhető, hogy venni, bár még
mindig véges. Természetes, hogy a különböző tényezők miatt a rögzített mérések változni
fognak. Ha az N méréseket ténylegesen megfigyelték, akkor ez relatív frekvenciafüggvényt
eredményez fX. Ne feledje, hogy végesen sok lehetőség van az f X-re, és elképzelhető, hogy
egyszerűen az N mérések elvégzésével ismert. Természetesen az f X ismerete sokat elárul a
mérési folyamatról, és sok szempontból érdekes. Továbbá ésszerű lehet azt feltételezni, hogy
ha nagyszámú mérést végeznek, akkor jó közelítésáll rendelkezésre az f X-hez.
Legyen θ a mért tárgy valódi hosszát ábrázolja. Tekintettel az általunk használt eszközre, ezt a
valódi hosszt centiméterben is rögzítik. Mint ilyen, θX és az fXáltal megadott eloszlás
bizonyos számszerűsítettségére szolgál. Nem világos, hogy melyik kvantitatív θ fog képviselni,
de ésszerű lehet azt feltételezni, hogy θ a medián, és ha tovább hajlandóak vagyunk feltételezni,
hogy fX szimmetrikus, akkor θ az fX átlagais. Ha továbbá feltételezzük, hogykülönböző
objektumok mérése során csak az f X helye és nem az fX formája változik, akkor erre a helyzetre
egy statisztikai modellt adunk fX{fθ:θΘ} ahol fθ(x)=fE(x−θ), fE a mérési hiba relatív
gyakoriságfüggvénye E=X−θ ésθΘ⸦ X. Ennek a formának a modelljét mérési modellnek
nevezik, és nyilvánvalóan ez számos módon általánosítható.
A lényeg itt az, hogy az alap mérési modell egy véges tárgy, amely ismét egyszerű számlálásból
származik. Ehhez a modellhez azonban számos feltételezésre van szükség. Mint ilyen, előnyben
részesítjük az 1.2.1. példát, mint alapvető motiváló példát, amelyre a statisztikai elméletet
építjük. A mérési modellek elemzése még elvégezhető, de az ilyen elemzés alapjául képező
elvek az egyszerűbb és konkrétabb összefüggésekből származnak.
Néha azzal érvelnek, hogy a változó folyamatos modelljének van értelme, mert egyre finomabb
pontossággal lehet elképzelni a mérést. Függetlenül attól, hogy ez igaz-e vagy sem, bármely
adott kontextusban a méréseket előre meghatározott pontossággal kell végezni. Az a tény, hogy
pontosabban meg tudtuk mérni, nem befolyásolhatja elemzésünket.
Végül, nagyon nagy számosság halmazokkal, nem sokat számít, ha egy ilyen halmazt
végtelennek veszünk, és a mért változóktól függően az eloszlásokat folyamatosnak vesszük.
Hogy ezt mikor kell megtenni, az az ítélőképességtől függ, és nem tűnik könnyűnek, hogy
konkrét útmutatást nyújtson. Az előállított egyszerűsítések általában megérik. El kell ismerni
azonban a közelítések szerepét, és nem szabad a következtetés elméletét fejleszteni azáltal,
hogy a végtelen tárgyakat alapvetőnek tekintjük.
Néhányan nem értenek egyet azzal a statisztikai modellel, amely a végtelenségeket
közelítésként kezeli, nem pedig a valóságot képviseli, és így nem fogadja el azt az állításunkat,
hogy ez a korlátozás minden gyakorlatilag értelmes statisztikai problémára kiterjed. El kell
azonban ismerni, hogy minden általános következtetéselméletet alkalmazni kell az itt tárgyalt,
lényegében véges összefüggésekre. Továbbá, egy általános elméletnek meg kell oldania azokat
a következtetési kérdéseket, amelyek az alapvetően véges kontextusban merülnek fel, amint azt
a relatív hit elmélete is látni fogja. Tehát a matematikai általánosság hiányán alapuló relatív
hiedelem elméletének kritikája nem érvényes, kivéve, ha egy általánosabb elmélet, amely ezt is
megvalósítja, bizonyíthatóan létezik. Egyértelműen fontos elkülöníteni a statisztikai és
matematikai kérdéseket, és ez az, amit az alapvetően véges kontextusokra vonatkozó korlátozás
tesz.
1.5. Az empirikus kritika elve
Talán semmi sem gerjeszt több vitát a statisztikákról folytatott vitákban, mint az objektivitás
szó. A Merriam-Webster online szótár a következő meghatározást adja:
objektivitás: az egyik vagy másik oldal iránti kivételezés hiánya.
Ez meglehetősen világosnak tűnik, de a gondos gondolkodás azt sugallja, hogy az objektivitás
pontos meghatározása nehéz és talán lehetetlen is. Például megkérdezhetjük, hogy kire
vonatkozik a "kivételezés hiánya". Ha a tudós részt vesz egy vizsgálatban, akkor nem világos,
hogyan lehet valaha is azt mondani, hogy a tudományos vizsgálatot objektíven végezték, és
nem befolyásolták a tudós szubjektív véleménye. Valójában úgy tűnik, hogy a legjobb
tudományos munkát nagyban befolyásolja a tudós személyes véleménye és meglátása arról,
hogy mi igaz. A tudományos munka nem egyszerűen a tények objektív vizsgáló általi hideg,
lebemérődéses vizsgálata.
Tagadhatatlan, hogy az objektivitásnak irányadó fényként kell szolgálnia annak
meghatározásában, hogy mi igaznak tekinthető. Az, hogy figyelmen kívül hagyjuk azt a
szerepet, amelyet a szubjektivitás játszik az új ismeretek megszerzésében, legalább félrevezető.
Valahogy olyan megközelítésre van szükség, amely elismeri az objektivitás elsőbbségét az új
ismeretek meghatározásában, ugyanakkor felismeri a szubjektivitás szerepét ebben a
folyamatban. Véleményünk szerint a statisztikák tárgya megfelelő keretet ad a tudományos
vizsgálat ilyen megközelítésének kidolgozásához. Sajnos úgy tűnik, hogy a témával kapcsolatos
statisztikákban folytatott viták nagy része polarizálódik az objektivitás és annak elérésének
irreális nézete és a szubjektivitás erényeinek idealista nézete között. Egy jobb út valahol a kettő
között van.
Úgy tűnik, hogy a legtöbb területen fejleszteni a saját követelmények elfogadására az új
ismereteket. Például a matematikában a deduktív érvelés szabályainak alkalmazásával
következtetéseket von le az adott hipotézisekre oly módon, hogy az érv mások által helyesnek
igazolható legyen. Nem követelmény, hogy a kapott eredményeknek bármi köze legyen a
fizikai valósághoz. A fizikában a szabvány kísérleti ellenőrzést igényel, de azt is megköveteli,
hogy létezik olyan elmélet, amely bizonyos értelemben megmagyarázza a szóban forgó
jelenségeket. Például a sötét anyag létezésére következtetnek, mert enélkül a gravitáció nagyon
sikeres elmélete nem magyarázna meg néhány megfigyelt asztrofizikai jelenséget. Mégis, a
sötét anyag elfogadása kétségtelenül megköveteli a megfigyelését, vagy talán egy mélyebb
elméletet. A statisztikák számos területen kulcsszerepet játszanak annak meghatározásában,
hogy mit fogadnak el tudásként. Ezért egyértelmű meghatározásra van szükség a statisztikai
bizonyítékokról és arról, hogy milyen mértékben lehet objektívnek minősíteni.
Álláspontunk szerint a statisztikai elemzések eredendően szubjektív jellegűek, és ezt nem lehet
elkerülni. Valójában, ha úgy teszünk, mintha az ilyen elemzések objektívek lennének, csak
elvakít minket a benne rejlő hibáktól, mivel például nem adunk egyértelmű meghatározást arról,
hogy mi a statisztikai bizonyíték. Mások, mint például Berger és Berry (1988) hasonló
aggályokat vetettek fel.
Ugyanakkor azonban számos alkalmazásban el kell ismerni az objektivitás erényeit, sőt
szükségességét. Ennek a nyilvánvaló dilemmának az egyik megoldása annak elismerése, hogy
az adatok objektívek lehetnek egy statisztikai elemzésben, és hogy előírják a következő elv
betartását.
Az empirikus kritika elve: Minden összetevőt, amelyet egy statisztikus a statisztikai elemzés
részeként választott, ellenőrizni kell a megfigyelt adatokkal annak megállapítására, hogy van-e
értelme.
Ha például egy statisztikus azt a feltételezést választja, hogy a valódi eloszlás {f θ:θΘ} van, ha
ez a probléma összes lehetséges eloszlásának megfelelő részhalmaza, akkor ezt a megfigyelt
adatokkal összevetni kell annak ésszerűsége érdekében. Ezt modellellenőrzésnek nevezik, és az
5.
Továbbá, ha egy összetevőt olyan statisztikai elemzésben használnak, amelyet nem lehet
összevetni az adatokkal, akkor az ezen alapuló következtetéseket olyan összetevőktől függően
kell minősíteni, amelyeket empirikusan nem lehet ellenőrizni az alkalmasságuk szempontjából.
Véleményünk szerint minden olyan következtetési elmélet, amely eredendően olyan
összetevőktől függ, amelyeket nem lehet ellenőrizni, korlátozott hasznossággal bír, és mint
ilyen, hibás. Az elv alkalmazása, amelynek során minden szubjektív input átmegy az
ellenőrzésen, nem garantálja az objektivitást, de némi vigaszt nyújt, hogy a szubjektív döntések
legalább nem cáfoltak az elemzés objektív aspektusával. Megjegyezzük, hogy az empirikus
kritika elve hasonló Popper (1959) hamissági kritériumához, nevezetesen, hogy a tudományos
elmélet csak akkor érvényes, ha empirikusan tesztelhető.
1.5.1. Az adatok objektivitása
Egyértelműnek tűnik, hogy a statisztikai vizsgálatnak csak egy aspektusa van, amelyről valaha
is azt lehet mondani, hogy objektív, nevezetesen a megfigyelt adatok. Ez nem jelenti azt, hogy
az adatok mindig objektívek. Az adatok csak bizonyos feltételek fennállásakor tekinthetők
objektívnek, és ennek köze van az adatgyűjtés módjához. Tegyük fel, hogy van valamilyen
rendszer vagy folyamat, teljesen független a statisztikustól vagy másoktól, akik önérdekűek a
statisztikai elemzés eredményében, amely xX-et hoz létre. Ez a függetlenség teszi az adatok
objektivitását.
Léteznek ilyen rendszerek? Erre nehéz válaszolni, de a statisztikák nagyban hozzájárulnak
ehhez azáltal, hogy egy véletlenszerű rendszer létezését hirdetik. Lazán szólva, a véletlenszerű
rendszer egy olyan rendszer, amely többször is elvégezhető, minden egyes teljesítmény
kimenetelét egy halmaz {1,... ,N}, amely azt a stabilitási jellemzőt mutatja, hogy az i relatív
gyakorisága az előadások számának növekedésével 1/N-re konvergál, és amely véletlenszerűen
viselkedik a 2.4. Nem lehet kategorikusan kimondani, hogy létezik egy véletlenszerű rendszer,
de hajlandóak vagyunk elfogadni, hogy empirikus megfigyelésen alapulnak. Például, ha az 1-
ről N-re jelölt N póker zsetonokat egy tálba helyezik, alaposan összekeverik, majd anélkül,
hogy megnézné, egy zsetont húznak, és megfigyelik a címkéjét, akkor úgy tűnik, hogy ez a
kívánt jellemzőkkel rendelkezik. Természetesen soha nem garantálható, hogy a gyakorlatban
nincs olyan aspektusa a rendszernek, amely szisztematikus, nem véletlenszerű viselkedést
eredményez.
Egy ilyen rendszer alkalmazható az archetipikus statisztikai problémára, amelyet az 1.2.1. példa
tárgyal, hogy kiválasszon egy részhalmazt {ω1,... ,ωn}⸦Ω, x=(x1,... ,xn)ahol xi=X (ωi)úgy, hogy
minden részhalmaz {ω1,... ,ωn}⸦Ωrendelkezik a kiválasztás lehetőségével. Így gondolhatnánk,
hogy az n méretű Ω részhalmazait az 1, ... ,N, majd egy véletlenszerű rendszer
segítségével válasszon ki egy részhalmazt. A gyakorlatban egyszerűbb a Ω elemeit 1,... ,#(Ω),
majd használjon egy véletlenszerű rendszert, mint a zsetonok a tálban, hogy válassza ki n chipek
a tálból csere nélkül kap a részhalmaz {ω1,... ,ωn}.
Ilyen körülmények között azt lehet mondani, hogy az adatok objektívek, mivel az
adatkiválasztási folyamat ellenőrzése teljes egészében a véletlenszerű rendszeren keresztül
történik. Ezt az állítást erősíti az a tény, hogy minden lehetséges részhalmaznak ugyanolyan
esélye van a kiválasztásra. Figyeljük meg, hogy ha n=1, akkor xX esetén P(X(ω)=x)=fX(x),
és ha n=2, akkor x1;x2Xesetén
és egyértelműen hasonló képlet áll rendelkezésre tetszőleges n≤N. Ebből, ha n<<#(Ω), akkor
x=(x1,...,xn) avalószínűségi eloszlásból származó hozzávetőleges i.i.d. (függetlenül és azonosan
elosztott) minta, f X által megadott valószínűségi függvénylel. Ez az érv az alapja annak a
feltételezésnek, hogy az adatok egy eloszlásból vett i.i.d. mintaként keletkeznek.
Természetesen, ha n nagy képest # (Ω), akkor ez a feltételezés nem lehet tenni, és be kell építeni
a függetlenség hiánya az elemzésbe.
Tekintsük most az 1.4.2.
Példa 1.5.1 Érme dobás.
Tegyük fel, hogy X:Ω→{0,1} és #(Ω)=N nagyon nagy az n-hez képest. Ezután egyértelmű,
hogy az x=(x1,... modellje ,xn) közelíthető meg azzal a modellel, ahol feltételezzük, hogy az x i
i.i. Bernoulli(θ) ésígy
ahol i. Az 1.4.2. példában tárgyalt paramétertér folytonossági közelítése lehetővé teszi a

Θ=[0,1] használatát.
Ez csak a modell érme dobás, de vegye figyelembe a finom különbséget. Nem vesszük az
érmedobálást alapvető példaként a statisztikai elmélet felépítésére. Inkább érme dobálás merül
fel, mint a közelítés egy olyan kontextusban, amely minden tekintetben véges. Továbbá nem
állítják, hogy a tényleges érmedobálás egy véletlenszerű rendszernek felel meg.
1.5.2. A statisztikai modellek szubjektivitása
A bayesi következtetési módszerekkel kapcsolatos gyakori panasz az, hogy nem tudományosak,
mert egy olyan előzményt tartalmaznak, amely egy egyéni statisztikus meggyőződésén alapul.
Nincs érv azzal az állítással, hogy a perjel szubjektív, de van némi nehézsége azzal az állítással,
hogy ez egy ilyen elemzést "tudománytalanná" tesz. Ha ez így van, akkor úgy tűnik számunkra,
hogy gyakorlatilag minden statisztikai elemzés tudománytalan, mivel a statisztikus személyes
döntésein alapul. Ha például az1.2.1. példában az {f θ :θΘ} modellt úgy választják meg, hogy
az pontosan megegyezik az X és #(Ω) alapú összes lehetséges relatív frekvenciafüggvény
halmazával, akkor szubjektív választás történt. Az ilyen döntések nagyon gyakoriak. Továbbá,
amint azt az 1.6. szakasz tárgyalja, a statisztikai elemzések egyéb szempontjait is szubjektíven
választják ki.
A szubjektivitás kérdése véleményünk szerint a vörös hering, mivel ez a statisztikai elemzés
részeként minden alkalommal felmerülő döntések velejárója. Bár az ilyen döntések jól tükrözik
a jó ítélőképességet, az a tény, hogy a szubjektivitás ilyen kulcsszerepet játszik a statisztikai
elemzésekben, az eredmények értelmezésekor figyelmeztető tényezőnek kell lennie. Ahelyett,
hogy a szubjektivitás kontra objektivitás mellett érvelnék, eredményesebbnek tűnik egyszerűen
elismerni, hogy minden statisztikai elemzés szubjektív jellegű, majd az empirikus kritika elvén
keresztül foglalkozik a szubjektivitással kapcsolatos aggályokkal. A statisztikai modellek
esetében ez modellellenőrzést jelent – annak megkérdezése, hogy a megfigyelt x adatok
meglepőek-e a modell minden egyes fθ.
Az 5.2. szakaszban útmutatást ad a modellek kiválasztásáról, és a modellellenőrzést az 5.5.
szakasz tárgyalja. Addig is feltételezzük, hogy a kiválasztott modell megfelelt az
ellenőrzéseken, és így következtetéseket lehet következtetni.
1.5.3. A szubjektív prior
Az {fθ :θΘ}statisztikai modell esetébenaz előző egy valószínűség-eloszlási π Θ, amely tükrözi a
θΘ valódi értékével kapcsolatos hiedelmeket. Ahhoz, hogy ennek értelme legyen, feltételezni
kell, hogy fX{fθ:θΘ}, tehát a modell helyes. Az előzetes is szubjektív választás.
Egyes következtetési megközelítésekben a korábbit az elemző hiedelmeinek koherenciájának
szükséges tükrözésének tekintik; lásd a 2.3.2. Mint ilyen, változatlannak kell tekinteni, mivel
az előző módosítása az adatok alapján következetlen. Ez az álláspont itt nem állja meg a helyét.
Számunkra a prior az empirikus kritika elvének van alárendelve, csakúgy, mint a statisztikus
bármely más döntése.
Természetes kérdés, hogy az empirikus kritika elve hogyan alkalmazható az előzőre. Ha a
modellt elfogadják, akkor természetes, hogy megkérdezzük, hogy a θ valódi értéke meglepő
érték-e az előzőhöz képest. Ha így van, akkor természetesen aggályok merülnek fel az előzetes
elemzésre gyakorolt hatásával kapcsolatban. Természetesen a θ valódi értéke ismeretlen.
Mindazonáltal lehetőség van ilyen ellenőrzésre, és ezt az 5.
Amint azt az 5. fejezet is tárgyalja, a modellellenőrzés tevékenységeinek logikai szétválasztása,
a θ vonatkozó előzetes és következtetés ellenőrzése, a (θ,x) közös eloszlás faktorizálása alapján.
Továbbá van egy logikai sorrend: először ellenőrizze a modellt; ha a modell átmegy az
ellenőrzéseken, akkor ellenőrizze az előzőt, és ha mind a modell, mind az előzetes ellenőrzés
megfelel, folytassa a következtetést θ.
Az 5.3. szakaszban útmutatást adnak a priorok kiválasztásáról, és az előzetes ellenőrzésére
vonatkozó eljárásokat az 5.6. szakasz tárgyalja. Addig is feltételezzük, hogy az előzetest
választották ki, és átment az ellenőrzéseken, és így készen áll arra, hogy a következtetési lépés
részeként használják.
1.6. A közüzem fogalma
A hasznosság fogalma természetesen felmerül gazdasági kérdésekben, és mint ilyen, a
szerencsejátékban, ahol költségek és előnyök merülnek fel. Talán a legkorábbi esemény az
úgynevezett szentpétervári paradoxon kapcsán merült fel. Azt kérdezik, mi a tisztességes ár
fizetni a szerencsejáték, ahol a szerencsejátékos nyer 2 n dollárt, ha az első fej fordul elő az n-
edik dobás egy tisztességes érme. A várható kifizetés ∑n =1∞(2n)(2−n)=∞ dollár, de senki sem
fizethet végtelen összeget, hogy a játék tisztességes legyen. Állásfoglalásként rámutatnak arra,
hogy a növekvő pénzösszegek egyre kevesebb elégedettséget okoznak az összegek
növekedésével, így valójában 2n dollár u(2n ) elégedettségi vagy hasznossági egységeket ad,
ahol u növekvő funkció, amely kielégíti az u"(x)<0- t. Ha például(x)=log2x, akkor a
szentpétervári játék várható segédprogramja megegyezik
∞ −n ∞ −n
∑n=1 u(2 )(2 )=∑n=1 n(2 )=2=log24. Tehát, amikor elfogadja ezt a segédprogram funkciót, az
n
ember feltehetően hajlandó fizetni 4 dollárt játszani a játékot.

Vannak különböző kezelések a statisztikák, ahol a hasznosság kulcsszerepet játszik. Például az
{f θ :θΘ} statisztikai modellhez kapcsolódó mennyiség ψ=Ψ(θ) becslésévelkapcsolatos
problémábanáltalában azt javasolják, hogy az u(θ,a) értéket az a érték hasznossági értékének
mérésének tekintsék ψ, amikor θ igaz. Mivel a ψ valós értéke nem ismert, a megfigyelt x
adatokat d(x) becsléssel a valós érték becslésére használják. Természetesen egy jó becslő teszi
a közüzemi u(θ,d(x)) nagy minden θ és x. Ha θ előzetes π van, akkor a (θ,x) közös eloszlása
a π(θ)fθ(x) által megadott. Ezután a várható hasznosság maximalizálásának elvére hivatkozunk,
hogy olyan d becslőt válasszunk, amely maximalizálja a várható E közüzemi
kapacitást.(u(θ,d(x))), ahol E a (θ,x) közös eloszlására vonatkozó várakozásra utal. A d, amely
maximalizálja a várható segédprogram nevezik Bayes szabály. A statisztikai problémákra
irányuló megközelítés axiomatikus fejlesztését a 2.3.5.
Sok probléma van értelme beszélni szempontjából veszteségek helyett közművek és a veszteség
funkció L (θ,a) képviseli a veszteséget merült fel, amikor becslése Ψ(θ) a. Ha például Ψ valós
értéken értékelik, gyakran használják az L(θ,a)=(Ψ(θ)−a)2veszteséget, amelyet négyzetes
hibaveszteségnek neveznek. Természetesen kívánatos a lehető legkisebb veszteségeket okozni.
Ebben az esetben a közüzemi függvény u(θ,a)=−L(θ,a) függvénynek tekinthető, és a
várhatóveszteséget minimalizáló d becslés megtalálása egyenértékű a várható hasznosság
maximalizálásával.
A hasznossági vagy veszteségi funkciót itt nem tekintik statisztikai probléma szükséges vagy
akár megfelelő összetevőjének. Ennek több oka is van. Talán a legfontosabb ok az, hogy
egyértelmű, hogy a segédprogram a statisztikus döntése, és a modellel és az előzővel ellentétben
nem nyilvánvaló, hogyan lehet ellenőrizni ezt a választást az adatokkal annak biztosítása
érdekében, hogy van értelme. Ez sérti az empirikus kritika elvét. Sok példában egyértelmű,
hogy a segédprogram kiválasztása kritikus a végső következtetések meghatározásában, így ez
a jogsértés nem megfelelő, mivel nem lehet azt mondani, hogy a következtetések olyan
összetevőkön alapulnak, amelyeket empirikusan ellenőriztek ésszerűségük szempontjából.
Egyesek azzal érvelhetnek, hogy a probléma meghatározza a megfelelő segédprogramot, de ez
nem a mi tapasztalatunk. A segédprogramot vagy a veszteséget általában azért választják, mert
intuitív módon ésszerű és matematikailag kényelmes, mivel a következtetések meglehetősen
könnyen levezethetők. Ez például úgy tűnik, hogy a négyzetes hiba használatának gyakori
indoka. A statisztikai elmélet kidolgozásához erősebb alapra van szükség.
A közüzemi funkció alkalmazásának mellőzésének másik oka az, hogy nem helyénvaló a
statisztikai bizonyítékok fogalmát közüzemi adatokkal megzavarni, amelyeknek saját
problémáik vannak. Köztudott, hogy sok paradoxon kapcsolódik a közüzemi; lásd például
Poundstone (2010). A következő jól ismert példa azt mutatja be, hogy milyen megfontolásokat
kell figyelembe venni a hasznosság megvitatásakor.
Példa 1.6.1 Az Allais-paradoxon.
A következő paradoxon Allaisnak köszönhető (1953). Tegyük fel, hogy két olyan kontextus
jelenik meg, ahol az a) és b) között választhat.
1. kontextus
(a) Kapsz 10 $6 valószínűség 1,00.
(b) 106 dollárt kap 0,89 valószínűséggel, 2 ×106-ot 0,10-es valószínűséggel, és semmit
sem kap 0,01-es valószínűséggel.
Allais azt állította, hogy a legtöbb ember úgy dönt, (a) hogy elkerüljék a kis esélye, hogy
semmit. Most fontolja meg egy másik pár választást.
2. kontextus
(a) Kapsz 10 $6 valószínűség 0,11 és semmi valószínűség 0,89.
(b) Kapsz 2 $×106 valószínűség 0,10 és semmi valószínűség 0,90.
Allais azt állította, hogy a legtöbb ember választana (b), mert a különbség az esélye, hogy nem
kap semmit kicsi, és a kifizetés sokkal nagyobb a (b).
A paradoxon a következőképpen merül fel. Tegyük fel, hogy kaphat egy A és B tételből álló
díjat, vagy kaphat egy A és C elemekből álló díjat. Alapvető fontosságú a segédprogram-
elméletben, hogy a díjak közötti preferencia csak a B és C közötti preferenciától függ. Ez
azonban azt jelenti, hogy vagy az (a) a (b) vagy a b) az a) felett (a) mindkét 1. és 2. kontextusban
különbözik, mivel csak abban különböznek, hogy az 1. kontextusban van az a plusz 0,89
valószínűsége, hogy 106 dollárt kap mindkettő (a) és (b) esetében.
Miközben az 1.6.1. példában bemutatotthoz hasonló helyzeteket figyelembe véve a hasznosság
elméletének kidolgozása méltó tevékenység, álláspontunk szerint ezek a megfontolások nem
kapcsolódnak a statisztikai bizonyítékok fogalmához. Tekintettel a statisztikai bizonyítékok
alkalmazásának fontosságára, úgy tűnik, hogy jobb, ha a kezelést teljes egészében elválasztja a
hasznosság fogalmától. Ez nem tagadja, hogy néhány valós helyzetekben szükség van egy
közüzemi funkció állapotának kimondására és a várható segédprogram maximalizálására. De
ilyen összefüggésben legalább igazságosnak tűnik az eredményeket csak a bizonyítékok alapján
elért eredményekkel összehasonlítani, majd indokolni a válaszok közötti különbséget, amikor
erre szükség van. Például statisztikai bizonyítékok bizonyíthatók arra vonatkozóan, hogy egy
betegség gyógyszeres kezelése hatékony, de számos okból úgy lehet dönteni, hogy nem hozzák
forgalomba.
1.7. A frequentizmus elve
Sok statisztikus ragaszkodik a gyakoriság elvéhez. Ehhez a statisztikai elemzés összetevőiként
x és modell {fθ:θΘ} adatok vannak.
A frequentizmus elve: A következtetésre vonatkozó statisztikai eljárást a versenytársakkal
szemben úgy kell értékelni, hogy viselkedésüket végtelen teljesítménysorozatban hasonlítják
össze, ahol az adatok értéke x1;x2,... f. szerint i.i.d. és ezt az értékelést minden θΘ el kell
végezni. Az egyik eljárást előnyben részesítik a másikhoz, ha az átlagos viselkedése bizonyos
értelemben jobb.
Természetesen soha nem figyelhetünk meg végtelen eredménysort, így amit ez az elv javasol,
az csak egy gondolatkísérlet. Bizonyos esetekben azonban az összehasonlítás pontosan
matematikai vagy gyakrabban szimulációval történhet. Továbbá, ha az x 1értékeket
figyelnénkmeg ... ,xn, akkor helyénvaló lenne ezeketaz adatkészleteket kombinálni, hogy
nagyobb adathalmazt alkossunk, mivel akkor a következtetéseink pontosabbak lennének, mint
az egyetlen adatkészletek használata.
Az elv kijelentése kissé homályos, mivel nem mondja meg, hogyan kell összehasonlítani a
különböző következtetési eljárásokat. Ez általában úgy történik, hogy valamilyen érdemi adatot
javasolnak, például egy becslő átlagos négyzetes hibáját vagy egy statisztikai hipotézis
tesztjének erejét. Vegyünk egy példát.
1.7.1. példa. Hely Normális.
Tegyük fel, hogyx= (x1,...,xn) a Ν(θ,1) eloszlásból származó n minta, θΘ=R1 ismeretlen.
Tegyük fel, hogy célunk az, hogy olyan becslést kapjunk, amely θ T(x) a négyzetes hiba
( T ( x ) − θ)2 tekintetében abban az értelemben, hogy ez a lehető legkisebb. Intuitív módon a
négyzetes hiba ésszerű összehasonlítási alapnak tűnik, de mégis választás. Mint ilyen, meg kell
csoda, hogy miért abszolút hiba | T( x ) − θ| nem használják, vagy akár valami mást. Mint a mi
vita a hasznosság, úgy tűnik, hogy nincs semmilyen módon alkalmazni az elvet az empirikus
kritika, hogy ezt a választást, és tapasztalatunk szerint, ez soha nem diktálja az alkalmazás.
Mindenesetre tegyük fel, hogy a négyzetes hiba kiválasztása megtörtént. A frekventizmus elve
azt mondja, hogy mindenR 1 θ végtelen sorrendben kell figyelembe vennünk kritériumunk
viselkedését, mondjuk ( T (x1)−θ) 2 , ( T ( x 2 ) − θ ) 2 ,..., ahol az x i ma már független n-től N-
től. ( θ ,1) elosztás. Az összehasonlítás egyszerűsítése érdekében közös ajánlás annak a
kritériumnak a hosszú távú átlagértékének megvizsgálása, amely a nagy számok erős törvénye
szerint megegyezik az átlagos négyzetes hibával
Ismét ez egy választás, nevezetesen, hogy átlagosan a kritériumot, és valami mást lehetett volna
tenni. Például a ( T ( x ) − θ)2 eloszlásának mediánja használható az egyes sorozatokban, és ez
nem egyenlő az MSEθ( T ) .
Most az MSEθ(T) használatával a becslés összehasonlítására a frequentizmus elve magában
foglalja a T-kielégítő M S E θ ( T ) < M S E θ ( T " ) k e r e s é s é t minden θR1, bármely más
b e c s l é s r e T " . De könnyű belátni, hogy ez kudarcra van ítélve. A becslő ^( x ) =θ
MSEθ(T)=0, ami azt jelenti, hogy az optimális T kielégíti az MSEθ(T)=0 minden θ. Ez azt
jelenti, hogy T ( x ) = θ minden θ , és ilyen T nem létezik.
Tehát most egy másik, kissé önkényes választásra van szükség, és ez általában az identitáson
alapul
Ha E θ ( T ) =θ minden θ , tehát T elfogulatlan a θ, akkor M S E θ ( T ) = V a r θ ( T ) . Így

marad, hogy keresse meg elfogulatlan T a legkisebb eltérés minden θ . Mint ismeretes, a
T ( x ) = x elfogulatlan, és az elfogulatlan becslési adatok között egyenletesen minimalizálja a
varianciát ebben a példában.
Az 1.7.1. példában sok panaszra lehet panaszkodni. Például sok olyan döntés születik, amely
intuitív módon ésszerűnek tűnik, de hiányzik a szilárd elméleti megalapozás. Azt is meg kell
jegyezni, hogy bár ebben a példában sikeres volt az ésszerű becslés megszerzése, az ugyanazon
érvelés más kontextusban történő alkalmazására irányuló kísérletek nagyon is kudarcot
vallhatnak. Köztudott, hogy számos becslési probléma van, amelyekhez nem létezik
elfogulatlan becslés, nem is beszélve az egyenletesen legkisebb szórásúról.
Lehet azzal érvelni, hogy az 1.7.1. Talán van egy kritérium, ahol a gyakoriság elve
egyértelműen a helyes következtetéshez vezet minket. Ha igen, a szerző nem tudja, mi az.
Mindenesetre az elvvel kapcsolatos panaszunk sokkal mélyebb, mint az, hogy önkényes
döntések nélkül nem tudunk sikeresen választ adni a problémákra.
Lényegében érvre van szükség annak igazolására, hogy miért van szükség a gyakoriság elvének
betartására. Talán a legjobb válasz a valószínűség hosszú távú valószínűség szerinti
értelmezéséhez kapcsolódik, és hogy ez a kapcsolat valamiféle objektivitást jelent a gyakori
statisztikai érvekkel. Eltekintve attól az aggodalomtól, hogy a valószínűségeket mindig hosszú
távú gyakorisággal értelmezzük (lásd a 2. fejezetet), ez semmilyen értelemben nem jelent
objektivitást a frekventált módszerek esetében, mivel modellfüggőek és annyira szubjektív
jellegűek, amint azt az 1.5. szakasz tárgyalja. Például a T( x ) =x nem elfogulatlan becslése θ,
amely minden modellnél {fθ:θR1} egyenletesen minimális szórással
rendelkezik,aholfθ( x ) =f( x − θ ) bizonyos f sűrűség esetén R n-en, átlagosan 0- val.
Mint ilyen, az ebben a szövegben javasolt relatív hit következtetési módszereket nem indokolja
a frequentizmus elvének felhívása. Mégis, amint azt a 3. fejezet tárgyalja, figyelembe lehet
venni a Bayes-féle következtetések gyakori tulajdonságait, de ennek végtelen szekvenciái
némileg eltérnek a frequentizmus elvében használttól. Bayes-i frequentizmus nem befolyásolja
a relatív hit következtetéseket.
1.8. Statisztikai következtetések
Az 1.2.1. példában három információforrás található a valódi f X-ről.
Az adatok: xX-et figyeltek meg.
A modell: x a {fθ:θ Θ} egyik eloszlásából származik.
A korábbi: hiedelmek az igazi θΘ írja le π.
Ezeknek a tételeknek a felsorolásának sorrendje megfelel a statisztikai elemzés során betöltött
fontossági sorrendjüknek. Ha az adatok bizonyos értelemben rosszak, például elfogult mintával
rendelkezünk, akkor az elemzés minősége romlik, és kiigazításokat kell végrehajtani. Ha az
adatokat megfelelően állították elő, de a modell rossz, például nincs fθ közel áll ahhoz, hogy
ésszerű közelítés legyen az f X-hez , akkor az elemzés általában nem elfogadható. Végül, ha az
adatok és a modell egyaránt elfogadható, de az előző komolyan torzítja, amit az adatok és a
modell mondanak, akkor ismét van egy probléma. Mint ilyen, megfelelően kell gyűjteni az
adatokat, ellenőrizni kell a modellt az adatokkal annak biztosítása érdekében, hogy ésszerű
választás legyen, majd ellenőrizni kell az előzőt annak értékelése érdekében, hogy van-e súlyos
konfliktus vagy sem.
Az adatok megfelelő gyűjtése a statisztika tervezési aspektusának része, amely nem képezi e
szöveg témáját, és mint ilyen, mindig feltételezzük, hogy ezt megfelelően hajtották végre. A
modell és az előző ellenőrzése az 5. fejezet témája, és egyelőre azt feltételezik, hogy ezt
elvégezték, és hogy {fθ:θΘ} és π elfogadhatók. Ez most elvezet minket a következtetés
témájához, nevezetesen ahhoz, hogy hogyan kombináljuk az adatokat, a modellt és az
előzeteseket, hogy következtetéseket vonjunk le bizonyos érdekes paraméterről, ψ =Ψ(θ).
Először is, egy meghatározásra van szükség ahhoz, hogy mit ünk következtetés alatt. Az
ismeretlen θ két alapvető következtetési formája van .
Becslés: Becslés ψ ( x ) a ψ= Ψ(θ) valós értékére, valamint a becslés pontosságának
értékelésére.
Hipotézisértékelés: Nyilatkozz arról, hogy a H0=Ψ−1{ψ0} hipotézis igaz vagy hamis, a
bizonyíték erősségének értékelésével együtt.
A becslés következtetése olyan, mint a szokásos gyakorlat, hogy egy becslést a szokásos
hibával együtt idéznek, bár valamivel általánosabb. Ehhez i d é z z ü k ψ ( x ) és a becslést
tartalmazó C ( x ) régiót, és értelmezzük a C ( x ) "méretét" a becslés pontosságának
értékeléseként. A szó mérete az idézetekben van, mert ez alkalmazásfüggő, és a készlet
bizonyos mértékére utal, például a térfogatra vagy a sokrétűségre stb. A hipotézisértékelési
következtetés azon a bizonyítékon alapul, hogy a ψ valódi értéke valamilyen rögzített érték,
ψ 0, és rendelkezésre áll a bizonyítékok megtalálása akár a H 0mellett, akár ellen. Ezenkívül
kalibrációt javasolnak arról, hogy ez a bizonyíték mennyire erős, akár mellette, akár ellene. Ez
magában foglalja a 0 ψbizonyítékainak értékelését a ψ lehetséges értékeire vonatkozó
bizonyítékokkal összehasonlítva. Mint ilyen, ez a megközelítés eltér a hipotézisvizsgálati
probléma szokásos megfogalmazásától, ahol az egyik teszt Ψ(θ)=ψ0 szemben Ψ ( θ ) ≠ψ0.
Hasonló következtetéseket lehet kidolgozni az előrejelzési problémákra is. Általánosságban
elmondható, hogy egy előrejelzési probléma magában foglalja a jövőbeli yY becslését vagy
annak értékelését, hogy azy 0Y elfogadható érték-e az {fθ:θΘ}modell x
megfigyelésealapján, ha y modellje {gδ(∙| x) :δΔ} δ=Δ ( θ ) . A modellek közötti kapcsolat
Δ keresztül jön létre δtrue=Δ(θtrue).
A 4. fejezet a relatív meggyőződésen alapuló statisztikai bizonyítékokat tartalmazza. E
meghatározás megadva a becslés és a hipotézisértékelési következtetések formáit úgy
határozzuk meg, hogy a statisztikus ne hozzon döntéseket. Néhány más fejleménysel
ellentétben a becslés és a hipotézisértékelés egy közös alapgondolatból – a statisztikai
bizonyítékok mércéje – származik. E meghatározás előtt azonban szükség van a feltételes
valószínűségnek a 2.1.2.
1.9. Példa
Ez a szakasz egyszerű példát mutat arra, hogy mit javasolnak a statisztikai elemzéshez indoklás
nélkül. Ez magában foglalja a modell és az előzetes meghatározását, a modellnek az adatokkal
való összevetését, az előző adatokkal való ellenőrzését, az előző elfogultság értékelését, majd
ezen összetevők feltételezett ellenőrzését, a statisztikai bizonyítékok meghatározásán alapuló
következtetések végrehajtását. A 4. és 5. fejezetben ezek a témák sokkal szélesebb körben
kidolgozottak. Baskurt és Evans (2013) a statisztikai bizonyítékok mérésével és az elfogultság
előzetes értékelésével kapcsolatos fejlődés nagy részét is tartalmazza.
Vegyük figyelembe azt a helyzetet, amikor x=(x 1 ,. ..,xn){0,1}n figyelhető meg, és az x i-t
feltételezzük, hogy i.i.d. Bernoulli(θ) θ [0,1]. Ez meghatározza az adatok előállítására
szolgáló mintavételi modell kiválasztását. Az előjel béta(α0,β0) eloszlású, ahol a 0 és β0 α meg
van adva, így az előzetes sűrűséget a
Tegyük fel, hogy az 5.3. szakaszban tárgyalt megfontolások alapján a 0 = β

0=4αválasztásmegfelelő előzményt biztosít. Például, ha θ=1/2-ről kérünk szimmetriát, és
megkövetelünk, hogy az intervallum (0,000,0,225) az előző valószínűség 0,05-ét tartalmazza,
akkor ez a korábbi választáshoz vezet. Legyen a kamatparaméter Ψ(θ)=θ, és tegyük fel, hogy
az érdeklődés a H0 hipotézis értékelésében rezesszük meg, amely θ=1/2.
Ne feledje, hogy a paraméter a példában szereplő értékek folyamatos halmazán alapul. A
gyakorlatban azonban nem szabad megfeledkezni arról, hogy ez egy olyan helyzet közelítése,
amelyben a valóságban csak véges θ értékek vannak, talán egy egyenlő távolságú rácson fekve
[0,1]. A probléma ezen aspektusát itt figyelmen kívül hagyják, azon kívül, hogy rámutatnak
arra, hogy ez a probléma hol lehet jelentős.
1.9.1. A modell ellenőrzése
Ebben a helyzetben a modellellenőrzés az adatok feltételes eloszlásán alapul, mivel a
minimálisan elégséges statisztika T(x)=nxˉ, a megfigyelt adatok száma. Ismeretes, hogy ez a
feltételes eloszlás független θ. Legyen D:X→R1 egy eltérési statisztika, amely bizonyos
értelemben a modell helyességétől való eltérést méri. Bérbeadás fD(∙| T ( x ) ) D adott T feltételes
valószínűségi függvényét jelöli, az ellenőrzés magában foglalja a számítástechnikát
amely a feltételes eloszlásból származó olyan érték feltételes valószínűsége, amelynek

előfordulási valószínűsége nem nagyobb, mint a megfigyelt érték valószínűsége. Ha ez a
valószínűség kicsi, akkor az eltérési statisztika megfigyelt értéke a D alacsony valószínűségű
régióban található, így a megfigyelt adatok meglepőek a modell számára. Ez viszont
kétségekhez vezet a modell érvényességét illetően. Ne feledje, hogy az (1.2) nagy értékei nem
utalnak modell helyességre. A modellellenőrzés csak arra utaló jeleket keres, hogy a modell
rossz, mivel gyakorlatilag soha nem lehet azt mondani, hogy helyes.
A T ( x ) = n x ˉ megadott adatok feltételes eloszlása a z = (z1,...,z n ) bináris szekvenciák
halmazán egységes, T ( z ) = n x ˉ . Ebből az eloszlásból értékeket lehet generálni egy ilyen
bináris szekvencia figyelembevételével és az elemek véletlenszerű elnémításával.
Tegyük fel az adatokat
megfigyelt így T ( x ) = 8. Valójában ezek az adatok bernoulli(1/2) eloszlásból származnak, így

a modell és a hipotézis egyaránt helyes.
Az egyik aggodalomra ad okot, hogy az adatokban van egy lehetséges időbeli tendencia,
nevezetesen, hogy az eloszlás a mintavétel során változhatott volna, és így a modell helytelen
lenne. Ennek értékelésére az egyik lehetséges módszer a D ( x ) =n1xˉ1−n2xˉ2 eltérési statisztikán
keresztül történik, ahol n1xˉ1 az első n1 mintaértékben szereplő értékek száma, n2xˉ2 pedig az
utolsó n2 mintaértékben szereplő értékek száma. Mint ilyen, D ( x ) összehasonlítja a minta két
részében lévők számát. Itt n1=n2=10 értéket veszünk, és megkapjuk a megfigyelt értéket
D ( x ) =2−6=−4 az adatokhoz (1.3). Az 1.1. ábra a szimulációval kiszámított D feltételes
valószínűségi függvényének ábrázolása. Az (1.2) értéke 0,17, így a megfigyelt érték nem túl
meglepő, és így nem mond ellent a modellnek.
Természetesen más eltérési statisztikákat is alkalmazni lehetne. A modellellenőrzéssel
kapcsolatos további kérdéseket az 5.
1.9.2. Előzetes adatütközés ellenőrzése
Az előzetes adatütközés ellenőrzése itt a valószínűség kiszámítását igényli
ahol mT a T korábbi prediktív sűrűsége ,nevezetesen,

Lényegében mT adja a minimális elégséges statisztika előzetes eloszlását T. Az (1.4) érték arra
szolgál, hogy a T(x) értékét az előző eloszlásában keresse meg, mivel ez az érték kicsi lesz, ha
T(x) egy kis valószínűségű régióban fekszik. Amint azt az 5. fejezet is mutatja, ez a
valószínűség azt jelzi, hogy a θ valós értéke az előzőre vonatkozó alacsony valószínűségű
régióban fekszik-e vagy sem.
Ebben a példában (1.4.)
és ez könnyen kiszámítható generálásával θ~ béta (α0,β0), majd t~binomial(n,θ) sokszor.

Amikor α0=β0=1, akkor az egyenlőtlenség mindkét oldala mindig egyenlő, így (1.4) mindig 1-
nek felel meg. Ezért egy egységes előzetessel soha nincs előzetes adatütközés.
Az 1.2. ábra mT-t ábrázol az előzőre, α0=β0=4. Az (1.3) adatok esetében az (1.4.) értéke 0,728.
Ennek megfelelően az adatok nem ellentmondanak a korábbiaknak.
Számos további fogalom és probléma kapcsolódik az előzetes adatütközés ellenőrzéséhez.
Például mit lehet tenni, ha megállapítást nyer, hogy korábbi adatütközés áll fenn? Az 5. fejezet
a téma teljes fejlesztését tartalmazza.
Egy másik szempont az előzetes, hogy ellenőrizni kell, hogy a korábbi indukálja elfogultság
egy kérelmet. Ehhez fel kell függeni, hogy milyen statisztikai bizonyítékról van szó, és így
elhalasztják az 1.9.4. szakaszig. Logikusan az előzetes által kiváltott torzítás értékelésének meg
kell előznie a következtetést, mivel a szélsőséges torzítás használhatatlanná teheti a
következtetést. Az elfogultság értékelése nem függ a megfigyelt adatoktól, és a tervezési
szakaszban megfelelően történik.
1.9.3. Statisztikai következtetés
Először meg kell határozni a T(x) adott θ feltételes (hátsó) sűrűségét. Ezt a (θ,T ( x ) ) és a
T ( x ) határ hányadosa adjameg, nevezetesen,
Ezért a θ hátsó része egy béta(nxˉ+ α0,n − n x ˉ + β 0 ) eloszlás, és ha 0 =β0=4α,akkor ez egy
béta(nxˉ+4,n − n x ˉ + 4) eloszlás.
Az 1.3. ábra a béta(4,4) és a béta(12,16) hátsó részének együttes ábrázolása az (1.3) adatok
felhasználásával. Nyilvánvaló, hogy az adatok némi tanuláshoz vezettek a θ valódi értékével
kapcsolatban.
Amint azt a 4. fejezet tárgyalja, annak a bizonyítéknak az mértéke, hogy θ a valós érték,
megegyezik az R B ( θ | x ) relatív hithányadosával. Ebben az esetben a z R B ( θ | x ) a hátsó
sűrűség és az előző sűrűség aránya, nevezetesen:
amely azt méri, hogy a θ valódi értéke az a priori-tól a posteriori-ig. Ha a z R B ( θ | x ) 1 > az

adatokból arra van bizonyíték, hogy θ a valós érték, a z e l l e n θ bizonyíték, ha az R B ( θ |
x ) < 1, és nincs bizonyíték, ha az R B ( θ | x ) = 1. Míg a z R B ( θ | x ) arányos a példában szereplő
valószínűségével, nem szorozható meg pozitív állandóval anélkül, hogy ne semmisíteném meg
annak értelmezését, mint annak bizonyítékát, hogy θ a valódi érték.
A θ becslése az R B ( θ | x), mivel ez a maximális bizonyíték a javára. A 4. fejezetben
bebizonyosodik, hogy ez a maximális érték mindig nagyobb, mint 1. Az az érték, ahol a z
R B ( θ | x ) ebben az esetben a maximális x ˉ . Az (1.3) adatok esetében ez 0,400-nak felel meg.
Ennek a becslésnek a pontosságát a 0,95-hiteles
ahol c0,95(x) a k állandók infimumának van meghatározva úgy, hogy a halmaz hátsó
valószínűségi tartalma {θ:R B ( θ | x ) ≤ k } legalább 0,05. Közlemény, hogy x ˉ {θ :R B ( θ |
x ) ≥ k } ha k < R B ( θ | θ x ) . A C0mérete. 9 5 ( x ), amely ebben az esetben a hosszúság, mint
egy intervallum, akkor kell tekinteni, mint az értékelés pontosságát x becslésként. A
C0formája. 95 .95x ) a bizonyítékok meghatározása szerint, ha θ1C0. 9 5 ( x ) és
RB,θ2|x)>R B , θ 1 | x ) , akkorlogikailag szükséges, hogy θ2C0. 95( x ) is.
Az 1.4. ábra az (1.3) adatokon alapuló relatív hitarányok és a 0 = β 0=4αválasztás. A 0,95-hiteles

intervallum C0,95(x)=(0,227,0,593) és hossza 0,593−0,227=0,366 azt jelzi, hogy még mindig
ésszerű mértékű a bizonytalanság a θ valódi értékével kapcsolatban .
A H 0= {θ0 } hipotézis értékeléséhez a z R B ( θ 0 | x ) a bizonyíték arra, hogy a H 0 igaz. Amint
azt a 4. fejezet később tárgyalta, r b - t ( θ 0| x ) k e l l k a l i b r á l n i , és ez úgy történik, hogy
összehasonlítjuk az R B ( θ 0 | x ) értéket az R B (θ | x ) . Különösen azt kell megnézni, hogy az
RBhátsóeloszlása tekintetében hol helyezkedik el az RB,θ0∙||x) x). Például ennek a
bizonyítéknak az erősségét annak a hátsó valószínűségnek az egyik mértéke adja meg, hogy a
θ valós értéke relatív hitaránya nem nagyobb, mint az R B ( θ 0|x), nevezetesen,
Amikor RΒ(θ0| x ) < 1. és (1.5.) kicsi, akkor erős bizonyíték van a H 0 ellen, mert nagy a
valószínűsége annak, hogy a valós értéknek nagyobb relatív hitaránya van. Amikor a z R B ( θ 0 |
x ) > 1. és 1.5. nagy, akkor erős bizonyíték van a H 0 javára, mert kicsi a valószínűsége annak,
hogy a valós értéknek nagyobb relatív hitaránya van, és θ0-nak van a legtöbb bizonyítéka a
javára {θ : R B ( θ | x ) ≤ R B ( θ 0 | x)}.
Az adatok (1.3.) és a választás α 0 =β0=4, a relatív hitarány releváns értéke R B ( 1 / 2 | x ) = 1,421,
és mivel ez nagyobb, mint 1, bizonyíték van a H0javára. Az (1.5) érték esetében
kapnak, és így a bizonyíték mellett H0 csak mérsékelt, mivel van egy hátsó valószínűsége
0,691, hogy a valódi értéke θ nagyobb relatív hit arány.
A bizonyítékok erősségének értékelésekor és különösen az (1.5) kiszámításánál a
folytonossággal kapcsolatos kérdések merülnek fel. Ezt a 4.4.1.
1.9.4. Az előzetes elfogultság ellenőrzése
Mint korábban említettük, azt is fel kell mérni, hogy a kiválasztott előzetes indukál-e
elfogultságot a problémában. Abban az esetben, az egységes előtt tűnhet nyilvánvaló, hogy
nem, de ez a kérdés általában bonyolultabb és finomabb. Itt a Savage-Dickey arány eredménye,
amint azt a 4. fejezet mutatja, amely azt mutatja, hogy a relatív hitarány
ahol mT(∙| θ) a T feltételes előzetes valószínűségi függvénye, mivel θ igaz.

A H0={θ0} elleni torzítás az előzetes valószínűség szerint mérhető, ha h0 igaz, akkor a H0-
valszemben bizonyítékot kapunk,nevezetesen,
ahol az MT(∙| θ0) a T korábbi eloszlását jelöli, ha a valós érték 0 θ. Ha (1.6) nagy, akkor
elfogultság van a H0-valszemben, mint ismeretes, még az adatgyűjtés előtt is, hogy valószínűleg
bizonyítékot szerez a H0ellen. Ehhez a problémához M T ( ∙ | θ0) a binomiális(n,θ0) eloszlás.
A H0={θ0} melletti torzítást az előző valószínűség alapján mérjük, amikor θ = θ * ≠θ0 igaz,
akkor a H0 mellett bizonyítékokat kapunk, nevezetesen:
Erre a problémára M T ( ∙ | θ *) a binomiális(n,θ*) eloszlás. Jellemzően (1,7) csökken, ahogy θ *

eltávolodik a 0 θ, ezért érdemes a θ * olyan értékeknek tekinteni, amelyek csak a legkisebb,
gyakorlatilag jelentős összeggel térnek el a θ0-tól. Ha (1.7) nagy az ilyen θ*, akkor elfogultság
van a H0javára, mint ismeretes, még mielőtt látjuk az adatokat, és ha a H 0 hamis, akkor a
bizonyítékokat a H0 javára nyerik. A gyakorlatilag értelmezhető különbség mérete az
alkalmazástól függ.
Az adatok (1.3.) és a 0 = β0=4 αválasztás esetében a H0 melletti torzítás
így kevés az elfogultság a H0={1/2} ellen, amit az előző béta(4,4) indukál.

θ * = 0,50±0,05esetén a H0 melletti elfogultság
és ezek a szimmetria miatt egyenlőek. Tehát van némi elfogultság mellett H 0={1/2} által
kiváltott béta(4,4) előtt.
Az elfogultságot némileg az előző, de elsősorban a minta méretének megválasztása
szabályozhatja. Az elfogultság ellenőrzése és a korábbi adatok ütközésének ellenőrzése
hatékony eszközöket biztosít a priorok használatával gyakran kiegyenlített kritikák kezelésére.
1.10. Záró megjegyzések
Ez a fejezet arról szólt, hogy hátteret biztosítsunk a statisztikai következtetés elméletének
későbbi fejleményeihez, amelyek a statisztikai bizonyítékok relatív meggyőződésen alapuló
mérésén alapulnak. Minden következtetés elméletéhez világossá kell tenni, hogy milyen
problémákat kell alkalmazni, és milyen összetevők az elméletben. Ezekkel a kérdésekkel itt
foglalkoztunk. Tekintettel arra, hogy a relatív hitelmélet különbözik a következtetés más
elméleteitől, meg kell vitatni, hogy miért van szükség valami más fejlesztésére. A 3. fejezet a
statisztikai bizonyítékok fogalmának más elméleti megközelítéseinek vizsgálata, a 4. fejezet
pedig magát a relatív hitelméletet fejleszti ki.

Measuring Statistical Evidence Using Relative Belief - 1

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Measuring Statistical Evidence Using Relative Belief - 1

Uploaded by

Copyright:

Available Formats

Statisztikai bizonyítékok mérése relatív

Tehát r X ( A ) csak azoknak az elemeknek az aránya Ω, amelyek X mérése A-ban van.

xX esetében, mivel az egyik a másikból nyerhető. Figyelje meg, hogy a frekvenciaeloszlás az

Tehát két változó kapcsolódik egymáshoz, ha a kondicionáló változó megváltoztatása a másik

változnak, ahogy változik x. Gyakran lineáris regressziós feltételezést is feltételeznek, ha

az x megfigyelés valószínűségének aránya, ha θ1 igaz az x megfigyelésének valószínűségére,

0. ε→,mivel P θ( N ε ( x ) ) / f θ ( x ) V o l ( N ε ( x ) ) → 1, mint ε → 0. Így a kis ε

mivel ez biztosítja, hogy Ρθ(Νε(x))≈fθ(x)Vol(Nε(x)) kis ε. A sűrűség meghatározását

és az 1/(2√ψ) tényező pψ egyszerűen igazodik az a tényhez, hogy az átalakulási Ψ a

ahol i. Az 1.4.2. példában tárgyalt paramétertér folytonossági közelítése lehetővé teszi a

ember feltehetően hajlandó fizetni 4 dollárt játszani a játékot.

Ha E θ ( T ) =θ minden θ , tehát T elfogulatlan a θ, akkor M S E θ ( T ) = V a r θ ( T ) . Így

Tegyük fel, hogy az 5.3. szakaszban tárgyalt megfontolások alapján a 0 = β

amely a feltételes eloszlásból származó olyan érték feltételes valószínűsége, amelynek

megfigyelt így T ( x ) = 8. Valójában ezek az adatok bernoulli(1/2) eloszlásból származnak, így

ahol mT a T korábbi prediktív sűrűsége ,nevezetesen,

Ebben a példában (1.4.)

és ez könnyen kiszámítható generálásával θ~ béta (α0,β0), majd t~binomial(n,θ) sokszor.

amely azt méri, hogy a θ valódi értéke az a priori-tól a posteriori-ig. Ha a z R B ( θ | x ) 1 > az

Az 1.4. ábra az (1.3) adatokon alapuló relatív hitarányok és a 0 = β 0=4αválasztás. A 0,95-hiteles

ahol mT(∙| θ) a T feltételes előzetes valószínűségi függvénye, mivel θ igaz.

Erre a problémára M T ( ∙ | θ *) a binomiális(n,θ*) eloszlás. Jellemzően (1,7) csökken, ahogy θ *

így kevés az elfogultság a H0={1/2} ellen, amit az előző béta(4,4) indukál.

You might also like

Erre a problémára M T ( ∙ | θ ) a binomiális(n,θ) eloszlás. Jellemzően (1,7) csökken, ahogy θ *