Chapter 116 - Bedside Statistical Tools

Access
Provided by:
Kritička njega
Poglavlje 116: Statistički alati uz krevet
Ivan T. Doucette; Steven Krasnica
UVOD
Primarni cilj kliničara je procijeniti koristi i štete od mogućnosti liječenja prije njih. Primum non nocere je osnovno načelo etičke prakse. "Medicina
temeljena na dokazima je savjesna, eksplicitna i razborita uporaba trenutno najboljih dokaza u donošenju odluka o skrbi za pojedine pacijente.
Praksa medicine utemeljene na dokazima znači integrirati individualnu kliničku stručnost s najboljim dostupnim vanjskim dokazima iz sustavnog
pregleda."1 Od 1990ih medicina temeljena na dokazima (EBM) dobiva čvrsto uporište u većini medicinskih disciplina. Međutim, da bi se prakticirao
EBM, najvažnije je da su kliničari sposobni procijeniti i sintetizirati medicinsku literaturu. Učinkoviti liječnici shvaćaju ravnotežu između osobnog
kliničkog iskustva i dokaza iz odgovarajuće provedenih istraživanja. Kliničari moraju vješto procijeniti kvalitetu objavljenih studija s obzirom na dizajn,
provođenje i analizu, a zatim odrediti relevantnost i vanjsku valjanost za svog specifičnog pacijenta. Nisu svi dokazi jednaki, niti nude definitivne
kliničke planove skrbi. Treba razumjeti osnovne prijetnje valjanosti studija, naime pristranost, zbunjujuće i slučajno. Randomizirano kontrolirano
ispitivanje (RCT) i metaanaliza smatraju se zlatnim standardom EBMa. Međutim, RCTove je teško provesti u medicini kritične skrbi.
Medicina kritične skrbi je disciplina koja se brzo razvija i bavi se složenim spektrom bolesti. Sepsa i ARDS, na primjer, još uvijek su slabo shvaćeni
procesi bolesti s višestrukim etiologijama i fenotipovima. Sindrom sepse može proizaći iz brojnih izvora koji se različito predstavljaju kod različitih
pacijenata. Slijedom toga, postoje mnogi izazovi u provođenju zdravih kliničkih istraživanja u ovom području: kritičnu bolest teško je precizno
definirati; populacije pacijenata mogu se drastično razlikovati s obzirom na težinu bolesti, modalitete liječenja i druge karakteristike; zapošljavanje
predmeta može biti teško.
Dobro poznavanje temeljnih statistika postavit će osnovu za kritičku procjenu literature, imperativnog kliničkog alata u armamentariju svakog
praktičara. Statistički alati mogu se koristiti za opisivanje izvedbe dijagnostičkih testova, karakterizaciju odnosa između kliničkih odluka i ishoda i
procjenu vjerojatnosti preživljavanja, samo da navedemo neke od njihovih brojnih primjena. U konačnici, želi se upariti kritičku procjenu dokaza sa
sveobuhvatnom kliničkom prosudbom uz krevet, gdje je n = 1.
DIZAJNI STUDIJA
Možda jednako važno kao i razumijevanje metoda analize koje se koriste u kliničkim studijama je razumijevanje različitih vrsta dizajna studija, njihovih
definirajućih karakteristika i prednosti i slabosti svakog od njih. Najčešće korišteni dizajni koji uključuju prikupljanje i analizu izvornih podataka
("primarne studije") mogu se podijeliti u 2 podtipa: eksperimentalne ili intervencijske studije i opservacijske studije. Još jedna klasa studija
("sekundarne studije") nastoji sintetizirati informacije iz više postojećih studija istog istraživačkog pitanja. Za eksperimentalne dizajne opisujemo RCT
i druge dizajne kliničkih ispitivanja. Za opservacijske studije razmatramo kohortne studije, studije kontrole slučaja, studije presjeka, serije slučajeva i
izvješća o slučajevima. Naposljetku, razmatrane su metaanalize i sustavni pregledi kao vrste sekundarnih studija.
EKSPERIMENTALNE STUDIJE
Randomizirana kontrolirana ispitivanja
Djelomično zbog svojih poželjnih svojstava, RCT se široko koristi u medicini kritične skrbi. U ovom dizajnu, pacijenti koji zadovoljavaju kriterije
prihvatljivosti nasumično se raspoređuju u 1 od 2 ili više skupina, koje se nazivaju krakovi ispitivanja. Skupine su često definirane režimom liječenja
koji će primati ispitanici u skupini. To je eksperimentalni dizajn, što znači da istraživač aktivno odlučuje dati, na primjer, 1 liječenje jednoj skupini
pacijenata i drugu drugoj skupini. Stoga RCT nije prikladan za istraživačka pitanja ako nije praktično ili etički eksperimentalno dodijeliti subjekte
izloženosti (liječenju) od interesa.
Downloaded 202311 5:56 A Your IP is 31.223.128.254
Ključna značajka RCTa je randomizacija subjekata u ruke suđenja. Svrha ove randomizacije je stvoriti skupine subjekata koji su obično usporedivi s
Chapter 116: Bedside Statistical Tools, Ivan T. Doucette; Steven Krasnica Page 1 / 6
drugim prognostičkim čimbenicima povezanim s ishodom, osiguravajući tako "poštenu" usporedbu. Naglašavamo da su skupine obično usporedive,
©2023 McGraw Hill. All Rights Reserved. Terms of Use • Privacy Policy • Notice • Accessibility
jer randomizacija to ne jamči. Iz tog razloga, neophodno je usporediti ispitanike u svakoj ruci za liječenje s obzirom na druge čimbenike za koje se zna
da su povezani s ishodom kako bi se osiguralo da su skupine slične ili kako bi se u obzir uzela bilo kakva različita odstupanja u analizi podataka
Djelomično zbog svojih poželjnih svojstava, RCT se široko koristi u medicini kritične skrbi. U ovom dizajnu, pacijenti koji zadovoljavaju kriterije
prihvatljivosti nasumično se raspoređuju u 1 od 2 ili više skupina, koje se nazivaju krakovi ispitivanja. Skupine su često definirane režimom liječenja
Access Provided by:
koji će primati ispitanici u skupini. To je eksperimentalni dizajn, što znači da istraživač aktivno odlučuje dati, na primjer, 1 liječenje jednoj skupini
pacijenata i drugu drugoj skupini. Stoga RCT nije prikladan za istraživačka pitanja ako nije praktično ili etički eksperimentalno dodijeliti subjekte
izloženosti (liječenju) od interesa.
Ključna značajka RCTa je randomizacija subjekata u ruke suđenja. Svrha ove randomizacije je stvoriti skupine subjekata koji su obično usporedivi s
drugim prognostičkim čimbenicima povezanim s ishodom, osiguravajući tako "poštenu" usporedbu. Naglašavamo da su skupine obično usporedive,
jer randomizacija to ne jamči. Iz tog razloga, neophodno je usporediti ispitanike u svakoj ruci za liječenje s obzirom na druge čimbenike za koje se zna
da su povezani s ishodom kako bi se osiguralo da su skupine slične ili kako bi se u obzir uzela bilo kakva različita odstupanja u analizi podataka
ispitivanja.
Važno pitanje u dizajnu RCTa je zasljepljujuće ili maskiranje. Zasljepljivanje studije čuva znanje o nasumičnom zadatku liječenja svakog subjekta
skrivenim od 1 ili više strana. U takozvanoj dvostruko slijepoj studiji, i istraživači i ispitanici su tako zaslijepljeni. Svrha zasljepljivanja je minimiziranje
potencijala za pristranost u rezultatima studije. Pristranost se često može pojaviti na suptilne, nenamjerne načine od dobronamjernih pojedinaca, pa
tako zasljepljujući pokušaji uklanjanja potencijala za mnoge vrste pristranosti. Za neke vrste intervencija (npr. Kirurgija vs medicinsko liječenje),
zasljepljivanje nije izvedivo. Kada se to dogodi, u mjeri u kojoj je to moguće preporučljivo je zaslijepiti istražitelje koji procjenjuju ishode. To se može
postići tako da ishode procijene članovi istraživačkog tima koji nisu uključeni u kliničku skrb o pacijentu ili primjenu intervencije.
Drugi važan čimbenik, specifičan za eksperimentalne studije, a time i za istraživanja, je crossover i povezan s tim, načelo namjere liječenja. U nekim
studijama, pacijenti koji su nasumično raspoređeni u 1 terapijsku skupinu mogu, u nekom trenutku tijekom ispitivanja, završiti ne primajući tu terapiju
i možda primati terapiju povezanu s jednim od drugih krakova ispitivanja. Kaže se da su ti ispitanici prešli, a postojanje takvog crossovera komplicira
analizu rezultata ispitivanja. Načelo namjere liječenja, koje je prihvaćena metoda rješavanja crossovera kada se dogodi, nalaže da se podaci prikupljeni
od ispitanika analiziraju sa skupinom u koju je subjekt randomiziran, bez obzira na to koji je tretman subjekt stvarno primio. Iako se to u početku može
činiti kontraintuitivnim, to štiti valjanost svih uočenih razlika između skupina. Ne može se pretpostaviti da se crossover događa nasumično, pa bi
uklanjanje crossover subjekata iz skupine kojoj su nasumično dodijeljeni ugrozilo randomizaciju, što bi moglo dovesti do nevažećih rezultata. U
skladu s načelom namjere liječenja, križanje može razrijediti stupanj razlike između skupina u pogledu bilo koje mjere ishoda koja se primjenjuje. No,
integritet bilo koje uočene razlike (koja se nalazi unatoč takvom razrjeđivanju) je netaknut. U fazi projektiranja ispitivanja, ako se očekuje prilična
količina crossovera, istraživačima bi moglo biti pametno planirati nešto veće veličine uzoraka kako bi se nadoknadilo razrjeđivanje veličina učinka
zbog križanja.
OPSERVACIJSKE STUDIJE
U opservacijskim studijama, za razliku od studija s eksperimentalnim dizajnom, istraživač ne odlučuje tko ima koji tretman ili izloženost, već samo
promatra što se događa unutar svake skupine izloženosti. Stoga se mora dodatno paziti, obično u analizi, kako bi se uzele u obzir neravnoteže među
skupinama u pogledu čimbenika povezanih s ishodom koji nisu izloženosti od interesa.
Kohortne studije
U dizajnu kohorte identificira se skupina subjekata ("kohorta") i prati naprijed tijekom vremena kako bi se promatrala stopa pojavljivanja ishoda od
interesa. Skupina je obično podijeljena u dvije ili više skupina na temelju izloženosti određenom faktoru rizika za ishod (npr. Liječenje), pri čemu se te
skupine izloženosti uspoređuju na kraju studije s obzirom na stopu ishoda. Većina kohortnih studija je prospektivna i odvija se kako je ranije opisano.
Povremeno, ako su pouzdani podaci o izloženosti dostupni od ranijeg vremena, istražitelj može retroaktivno sastaviti skupinu utvrđivanjem tko je bio
izložen u određeno prethodno vrijeme i usporedbom ishoda tijekom vremena nakon te izloženosti. Ove potonje studije naizmjence se nazivaju
retrospektivna kohorta ili povijesne kohortne studije.
Studije kontrole sluča j a
U dizajnu kontrole slučaja, skupine subjekata biraju se nakon što se ishod od interesa već dogodi. Odabrana je skupina ispitanika s određenom
bolešću (ili drugim ishodom) i odabrana je usporedna skupina ispitanika (kontrola) bez bolesti. Zatim se prikupljaju i uspoređuju informacije o
prošlim izloženostima i čimbenicima rizika od interesa između slučajeva i kontrola. Ako se podaci o izloženosti oslanjaju na samoprijavu ispitanika i
ako se ispitanici prisjećaju svojih izloženosti drugačije od kontrolnih ispitanika, te studije mogu patiti od rezultirajuće pristranosti poznate kao
pristranost pristiglog opoziva. Ipak, studije kontrole slučaja često mogu biti koristan način rješavanja pitanja koje treba opservacijski dizajn.
Studije presjeka
Druga vrsta opservacijskog dizajna je studija poprečnog presjeka. To se ponekad jednostavno naziva anketom. U dizajnu presjeka nije prošlo vrijeme
između procjene izloženosti i ishoda. Umjesto toga, oba se procjenjuju ili mjere u istom trenutku. Kao takvo, glavno ograničenje takvih studija je da se
vremenski odnos između jednog faktora i drugog ne može uspostaviti. Dizajni poprečnog presjeka često se koriste za opsežna istraživanja temeljena
na stanovništvu kako bi se razmotrile zdravstvene karakteristike stanovništva.
Izvješ ća slučaja i serije slučajeva
ako se ispitanici prisjećaju svojih izloženosti drugačije od kontrolnih ispitanika, te studije mogu patiti od rezultirajuće pristranosti poznate kao
pristranost pristiglog opoziva. Ipak, studije kontrole slučaja često mogu biti koristan način rješavanja pitanja koje treba opservacijski dizajn.
Access Provided by:
Studije presjeka
Druga vrsta opservacijskog dizajna je studija poprečnog presjeka. To se ponekad jednostavno naziva anketom. U dizajnu presjeka nije prošlo vrijeme
između procjene izloženosti i ishoda. Umjesto toga, oba se procjenjuju ili mjere u istom trenutku. Kao takvo, glavno ograničenje takvih studija je da se
vremenski odnos između jednog faktora i drugog ne može uspostaviti. Dizajni poprečnog presjeka često se koriste za opsežna istraživanja temeljena
na stanovništvu kako bi se razmotrile zdravstvene karakteristike stanovništva.
Izvješ ća slučaja i serije slučajeva
Kao što njegovo ime implicira, izvješće o slučaju je opis karakteristika jednog pacijenta. Serija slučajeva opisuje obično malu skupinu (seriju)
pacijenata. Te vrste studija obično ne uključuju nikakvu analizu podataka ili usporedbu podskupina, već samo izvješćuju o značajkama od interesa u
slučaju ili nizu slučajeva. Kao takvi, posebno su korisni kada se dogodilo nešto neuobičajeno što može baciti novo svjetlo na postojeće znanje ili možda
čak identificirati novi tip ili sindrom bolesti.
SEKUNDARNE STUDIJE
U sekundarnim studijama nisu prikazani novi podaci. Umjesto toga, postojeći podaci iz drugih studija prikupljaju se i možda ponovno analiziraju kako
bi se sintetizirao niz dokaza o određenoj temi. Sve takve studije trebaju uzeti u obzir moguću ulogu onoga što je poznato kao pristranost objavljivanja,
što proizlazi iz uvjerenja da je vjerojatnije da će studije koje pronalaze učinak ("pozitivne studije") biti objavljene od studija koje to ne čine ("negativne
studije"). Ako je ovo uvjerenje opravdano, sinteza samo objavljenih studija bit će pristrana prema pronalaženju učinka.
Postoje 3 glavne vrste sekundarnih studija: pregledni članci, sustavni pregledi i metaanalize. U preglednom članku autori identificiraju onoliko studija
koliko se može pronaći u vezi s određenim istraživačkim pitanjem (a možda i srodnim temama). Zatim organizirano predstavljaju ključne nalaze tih
studija i donose zaključke na temelju kritičke procjene cijelog niza dokaza o tom pitanju.
Sustavni pregledi u velikoj su mjeri zauzeli mjesto osnovnog članka iz sustavnog pregleda. U sustavnom pregledu, istraživači moraju navesti sustavni
pristup koji se koristi u identificiranju istraživanja koja će biti uključena u pregled. Obično se baca vrlo široka mreža i potrebno je provjeriti vrlo velik
broj studija radi uključivanja ili isključenja iz sustavnog pregleda.
U metaanalizi, istraživači prikupljaju sve studije relevantne za određeno pitanje na sličan način kao što bi to učinio za sustavni pregled. Zatim rade
novu analizu kombiniranog skupa podataka iz tih studija, kako bi predstavili ukupnu procjenu učinka interesa koji je precizniji zbog mnogo većeg
broja ispitanika iz svih studija zajedno.
Statistička analiza
Testovi hipoteze
Većina kliničkih studija uključuje jedan ili više statističkih testova hipoteze za rješavanje istraživačkih pitanja. Postoje mnoge vrste takvih testova
hipoteze. Za složena pitanja ili dizajne treba konzultirati biostatističara, ali ovdje su prikazani neki od osnovnih testova i pitanja povezana s njihovom
pravilnom uporabom. Vrste testova mogu se grupirati kao one koje se odnose na kontinuirane ishode, kategorične ili diskretne ishode i podatke s
vremena na događaj (preživljavanje).
Kontinuirani ishodi — Mnogi ishodi koje mjerimo kvantitativne su prirode i daju se zaključku na temelju kontinuiranih distribucija. Mnogi testovi
ove vrste uključuju usporedbu srednje (ili druge mjere središnje tendencije) od 2 ili više populacija. Kada treba usporediti samo dvije skupine, često se
koristi ttest za 2 neovisna uzorka. Ako usporedna skupina interna u studiji nije dostupna, ponekad se srednja vrijednost jedne skupine uspoređuje s
poznatom populacijskom vrijednošću pomoću ttesta s jednim uzorkom. Ako dva uzorka podataka koja treba usporediti nisu iz dvije neovisno
odabrane skupine, već su ili iz istih subjekata (upareni podaci) ili iz usporedne skupine posebno odabrane tako da odgovaraju prvoj skupini na važnim
karakteristikama (podudarni podaci), tada se često koristi upareni ttest. Kada treba usporediti više od 2 skupine s testom jednakosti sredstava, može
se koristiti metoda koja se naziva analiza varijance (ANOVA).
Sve ove vrste ttestova i ANOVA metoda pretpostavljaju da se podaci unutar svake populacije (približno) obično distribuiraju. Manja odstupanja od ove
pretpostavke mogu se tolerirati, ali kada ta pretpostavka nije realna, kao što je to često slučaj, analitičar ima dvije mogućnosti: (1) podaci se mogu
transformirati na način koji rezultira simetričnijom raspodjelom (npr. Pozitivno iskrivljeni podaci mogu imati koristi od logaritamske transformacije) ili
(2) umjesto t može se primijeniti neparametrijski test test ili ANOVA. Ovi neparametrijski testovi, kao što im ime govori, ne donose distribucijske
pretpostavke o podacima. Oni su neosjetljivi na ekstremne vanserijske jer koriste redoslijed ranga opažanja, a ne njihove stvarne vrijednosti. Tako bi,
na primjer, da je 5 najstarijih pacijenata u uzorku imalo 102, 64, 63, 59 i 56 godina, u neparametrijskoj analizi te bi se vrijednosti pretvorile u rangove od
1, 2, 3, 4 i 5, čime bi se smanjio utjecaj ekstremne vrijednosti 102. Primjeri neparametrijskih testova (ne iscrpan popis) uključuju MannWhitney U test ili
Wilcoxonov test ranga umjesto ttesta s dva uzorka, Wilcoxon je potpisao test ranga umjesto uparenog ttesta i Friedmanov test umjesto ANOVAe.
Kategorički ishodi Kada je ishod interesa kvalitativni faktor, kažemo da je to kategorička varijabla, što znači da može poprimiti samo diskretan
Sve ove vrste ttestova i ANOVA metoda pretpostavljaju da se podaci unutar svake populacije (približno) obično distribuiraju. Manja odstupanja od ove
Access Provided by:
pretpostavke mogu se tolerirati, ali kada ta pretpostavka nije realna, kao što je to često slučaj, analitičar ima dvije mogućnosti: (1) podaci se mogu
transformirati na način koji rezultira simetričnijom raspodjelom (npr. Pozitivno iskrivljeni podaci mogu imati koristi od logaritamske transformacije) ili
(2) umjesto t može se primijeniti neparametrijski test test ili ANOVA. Ovi neparametrijski testovi, kao što im ime govori, ne donose distribucijske
pretpostavke o podacima. Oni su neosjetljivi na ekstremne vanserijske jer koriste redoslijed ranga opažanja, a ne njihove stvarne vrijednosti. Tako bi,
na primjer, da je 5 najstarijih pacijenata u uzorku imalo 102, 64, 63, 59 i 56 godina, u neparametrijskoj analizi te bi se vrijednosti pretvorile u rangove od
1, 2, 3, 4 i 5, čime bi se smanjio utjecaj ekstremne vrijednosti 102. Primjeri neparametrijskih testova (ne iscrpan popis) uključuju MannWhitney U test ili
Wilcoxonov test ranga umjesto ttesta s dva uzorka, Wilcoxon je potpisao test ranga umjesto uparenog ttesta i Friedmanov test umjesto ANOVAe.
Kategorički ishodi Kada je ishod interesa kvalitativni faktor, kažemo da je to kategorička varijabla, što znači da može poprimiti samo diskretan
skup mogućih vrijednosti. Kategoričke varijable mogu se nadalje klasificirati kao nominalne (imenovane kategorije, kao što je krvna grupa) ili redne
(poredane kategorije, kao što je ozbiljnost boli ako se mjeri kao nijedna, blaga, umjerena ili teška).
Analiza kategoričkih ishoda često uključuje korištenje jednog od skupova testova poznatih zajedno kao chisquare testovi. U Pearson chisquare testu,
2 ili više skupina se uspoređuju s obzirom na udio koji pokazuje ishod. Podaci se često sažimaju u tablici za nepredviđene situacije ili unakrsnoj tablici,
u kojoj se ispitanici unakrsno klasificiraju kombinacijom svoje skupine izloženosti i imaju li ishod ili ne. Unakrsna tablični prikazi predstavljaju broj i
postotke za svaku moguću kombinaciju 2 čimbenika, pri čemu je jedan faktor naveden u recima, a drugi u stupcima. Pearsonov chikvadrat koristi
kontinuiranu distribuciju kako bi približio ponašanje kategoričkih podataka; međutim, ako je broj ispitanika u jednoj ili više skupina (definiranih
izlaganjem ili ishodom) mali, međutim, upitna je valjanost te aproksimacije, u tom bi se slučaju umjesto toga trebao upotrijebiti Fisherov točan test.
Većina statističkog softvera programirana je da upozori korisnike kada se preferira upotreba Fisherovog točnog testa. Baš kao što je slučaj s
kontinuiranim ishodima, ako skupine koje treba usporediti nisu neovisno odabrane, već su umjesto toga uparene ili usklađene, tada metoda analize
mora uzeti u obzir međuovisnost unutar parova. U ovom slučaju, moglo bi se koristiti McNemarov test za uparene podatke. Tablica za nepredviđene
situacije postavljena je drugačije, međutim, jer jedinica promatranja postaje podudarni parovi umjesto pojedinačnih subjekata. Svaki par je unakrsno
klasificiran s obzirom na ishod za svakog od 2 člana para.
Ishodi s vremena na događaj (analiza preživljavanja)— Kada je ishod događaj koji se događa tijekom vremena, često se zanima i doživljavaju li
subjekti događaj i koliko brzo doživljavaju događaj. Ako je događaj onaj za koji se svi subjekti mogu u potpunosti promatrati s obzirom na činjenicu ili
vrijeme događaja, tada se mogu primijeniti ranije opisane metode. Mnoge studije, međutim, prate ispitanike za pojavu događaja u kojem na kraju
studije neki ispitanici nisu doživjeli događaj, ali su bili izloženi riziku za taj događaj neko vrijeme. Kaže se da je vrijeme za događaj za takve teme
cenzurirano, jer ga samo djelomično promatramo (tj. znamo da je vrijeme barem onoliko dugo koliko su vremena bili ugroženi, ali ne znamo koliko
još). To se često javlja u studijama u kojima je događaj od interesa smrtnost, jer se takve studije često neće nastaviti dok svi ispitanici ne umru. Kao
takve, analitičke metode za rješavanje cenzuriranih podataka s vremena na događaj često se nazivaju analizom preživljavanja. Iskustvo preživljavanja
(ili vremena bez događaja) u 1 ili više skupina može se procijeniti različitim metodama, uključujući KaplanMeier ili metodu ograničenja proizvoda. To
se može grafički ilustrirati KaplanMeier krivuljom (zapravo funkcija koraka) koja prikazuje vrijeme proučavanja na horizontalnoj osi protiv
vjerojatnosti preživljavanja (bez događaja) na vertikalnom pristupu. Iskustvo preživljavanja 2 ili više skupina može se usporediti s različitim metodama,
uključujući test logranga.
Pvrijednosti— Bez obzira na vrstu korištenog statističkog testa, test hipoteze provodi se usporedbom promatranih podataka s onim što bi se
očekivalo da će se primijetiti pod onim što se naziva nultom hipotezom koja, općenito govoreći, predstavlja odsutnost razlike između skupina, ili
učinka, povezanosti itd. Ako bi ono što je uočeno bilo malo vjerojatno pod nultom hipotezom, tada se ta ništetna hipoteza odbacuje u korist
alternative (npr. Da postoji razlika ili učinak). Naime, izračunava se statistika testa (to može biti t statistika, chikvadrat statistika ili neka druga) čija je
raspodjela vjerojatnosti pod ništetnom hipotezom poznata. Kada se pojave "malo vjerojatne" vrijednosti statistike testa, odnosno kada odbacimo
nultu hipotezu. Način na koji definiramo malo vjerojatan određen je razinom značajnosti testa, označenog α, koji je obično postavljen konvencijom u
0,05. Dakle, s α = 0,05, ako statistika testa padne u rasponu vrijednosti za koje je najmanje vjerojatno da će se dogoditi 5%, odnosno kada odbacimo
nultu hipotezu. No, osim što to odbacuje ili ne odbacuje dihotomiju, naši statistički testovi proizvode mjeru vjerojatnosti naše statistike testa poznate
kao P vrijednost. Naime, P vrijednost je šansa za promatranje tako velike statistike testa (u apsolutnoj vrijednosti) kao ona uočena ako je ništetna
hipoteza istinita. Budući da je statistika testa funkcija promatranih podataka, P vrijednost se može smatrati izgledima za promatranje tako velikog
stupnja razlike kao što je uočeno ako se, zapravo, populacije koje predstavljaju skupine uopće ne razlikuju. Jedna stvar koju P vrijednost nije, iako se
često pogrešno tumači kao takva, je vjerojatnost da je zaključak o odbacivanju ili ne odbacivanju samo zbog slučajnosti.
Mjere pojave i udruživanja bolesti
Ciljevi studije često uključuju želju za kvantificiranjem učestalosti kojom se, ili brzinom kojom se bolest (ili drugi ishod) javlja i / ili povezanost 1 ili više
čimbenika rizika s pojavom bolesti. Za to moramo imati mjerne podatke koji opisuju i pojavu bolesti i povezanost čimbenika rizika i ishoda.
Rizici, stope i kvote
Udio određene populacije koja razvija određenu bolest naziva se rizikom od bolesti. Rizik se procjenjuje jednostavno kao broj s bolešću u odnosu na
ukupan broj izložen riziku od bolesti. Udio razvoja bolesti po jedinici vremena naziva se stopa bolesti. Brojnik za stopu je još uvijek isti, ali nazivnik više
nije broj rizične populacije, već vrijeme promatranja osobe. Da bi se izračunalo vrijeme za osobu, recimo u godinama, zbraja se broj godina koje je
slijedio svaki subjekt u rizičnoj skupini kako bi se dobila ukupna osobagodina za izračun stope. Granica između rizika i stopa ponekad može biti u
Access Provided by:
Ciljevi studije često uključuju želju za kvantificiranjem učestalosti kojom se, ili brzinom kojom se bolest (ili drugi ishod) javlja i / ili povezanost 1 ili više
čimbenika rizika s pojavom bolesti. Za to moramo imati mjerne podatke koji opisuju i pojavu bolesti i povezanost čimbenika rizika i ishoda.
Rizici, stope i kvote
Udio određene populacije koja razvija određenu bolest naziva se rizikom od bolesti. Rizik se procjenjuje jednostavno kao broj s bolešću u odnosu na
ukupan broj izložen riziku od bolesti. Udio razvoja bolesti po jedinici vremena naziva se stopa bolesti. Brojnik za stopu je još uvijek isti, ali nazivnik više
nije broj rizične populacije, već vrijeme promatranja osobe. Da bi se izračunalo vrijeme za osobu, recimo u godinama, zbraja se broj godina koje je
slijedio svaki subjekt u rizičnoj skupini kako bi se dobila ukupna osobagodina za izračun stope. Granica između rizika i stopa ponekad može biti u
redu, jer je rizik često na određeno vrijeme, na primjer, petogodišnji rizik od recidiva raka. Ne razmišljamo često o izgledima za bolest, ali ponekad
moramo izračunati koeficijente za mjere udruživanja (opisane kasnije). Ako je vjerojatnost ishoda P, onda su izgledi za takav ishod P/(1 – P), odnosno
šansa da se to dogodi podijeljena su šansom da se to ne dogodi. Imajte na umu da ako je ishod rijedak (P blizu nule), onda je šansa da se to ne dogodi
blizu jedne, a izgledi i rizik su gotovo isti.
Mjere omjera pridruživanja
Ako se uspoređuju dvije skupine s obzirom na pojavu ishoda, one se mogu usporediti s mjerama omjera ili mjerama razlike. Prvo razmatramo mjere
omjera. Relativni rizik je jednostavno rizik u skupini interesa podijeljen s rizikom u usporednoj skupini. Ako se uspoređuju stope, a ne rizici, umjesto
toga može se izračunati omjer kamatnih stopa. U kontekstu analize preživljavanja, stopa događaja u jednoj skupini podijeljena sa stopom u drugoj
naziva se omjer opasnosti (stope). Za izradu studije kontrole slučaja rizik u svakoj usporednoj skupini ne može se izravno promatrati, a umjesto toga
izračunavamo omjer koeficijenata, definiran kao izgledi za izloženost u slučajevima oko izgleda za izloženost u kontrolama. Ako je ishod rijedak, može
se iskoristiti činjenica da su izgledi i rizik gotovo isti i upotrijebiti takozvanu pretpostavku o rijetkim bolestima kako bi se omjer koeficijenata
protumačio kao procjena relativnog rizika. Međutim, kada ishodi nisu rijetki, omjer koeficijenata ima tendenciju precjenjivati relativni rizik (tj. biti dalje
od nultog omjera jedan).
Različite mjere udruživanja
Ponekad je apsolutna razlika u riziku ili stopi između 2 skupine od većeg interesa od relativne razlike. U takvim bi se slučajevima prednost dala mjeri
razlike u odnosu na mjeru omjera. Razlika u riziku je jednostavno rizik u jednoj skupini minus rizik u drugoj. U kliničkim studijama, gdje je cilj često
testirati eksperimentalno liječenje kako bi se vidjelo smanjuje li rizik od nepovoljnog ishoda u odnosu na kontrolni tretman, te mjere ponekad idu po
specifičnijim imenima. Brzina kontrolnih događaja i eksperimentalna stopa događaja jednostavno su stope (ili rizici) ishoda u kontrolnoj skupini,
odnosno eksperimentalnoj skupini. Razlika između njih poznata je kao apsolutno smanjenje rizika (ARR) i mjera je koliko bi se događaj (bolest,
smrtnost itd.) mogao spriječiti (ili izliječiti) zamjenom kontrolnog liječenja eksperimentalnim liječenjem. Druga mjera povezanosti, povezana s ARRom
i često važna u kliničkim studijama, je broj potreban za liječenje (NNT). Definira se kao NNT = 1/ARR. Procjena je koliko bi pacijenata trebalo liječiti
eksperimentalnim liječenjem kako bi se spriječio 1 štetni ishod (npr. Smrt). Tako, na primjer, ako bi novi tretman smanjio smrtnost u određenoj
populaciji pacijenata s 10% na 4%, relativni rizik (smrti) bio bi 0,40 (4%/10%), ARR bi bio 6% (10% 4%), a NNT = 1/0,06 = 16,67, što sugerira da bi se 17
pacijenata trebalo liječiti kako bi se spriječila 1 smrt. Broj potreban za nanošenje štete analogna je mjera u studijama u kojima se skupine uspoređuju s
obzirom na faktor rizika ili izloženost koja povećava, a ne smanjuje rizik od ishoda. I dalje se izračunava kao 1 podijeljena s apsolutnom razlikom u
riziku, ali ima suprotno tumačenje jer je skupina s faktorom interesa oštećena, a ne da joj se pomogne.
Intervali pouzdanosti
Bilo koja od prethodno navedenih mjera može se procijeniti iz određenog skupa podataka. Takva procjena naziva se točkasta procjena. Budući da se
temelji na ograničenim podacima uzorka, procjena točke razlikovat će se od stvarne vrijednosti koju namjerava procijeniti zbog varijabilnosti
uzorkovanja. Da biste dobili bolju predodžbu o tome koja bi mogla biti prava vrijednost parametra populacije, može se izračunati i predstaviti interval
pouzdanosti (CI) oko procjene točke. CI ima razinu pouzdanosti povezanu s njom, označenu (1 α) i obično izraženu kao postotak, što odgovara razini
značajnosti α za povezani test hipoteze. Tipično, α = 0,05, što odgovara 95% CI a. Iako nam CI daje bolju predodžbu o tome koja je prava vrijednost
populacije od procjene točke, bilo koji CI iz jedne studije može, ali i ne mora sadržavati tu pravu vrijednost. No, formule za izračunavanje 95% CI
konstruirane su na takav način da će, tijekom ponovljenih studija, sadržavati ispravnu vrijednost 95% vremena. Iz toga CIi dobivaju svoje ime, jer
tvrdimo 95% povjerenja da će interval sadržavati pravu vrijednost.
Diagnostic and Screening Test Performance Measures
Dijagnostički testovi i testovi probira koriste se za klasificiranje pacijenata s obzirom na prisutnost ili odsutnost bolesti, sindroma ili drugog stanja. Ti
testovi nisu uvijek točni, a njihova učinkovitost opisana je različitim mjernim podacima koji se odnose na ispravnu klasifikaciju onih s bolešću i bez nje.
Da biste definirali ove mjere, razmotrite populaciju N pacijenata zastupljenih u sljedećoj "tablici istine". Stupci tablice predstavljaju stvarnu prisutnost
ili odsutnost bolesti pacijenata, dok redovi predstavljaju njihov rezultat ispitivanja. U praksi, pri procjeni novih testova, možda nećemo sa apsolutnom
sigurnošću znati pravi status bolesti skupa pacijenata, već ćemo usporediti novi test sa "zlatnim standardom" za koji se pretpostavlja da predstavlja
pravi status bolesti (tablica 116–1).
Table 116–1
Access Provided by:
Diagnostic and Screening Test Performance Measures
Dijagnostički testovi i testovi probira koriste se za klasificiranje pacijenata s obzirom na prisutnost ili odsutnost bolesti, sindroma ili drugog stanja. Ti
testovi nisu uvijek točni, a njihova učinkovitost opisana je različitim mjernim podacima koji se odnose na ispravnu klasifikaciju onih s bolešću i bez nje.
Da biste definirali ove mjere, razmotrite populaciju N pacijenata zastupljenih u sljedećoj "tablici istine". Stupci tablice predstavljaju stvarnu prisutnost
ili odsutnost bolesti pacijenata, dok redovi predstavljaju njihov rezultat ispitivanja. U praksi, pri procjeni novih testova, možda nećemo sa apsolutnom
sigurnošću znati pravi status bolesti skupa pacijenata, već ćemo usporediti novi test sa "zlatnim standardom" za koji se pretpostavlja da predstavlja
pravi status bolesti (tablica 116–1).
Table 116–1
Truth table.
True Disease Status
Disease No Disease Total
Test Result Positive a b a + b
Negative c d c + d
Total a + c b + d N
Osjetljivost testa odnosi se na to koliko dobro klasificira one s bolešću i jednaka je [a/(a + c)], udjelu onih s bolešću koji su pozitivni. Specifičnost testa
odnosi se na to koliko dobro klasificira one bez bolesti i jednaka je [d/(b + d)], udjelu onih bez bolesti koji su negativni. Pozitivna prediktivna vrijednost
(PPV) testa odnosi se na to koliko je vjerojatno da pozitivan rezultat testa ukazuje na prisutnost bolesti i jednak je [a/(a + b)], udjelu svih onih s
pozitivnim rezultatom testa koji zapravo imaju bolest. Negativna prediktivna vrijednost (NPV) testa odnosi se na to koliko je vjerojatno da negativan
rezultat testa ukazuje na odsutnost bolesti i jednak je [d/(c + d)], udjelu svih onih s negativnim rezultatom testa koji zapravo nemaju bolest.
Osjetljivost i specifičnost testa su karakteristike samog testa i stoga se ne mijenjaju ako se nešto u vezi sa samim testom ne promijeni (npr. promjenom
prekida za ono što se smatra pozitivnim rezultatom testa). PPV i NPV, međutim, ne ovise samo o tome koliko je test točan, već io tome koliko je bolest
rasprostranjena u populaciji na koju se test primjenjuje. Prevalencija bolesti je udio populacije koja ima bolest. U našoj prethodno raspravljenoj tablici
istine prevalencija je [(a + c)/N]. Konkretno, ako je prevalencija niska u populaciji koja se testira, test s prilično visokom osjetljivošću i specifičnošću još
uvijek može imati vrlo loš PPV. U takvim slučajevima mogu biti potrebni konkretniji potvrdni testovi kod onih koji su u početku pozitivni.
ZAKLJUČAK
Razvoj sveobuhvatne stručnosti u statističkim metodama izvan je opsega studija za većinu liječnika, a ovdje su predstavljene samo osnovne metode.
No kliničar koji je opremljen ovim alatima bolje je pripremljen za kritičku procjenu medicinske literature, gdje se mogu pojaviti inovacije koje mogu
utjecati na kliničku praksu. Klinički istraživač koji je opremljen ovim alatima bolje je pripremljen za osmišljavanje zdravih, nepristranih studija i
učinkovitu komunikaciju s kovanim istraživačima (uključujući biostatističare) kako bi iz svojih podataka napravio valjane zaključke. Konačno, liječnik
koji može cijeniti kada su tvrdnje objavljenih studija valjano potkrijepljene dostupnim podacima, a kada nisu, bolje je pripremljen za liječenje
pacijenata na optimalan način utemeljen na dokazima.
REFERENCA
1. Sackett DL, Rosenberg WM, Sivo JA, Haynes RB, Richardson WS. Medicina utemeljena na dokazima: što je to, a što nije. BMJ . 1996;312(7023):71–72.
[PubMed: 8555924]

Chapter 116 - Bedside Statistical Tools

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Chapter 116 - Bedside Statistical Tools

Uploaded by

Copyright:

Available Formats

Access

Disease No Disease Total

Test Result Positive a b a + b

Total a + c b + d N

You might also like