You are on page 1of 23

Statistik fr Unbegabte (Mediziner und Apotheker) Studie verstehen, Ergebnisse hinterfragen T Decker T.

Statistik die Sprache

Folgende statistische Hypothese wird getestet: H0 : Di wahre Die h 6-Monats-PFS-Rate 6 M t PFS R t einer i Vi Vinorelbinlbi EverolimusKombinationstherapie ist kleiner gleich 35% H1 : Die wahre 6-Monats-PFS-Rate 6 Monats PFS Rate einer VinorelbinVinorelbin EverolimusKombinationstherapie ist grer gleich 55% Fr ein einseitiges einseitiges Signifikanzniveau von 0.05 0 05, einer Power von 90% und 53 auswertbaren Patientinnen kann bei einer beobachteten 6-Monats-PFS-Rate von 47,2% die Nullhypothese, dass die Vinorelbin-Everolimus-Kombinationstherapie Vinorelbin Everolimus Kombinationstherapie bei der untersuchten Population nicht wirksamer ist als die Vinorelbin-Monotherapie, zurckgewiesen werden.

Statistik die Spezies?

Deskriptive Statistik: Darstellung der Daten: A ht Achtung F Fehlerbalken!! hl b lk !!

-SD: (Standartabweichung, Gauss/Normalverteilung) g 2/3 der Beobachtungen g in einer Population p -Faustregel: liegen im Bereich mean +/-SD (95% mean +/- 2SD) Ma fr die Streuung der Stichprobe -SEM: -Standartabweichung des Mittelwerts: SD/square n gibt b an, wie genau der d Mittelwert l ist (hngt (h von SD D und d Probengre n ab) -CI (Konfidenzintervall) -Das von der Probe kalkulierte Intervall enthlt den Populationswert mit 95% Sicherheit (besonders hilfreich zur Abschtzung der statistischen Signifikanz

Daten Prsentation.

Scattergramm

+// SD

+/ SEM +/-

Daten Prsentation.

+/- SEM +/

+// CI

Box-whisker

Error bars Regeln frs clevere Publizieren

Wenn man kleine Unterschiede hervorheben mchte (muss): SEM zeigen und hoffen, dass die Leser glauben, es handelt sich um SD Wenn man groe Unterschiede verschleiern mchte: SD zeigen und hoffen, hoffen dass die Leser denken denken, es seien SEM

Error bars Regeln frs richtige Publizieren

Wenn man die Variationsbreite der Daten zeigen mchte: Scatter blot, box box-whisker, whisker, (mean +// SD) Wenn man zeigen mchte, wie genau man den Mittelwert gef. hat: Mean +/- (95% CI), CI)

P-Werte und Signifikanz

Beispiel: Coin-Flipping Coin Flipping: : 20 Wrfe, Wrfe 16 x Kopf; Null-Hypothese: fairer Wrfel; Wie gro Wi i ist die di Chance Ch (bei (b i einem i f fairen i Wrfel) W f l) , dass bei 20 Wrfen entweder 16 oder mehr oder 4 oder weniger p kommen? Kpfe (binomial Verteilung. 1,19% oder 0,019) Kontext!! (Deutsche Mark versus Mnze in Zaubershow)

P-Werte und Signifikanz

P-Werte Verstndnisprobleme: -Null Hypothese ist gewhnlich das Gegenteil von dem, was die Studie zeigen mchte (z.B. (z B neue Therapie und Standart sind gleich wirksam wirksam, ein ev. Unterschied zwischen den Gruppen besteht zufllig) Knoten im Hirn Rckwrts-Logik: Null Hypothese wird festgelegt, Gruppe wird beobachtet, es wird die Wahrscheinlichkeit bestimmt, mit der beobachtete Ergebnis zufllig erreicht i ht wird, i d -Wenn diese Wahrscheinlichkeit kleiner ist, als ein vorher festgelegter Wert g spricht p man von statistisch signifikant g (Signifikanzniveau), Trick: one tailed / two tailed Vorteil: Ergebnis schneller signifikant!! Aber: Vorteil Aber One tailed nur, wenn vorher schon klar ist, dass der Unterschied nur in Einer Richtung liegen kann (z.B Gre vor und nach Wachstumshormon)

Statistisch signifikant

-Hufig missverstanden! m, wichtig)!!! w g) bedeutsam,

(statistisch signifikant nicht gleich

-Entscheidung treffen!, Null Hypothese annehmen / verwerfen verwerfen.. -p-Wert Schwelle = Signifikanz-level alpha (0.05) -Wenn die Wahrscheinlichkeit p (wird von den aktuellen Daten berechnet) < 0 0.05, 05 dann: -Signifikant, sehr signifikant, -extrem signifikant? fk g (p= (p 0,051..) , ) -- fast signifikant?

Statistisch signifikant

-Type I Fehler: , wenn w die Nullhypothese yp abgelehnt g wird, w , obwohl w sie -Passiert, zutrifft -Type II Fehler -Passiert, wenn die Nullhypothese nicht abgelehnt wird, obwohl sie falsch ist -Niedrige Signifikanzlevel alpha: wenige Type I / mehr Typ 2 Fehler -Schuldig g Typ I -Korrekt Unschuldig g korrekt Typ II

Statistisch signifikant
-Wenn ein Ergebnis g statistisch signifikant g ist, nicht aufhren zu denken! -Statistisch sign. heisst, dass die erzielten Resultate berraschend wren, wenn die Nullhypothese stimmen wrde -(aber auftreten knnen), klinischer Kontext ist wichtig! -Bayesian Logic: -Der Kontext einer Studie (in vitro Daten etc) beeinflusst di I die Interpretation t t ti d der D Daten! t ! ( (exakte kt M Methoden th d z.B. B genetische Vererbung), informell! -(Beispiel: gute in vitro Daten, plausible Versuchsanordnung)

Statistisch nicht signifikant

-Wenn ein Ergebnis statistisch nicht signifikant ist, nicht aufhren zu denken! -Statistisch nicht sign. heisst, dass die erzielten Resultate durchaus auftreten knnen, wenn H0 stimmt -Insbesondere bei groen Konfidenzintervallen knnten die Daten einfach unklar sein (zu kleine Stichprobe, zu wenig P Power) ) -Faustregel: Stichprobe x 4; CI wird um den Faktor 2 kleiner

Power

Power Wenn zwischen zwei Behandlungen ein def. Unterschied besteht (z.B. OS 10%): Wie gro ist die g f Resultat zu erhalten Chance ein statistisch signifikantes (Stichprobenumfang) -Der Stichprobenumfang wird so gewhlt, gewhlt soda die Chance Chance, ein statistisch signifikantes Resultat zu erhalten z.B. 80% betrgt; je grer der Unterschied, desto geringer die Fallzahl -Je grer die Power, desto geringer Typ-2 Error -Power P = C/C+D / Wird (vom PC) kalkuliert: sample size, SDs, Signifikanz, Gre des erwarteten Effekts level, H0 ablehnen H0 annehmen -H0 true -H0 false A C B D

Multiple Vergleiche

-Wenn Du Deine Daten lang genug qulst, zeigen sie was Du willst -X unabhngige Vergleiche aus der selben Stichprobe: Chance, dass mindestens 1 Ergebnis signifikant ist: 1-0,95X -Bei 13 Vergleichen: 50% Chance auf ein statistisch sign. sign Ergebnis (aus Zufall) -Bonferroni-Korrektur: B f i K kt -Statistisch signifikant, wenn p < 0,05/Anzahl der Vergleiche -Beispiel T-REX: G1 v G2/G3; G /G3; N0 v N1 N v N2, N , T1 v T2-4, 4, her her-2 pos -G -v Hr pos v triple neg., ductal vs lobulr -P=0,008, P=0 008 p=0,04; p=0 04; (7 Tests: Sig Niveau: 0,007) 0 007)

Multiple Vergleiche

Welcher Test?

Kontinuierliche Variable von einer Gauss Verteilung (z.B. ( . . Leukozytenzahl; L y ; mean m +/-SD) / D) - 2 Gruppen: T Test (paired, unpaired) (ggf. Korrektur fr multiples testen) ->2 Gruppen: ANOVA Kontinuierliche Daten von nicht-Gauss nicht Gauss Verteilungen Verteilungen (weniger Power! im T-Rex Beispiel p= 0.008 versus p=0.29) (z.B. Gleason Score: median +/- 25er/75er Perzentilen) - 2 Gruppen: - >2 Gruppen: Mann-Whitney, Wilcoxon Kruskal-Wallis, Friedman`s

Welcher Test?

berlebenszeit Kaplan-Meier K p M Kurve, K , Median M survival, , % berleben nach x Jahren Log-rank Test Binomial AML Heilung ja/nein nach 5 Jahren: (Kontingenz-Tafeln) - 2 Gruppen: G pp - >2 Gruppen: F h Fisher, Mc Nemars Chi square q

Zusammenfassung

-Don Don`t t forget the big picture picture -Sinn und Zweck: Extrapolieren von einer limitierten S i h Stichprobe, b um generelle ll Aussagen A zu machen h q / Design g / -Mll rein Mll raus : Datenqualitt Manipulation (Mini-Unterschiede Unterschiede statistisch -Problem der sehr groen (Mini signifikant) und sehr kleinen Stichproben (underpowered) -P < 0 0,05 05 ist nicht heilig ! -Statistisch signifikant heit nicht, wissenschaftlich relevant -Absence of evidence is not evidence of absence

Zusammenfassung

-Problem der multiplen Vergleiche -Planung (Stichprobenumfang, Tests etc. vorher!!) -Konfidenzintervalle sind einfacher zu handhaben als pWerte -Skeptisch sein! Viele (die meisten publizierten?) (statistisch signifikanten) Ergebnisse sind falsch (TypI error), kleine Stichprobe, Bias, multiple Vergleiche, flexible Datenanalyse, l

Statistik intuitiv daneben?

Das Monty Hall Problem 3 Tren, Tren hinter einer Tr ist ein Auto, Auto hinter 2 Tren eine Ziege Du whlst eine Tr..

Der Sh D Showmaster t ff ffnet t eine i andere d T Tre und d zeigt i t Di Dir, d dass dahinter d hi t Kein Auto ist - er bietet Dir an, Deine Wahl zu ndern. Was nun? Annehmen? Falle?

Statistik intuitiv daneben?

Auflsung: g Tre wechseln!!! Erklrung z B auf youtube: Monthy Hall z.B.