You are on page 1of 5

© Michał Jasieński – Myślenie Krytyczne – 28 sierpnia 2023 – strona 164

14.3 Co to jest “próba podwójnie ślepa”?

Kto ma być “ślepy” i dlaczego? Z jednej strony eksperymentu jest osoba jemu
poddana, czyli pacjent albo podmiot badawczy. Nie ma wątpliwości, że efekt placebo
może wpłynąć na reakcję takiej osoby na zabieg/procedurę, a więc osoby należące do
grupy eksperymentalnej (poddanej zabiegowi) oraz kontrolnej (poddanej zabiegowi
nieprawdziwemu) nie mogą wiedzieć, do której grupy należą. Chodzi nam w końcu o
uzyskanie oszacowanie “czystej” wielkości efektu podania leku lub zastosowania
procedury, bez wzmocnienia lub osłabienia spowodowanego przez efekt placebo
wywołany u konkretnych pacjentów.

Z drugiej strony eksperymentu jest osoba badająca, czyli eksperymentator. Ponieważ


nastawienie takiej osoby i jej mimowolne zachowanie (mowa ciała) może w subtelny
sposób wpłynąć na reakcję osoby badanej, należy “oślepić” badacza także. Badacz nie
powinien wiedzieć, czy ma do czynienia z osobą z grupy eksperymentalnej czy z
kontrolnej.

Taką potrzebę ilustruje doskonale historia Mądrego Hansa (der Kluge Hans),
sławnego konia, który – rzekomo - umiał liczyć, odróżniać akordy harmonijne od
dysonansów i nawet podawał
aktualną datę, przez stukanie
kopytem. Trener pytał konia
ustnie lub pokazywał pytania
napisane na tablicy. W
pierwszych latach XX wieku
Mądry Hans był wielką
atrakcją i jednocześnie -
sensacją naukową; dwie
komisje badały jego
zagadkowe i niespodziewane
talenty!

Ryc. 14.4 – Mądry Hans (chodzi o konia, a nie masztalerza), ze swoim trenerem, Wilhelmem von
Osten, autorem całej mistyfikacji.

Berliński psycholog Oskar Pfungst udowodnił w 1907 roku, że wszystkie


intelektualne osiągnięcia konia polegały na obserwowaniu przez niego mimowolnych
reakcji trenera lub innych osób. Mądry Hans potrafił odpowiadać prawidłowo na
zadane pytania tylko wtedy, gdy widział osobę zadającą pytania. Mało tego, taka
osoba musiała jednocześnie znać odpowiedź na pytanie (wtedy koń odpowiadał
poprawnie na 89% pytań); gdy nie znała – tylko 6% jego odpowiedzi było
prawidłowych, czyli wynikały one wtedy wyłącznie z przypadku. Von Osten nigdy
nie przyznał racji Pfungstowi i jego (o dziwo) darmowe, pokazy były bardzo
popularne w Niemczech nawet po 1907 roku, a więc gawiedzi nie przeszkadzało to,
że oglądali coś nieprawdziwego!

Natomiast inna sprawa jest całkowicie fascynująca: zdolność tego konia do


“czytania” reakcji trenera albo innych osób – w końcu te reakcje to były bardzo
subtelne zachowania, trudne do zauważenia dla innych ludzi. Wynika z tego, że konie
są intelektualnie bardzo głupie, czyli w toku ich ewolucji umiejętność liczenia,
odróżniania akordów i podawania prawidłowej daty w kalendarzu nie były raczej
© Michał Jasieński – Myślenie Krytyczne – 28 sierpnia 2023 – strona 165

istotne, z punktu widzenia maksymalizacji szans przeżycia i wydania potomstwa.


Jednocześnie, jako zwierzęta stadne, konie wyewoluowały wspaniałe umiejętności
reagowania na zachowanie innych osobników, czyli są niesamowicie wrażliwe
“towarzysko”!

14.4 Testowanie przepowiedni astrologicznych


Każdej minuty rodzi się gdzieś jakiś frajer
P.T. Barnum 226

Oto jedna z wielu dróg do weryfikowania postulatów astrologii. Skoro jest 12 znaków
Zodiaku, to potrzebujemy minimum 30 osób urodzonych “pod” każdym ze znaków,
czyli w naszym eksperymencie powinno uczestniczyć 360 osób. Otrzymujemy od
wynajętego astrologa horoskopy dla każdego znaku Zodiaku i
eksperyment zaczyna się! „Przepowiednia” dla Koziorożca
jest wysłana wszystkim 360 osobom, z których – oczywiście
– tylko 30 osób to Koziorożce i tylko oni powinni określić
horoskop jako celny (po miesiącu obserwacji tego co się
wydarzyło). Wszyscy pozostali nie powinni, bo horoskop
nie był dla nich.

Ryc. 14.5 – Ikona zodiakalnego Koziorożca.

Czy przepowiednia (horoskop) jest prawidłowa, czyli czy astrologia “działa”? Aby
odpowiedzieć na to pytanie, formułujemy hipotezę zerową, czyli taką, którą
odrzucimy, gdy okaże się, że horoskopy dobrze przewidują ludzie losy. Hipoteza Ho
brzmi: “Procent odpowiedzi „tak” wśród Koziorożców (n = 30) jest taki sam jak
średni procent odpowiedzi „tak” u wszystkich pozostałych 11 grup, czyli nie-
Koziorożców (n = 330)”. Wiadomo, że nie wszystkie Koziorożce odpowiedzą “tak”,
ale procentowo powinno ich być znacznie więcej niż osób z innych znaków Zodiaku
odpowiadających “tak”. Jeżeli horoskop mówi prawdę…

Jeśli okaże się, że rzeczywiście procenty w grupie Koziorożców i w grupie


wszystkich innych osób są takie same albo bardzo podobne, to Ho jest prawdziwa,
czyli astrologia nie działa. Oczywiście, decyzję o tym, czy procenty w obu grupach
różnią się istotnie możemy podjąć tylko po wykonaniu testu statystycznego (zob.
część 6 rozdział 2 – o sondażach, bo to jest ten
sam problem: musimy wiedzieć jaki jest
tzw. margines błędu naszych oszacowań
procentowych).

Ryc. 14.6 – Znaki Zodiaku.

Tę procedurę powtarzamy jeszcze 11


razy – dla każdego z pozostałych
znaków Zodiaków. Idealnie,
powinniśmy badać za każdym razem
inną grupę ludzi (co oznacza, że
potrzebowalibyśmy 12*360 = 4,320 osób),
ale – od biedy – można wykorzystać te same
© Michał Jasieński – Myślenie Krytyczne – 28 sierpnia 2023 – strona 166

osoby co poprzednio.

Ktoś może jednak powiedzieć, że to był głupi astrolog i powinniśmy spróbować


innego. OK, zróbmy to jeszcze raz, z innym autorem horoskopu, ale nie ma
gwarancji, że będzie lepszy, skoro nie ma żadnych racjonalnych kryteriów oceny
jakości ich pracy… Najlepiej podejdźmy do tego profesjonalnie i zatrudnijmy 30
astrologów (bo wtedy ich osobiste zalety i wady uśrednią się). Każdy z nich pisze 12
horoskopów i testujemy ich przepowiednie na 30*4320 = 129,600 osobach…. Takie
są standardy prawdziwych badań w naukach ścisłych i dlatego badania tyle kosztują i
zajmują tyle czasu. Bez tego, po prostu nie wiemy dość. Podejście “od biedy”
możemy stosować w niepoważnym eksperymencie nad astrologią, ale nie w badaniu
szczepionek lub leków.

Pod koniec całego procesu zbierania danych pytamy: “Czy horoskopy bardziej celnie
stosowały się do osób, dla których zostały napisane?”. Powiedzmy, że średni %
odpowiedzi „tak” wyniósł 52% wśród osób docelowych (czyli tych, dla których
horoskopy były napisane). Średni % odpowiedzi „tak” wyniósł 48% wśród osób z
grupy kontrolnej (czyli tych, którzy mieli inny znak Zodiaku niż ten, o którym mówił
horoskop). Potem, badamy czy 52% jest statystycznie istotnie wyższe niż 48%, czy
też – tak naprawdę – ta drobna różnica wynika z przypadku. Jeżeli różnica NIE jest
istotna, to znaczy, że nie możemy odrzucić hipotezy zerowej i wyciągamy wniosek,
że astrologia to tylko zabawa i nie ma nic wspólnego z rzeczywistością.

Ale, jeżeli odrzucimy Ho, to pojawia się pytanie, jak to wytłumaczyć? Czy były inne,
uwikłane, przyczyny, które mogły spowodować taki wynik? Na przykład, lektura
horoskopu wpływa na zachowanie ludzi, którzy – mimowolnie, być może –
zachowują się tak jak mówiła przepowiednia. Otóż nie! Ten efekt został
zneutralizowany przez formę naszego badania, ponieważ był to eksperyment. Dzięki
temu, efekt lektury horoskopu wpływał tak samo na wszystkich czytających go,
niezależnie od tego pod jakim znakiem Zodiaku się urodzili. Dlaczego? Ponieważ
wszyscy uczestnicy sądzili, że czytają horoskop napisany dla nich! Jednak tylko
horoskop napisany dla właściwego odbiorcy, czyli tego, który ma odpowiednią datę
urodzenia, powinien zawierać celne przepowiednie. (Oczywiście, nie zawiera, bo to
wszystko są archaiczne bzdety.)

Powyższy – wyimprowizowany przeze mnie - scenariusz „badawczy” dotyczy


zjawiska z psychologii, które interesowało psychologów od dawna. Jest to tzw. efekt
horoskopowy (zwany inaczej efektem Forera lub Barnuma – zob. motto tego
rozdziału), który pojawia się, ponieważ ludzie mają skłonność do naciągania bardzo
ogólnych opisów cech osobowości do swojej własnej sytuacji, tworząc poczucie
zgodności opisu – gdy, w rzeczywistości, nie ma powodu, żeby istniała jakakolwiek.

W klasycznym eksperymencie z 1948 roku, Bertram Forer zademonstrował to


zjawisko dając wszystkim studentom identyczny tekst analizy ich osobowości
(zrobiony rzekomo na podstawie ankiety, którą wcześniej wypełniali). W opinii
studentów trafność analizy była bliska znakomitej (4.26 na skali od 0 do 5). „Analiza”
była sklejanką zdań z różnych horoskopów i brzmiała tak (wg Wikipedii):

Masz potrzebę, by ludzie cię lubili i podziwiali, jednak jesteś osobą krytyczną wobec siebie. Masz
pewne wady osobowości, ale potrafisz je kompensować tym, co jest w tobie dobre. Masz duże
możliwości, które wciąż pozostają niewykorzystane. O ile na zewnątrz możesz wyglądać na osobę
© Michał Jasieński – Myślenie Krytyczne – 28 sierpnia 2023 – strona 167

zdyscyplinowaną i opanowaną, wewnątrz często trapi cię niepewność i martwisz się o wiele spraw.
Niekiedy masz poważne wątpliwości, czy twoja decyzja była dobra albo czy twoje czyny były
właściwe. Lubisz pewną ilość zmian i różnorodności, a kiedy osaczają cię ograniczenia, odczuwasz
niezadowolenie. Cenisz sobie własną niezależność myślenia i nie przyjmujesz cudzych twierdzeń bez
przekonujących dowodów. Życie nauczyło cię, aby nie przesadzać ze szczerością, kiedy się przed kimś
otwierasz. Czasem bywasz osobą otwartą na ludzi, przystępną i towarzyską, ale innym razem
zamkniętą, ostrożną i zdystansowaną. Niektóre z twoich marzeń wydają się być nierealistyczne.

Im silniejsze poczucie mają odbiorcy tego tekstu, że jest to analiza sporządzona


specjalnie dla nich, tym wyżej oceniają jej trafność. Średnia ocena robiona przez
osoby, które podały pełną datę urodzenia, była znacznie wyższa (4,38) od oceny osób,
które nie podały o sobie żadnych informacji (3,24). Efekt wzmacnia też autorytet
227
analizującego.

14.5 Testowanie przepowiedni różdżkarskich

Film Richarda Dawkinsa “Wrogowie rozumu” (dostępny w YouTube) ilustruje w jaki


sposób można przeprowadzić prosty test czy różdżkarstwo działa czy nie. Jeżeli
ukryta jest butelka wody lub nie ma jej, oznacza to, że różdżkarz ma 50% szans na
prawidłowe zdiagnozowanie sytuacji: mówiąc, że woda jest
(jeżeli jest) albo mówiąc, że nie ma (jeżeli jej nie ma).
Powtarzając taki sam test kilka razy, szansa prawidłowej
diagnozy podjętej przez szczęśliwy przypadek, za każdym
razem, spada z 50% na 25% przy dwóch próbach (1/2*1/2 =
1/4), 12.5% przy trzech próbach (czyli 1/2*1/2*1/2 = 1/8),
6.25% przy czterech próbach, 3.125% przy pięciu próbach
itd. A więc, jeżeli ktoś prawidłowo odgadnie obecność lub
nieobecność wody w 5 próbach (na 5 możliwych), to obawa,
że stało się to tylko przez przypadek (czyli bez dowodu na
posiadanie specjalnego talentu) wynosi zaledwie 3%. To już
coś, ale wolelibyśmy mocniejsze dowody.
Ryc. 14.7 – Zabawa w wahadełkowanie.

Na przykład, zwolennicy radiestezji woleliby, żeby okazało się, że wielu różdżkarzy


osiąga podobny rezultat, a nie tylko jeden człowiek. Dlaczego? Ponieważ 5
prawidłowych wskazań to jeszcze nie dowód na ogłaszanie różdżkarskiego tryumfu.
Tak samo, jak wyrzucenie 5 orłów pod rząd nie jest jeszcze powodem, żeby pisać
pismo z protestem do Mennicy Polskiej S.A., że wybija nieprawidłowo zbalansowane
monety. Wiemy, że seria 5 wydarzeń takich samych (orzeł-orzeł-orzeł-orzeł-orzeł
albo 5 razy czerwone pole w ruletce) to nie jest znowu takie wyjątkowe wydarzenie.
Natomiast ciekawą wiadomością byłoby, gdyby zdarzało się to znacznie częściej niż
to wynika z przypadku.

Wyniki przypadkowe są dla nas ważnym punktem odniesienia, bo formułujemy naszą


hipotezę zerową w następujący sposób: “Spodziewamy się, że wśród badanych
różdżkarzy, seria 5 prawidłowych decyzji co do obecności lub nieobecności wody,
wystąpi u ok. 3% z nich tylko przez przypadek, nie oznaczając powodu
przywoływania jakichś specjalnych umiejętności”. Jeżeli będzie ich więcej, to
sprawdzamy czy jest to istotnie więcej niż 3%. 228
© Michał Jasieński – Myślenie Krytyczne – 28 sierpnia 2023 – strona 168

Oczywiście, wiem, że różdżkarze na ogół starają się “wykazać” w umiejętnościach


wykrywania prawdziwych podziemnych cieków wodnych, a nie uczestnicząc w
żałosnych próbach w namiocie, pokazanych przez Dawkinsa. W Niemczech, kosztem
400 tysięcy marek, zrobiono w 1987 i 1988 roku eksperyment bardziej pasujący do
ich ambicji. 229 W dużym budynku stodoły zainstalowano rurę z płynącą wodą, ale
ułożenie rury było łatwo zmieniane przez eksperymentatorów. Lokalizacja rury była
ustalana z dokładnością do 10 cm przez liczby losowane przed każdą próbą, a
różdżkarz poszukiwał tej rury z poziomu pierwszego piętra, 5 metrów wyżej, stosując
różdżkę albo wahadełko. Osoby obecne z różdżkarzem na piętrze nie znały lokalizacji
rury, aby uniknąć efektu “mądrego Hansa” (zob. rozdział 3.3), gdy
eksperymentatorzy mogliby mimowolnie sugerować odpowiedź testowanemu
różdżkarzowi.

Spośród 500 kandydatów (a każdy z nich mógł wcześniej zrobić test swojej
“aparatury”, czyli wahadełek albo różdżek, w próbach o znanym położeniu “cieku”),
badacze wybrali 43 najlepszych, którzy zrobili ponad 800 prób wykrycia położenia
rur. Kilka osób osiągnęło wyniki zadziwiająco lepsze niż losowe. Jak to możliwe?
Czyżby posiadali oni jakąś, nieznaną współczesnej nauce, umiejętność? Odrzucenie
ich osiągnięć tylko dlatego, że naukowcy nie mogą ich wytłumaczyć wyglądałoby
jednak jak aroganckie poczucie wyższości i nieczyste zagranie ze strony naukowców
(zob. rozdział 14.8).

Ale nie: w dużej próbie osób badanych, zawsze znajdzie się kilka osób, które osiągną
dobry wynik przez przypadek. Można sobie doskonale wyobrazić, że wśród setek
tysięcy osób grających w Las Vegas na automacie do gry znajdą się osoby, które
wylosują wygrywającą kombinację parę razy pod rząd, ale to nie znaczy, że są
mistrzami. Po prostu, byli szczęściarzami.

Oczywiście, okazało się, że pre-selekcjonowanie osób badanych i “masowanie”


danych tak długo, aż coś wyszło, zostało badaczom wytknięte. Najprostszy sposób
wizualizacji rezultatów pokazał, że nie ma żadnego związku pomiędzy położeniem
rury z wodą a wskazaniem różdżkarza. Zrobiono wykres, na którym zaznaczono, jako
kropki, wyniki wskazań sześciu najlepszych różdżkarzy, wybranych z puli 500
badanych osób. Współrzędne każdego punktu to prawdziwa lokalizacja rury pod
podłogą (na osi X) oraz lokalizacja wskazana przez różdżkarza (na osi Y) podczas
jednej próby.

Gdyby ktoś potrafił odnaleźć położenie rury, wynik próby powinien mieć podobną
współrzędną zaznaczoną na osi X oraz na osi Y. Jeżeli rura miała położenie z lewej
strony, to wskazanie powinno być na lewą stronę. Jeżeli z prawej strony – to na
prawą. Możnaby spodziewać się wtedy korelacji dodatniej, czyli chmura punktów
powinna mieć kształt elipsy, skierowanej ku górze z prawej strony. Łatwo było
jednak ocenić, że nie było w rozrzucie punktów jakiegokolwiek śladu korelacji, czyli
punkty były rozrzucone “od sasa do lasa”.

Wniosek końcowy był dewastujący dla postulatów radiestezji: nie ma czegoś takiego
jak “zdolność” do wykrywania wody pod ziemią. Do podobnych wniosków doszedł
amerykański Department of the Interior, gdzie przeanalizowano wyniki 500
publikacji o radiestezji.

You might also like