Po nedělní prohře v basketbalu přítelkyně pronesla ironickou poznámku, že i ona by trefila koš lépe než můj tým. "To já téměř vždycky trefím koš," dodala. Vaše zraněné ego z prohry bohužel převážilo nad racionálním řešením celé situace a hned následný den jsem ji vzal do haly. Stoupne si na čáru, zamíří a trefí. "Vidíš, měla jsem pravdu. Stačilo ti to?"

Jste udiven, odpovíte však, že to byla pouze náhoda. "Kolikrát musím házet, abych ti dokázala, že ne?" Dobrá otázka. Nebo řečí statistiky: testovatelná hypotéza.

Při snaze oddělit platnost tvrzení od pouhé náhody se díky významnému statistikovi a genetikovi 20. století R. A. Fisherovi stal populární koncept takzvané p-hodnoty. Zjednodušeně řečeno, tato hodnota představuje pravděpodobnost získání stejných nebo ještě extrémnějších dat, jestliže testovaný výrok platí. 

Všeobecně uznávanou hranicí pro zamítnutí testované hypotézy se stala hladina 5 %, s kterou p-hodnotu porovnáváme. Pokud p-hodnota proklouzne pod hranici 5 % (p<0,05), znamená to, že při platnosti testovaného výroku bychom daná data téměř jistě nenapozorovali. Dostatečně nízká p-hodnota je tak nyní jakýmsi objektivním měřítkem významnosti vědeckých zjištění. Potud vše vypadá rozumně. Má to však i svá velká úskalí.

Stejně jako se Alenka v říši divů bezmyšlenkovitě hnala za bílým králíčkem i velká část vědců je často zaslepena honbou za p-hodnotou. Není proto překvapením, že ani někteří zkušení výzkumníci nejsou schopni tuto hodnotu – a tedy získané výsledky – správně interpretovat.

Každý den jsme pak vystaveni převratným objevům, které jsou potvrzeny nejrůznějšími studiemi vědců zaštítěných světovými univerzitami. Výrobci čisticích prostředků nám tvrdí, jak bělejší by mohly naše košile být a farmaceutické společnosti zase, jak nám užívání jejich pilulky významně zlepší kvalitu života. V podstatě jakýkoli výrok podložený nezávislou empirickou studií, nám přijde dostatečně věrohodný. Natolik věrohodný, že se neobtěžujeme, někdy ani nemáme možnost, ověřit původní zdroj této studie, natož pak statistickou významnost, dodržení nutných předpokladů a možnost konkrétní pokus opakovat se stejným výsledkem (současná replikační krize ve vědě).

Nemluvě o tzv. "p-hackingu" (švindlování pomocí p-hodnot) či populárním zamlčování studií, které nesvědčí ve váš prospěch. Jestliže například chcete veřejnosti prokázat, že váš nový přípravek funguje, tzn. statisticky významně funguje, i když ve skutečnosti fungovat nemusí, není nic jednoduššího, než si připlatit a oslovit více nezávislých testovacích center.

Poté stačí přidat do smlouvy malý odstavec, že výsledky nesmí být bez vašeho souhlasu nikde publikovány. Jednoduše pak zveřejníte pouze ty, které účinnost vašeho přípravku potvrdily. S těmi ostatními si poradí vaše skartovačka.

Uplatníte v podstatě stejný postup, který jste používali jako děti. Když jste si chtěli jít hrát ven na pískoviště a jeden z rodičů to nepovolil, prostě jste se zkusili zeptat i toho druhého. Tím jste šanci jít ven zvýšili. A za předpokladu dostatečně velkého počtu příbuzných jste se opravdu dřív nebo později na pískoviště dostali. Jak už tomu ve světě bývá, tak i p-hodnota může být dobrým sluhou, ale určitě není vždy dobrým pánem.

Související
Newsletter

Týden v komentářích HN

Máte zájem o informace v širších souvislostech?

Zadejte Vaši e-mailovou adresu a každý pátek dopoledne od nás dostanete výběr komentářů, které se během týdne objevily na stránkách Hospodářských novin. Těšit se můžete na komentáře Petra Honzejka, předního ekonoma Tomáše Sedláčka, kardiologa Josefa Veselky a dalších. Výběr pro vás připravuje šéfeditor iHNed.cz Jan Kubita.

Přihlášením se k odběru newsletteru souhlasíte se zpracováním osobních údajů a zasíláním obchodních sdělení, více informací ZDE. Z odběru se můžete kdykoli odhlásit.

Přihlásit se k odběru