Starší ľudia boli vychovaní v tom, že astrológia, numerológia, horoskopy, veštenie a podobné veci sú všetko nezmysly, ktorým veria len ľudia mdlého rozumu. Medzitým sa časy trochu zmenili, dnes už aspoň o tom možno začať hovoriť bez toho, aby sa človek musel obávať, že sa totálne znemožní hneď po prvej vete. Stále však väčšina ľudí vníma tieto veci ako čosi, čo je na míle vzdialené od racionálneho vedeckého myslenia.
Závisia naše vlastnosti ba i náš životný osud od presnej chvíle nášho narodenia? Povedzme si to rovno: Neexistuje dôkaz, že nezávisia. Ak by ale aj záviseli, mechanizmus, ktorý by ich spájal, je pre nás totálnou čiernou skrinkou. Nepoznáme nijakú prírodnú zákonitosť, ktorá by mohla vytvoriť takéto spojenie. Nie je hlúposť skúmať to – rovnako ako nie je hlúposť skúmať akýkoľvek prírodný úkaz, ktorý pozorujeme, alebo ktorý sa nám zdá, že pozorujeme. Je to však neefektívne. Je veľa oblastí, ktoré možno skúmať, ktoré sľubujú lepšie vyhliadky na to, že to skúmanie prinesie aj nejaký praktický úžitok.
V skutočnosti ale aj tá najprísnejšia veda bežne prináša praktické recepty bez toho, aby chápala mechanizmus, na základe ktorého fungujú. Používa na to štatistiku.
Ako funguje štatistika
Základnou metódou, pomocou ktorej štatistika preniká do neznámych svetov je korelačná analýza. Funguje takto:
V dedine koluje stará ľudová múdrosť, že kto je viac ovocia, ten zriedkavejšie prechladne. Je to akési pozorovanie, ale môže to byť len zdanie, len nejaká náhodná zhoda okolností. Aby sme z toho spravili vedu, použijeme korelačnú analýzu. Oslovíme tisíc ľudí a každého sa opýtame, koľko ovocia jedáva a ako často je prechladnutý. Oba tieto údaje vyjadríme číslom. Povedzme, že zapíšeme priemerné množstvo zjedeného denne ovocia v gramoch a priemerný počet dní, ktorý uplynie medzi dvoma ochoreniami. Dostaneme tak tisíc dvojíc čísiel. Z nich vypočítame korelačný koeficient. Vzorec nie je zložitý, no nemá zmysel ho tu uvádzať. Spočíta vám ho ktorákoľvek kalkulačka – nie tá najlacnejšia za tri eurá, ale takzvaná vedecká za päť euro.
Korelačný koeficient je číslo z intervalu od –1 do +1. Hodnota +1 znamená dokonalú priamu úmeru, hodnota –1 znamená dokonalú nepriamu úmeru, hodnota 0 znamená, že tam nijaký vzťah nie je. V praxi sa berú vážne hodnoty nad 0,5 (alebo pod –0,5), často je hranicou hodnota 0,8.
Predstavme si, že nám naše meranie dalo výsledok 0,85. To znamená, že viac gramov ovocia ide ruka v ruke s väčším počtom dní medzi ochoreniami, čiže s lepším zdravím. To je už slušný dôvod, aby sme súvislosť medzi jedením ovocia a odolnosťou začali považovať za poznatok podložený dôkazom. V praxi vedci ešte použijú nejaké opatrenia, aby sa znížila možnosť omylu, ale základný princíp je tento. Výsledok bezchybne vykonanej korelačnej analýzy je vedeckým dôkazom.
Na základe tohto výsledku môžeme smelo povedať: „Vedci dokázali, že jedenie ovocia zlepšuje odolnosť voči prechladnutiu.“
Dnes už vieme, že existujú baktérie, že ovocie obsahuje vitamín C, a vieme aj pomerne presne, ako vitamín C pomáha telu tieto baktérie likvidovať. Všimnite si ale, že na formulovanie našej poučky sme nič z toho nepotrebovali. Poučku by sme dokázali vysloviť a dokázať aj vtedy, keby sme si mysleli, že máme vnútri v tele ozubené kolieska.
Ako sa vedecky testujú lieky
Nové lieky podliehajú prísnej regulácii. Nesmú sa dať na trh, kým sa vedecky nedokáže ich účinnosť a ich relatívna neškodnosť. Farmaceutické laboratóriá sú chrámom vedy a je len málo pracovísk, ktoré by si väčšmi zaslúžili prívlastok „vedecký“.
Ako ale také testovanie prebieha? Nerobme si ilúzie. Je veľa liekov, o ktorých nevieme presne, čo vlastne v tele spôsobujú. Vieme len to, že ak ich ľudia berú, tak sa im v istej situácii uľaví. Vieme to na základe korelačnej analýzy. V zložitejších situáciách sa používajú ešte nejaké iné podobné vzorce, no podstata je stále tá istá: porovnávame dva javy (branie lieku a zlepšenie stavu) a zisťujeme, do akej miery sa vyskytujú súčasne. Vznešené slová ako randomizovaný dvojito či trojito zaslepený pokus, to sú len názvy šikovných pomocných trikov, umožňujúcich znížiť pravdepodobnosť omylu.
Štatistika v numerológii a hocikde inde
Na korelačnej analýze je krásne to, že môžete porovnávať hocijaké dva javy, hoci aj spotrebu piva s úspešnosťou pravicových strán vo voľbách, alebo priemerný počet zabrechaní vášho psa s intenzitou slnečných erupcií. Väčšina z tých porovnaní bude najskôr číročistá strata času, no občas tak môžete prísť na zaujímavé súvislosti – a pri troche šťastia z nich hneď aj budete môcť odvodiť praktické odporúčania do života.
Ak skúma numerológ súvislosť medzi výškou vášho ročného príjmu a výskytom číslice 3 v dátume vášho narodenia, vyzerá to byť riadny nezmysel. Nezmysel je to ale len dovtedy, kým nenarazí na významnú koreláciu. Ešte si radšej overme, či sa nepomýlil (či napríklad bola vzorka ktorú skúmal, dostatočne veľká a reprezentatívna), ale ak nie, potom všetko uškŕňanie končí. V takom prípade urobil vedecký objav – o nič menej vedecký než je vedecké potvrdenie účinnosti a neškodnosti lieku, na základe ktorého sa ten liek smie predpisovať chorým ľuďom.
Opakujem, že to nemá nič spoločného s tým, že nemáme ani šajnu, prečo by to malo spolu súvisieť. Spoľahlivo sme určili, že to súvisí – a to bez ohľadu na to, či tomu rozumieme, alebo nie.
Pozor na kauzalitu
Patrí sa tu v tejto súvislosti upozorniť na jednu slabú stránku korelačnej analýzy. Jej výsledok svedčí o korelácii, čiže o spoločnom výskyte dvoch javov. Nehovorí nič o kauzalite, čiže o tom, ktorý jav je príčinou a ktorý následkom.
Napríklad si všimnete, že keď prší, tak na uliciach vidno viac ľudí s dáždnikmi. Ak nesprávne určíte kauzalitu, tak môžete dôjsť k záveru, že nosenie dáždnikov privoláva dážď. Susedovi, ktorého trápi sucho v záhradke, potom možno poradíte, aby sa začal prechádzať po záhradke s dáždnikom.
Najhoršie je, že oba javy môžu byť dôsledkom tretieho javu, o ktorého existencii nemáme ani poňatia. To potom niekedy vytvára situácie, kedy si ľudia robia zo štatistiky vtipy.
Korelačná analýza ukázala, že čím viac uhlia sa spotrebuje na vykurovanie miestnej krčmy v januári, tým lepšia je úroda čerešní v máji. Poradili preto krčmárovi, aby lepšie kúril. Miestni ožrani sa v krčme potili ako v saune, ale nepomohlo to.
V skutočnosti sú oba javy dôsledkom tretieho javu, ktorým je počet dní bez mrazu v januári. Ak ich je viac, potom je spotreba uhlia nižšia. Ak ich je ale príliš veľa, začnú predčasne pučať čerešne. Puky potom vo februárových mrazoch pomrznú a úroda je nižšia.
Pri určovaní kauzálnej závislosti na prípadnom treťom jave, o ktorom nevieme, či vôbec existuje, nám štatistika nepomôže. A práve z ríše týchto tretích neznámych javov sa môžu po čase vynoriť poznatky, ktoré môžu postaviť do nového svetla akékoľvek čudesné špekulácie.