13 Põhjuslikkus
Paljud statistilised protseduurid võimaldavad määrata, kas ja mil määral on tunnused üksteisega seotud. Tunnuste vahelise seose tugevuse mõõtmiseks on palju erinevaid arvutuskäike. Ükskõik kui tugev leitud seos aga on, ei saa me ühegi statistilise arvutusega kindlaks teha, kas ja mil viisil üks nähtus teist mõjutab. Üldiselt saame sekundaarandmeid kasutades
- oletada, kust otsida põhjuslikke seoseid või
- kasutada teoreetilisi põhjendusi statistika abil leitud seostele põhjuslikkuse omistamiseks.
Mitte ükski statistiline arvutus ei näita seose põhjuslikkust. Põhjuslike seoste näitamiseks on vajalikud juhusliku katse tingimustes kogutud andmed.
Põhjuslikke seoseid saame näidata ainult eksperimendi tingimustes kogutud andmetega. Teadustöös on tunnustatud viis põhjuslike seoste määratlemiseks juhuslikustatud katse (randomized controlled trial ehk RCT). Selle käigus jagatakse uuritavad objektid juhuslikult katse- ja kontrollrühma nii, et ainus erinevus nende vahel on põhjusliku tunnusena käsitletav uuritav nähtus. Nii saab igasugune erinevus mingis tagajärgses tunnuses nende rühmade vahel tuleneda ainult sellest uuritavast nähtusest1. Kui loodusteadustes on juhuslikud katsed tavalised, siis majandus- ja ühiskonnateadustes on need enamasti kulukad või eetilistel põhjustel sobimatud2.
1 Nt kui kahe rühma ainus erinevus seisneb ravimi manustamises, siis igasugune hilisem erinevus nende rühmade vahel on seletatav ravimi mõjuga.
2 Siiski on mitmes riigis määratud juhuslikult kodanikupalga saajad, et uurida selle mõju inimeste käitumisele.
Juhuslikustatud katse käigus määratakse uuritavad objektid juhuslkult katse- ja kontrollrühma. Kuna seetõttu on rühmade ainus erinevus katserühmal rakendatav tegevus, siis on igasugune hilisem erinevus rühmade vahel seletatav ainult selle tegevuse mõjuga.
Üks nähtus võib otseselt mõjutada teist (\(X \rightarrow Y\)). Lisaks sellele on veel mitu seletust statistilise protseduuri abil leitud seostele tunnuste vahel:
- seos on vastastikkune \[X \leftrightarrow Y,\]
- mingi kolmas nähtus mõjutab mõlemat uuritavat nähtust ja viimaste vahel vastastikkune mõju puudub: \[\displaylines{Z \rightarrow X \\ Z \rightarrow Y},\]
- mingi kolmas nähtus vahendab ühe nähtuse mõju teisele ja mõju uuritavate nähtuste vahel on kaudne: \[X \rightarrow Z \rightarrow Y,\]
- kuigi seda esineb harva, siis seos võib olla kokkusattumus3: \[X \cancel{\rightarrow} Y.\]