9 Valim ja kogum
Sageli on meil andmestik, mis hõlmab ainult väikest osa kõikidest vaatlustest, mida soovime kirjeldada. Selline olukord tekib tihti siis, kui andmed on saadud küsitluse teel ja vastuseid ei ole kogutud kõikidelt vastajatelt.
Kui andmetes on ainult osa vaatlustest, mida soovime kirjeldada, siis on tegemist valimiga (sample). Kõik vaatlused, mida soovime kirjeldada, moodustavad kogumi (population).
Kogumist valimi võtmiseks on palju viise, aga enamasti valitakse kogumist vaatlused võimalikult juhuslikult. Sellisel juhul esindab piisavalt suur valim kogumit ja nii saame teha valimi alusel järeldusi kogumi kohta ehk kirjeldada kogumit isegi siis, kui meil ei ole selle kohta täielikku teadmist.
Valim peaks võimalikult täpselt peegeldama kogumit. Seda saab saavutada juhuvalik. Juhuslik valik ei tähenda alati mitmekesisust. Kui kogum on ühetaoline, siis peaks olema ühetaoline ka valim ja vastupidi.
Isegi juhul, kui meil on andmed kõikide vaatluste kohta, mida soovime kirjeldada, siis võib olla kasulik mõelda ka kogumist kui valimist. Mõnikord saame nii teha üldistusi ka nende aegade kohta, mis jäävad väljapoole tehtud mõõtmisi. Samuti saame nii olla kindlamad, et järeldusi mõjutavad vähem mõõtmisvead.
Valimi kasutamine ongi sageli põhjuseks, miks me ei ole päris kindlad statistilistes mõõtmistes. Kui meil on ainult osa kirjeldatavast kogumist, siis isegi juhul, kui see osa valiti juhuslikult, ei saa me kunagi täiesti kindlad olla, et valim peegeldab kogumit täpselt. See valim võis ka juhuslikult kujuneda nii, et see esindab ainult ühte äärmust kogumist1. Sellisest ebakindlusest tulenevalt nimetatakse statistikas valimi alusel arvutatud väärtusi hinnanguteks (Peatükk 21).
1 Kui soovime kirjeldada erakondade toetust, siis võivad meie valimisse ka juhuslikul teel sattuda peaaegu ainult ühe erakonna toetajad, mis ei võimalda teha õigeid järeldusi.