18  Mõõtmevähendus

Andmed on enamasti paigutatud kahemõõtmelistesse tabelitesse, kus vaatlused on ridades ja tunnused veergudes. Sellist tabelit võib käsitleda maatriksina, kus iga rida ja veerg on omaette arvude hulk ehk vektor. Mõõtmete vähendamine tähendab nende vektorite koondamist, mille tulemusel ridade või veergude arv andmetabelis väheneb. Selle tulemusel tekivad uued vaatlused või tunnused. Need esindavad algseid vektoreid, sest mõõtmevähenduse käigus säilitatakse eelkõige meile huvipakkuv osa hajuvusest andmetes.

Important

Mõõtmevähenduse (dimensionality reduction) käigus koondatakse hulk vaatlusi või tunnuseid väiksemasse arvu vaatlustesse või tunnustesse nii, et säilib kõige asjakohasem osa nende tunnuste hajuvusest.

Põhjused mõõtmete vähendamiseks on seotud eelkõige andmete kirjeldamise või teiste protseduuride rakendamisega. Mõõtmete vähendamine võimaldab

Lisaks vaatluste vähendamist võimaldavale klasterdamisele (Peatükk 17) võib esitada ka meetodid, mille abil saab kokku võtta tunnuseid: