Aineiston alustava tarkastelu

Uutta aineistoa käsiteltäessä, sitä on aina syytä tarkastella ennen kuin ryhtyy varsinaisiin analyyseihin. Liiallisuuksiin tässä ei toki pidä mennä. On kuitenkin hyvä saada jonkinlainen kuva aineistosta ennen kuin ryhtyy sitä käsittelemään: muuttujien jakaumista, riippuvuussuhteista jne.

Esimerkkeinä tässä luvussa käytämme kahta myöhemmin esiteltävää aineistoa paketista rekola: plutakko7.3), jossa on biologisia ja kemiallisia mittauksia kalliolammikoista, sekä taimet7.4) missä on eri tavoin istutettujen mäntyjen pituuksia.

Meillä on kaksi käyttökelpoista komentoa, jotka kertovat meille paljon aineistosta: summary ja plot.

> data(plutakko)
> summary(plutakko)
> plot(plutakko)
Komento summary tulostaa kustakin muuttujasta viisi peruskvanttiilia: minimin, alakvartiilin, mediaanin, yläkvartiili ja maksimin sekä lisäksi vielä keskiarvon. Näiden lukujen perusteella näkee muuttujien vaihtelualueen ja voi saada jonkinlaisen kuvan lukujen jakaumasta. Komento plot taas tässä tapauksessa piirtää sirontakuviot muuttujista kaikkia muita vastaan, joten saamme jonkinlaisen kuvan riippuvuussuhteista. Näiden kahden komennon avulla pääsee jo pitkälle -- joskus muuta ei kaivatakaan. Lisäksi R:ssä on kyllä koko joukko muitakin mahdollisuuksia.



Aliluvut
Jari Oksanen 2003-01-21