Histogrammit: hist ja truehist

Histogrammit ovat ulkoisesti samanlaisia kuin pylväsdiagrammit eli ne ovat pylväitä. Histogrammissa pylvään korkeus kuitenkin edustaa muuttujan arvojen frekvenssiä tai osuutta koko aineistosta. Histogrammi muodostetaan yhdestä vektorista, joka tarpeen vaatiessa jaetaan pätkiin ja havaintojen lukumäärä tai osuus kussakin pätkässä esitetään. Histogrammit ovat muuttujien jakaumien tarkasteluun käytetty työkalu.

Komento hist on perus-R:n piirto-ohjelma ja truehist on MASS-paketin (Venables & Ripley, 1999) työkalu. Kummankin oletuskuva saadaan samanlaisella kutsulla, eli seuraavat komennot piirtävät muuttujan x histogrammin:

> x <- rexp(100)  ## Jotain piirrettävää
> hist(x)
> library(MASS)   ## truehist
> truehist(x)
Kummassakin komennossa voi kontrolloida pylväiden lukumäärää ja jakoväliä. Kumpikin näistä vaikuttaa suuresti jakauman ulkonäköön (kuva 2), joten kannattaa todellakin kokeilla erilaisia vaihtoehtoja:
> attach(plutakko)  ## Paketti rekola, kuvaus §7.3
> op <- par(mfrow=c(1,2)) ## Kaksi kuvaa rinnan
> hist(Fotosynt, h=0.5, x0=0) ## jakoväli h, alku x0
> hist(Fotosynt, h=0.5, x0=-0.2)
> par(op)  ## Vanhat kuva-asetukset takaisin
Venables & Ripley (1999) käsittelevät kuvan parametrointia perusteellisemmin.
Kuva 2: Männyn läpimittojen jakauma (Ranta et al., 1989, Esimerkki 2.3, kuva 2.4): Ainoa ero on jakovälien alkukohta.

\includegraphics[width=0.7\textwidth]{hist.eps}


Jari Oksanen 2003-01-21