Luokitellut selittäjät: boxplot ja stripchart

Box-plotit ovat kuvia, jotka esittävät arvojen jakauman hyvin selkeästi. Box-plot perustuu niihin viiteen pisteeseen, jotka tulostuvat Tukeyn fivenum-komennolla: minimi, noin alakvartiili, mediaani, noin yläkvartiili, maksimi. Kvartiilirajat muodostavat laatikon (``box''), jonka keskellä on vaakaviiva osoittamassa mediaania. Laatikon reunat yhdistetään janoilla maksimiin ja minimiin ja kaikkein äärimmäisimmät havainnot näytetään erikseen pisteinä (kuva 8A, sivu [*]). Jos selittävä tekijä on luokkamuuttuja (faktori), komento plot tuottaa boxplotin. Komentoa voi kutsua myös julkisesti:

> data(pojoviken)
> attach(pojoviken)
> boxplot(biomassa SPMtilde; syvyys)  ## tai plot(syvyys, biomassa)
Määritteellä notch=T komento piirtää vielä ``vyötärön'', jonka avulla voi arvioida ryhmäkohtaisten mediaanien virhemarginaalien suuruutta.

Box-plot on erittäin hyödyllinen muuttujien jakauman alustavaan tarkasteluun. Sen avulla on helppo huomata mahdollinen vinous sekä poikkeavat havainnot. Yllä olevassa esimerkissäkin näkyy, että eläinplanktonin biomassan hajonta kasvaa kun syvyys kasvaa (kuva 1), mikä tekee myöhemmästä varianssianalyysistämme kyseenalaisen (§7.9).

Mikäli aineisto on kovin pieni (kuten melkein kaikki tämän oppaan aineistot), kaikki havainnot esittävä pistekuvio stripchart on informatiivisempi (kuva 1):

stripchart(biomassa ~ syvyys, vertical=T, method="jitter")
Parametri jitter siirtelee satunnaisesti pisteitä sivuttain niin että samaan arvoon osuvat havainnot eivät mene pahasti päällekkäin. Vaihtoehtoisesti method="stack" sijoittaa samanarvoiset havaintopisteet säännöllisin välien rinnakkain (tai horisontaalisessa kuviossa alekkain).

Kuva 1: Sama luokiteltu aineisto (pojoviken) esitettynä kolmella vaihtoehtoisella tavalla.

\includegraphics[width=\textwidth]{boxbar.eps}


Jari Oksanen 2003-01-21