Jatkuvan jakauman tiheys: density

Komento density ei itse asiassa piirrä kuvaa vaan laskee tiedot, joita plot tarvitsee piirtääkseen jatkuvan tiheysjakauman:

> plot(density(Fotosynt))

Tiheyskuva on histogrammin vaihtoehto, jota käytetään ennen kaikkea jatkuville jakaumille. Kuten hist ja truehist, myös density tarvitsee vektorin ja sen perusteella piirtää kuvan arvojen todennäköisyystiheydestä. Jos meillä on kokonaislukumuuttuja (tai muu diskreetti muuttuja), meidän olisi käytettävä epäjatkuville muuttujille tarkoitettuja histogrammikomentoja.4

Tiheysjakauma välttää ainakin yhden histogrammin ongelman: jakovälien alkupisteen valinnan. Tiheyskuvissa käytetään liikkuvaa ikkunaa, joten tiheys arvioidaan jatkuvasti eikä pykälittäin. Perinteisistä menetelmistä liukuva keskiarvo on hieman samantapainen, mutta siinä ikkuna on jyrkkärajainen, joten käyrästä ei tule tasainen. Tiheyskuvassa sen sijaan käytetään tasoittavaa ydintä (``kernel''), joka on muodoltaan esim. normaalijakauman tapainen: kun tiettyyn x-pisteeseen arvioidaan tiheyttä, lähimmillä pisteillä on suurin paino ja kauemmilla pienempi. Näin käyrä on tasaisempi. Toista histogrammien ongelmaa ei kuitenkaan pystytä kiertämään: ikkunan leveys (``bandwidth'') vaikuttaa tasoituksen voimakkuuteen. Jos ikkuna on hyvin kapea, jokainen piste näkyy huippuna käyrässä, jos taas kovin leveä, hävitetään todellistakin informaatiota tiheydestä.

Komento density piirtää jakauman siten, että ääripäissään käyrä yhtyy x-akseliin. Jos meillä on aineisto, jossa on runsaasti nollan lähellä olevia arvoja tai jakauma, jonka moodi on nollassa (esim. eskponentiaalinen jakauma), density ei esitä ääripäätä oikein.


Jari Oksanen 2003-01-21