Keskiarvon vertaaminen teoreettiseen arvoon

Keskiarvon vertaaminen teoreettiseen arvoon eli populaatiokeskiarvoa $ \mu$ koskevaan nollahypoteesiin $ \mu_{0}^{}$ on kaikkein yksinkertaisin tapaus, sillä silloin virheemme on yksiselitteisesti ainokaisen keskiarvon keskivirhe. Sen sijaan ekologiassa ei kovin usein tule vastaan perustestitilanteita, missä teoreettinen arvo on selkeästi määritelty. Sen sijaan lineaaristen mallien (§7) parametreja testataan usein teoreettista arvoa 0 vastaan.

Biometrian kirjan esimerkki (Ranta et al., 1989, Esimerkki 7.2) käsittelee varpusen nilkan pituutta (mm) Herttoniemessä ja Helsingin keskustassa. Vähäinen aineisto on helppo kirjoittaa suoraan R-istunnossa:

> city <- c(21.4, 15.9, 20.3, 19.7, 17.0, 16.4)
> hertto <- c(18.1, 16.5, 22.2, 14.7, 13.9, 16.7, 13.5)
En tunne mitään erityistä kunnianhimoa kehittää teoriaa varpusen nilkan pituudesta, mutta kuvitelkaamme, että tutkija miettii, voiko hän puhtain tunnoin sanoa varpusen nilkan pituuden odotusarvon ao. populaatiossa olevan 16 mm pitkä:
> varpunen <- c(city,hertto)  ## varpuset, liittykää yhteen!
> t.test(varpunen, mu=16)

         One Sample t-test

data:  varpunen
t = 1.8262, df = 12, p-value = 0.09278
alternative hypothesis: true mean is not equal to 16
95 percent confidence interval:
 15.72822 19.08716
sample estimates:
mean of x
 17.40769
Tutkitun 13 varpusen nilkanpituus on keskimäärin 17.4 mm mikä ei näemmä merkitsevästi poikkea ``teoriastamme'' 16 mm nilkasta. Itse asiassa t.test tulostaa myös havaitun keskiarvon 95 % luottamusvälit 15.8...19.1 mm. ``Teoreettinen'' arvomme sisältyy tähän luottamusväliin, joten se voisi olla mahdollinen tosi arvo, kuten myös esim. 19 mm. ``Merkitsevyystestin'' sijaan hyödyllisempi tieto oli nilkanpituuden luottamusväli. Aineiston luottamusväli on tosin niin väljä, ettemme voi sanoa mitään kovin luotettavaa nilkanpituudesta.


Jari Oksanen 2003-01-21