Kahden keskiarvon vertaus

Kahta keskiarvoa verrattaessa meidän on aluksi selvitettävä, voidaanko keskiarvojen erotuksen keskivirhe laskea yhdistetystä otosvarianssista eli ovatko populaatiovarianssit yhtä suuret. Yleensä meillä riittää että varianssit eivät ole kovin erisuuret. Varianssien yhtäsuurutta voi arvoida ctest ohjelmalla var.test:

> var.test(hertto,city)  ## Testi: varianssien suhde = 1?

         F test to compare two variances

data:  hertto and city
F = 1.7012, num df = 6, denom df = 5, p-value = 0.5764
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
  0.243808 10.186162
sample estimates:
ratio of variances
          1.701219
Varianssisuhteen luottamusväli oli hyvin väljä ( 0.24...10.19), joten emme voi sanoa paljonkaan populaatiovarianssien suhteista. Toisaalta erillisten tai yhtäläisten varianssien käyttäminen ei paljonkaan vaikuta testisuureisiin, elleivät varianssit ole hyvin erilaiset. Jos taas varianssit poikkeavat voimakkaasti toisistaan, kannattaa pysähtyä miettimään, onko pelkkien keskiarvojen vertailu mielekästä ongelmamme kannalta.
> t.test(hertto,city, var.equal=T)  ## Oletetaan yhtäsuuret varianssit

          Two Sample t-test

data:  hertto and city
t = -1.2855, df = 11, p-value = 0.2250
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -5.250008  1.378580
sample estimates:
mean of x mean of y
 16.51429  18.45000
Herttoniemen ja keskustan varpusten nilkan pituudet 16.5 mm ja 18.4 mm eivät poikkea merkitsevästi toisistaan (p = 0.225). On kuitenkin valaisevampaa tarkastella nilkan pituuksien eron luottamusväliä -5.3...1.4 mm, jonka mukaan seuraavat tilanteet ovat mahdollisia:
  1. Herttoniemen varpusten nilkat ovat keskimäärin lyhyempiä kuin cityvarpusten.
  2. Herttoniemen varpusten nilkat ovat keskimäärin yhtä pitkät kuin cityvarpusten.
  3. Herttoniemen varpusten nilkat ovat keskimäärin pitempiä kuin cityvarpusten.
Luottamusväleihin sisältyy nollahypoteesi (vaihtoehto 2) joten emme voi hylätä nollahypoteesia nilkkojen yhtäläisyydestä. Toisaalta emme myöskään voi väittää että nollahypoteesi on oikea: se on vain mahdollinen, mutta mahdollista on myös että herttoniemeläiset ovat lyhyempi- tai pitempinilkkaisia. Tämän takia ei myöskään ole sallittua sanoa ``cityvarpuset olivat pitempinilkkaisia, vaikka ero ei ollutkaan merkitsevä''. ``Epämerkitsevä ero'' tarkoittaa juuri, että kaikki vaihtoehdot ovat mahdollisia emmekä pikkuruisen aineistomme takia pysty sanomaan, minkä suuntainen ero on.

Voimme olla melkoisen varmoja, että eri biologisista populaatioista mitatut muuttujat ovat erisuuria, mutta luontainen vaihtelu on niin suurta, ettemme pysty aineistomme perusteella sanomaan, minkäsuuntainen ero on. Tällaisen biologisen havaintoaineiston analyysi vastaa vain kysymykseen, onko aineistomme riittävän suuri luontaisen eron havaitsemiseen. Hyvin suuressa aineistossa pystymme havaitsemaan vähäpätöisiäkin eroja keskiarvoissa. Sen jälkeen voimme ryhtyä miettimään, ovatko nämä ``merkitsevät'' erot myös biologisesti merkittäviä -- mitä ne eivät välttämättä ole. Sen sijaan ``epämerkitsevien'' erojen pohjalta emme voi edes spekuloida. Jos luottamusvälit ovat ahtaat, voimme sen sijaan argumentoida jopa nollahypoteesin puolesta, jos se sisältyy väliin. Luottamusväli on tulkinnallisesti paljon arvokkaampi tunnuslukupari kuin p-arvo.

Varpusaineistossa saatoimme käyttää yhtäläisten varianssien oletusta. Erisuuret varianssit on oletusvaihtoehtona komennossa t.test:

> t.test(hertto,city)  ## Sallitaan erisuuret varianssit; t.testin oletusarvo

         Welch Two Sample t-test

data:  hertto and city
t = -1.3137, df = 10.9, p-value = 0.2159
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -5.182348  1.310920
sample estimates:
mean of x mean of y
 16.51429  18.45000
Koska varianssit olivat melko yhtälaiset, erot testisuureissa ovat pieniä.


Jari Oksanen 2003-01-21