Tilastollinen ohjelmointiympäristö

R ei ole vain tilastollinen ohjelma vaan on tilastollinen ohjelmointiympäristö. Se ei koostu vain erillisistä ohjelmista, vaan muodostaa eheän kokonaisuuden, jossa käyttäjä voi myös helposti ohjelmoida omia tilastollisia menetelmiään. Vaikka itsellä ei olisikaan haluja menetelmien ohjelmointiin, voi luottaa siihen, että joku muu on ohjelmoinnut ja julkistanut uudetkin temput. Tämän ansiosta R on hyvin nopeasti kehittyvä ja nykyaikainen ohjelmisto. Lisäksi R:ssä on hyvät graafiset ominaisuudet.

R muistuttaa suuresti S.-kieltä ja sen pohjalta kehitettyä -PLUS.-ohjelmaa. S. on alkujaan AT&T laboratoriossa kehitetty tilastollinen ohjelmointikieli, joka on yksinoikeudella lisensoitu -PLUS. -ohjelman tuottajalle. R on sisäiseltä toteutukseltaan hyvin erilainen kuin S., mutta käyttäjän kannalta kielet ovat samanlaiset. Niinpä S.- ja -PLUS. -ohjelmien oppaat soveltuvat melko suoraan myös R:n käyttöön (esim. Venables & Ripley, 1999)

R on komentopohjainen ohjelma. Noviisista tämä usein tuntuu vastenmieliseltä ja hankalalta verrattuna näennäisesti helppokäyttöisiin hiirellä käytettäviin ohjelmiin. Kieltämättä komentojen opiskelusta on oma vaivansa, mutta itse asiassa perusanalyysit voi tehdä melko helposti. Suuri osa tämän monisteen analyyseistä tehdään yhdellä komennolla (lm). Tilastollisen ohjelman käytössä pääongelma on tilastollinen ymmärrys -- hiirivetoisella ohjelmalla voi helposti tehdä analyysejä, joita ei itsekään ymmärrä (tosin se on mahdollista myös R:llä, mutta vaatii hieman enemmän vaivaa ylittää omat tietonsa). Ekologi joutuu käyttämään etupäässä regressio- ja varianssianalyysejä, ja niissä pääongelma on mallin (eli muuttujien suhteiden) määrittely. Tämä on usein paljon helpompi tehdä kirjoittamalla yksinkertainen mallilauseke kuin valitsemalla vaihtoehtoja hiirellä.


Jari Oksanen 2003-01-21