1 . fejezet Előszó

Az R ingyenes, nyílt forráskódú statisztikai környezet.

Az R egyik fontos jellemzője, hogy lényegében minden feladat elvégzéshez programot kell írnunk. Ez elsőre ijesztőnek hangozhat, és csakugyan igaz, hogy más programnyelvekhez képest a tanulási görbéje meredekebben indul: itt már két szám átlagolásához is programot kell írni, míg máshol csak kattintgatni kell. A dolog azonban kifizetődő: lehet, hogy egyszerű dolgokat más statisztikai környezetekben könnyebb végrehajtani, itt meg bonyolultabb, de cserében itt a bonyolultabbakat sem sokkal nehezebb, míg más statisztikai programokban az, vagy egyenesen lehetetlen.

A fentiekből már érthető, hogy ahhoz, hogy el tudjunk kezdeni statisztikai elemzéseket végezni R-ben, először az R-rel mint programozási nyelvvel kell megismerkedni. Nagyon fontos hangsúlyozni, hogy ez a jegyzet kizárólag az R nyelvi kérdéseivel és programozásával foglalkozik, az R statisztikai célokra történő felhasználása egy másik jegyzetem (Ferenci Tamás: Bevezetés a biostatisztikába) témája.

Az R talán legnagyobb erejét a hozzá megírt, megszámlálhatatlan sok kiegészítő csomag adja, amikkel jószerével minden elképzelhető statisztikai feladat – adott esetben rendkívül bonyolult számítások jelentőek is – megoldhatóak, sokszor mindössze egy-egy függvényhívással. Nagyon tipikus, hogy a vadonatúj statisztikai módszereket is R-ben implementálják első közlésükkor. A reprodukálható kutatás jegyében a cikkekkel együtt közzétett elemzések is nagyon gyakran R-ben íródtak, ezekből szintén sok ötlet meríthető. Mindezek alapja az R mögött álló, rendkívül széles nemzetközi közösség, mely erős támogatást jelent a hibák javítása, és az új funkciók megvalósításának irányában is.