R

Flashy time series image

Kursen använder det populära statistiska programmeringsspråket R. Programmet är helt gratis och kan laddas ner på alla datorer.

RStudio

R är lättast att jobba i från programmet RStudio. RStudio är en slags arbetsmiljö byggd kring R. Även RStudio är gratis.

Ladda ner R och RStudio

Du måste först installera R och sen RStudio:

  • R kan laddas ner här.
  • RStudio kan laddas ner här.

Den här YouTube videon går igenom alla steg i installationen.

Här är våra egna steg-efter-steg instruktioner:

Tre dialekter av R

Man kan dela upp R’s språk i tre slags dialekter, dvs tre olika kommandon (syntax) för att göra ungefär samma sak:

  • Base-R - (den ursprungliga) med dess s k dollar sign $ syntax
  • Formula - syntax som via paketet Mosaic har utvecklats för undervisning i statistik
  • Tidyverse - en alternativ syntax utvecklat av personerna bakom RStudio.
   


I SDA1 kommer vi försöka använda Formula syntax som mycket som möjligt, med inslag av Base-R. Tidyverse-kod kan ofta vara extremt effektiv, men tar för lång tid att lära sig på en grundkurs i statistik. Vi kommer ibland visa hur man gör samma sak i de olika dialekterna, men på ett sätt som inte stör flödet för den student som helst vill hålla sig till ett sätt. Vi använder ikoner i marginalen som man kan klicka på för att se ett kommando i olika dialekter. Se t ex avsnittet om cheatsheets på denna sida för ett exempel (prova att klicka ikonerna i höger-marginalen).

Guider/Tutorials

  • Tutorial om hur man läser in data från Excel och text-filer. 🇬🇧

  • Quarto för att skriva kompletta rapporter med kod. 🇬🇧
    html | pdf | video på Athena

  • Det kan bli lite trassel med svenska åäö när man skriver R kod eller arbetar med Quarto. Här är en guide om hur man ändrar s k teckenkodning i RStudio så R klarar av dessa svenska bokstäver.

Cheat sheets

  • Mosaic-paketet i R med dess sk formula syntax används mycket under kursen och innehåller grundläggande statistiska metoder och grafik. Detta s k cheat sheet för mosaic sammanfattar de viktigaste metoderna i mosaic paketet. Klicka på ikonerna i marginalen om du är nyfiken på motsvarande cheatsheets för de andra två dialekterna av R. Om du vill jämföra de olika dialekterna sida vid sida kan du titta på R Syntax Comparison cheat sheet.
  • Vill man bekanta sig lite mer med base-R så kan man titta i detta cheat sheet.

 

  • Denna RStudio cheat sheet är rätt rörig, men kan kanske vara användbar efter att man själv bekantat sig lite med RStudio.

  • Kursens R-paket sda123 (se nedan) har också ett cheat sheet.

Datamaterial

  • Kursboken Stats: Data and Models kommer med över 500 olika datamaterial som hittas här. Datamaterialen är i ofta i Excel-format, se denna guide om hur man läser in data från Excel i R.
  • Kursens R-paket sda123 (se nedan) och framförallt R-paket SUdatasets innehåller också några datamaterial som kommer användas under kursen.

Kursens R-paket

Kurserna statistik och dataanalys I, II och III har ett gemensamt R-paket sda123 med några hjälpfunktioner och datamaterial som används på kurserna.
cheat sheet | manual

sda123 kurspaket för R

Installera kurspaketet och paket med datamaterial

install.packages("remotes") 
library(remotes)
install_github("StatisticsSU/sda123") 
library(sda123)
install_github("StatisticsSU/SUdatasets") 
library(SUdatasets)