install.packages("remotes")
library(remotes)
install_github("StatisticsSU/sda123")
library(sda123)
install_github("StatisticsSU/SUdatasets")
library(SUdatasets)
R
Kursen använder det populära statistiska programmeringsspråket R. Programmet är helt gratis och kan laddas ner på alla datorer.
RStudio
R är lättast att jobba i från programmet RStudio. RStudio är en slags arbetsmiljö byggd kring R. Även RStudio är gratis.
Ladda ner R och RStudio
Du måste först installera R och sen RStudio:
Den här YouTube videon går igenom alla steg i installationen.
Här är våra egna steg-efter-steg instruktioner:
Tre dialekter av R
Man kan dela upp R’s språk i tre slags dialekter, dvs tre olika kommandon (syntax) för att göra ungefär samma sak:
- Base-R - (den ursprungliga) med dess s k dollar sign $ syntax
- Formula - syntax som via paketet
Mosaic
har utvecklats för undervisning i statistik - Tidyverse - en alternativ syntax utvecklat av personerna bakom RStudio.
I SDA1 kommer vi försöka använda Formula syntax som mycket som möjligt, med inslag av Base-R. Tidyverse-kod kan ofta vara extremt effektiv, men tar för lång tid att lära sig på en grundkurs i statistik. Vi kommer ibland visa hur man gör samma sak i de olika dialekterna, men på ett sätt som inte stör flödet för den student som helst vill hålla sig till ett sätt. Vi använder ikoner i marginalen som man kan klicka på för att se ett kommando i olika dialekter. Se t ex avsnittet om cheatsheets på denna sida för ett exempel (prova att klicka ikonerna i höger-marginalen).
Guider/Tutorials
Tutorial om hur man läser in data från Excel och text-filer. 🇬🇧
Quarto för att skriva kompletta rapporter med kod. 🇬🇧
html | pdf | video på AthenaDet kan bli lite trassel med svenska åäö när man skriver R kod eller arbetar med Quarto. Här är en guide om hur man ändrar s k teckenkodning i RStudio så R klarar av dessa svenska bokstäver.
Cheat sheets
- Mosaic-paketet i R med dess sk formula syntax används mycket under kursen och innehåller grundläggande statistiska metoder och grafik. Detta s k cheat sheet för mosaic sammanfattar de viktigaste metoderna i mosaic paketet. Klicka på ikonerna i marginalen om du är nyfiken på motsvarande cheatsheets för de andra två dialekterna av R. Om du vill jämföra de olika dialekterna sida vid sida kan du titta på R Syntax Comparison cheat sheet.
- Vill man bekanta sig lite mer med base-R så kan man titta i detta cheat sheet.
Denna RStudio cheat sheet är rätt rörig, men kan kanske vara användbar efter att man själv bekantat sig lite med RStudio.
Kursens R-paket
sda123
(se nedan) har också ett cheat sheet.
Datamaterial
- Kursboken Stats: Data and Models kommer med över 500 olika datamaterial som hittas här. Datamaterialen är i ofta i Excel-format, se denna guide om hur man läser in data från Excel i R.
- Kursens R-paket
sda123
(se nedan) och framförallt R-paketSUdatasets
innehåller också några datamaterial som kommer användas under kursen.
Kursens R-paket
Kurserna statistik och dataanalys I, II och III har ett gemensamt R-paket sda123
med några hjälpfunktioner och datamaterial som används på kurserna.
cheat sheet | manual