Introduction to R: Analysing Big Data for Dynamic Systems
-
Natuurwetenschappen
-
NB2602
-
5 EC
-
Vanaf € 384
Inhoud
R is momenteel een van de populairste computertalen voor het analyseren van data. Het programma is oorspronkelijk ontwikkeld voor statistische doeleinden, maar kan ook worden gebruikt als programmeertaal en voor datavisualisatie (graphics). In het begin werd R vooral gebruikt door statistici en dataminers, maar tegenwoordig hebben steeds meer wetenschappers, zoals biologen, psychologen en milieuwetenschappers, hun weg ernaartoe gevonden.
In deze cursus leer je hoe je op efficiënte wijze de R-taal kunt gebruiken voor het beheren, analyseren en visualiseren van grote hoeveelheden milieugegevens. Aangezien het onmogelijk is om alle aspecten van R in deze cursus van 5 EC te bestuderen, leren we je ook hoe je zelf nieuwe R-vaardigheden kunt verwerven. Deze cursus is geschikt voor studenten die relatief weinig kennis en ervaring op het gebied van datamanagement en programmeren hebben, maar wel enige affiniteit hiervoor hebben.
De cursus bestaat uit 8 leereenheden, twee individuele projectopdrachten en een schriftelijk tentamen. Achtereenvolgens komen in de leereenheden de volgende onderwerpen aan bod:
1. The Basics I: R interface, eenvoudige operaties, objecten toewijzen, vector- & matrixoperaties, scripts schrijven;
2. The Basics II: datatypes, datastructuren, elementen extraheren & vervangen;
3. Data Management I: werkruimte, werkmap, data laden, wegschrijven, opschonen en samenvoegen;
4. Data Management II: deelverzamelingen, sequenties, sorteren, voorwaardelijke constructies;
5. Data Analysis: samenvattende statistieken, kruistabellen, verdelingen, uitbijters;
6. Plotting: grafieken en diagrammen maken, kleur en tekst aanpassen, opmaak, opslaan;
7. Iteration: code herhalen in loops, fouten in loops, functies van de Apply Family;
8. Outlook: werken met R-pakketten, fouten opsporen, hulp zoeken.
De leereenheden bestaan uit een combinatie van teksten, verwerkingsvragen en kennisclips. Leereenheden 3 t/m 7 worden afgesloten met een aantal oefenopdrachten. Na de leereenheden volgen twee integrale projectopdrachten die de gehele leerstof bestrijken. De eerste opdracht dient om te oefenen; de tweede leeropdracht is onderdeel van het tentamen. De cursus wordt afgesloten met een digitaal groepstentamen.
Leerdoelen
Na afronding van deze cursus kun je:
- de R-programmeertaal op een efficiënte manier gebruiken voor het beheren, analyseren en visualiseren van grote verzamelingen milieugegevens;
- aangeven hoe nieuwe R-vaardigheden kunnen worden verworven die nodig zijn voor het beheren, analyseren en visualiseren van een specifieke dataset.
Aanmelden
Toelichting aanmelden
Houd daarom bij het aanmelden voor deze cursus rekening met de aanmeldtermijn voor de tentamens, de tentamendata van de cursus en met de data van eventuele begeleidingsbijeenkomsten.
Voorkennis
De cursussen Gegevens en gevolgtrekkingen (NB0902/NB0912) en Wiskunde voor milieuwetenschappers (NB0302) vormen een goede voorbereiding op deze cursus.
Programmeerervaring is niet vereist.
Begeleidingsvorm
Begeleidingsbijeenkomsten
Online-bijeenkomsten
Kwartiel 3 - begeleider: mw.dr. J. van Wijnen en mw.dr.S. Vogel
- wo 12-02-2025 / bk 1 / 19.00-21.00 uur
- wo 05-03-2025 / bk 2 / 19.00-21.00 uur
- wo 02-04-2025 / bk 3 / 19.00-21.00 uur
Docenten
Tentamenvorm
Tentamentoelichting
Het tentamen bestaat uit twee onderdelen: (1) een individuele projectopdracht die moet worden ingeleverd en met een voldoende of onvoldoende wordt beoordeeld, en (2) een tentamen dat bestaat uit 28 open vragen. Het behalen van een voldoende voor de individuele projectopdracht is een voorwaarde voor deelname aan het tentamen. Tijdens het tentamen mag de student het leermateriaal raadplegen en gebruik maken van R-software en R-studio om scripts te testen. Het cijfer van het tentamen wordt geregistreerd als eindcijfer.
De tentamens vinden plaats op 13 november 2024, 24 april 2025 en 7 juli 2025.
Tentamendata
Opdracht: volgens afspraak.
Tentamenhulpmiddelen
Het online woordenboek t.b.v. ANS
Cursusmateriaal
Mediagebruik
- R-software en R-studio;
- toegang tot en gebruik van het oefenmateriaal van DataCamp is optioneel.