null Introduction to R: Analysing Big Data for Dynamic Systems

Introduction to R: Analysing Big Data for Dynamic Systems

  • Natuurwetenschappen
  • NB2602
  • 5 EC
  • Vanaf € 384
Deze cursus kun je op elk gewenst moment starten. Kijk in het Jaarrooster wanneer de begeleiding is ingeroosterd.

Inhoud

De afgelopen jaren hebben we als samenleving ongelofelijke sprongen gemaakt in het verzamelen en analyseren van data – sommigen noemen dit zelfs het Big Data-tijdperk. Die ontwikkeling heeft geleid tot nieuwe kansen in de bestudering van de dynamische interacties tussen mens en milieu. Voorbeelden daarvan zijn vegetatiepatronen in tropische regenwouden, het gedrag van plastic deeltjes in het milieu en de analyse van energienetwerken. Om die kansen goed te kunnen benutten, is het van belang dat onderzoekers met specifieke tools kunnen werken om die big data te beheren en analyseren. Een van die tools is R.
R is momenteel een van de populairste computertalen voor het analyseren van data. Het programma is oorspronkelijk ontwikkeld voor statistische doeleinden, maar kan ook worden gebruikt als programmeertaal en voor datavisualisatie (graphics). In het begin werd R vooral gebruikt door statistici en dataminers, maar tegenwoordig hebben steeds meer wetenschappers, zoals biologen, psychologen en milieuwetenschappers, hun weg ernaartoe gevonden.

In deze cursus leer je hoe je op efficiënte wijze de R-taal kunt gebruiken voor het beheren, analyseren en visualiseren van grote hoeveelheden milieugegevens. Aangezien het onmogelijk is om alle aspecten van R in deze cursus van 5 EC te bestuderen, leren we je ook hoe je zelf nieuwe R-vaardigheden kunt verwerven. Deze cursus is geschikt voor studenten die relatief weinig kennis en ervaring op het gebied van datamanagement en programmeren hebben, maar wel enige affiniteit hiervoor hebben.

De cursus bestaat uit 8 leereenheden, twee individuele projectopdrachten en een schriftelijk tentamen. Achtereenvolgens komen in de leereenheden de volgende onderwerpen aan bod:
1. The Basics I: R interface, eenvoudige operaties, objecten toewijzen, vector- & matrixoperaties, scripts schrijven;
2. The Basics II: datatypes, datastructuren, elementen extraheren & vervangen;
3. Data Management I: werkruimte, werkmap, data laden, wegschrijven, opschonen en samenvoegen;
4. Data Management II: deelverzamelingen, sequenties, sorteren, voorwaardelijke constructies;
5. Data Analysis: samenvattende statistieken, kruistabellen, verdelingen, uitbijters;
6. Plotting: grafieken en diagrammen maken, kleur en tekst aanpassen, opmaak, opslaan;
7. Iteration: code herhalen in loops, fouten in loops, functies van de Apply Family;
8. Outlook: werken met R-pakketten, fouten opsporen, hulp zoeken.

De leereenheden bestaan uit een combinatie van teksten, verwerkingsvragen en kennisclips. Leereenheden 3 t/m 7 worden afgesloten met een aantal oefenopdrachten. Na de leereenheden volgen twee integrale projectopdrachten die de gehele leerstof bestrijken. De eerste opdracht dient om te oefenen; de tweede leeropdracht is onderdeel van het tentamen. De cursus wordt afgesloten met een digitaal groepstentamen.

Leerdoelen
Na afronding van deze cursus kun je:
- de R-programmeertaal op een efficiënte manier gebruiken voor het beheren, analyseren en visualiseren van grote verzamelingen milieugegevens;
- aangeven hoe nieuwe R-vaardigheden kunnen worden verworven die nodig zijn voor het beheren, analyseren en visualiseren van een specifieke dataset.

Aanmelden

Aanmelden is mogelijk voor iedereen.

Toelichting aanmelden

De inschrijfduur van 12 maanden start 14 dagen na de verwerking van je aanmelding voor deze cursus. Aanmelden voor het tentamen kan pas nadat je inschrijfduur gestart is.
Houd daarom bij het aanmelden voor deze cursus rekening met de aanmeldtermijn voor de tentamens, de tentamendata van de cursus en met de data van eventuele begeleidingsbijeenkomsten.

Voorkennis

Je dient te beschikken over elementaire voorkennis op het gebied van de natuurwetenschappen (biologie/scheikunde/natuurkunde op havo/vwo 3 niveau). Indien je geen affiniteit hebt met computers en/of datamanagement (bv. met Excel) moet je er rekening mee houden dat de studiebelasting voor jou hoger zal zijn dan gemiddeld.
De cursussen Gegevens en gevolgtrekkingen (NB0902/NB0912) en Wiskunde voor milieuwetenschappers (NB0302) vormen een goede voorbereiding op deze cursus.
Programmeerervaring is niet vereist.

Begeleidingsvorm

Deze cursus kun je op elk gewenst moment starten. Kijk in het Jaarrooster wanneer de begeleiding is ingeroosterd.

Begeleidingsbijeenkomsten


Online-bijeenkomsten
Kwartiel 3 - begeleider: mw.dr. J. van Wijnen en mw.dr.S. Vogel
- wo 12-02-2025 / bk 1 / 19.00-21.00 uur
- wo 05-03-2025 / bk 2 / 19.00-21.00 uur
- wo 02-04-2025 / bk 3 / 19.00-21.00 uur

Docenten

Mw. dr. J. van Wijnen (examinator) en mw. dr. ir. S. Vogel (plv. examinator).

Tentamenvorm

Digitaal groepstentamen met open vragen en een opdracht.

Tentamentoelichting

Je dient zelf tijdig aan te melden voor een tentamen.

Het tentamen bestaat uit twee onderdelen: (1) een individuele projectopdracht die moet worden ingeleverd en met een voldoende of onvoldoende wordt beoordeeld, en (2) een tentamen dat bestaat uit 28 open vragen. Het behalen van een voldoende voor de individuele projectopdracht is een voorwaarde voor deelname aan het tentamen. Tijdens het tentamen mag de student het leermateriaal raadplegen en gebruik maken van R-software en R-studio om scripts te testen. Het cijfer van het tentamen wordt geregistreerd als eindcijfer.

De tentamens vinden plaats op 13 november 2024, 24 april 2025 en 7 juli 2025.

Tentamendata

Digitaal groepstentamen:.
Opdracht: volgens afspraak.

Tentamenhulpmiddelen

Het online woordenboek
Het online woordenboek t.b.v. ANS

Cursusmateriaal

Deze cursus bestaat uit 8 leereenheden en twee projectopdrachten die op de cursussite in de online leeromgeving staan. Multimediale toepassingen zoals links naar websites en video’s ontbreken in de geprinte versie.

Mediagebruik

- online leeromgeving;
- R-software en R-studio;
- toegang tot en gebruik van het oefenmateriaal van DataCamp is optioneel.

Digitale leeromgeving

Als student kun je via de cursussite in de online leeromgeving naar de discussiegroepen. Hier kun je met medestudenten en begeleiders informatie uitwisselen en discussiëren over de leerstof.