Data Analytics
Informatica en informatiekunde | 7,5 EC | Voor dit product gelden ingangseisen
Code IM0503
Deze cursus heeft een vast startmoment. Kijk in het Jaarrooster wanneer de begeleiding is ingeroosterd.

Dankzij de groeiende hoeveelheid aan data, waarover we tegenwoordig beschikken- ook bekend als big data - staat data analytics nu in het middelpunt van belangstelling.
Al die data worden beschouwd als een bijzonder waardevolle gromdstof, welke onderzocht, geanalyseerd en omgezet kan worden in informatie of zelfs actiegerichte kennis. Een voorbeeld: data van alle transacties van de klanten van Jumbo levert inzichten op in hun voorkeuren en koopgedrag.
Het transformeren van data naar actiegerichte kennis vereist technieken, die in het algemeen bekend staan als data analytics of data mining technieken. Omdat er zo veel verschillende analytische technieken zijn, focust deze cursus op het verschaffen van een goed begrip van de sterkten en beperkingen, essentieel voor een juiste toepassing in een organisatorische context.

Algemeen

Inhoud

In deze cursus bestudeert u een aantal bekende analytische technieken en u leert hoe u deze kan toepassen in verschillende omstandigheden. In een breder perspectief behandelt de cursus ook het data safari proces, zijnde het proces van het onderzoeken en analyseren van de data. Kennis van dat proces is essentieel om data te transformeren naar actiegerichte kennis omdat het meer omvat dan het louter toepassen van de juiste analytische techniek.
In het bijzonder leert u als student om een onderscheid te maken tussen supervised en niet-supervised taken en tussen classificatie, clustering en regressieproblemen door het toepassen van state-of-the-art machine learning tools zoals RapidMiner.
Het cursusmateriaal bestaat uit een tekstboek en een werkboek met korte wekelijkse opdrachten. In het tekstboek vindt u de theorie die van belang is voor de opleiding en het werkboek leidt u door het tekstboek. Het werkboek bevat bovendien korte wekelijkse opdrachten, die u moet voltooien tijdens de cursus. Voor de opdrachten maakt u gebruik van open source software om de benodigde analyse werkzaamheden te kunnen uitvoeren. Hierbij ligt de focus op hoe de software te gebruiken en niet op het programmeren van uw eigen algoritmes.
Het examen bestaat uit een aantal groepsopdrachten, variërend van een analyse opdracht tot een evaluatie, die u moet inleveren tijdens de cursus

Leerdoelen
- Na het voltooien van de cursus begrijpt u de belangrijkstel elementen van 'machine learning', zoals dataset, classificatie algoritme, label, 'mean classification accuracy' en standaarddeviatie.
- U begrijpt de belangrijkste concepten van Business Intelligence en Data Analytics en hun rol voor organisaties bij besluitvorming en innovatie.
- U begrijpt het verschil tussen predictive tools, prescriptive tools en descriptive tools.
- U bent in staat de stappen en stakeholders te beschrijven in het Knowledge Discovery en Data Mining proces.
- U bent in staat een onderzoekbare data mining vraag af te leiden uit de behoeften van een organisatie.
- U kunt de volgende analytische technieken toepassen: multiple regression analysis, clustering, classification trees, Naybe Bayes, Bayesian Networks, Support vector machines, principal component analysis and linear discriminant analysis.
- U bent in staat een tool als RapidMiner te gebruiken.
- U bent in staat om de uitkomsten van het Knowledge Discovery en Data Mining proces te interpreteren en te presenteren aan leken.

Aanmelden

Ingangseisen

Aanmelden is alleen mogelijk voor opleidingsstudenten die formeel zijn toegelaten tot de masteropleiding Business Process Management and IT of de masteropleiding Computer Science.

Aanmelden

Aanmelden is alleen mogelijk voor studenten die formeel zijn toegelaten tot de masteropleiding.

Toelichting aanmelden

Deze cursus start maandag 20 november 2017. We adviseren om uiterlijk woensdag 1 november 2017 hiervoor aan te melden zodat u tijdig het cursusmateriaal ontvangt, toegang heeft tot de leeromgeving en (indien van toepassing) ingedeeld kunt worden in een studiegroep. Bij aanmelding na 1 november 2017 kunnen we dit niet garanderen. Aanmelden is mogelijk tot en met 19 november 2017.

Deze cursus start 20 november 2017. We adviseren u om u uiterlijk 1 november 2017 aan te melden, zodat u tijdig het cursusmateriaal ontvangt, toegang heeft tot de leeromgeving en (indien van toepassing) ingedeeld kunt worden in een studiegroep.

Voorkennis

De cursus veronderstelt basiskennis statistiek zoals deze in het voortgezet onderwijs wordt gegeven: data verzamelen en weergeven (bijv. histogrammen), centrummaten (zoals gemiddelde), spreidingsmaten (zoals standaarddeviatie) en relatiematen (zoals correlatie) en kansverdelingen. Kennis van toetsende statistiek is een pré.

Begeleiding

Begeleidingsvorm

Deze cursus heeft een vast startmoment. Kijk in het Jaarrooster wanneer de cursus van start gaat en wanneer de begeleiding is ingeroosterd.

Online bijeenkomsten en zelfstudie (lezen en opdrachten maken).

Begeleidingsbijeenkomsten


Online bijeenkomsten
Kwartiel 2 - begeleider: dhr. dhr. S. Bromuri PhD
1. ma 20-11-2017 / 19.00-20.30 uur
2. ma 04-12-2017 / 19.00-20.30 uur
3. ma 18-12-2017 / 19.00-20.30 uur
4. ma 08-01-2018 / 19.00-20.30 uur
5. ma 15-01-2018 / 19.00-20.20 uur

Docenten

Dhr. dr. S. Bromuri en dhr. prof. dr. ir. R. Helms.

Bereikbaarheidsoverzicht

Bereikbaarheidsinformatie docenten/examinatoren

Tentamen

Tentamenvorm

Opdracht.

Tentamentoelichting

Gedurende de cursus dienen een aantal opdrachten te worden ingeleverd welke worden beoordeeld voor een cijfer. Aan de hand van de cijfers voor de opdrachten wordt het uiteindelijke cijfer voor de cursus berekend.

Tentamendata

Volgens afspraak.

Meer info

Cursusmateriaal

Deze cursus bestaat uit een tekstboek en een digitaal werkboek dat u door de tekst leidt en een aantal opdrachten bevat.

Mediagebruik

Gebruik van data analytics software.

Digitale leeromgeving

Als medewerker of als student (na inschrijven) kunt u via de cursussite in de digitale leeromgeving naar de discussiegroepen. Hier kunt u met medestudenten en begeleider informatie uitwisselen en discussiëren over de leerstof.