(BIG) DATA DENKEN

Op deze pagina staan een aantal oefeningen die je kunt doen om studenten aan het denken te zetten over (big) data Je kunt deze oefeningen doen nadat de studenten de informatie op INSPIREREN en ACHTERGROND tot zich hebben genomen of daarvoor, dat is aan jezelf.

Heb jij betere oefeningen, uit ervaring wat toe te voegen, laat het ons dan weten!

De oefening staat beschreven met eventueel extra materiaal om te downloaden.

Oefening 1. Is er een relatie of niet?
Geef van de volgende drie stellingen aan of deze relatie verzonnen is, of waar. En als de relatie waar is, waar zou het dan aan kunnen liggen? Studenten weten dat minimaal twee stellingen waar zijn, en zoeken naar een verklaring. O ja, Googlen mag niet! Denken, wel.

Mensen die verse venkel kopen, maken minder stuk in huis.
Antwoord. Klopt. In Amerika werden de databestanden van een verzekeraar en een supermarkt gekoppeld (daar mag dat). Men ontdekte dat mensen die graag thuis uitgebreid koken, ook een zorgvuldigere relatie hebben met hun huis. En de gemakkelijkste manier om mensen op te sporen die thuis uitgebreid koken, is om te selecteren op het ingrediënt verse venkel.

Wanneer het harder waait wordt er meer yoghurt verkocht.
Antwoord. Klopt. Echter, de reden is volstrekt onduidelijk. Inmiddels weten de yoghurt – fabrikanten dat en ze geven korting of promoten acties als het harder gaat waaien. Op die manier is er een self – fulfilling prophecy ontstaan en is de dataset inmiddels vervuild. Misschien was het toeval, misschien was er een reden, we zullen het waarschijnlijk nooit weten.

Is er een dokter aan boord? In 1966 verscheen er een rapport (link naar rapport) van de Amerikaanse luchtvaart autoriteit dat aantoonde dat dokters veel meer dodelijke ongelukken maakten dan andere vliegers. Ook als je aantal vliegende dokters (3000) afzette tegen het totaal aantal piloten (400.000). Dus, dokters kunnen niet vliegen.
Klopt niet. Er is veel onderzoek naar gedaan en er is geen aanwijzing te vinden dat dokters eigenschappen hebben, die ze slechtere piloten maken, zoals overmoed. Echter, deze case studie laat wel twee andere dingen zien. Eén, keek men wel naar de juiste dataset. Want moet je niet kijken naar aantal vlieguren in plaats van aantal piloten én twee keek men wel naar alle data. Later werd bijvoorbeeld duidelijk dat in die tijd een nieuw soort goedkoop en onbetrouwbaar Cessna – model werd geïntroduceerd. En laat dat model nu net betaalbaar zijn geweest voor kleine professionals, zoals dokters…..

Oefening 2. Aan de slag met de Ethische Data Assistent (DEDA)

De Utrechtse Dataschool ontwierp een data – assistent voor projectmanagers, data-analisten en beleidsmakers. In hun toolkit zit een grote poster (A0), die je kunt gebruiken in een workshop om te bepalen welke ethische overwegingen en beslissingen er te nemen zijn in een data – project. Op de site staat uitleg. In het onderwijs is het perfect om een bepaald project te verzinnen, te bepalen welke data nodig is, en vervolgens aan de slag te gaan met deze toolkit.

Laatste aanpassing: 20-2-19