In tijden van isolatie, mogelijke besmettingen en tests, krijgen we tijd om na te denken over virale systemen. Deel twee in de serie Allemaal viraal. Mogelijk nuttig voor wie zich met sociale media bezighoudt, maar vooral handig om te weten wat de nauwkeurigheid van een test op besmetting nu eigenlijk precies betekent voor de werkelijke stand van de gezondheid.
Voor wie schrikt van de nauwkeurigheid van diagnostische tests… in een cocktail van denkwerk en een vleugje wiskunde.
Een voorbeeld
Stel dat je een corona-test moet ondergaan. Laten we aannemen dat deze test in dit voorbeeld 99% nauwkeurig is. Dat wil zeggen dat de test 99% van de mensen die de test ondergaat correct aanwijst als ziek, terwijl 1% van de mensen onterecht wordt aangewezen als ziek.
Stel, de test valt – in dit voorbeeld – in jouw nadeel uit. Betekent dat dan ook dat jij met 99% zekerheid die nare ziekte hebt?
Met het theorema van Bayes in de hand kunnen we dan gelukkig zeggen dat dit een denkfout is. Want, de nauwkeurigheid van de test (99%) betekent niet dat jij met 99% zekerheid deze ziekte hebt als de test bij jou positief uitvalt.
Gelukkig… Maar hoe zit dat dan?
Wat we vergaten
Een belangrijk gegeven dat we moeten meewegen is: hoeveel mensen in een groep kunnen deze ziekte hebben? Dat noemen we de ‘a priori’ kans (de kans vooraf) op de ziekte.
- Stel, die kans is 1 op 1000, wat best veel is. Dat betekent dat van een groep van 1000 mensen er één besmet is.
- In diezelfde groep van 1000 mensen wijst de test echter tien mensen aan als besmet (dat is die 1% onnauwkeurigheid van de test).
- Dat betekent dat in deze testronde binnen deze groep één van de elf positief geteste mensen besmet is met het virus. Dat is 0,09.
Daarom is na één test die jou aanwijst als ziek, de kans dat jij die ziekte werkelijk hebt geen 99%, maar veel lager namelijk 9%.
Iets technischer
Dat is precies wat het theorema van Bayes uitdrukt:
P(H|e) = (P(e|H) * P(H)) / P(e)
- P(H|e) staat voor de kans (P voor probability) dat je ziek bent (H is de hypothese dat je ziek bent) gegeven de test (e is de ‘evidence’ die de test geeft).
- P(e|H) staat voor de kans dat de test (e) wijst op de ziekte (H); in ons voorbeeld is dat 99% of anders opgeschreven 0,99.
- P(H) staat voor de vooraf gegeven kans op de ziekte; in ons voorbeeld is dat 0,001 (een op duizend mensen)
- P(e) staat voor de totale kans om het bewijs (evidence) zien.
Driemaal is scheepsrecht
Het mooie aan deze benadering is dat zaken bij een tweede test (opinie 2 in het plaatje) drastisch gaan veranderen. De vooraf gegeven kans op deze ziekte is bij een tweede test niet meer 0,001 maar de zojuist verkregen kans van 0,09! Daardoor verandert de uitslag van de tweede test grondig: als deze opnieuw positief uitvalt is de kans dat je die ziekte hebt opeens 0,9 ofwel 90%.
Opnieuw een kijkje op het gedrag van een viraal systeem. Of het nu een virus of een bericht op de sociale media betreft, de constatering van de overdracht vraagt om een heel nauwkeurige aanpak. Twee of meer keer testen lijkt zekerheid te bieden.
Meer weten? Kijk ook eens naar deze heldere uitleg door Veritasium https://www.youtube.com/watch?v=R13BD8qKeTg, of naar deze uitleg met veel illustraties https://youtu.be/HZGCoVF3YvM.