De verdoezelde cijfers: fake nieuws of ruis?

Afgelopen week trad staatssecretaris Harbers af wegens cijfers over criminaliteit onder asielzoekers. Op 14 mei had hij de ‘Rapportage vreemdelingenketen periode januari-december 2018’ aan de Kamer gestuurd. Daarin werd gerapporteerd over het landelijk aantal geregistreerde incidenten waarbij asielzoekers als verdachte bij de politie in de systemen voorkomen.

Eerder waren de registraties beperkt tot gebeurtenissen op en rond de COA-locaties. In de rapportage stond een top 10 van de 4600 misdrijven waarvan asielzoekers werden verdacht. De lijst werd afgesloten met de categorie ‘overig’ waaronder 1000 misdrijven vielen. Twee dagen later berichtte De Telegraaf dat onder die noemer ernstige door asielzoekers gepleegde misdrijven zijn weggemoffeld. Kamerleden vroegen opheldering en de staatsecretaris stuurde dezelfde dag de uitgewerkte cijfers. Het was een rampzalig lijstje. Waar de top 10 bestond uit alledaagse delicten als winkeldiefstal, zakkenrollerij, eenvoudige mishandeling, bedreiging en vernieling, doken nu ‘verkrachting, misbruik en moord’ op. Dat was natuurlijk voorspelbaar op grond van common sense en de normale statistische verhouding tussen aantallen diefstallen en moorden. Maar het is wel raar om niet eens stil te staan bij de hoge aantallen van 51 zware mishandelingen, 47 aanrandingen en 31 gevallen van moord/doodslag. Het debat stond in het teken van verdoezelen en slechte voorlichting aan de Kamer. Met opmerkelijke voortvarendheid stapte de staatsecretaris op.

Ik vroeg me af of dit nu een voorbeeld is van fake nieuws – opzettelijke desinformatie. Een nadere blik op de cijfers leert dat het (ten minste ook) om iets anders gaat.

Laat ik vooropstellen dat politici geacht worden hun opvattingen en hun daaruit voortkomende beleid te baseren op informatie. Het is belangrijk om stil te staan bij de betekenis van dat woord. Informatie is iets anders dan gegevens (data). Gegevens zijn ‘ruwe’ feiten of cijfers. Beleid wordt gebaseerd op gegevens die zo worden gepresenteerd dat ze betekenisvol of bruikbaar zijn. Die ‘verrijking’ gebeurt bijvoorbeeld door categorisering, vergelijking met andere gegevens of door het geven van context. Tijdens dat verrijkingsproces wordt de juistheid van de gegevens geverifieerd aan de hand van andere gegevens.

Het is politiek relevant om het aantal misdrijven gepleegd door asielzoekers te vergelijken met het totaal aantal dat is gepleegd. Het is ook politiek relevant om het aantal misdrijven gepleegd door vluchtelingen te plaatsen in de context van hun moeilijke omstandigheden. De eerste verrijking zal degenen die beducht zijn voor de komst van vluchtelingen in hun opvattingen sterken; 47 aanrandingen op 36.600 mensen die instroomden in een COA is relatief veel meer dan de 740 aanrandingen die in heel Nederland werden geregistreerd. De tweede verrijking zal degenen die deernis met de vluchtelingen voorop stellen juist aanspreken; betrekken we de context van 5 zelfmoorden in 2018 in een COA erbij, dan is dat ook veel meer dan de 1917 zelfmoorden in heel Nederland. Van dergelijke gegevensverrijkingen was geen sprake.

Sterker nog: er heeft niet eens een vage verificatie plaatsgevonden. Mijn eerste reactie toen ik las dat asielzoekers 31 moorden/doodslagen hadden gepleegd, was er een van verbijstering dat niemand had beseft dat dit cijfer fout moest zijn op een totaal aantal van 108 moorden en doodslagen in 2018. Op de valreep meldde de staatsecretaris dat het om pogingen ging en slechts in één geval om een voltooide moord/doodslag. Mijn tweede reactie was die van irritatie: welke zot noteert in de top 10 op 1) winkeldiefstal, 2) zakkenrollerij, 6) overige (eenvoudige) diefstal, 9) diefstal fiets? Nog rommeliger was de categorie ‘overig’ waarin ik grofweg 225 gekwalificeerde diefstallen aantrof naast de 108 die in de top 10 waren genoemd. Het lijkt op de categorisering van dieren die de Argentijnse schrijver Borges ooit maakte: ‘a) dieren die toebehoren aan de keizer, b) gebalsemde, c) getemde, d) speenvarkens, e) zeemeerminnen, f) fabeldieren, g) zwerfhonden, h) degene die in deze classificatie zijn opgenomen, i) degene die tekeergaan als dwazen, j) ontelbare, k) degene die getekend zijn met een heel fijn kameelharen penseel, l) et cetera, m) degene die net een vaas hebben gebroken, n) degene die in de verte op vliegen lijken’.1

Mijn verbijstering en irritatie doen er niet toe. Het gebrek aan verrijking en verificatie roept de vraag op hoe dit lijstje tot stand kon komen. Dat is alleen te begrijpen door het besef dat de cijfers zijn gebaseerd op wat politieagenten zonder juridische ordening intikken: de gegevens kunnen in de Basisvoorziening Informatie terecht zijn gekomen door een enkele melding (die de uitrukkende agenten inzicht geeft in wat hen te wachten staat) maar ook door een van de 800 andere werkprocessen, bijvoorbeeld de aangifte, de aanhouding, de dienstverlening etc. In zoverre zeggen de gegevens meer over wat de politie doet dan over wat de verdachte deed. Uiteindelijk is die ene moordverdachte vrijuit gegaan wegens noodweer: en hij was wel illegaal maar kwam niet uit een AZC. Het punt is dat de (kwalitatief slechte) gegevens het beste kunnen zijn dat je hebt op de werkvloer, maar dat ze in een andere context betekenisloos of fout zijn.

Er is van alles te zeggen over de deconfiture van Harbers. Maar uiteindelijk ligt eraan ten grondslag het vaker voorkomende fenomeen van wat Amerikanen stovepiping noemen: ruwe data worden vanaf de werkvloer de schoorsteenpijp van de organisatie ingeblazen. De gegevens die in de context van werkomschrijving van de politie zijn genoteerd, komen zo terecht in de politiek gevoelige context van de misdaadcijfers van asielzoekers. In die context zijn niet-verrijkte en niet-geverifieerde gegevens alleen maar ruis – geluid dat afleidt van betekenisvolle informatie. In een tijd waarin ruwe gegevens heel eenvoudig bij elkaar te harken zijn, is het gevaar dat ruis het debat vervuilt misschien nog wel groter dan dat van het verspreiden van fake nieuws.

 

Dit Vooraf wordt gepubliceerd in NJB 2019/1198, afl. 21

 

  1. J.L. Borges, ‘De analytische taal van John Wilkins’ , in: De essays, Bezige Bij 2016 (1942).

 

Afbeelding: Pixabay

Over de auteur(s)
Author picture
Ybo Buruma
Raadsheer in de Hoge Raad