Analyse

Wat doen we anders?

Het Verkiezingsonderzoek LISS panel van Tilburg University voorspelt de uitslag van de Tweede Kamerverkiezingen van 15 maart 2017. Net zoals ook bij andere peilingen doen we dit door mensen te vragen wat ze zullen gaan stemmen. Maar dat doen we op een voor Nederland nieuwe manier, waarbij twee zaken centraal staan: onze steekproef én unieke vragen waarmee panelleden twijfel uit kunnen drukken.

  1. Steekproef
    De peiling wordt gedaan met behulp van het LISS panel. De leden van het panel beantwoorden vragenlijsten via het internet. Dit panel is representatief voor de Nederlandse bevolking. In tegenstelling tot andere panels kan men zichzelf niet op geven om deel te nemen aan het panel. Dit zorgt ervoor dat de kans kleiner is dat bepaalde groepen stemmers over- of ondervertegenwoordigd zijn. Bovendien worden dezelfde mensen gedurende de hele verkiezingsperiode gevolgd. Veranderingen kunnen dus goed worden geïnterpreteerd.
     
  2. Vragen
    In het Verkiezingsonderzoek LISS panel vragen we wat de kans is dat men gaat stemmen. Vervolgens vragen we wat de kans is dat ze op de verschillende partijen stemmen, als ze naar de stembus gaan. In andere peilingen wordt gevraagd of iemand gaat stemmen en zo ja, op welke partij. Onzekerheid kan dus in de Tilburg University peiling beter worden uitgedrukt. Natuurlijk kan men net als in andere peilingen aangeven hoe zeker men is van zijn stem. In dat geval vult men een kans van 100% in voor de partij van hun keuze.

Basis analyse

Iedere dag gebruiken we nieuwe data om de opkomst en verkiezingsuitslag te voorspellen. De opkomst is het percentage kiesgerechtigden dat gaat stemmen. De verkiezingsuitslag is de fractie stemmen voor iedere partij uit het totaal van valide, niet-blanco, stemmen. Het volgende voorbeeld verduidelijkt onze analyse voor een denkbeeldige dataset van twee personen en twee partijen.

 

Kans op stemmen

P(stem)

Kans op stemmen op partij

P(partij A | stem)

Kans op stemmen op partij

P(partij B | stem)

Kans op stemmen op partij

P(blanco | stem)

Persoon 1 0.7 0.5 0.1 0.4
Persoon 2 1.0 0.5 0.5 0.0

We rekenen eerst voor beide personen de kans op een geldige stem uit en op een stem voor ieder van beide partijen gegeven dat de persoon een  geldige stem uitbrengt:

P(valide stem) = P(valide stem | stem)*P(stem) = (1 – P(blanco | stem))*P(stem)

P(partij A | valide stem) = P(partij A | stem) / (P(partij A | stem) + P(partij B | stem))

 

P(valide stem)

P(partij A | valide stem)

P(partij B | valide stem)

Persoon 1

(1-0.4)*0.7 = 0.42

0.5/(0.5+0.1) = 0.83

0.1/(0.5 + 0.1) = 0.17

Persoon 2

1.0

0.5

0.5

Dat levert de volgende kansen op voor het stemmen op partijen A en B:

P(partij A) = P(Partij A | valide stem)*P(valide stem)

 

P(partij A)

P(partij B)

Persoon 1

0.42*0.83 = 0.35

0.42*0.17 =0.07

Persoon 2

0.5

0.5

We voorspellen dus de volgende verkiezingsuitslag:

Partij A

(0.35 + 0.5) / 1.42 = 0.60

Partij B

(0.07 + 0.5) / 1.42 = 0.40

Weging van de analyse

Het LISS panel is in zijn geheel representatief voor de Nederlandse bevolking. Maar het kan gebeuren dat op een bepaalde dag slechts een deel van het panel de vragen invult. Om te voorkomen dat er verschillen ontstaan tussen de kiesgerechtigde populatie in Nederland en onze dagelijkse steekproeven worden de observaties gewogen. Stel, er geven op een bepaalde dag veel meer mannen antwoord dan vrouwen, dan wegen de vrouwen die dag zwaarder mee, zodat de verhouding tussen mannen en vrouwen in de gewogen data overeenkomt met de verhouding mannen en vrouwen in de bevolking. Zo wordt gewogen op geslacht, leeftijd, opleidingsniveau, inkomen van het huishouden, type huishouden (alleenstaand/partner/kinderen), stedelijkheid van woonplaats, huiseigenaarschap en migratie achtergrond.

Onzekerheidsmarges

Onze peilingen zijn gebaseerd op de voornemens van de panelleden. Deze cijfers uit de steekproef worden gebruikt als benadering van de voornemens in de gehele kiesgerechtigde populatie. Een andere steekproef had een andere benadering opgeleverd. We gebruiken foutmarges, of betrouwbaarheidsintervallen, om de onzekerheid uit te drukken die voortkomt uit dergelijke verschillen tussen steekproeven en de populatie gegevens die we proberen te benaderen.

Let wel: de onzekerheidsmarges zeggen alleen iets over de benadering van voornemens in de populatie van kiesgerechtigden op het moment dat de data wordt verzameld. Tussen dat moment en de verkiezingen kunnen allerlei onverwachte gebeurtenissen plaatsvinden die niet in de foutmarges zijn opgenomen. De onzekerheidsmarges kunnen dus niet geïnterpreteerd worden als voorspellingsintervallen voor de daadwerkelijke verkiezingsuitslag.