De Stemtest van de VRT: een kijk in de keuken

1. Wat is een stemtest (en wat is het niet)?

Een stemtest - hoe de naam ervan ook luidt - heeft eigenlijk een heel eenvoudig doel, dat echter niet zo eenvoudig te bereiken is. Het doel van een stemtest is, in een periode die voorafgaat aan verkiezingen, kiezers de mogelijkheid te bieden om te bepalen hoe hun eigen overtuigingen en verwachtingen zich verhouden tot het aanbod van de politieke partijen die deelnemen aan de verkiezingen. Kiezers kunnen door de stemtest of stemwijzer in te vullen aan de weet komen welke partij het beste aansluit bij hun eigen visies op mens en maatschappij, welke partij wat verder af staat en welke partijen zich heel ver van hem of haar bevinden. Met die kennis kan de kiezer - indien hij of zij dat wil - ‘wijzer’ stemmen, d.w.z. een stem uitbrengen die gebaseerd is op de inhoudelijke keuzes die in het maatschappelijke en politieke debat gemaakt moeten worden.
Het instrument ontstond in Nederland en op het internet. De concrete aanleiding om een stemtest en daarbij horende televisie-uitzending te maken ontstond ook door naar Nederland te kijken. De commerciële zender SBS6 maakte voor de Nederlandse parlementsverkiezingen van 2002 en nadien ook in 2003 een stemwijzer waarvan de items toegelicht werden in een televisieshow Waar stem ik op?. Niet alleen de items werden daar inhoudelijk toegelicht, maar ook de standpunten van de politieke partijen op die items. Dit concept werd - zij het zeer grondig geamendeerd - vertaald in de VRT-stemtesten van 2003 en van 2004. In deze bijdrage zullen we vooral ingaan op de versie van 2004.
Het maken van die stemtesten was een zeer boeiend experiment, met onderweg ook veel onzekerheden en twijfels. Door hier het recept te geven en aan te duiden welke keuzes we maakten en waarom, hopen we een bijdrage te leveren tot een inhoudelijk debat over de mogelijke varianten van stemtesten en over zin en onzin van dit soort oefeningen.
Bij het bouwen van zo’n stemtest moeten een hele reeks afwegingen gemaakt worden en beslissingen genomen worden. Elke daarvan is vatbaar voor discussie en kritiek, en daarom zullen we in dit artikel de verschillende fasen en hun bijhorende afwegingen elk beschrijven. De allereerste stap is het bepalen van wat er precies met de stemtest kan en zal gemeten worden. Het idee dat de test moet kunnen aangeven ‘hoe kort een kiezer bij de verschillende politieke partijen staat’ is immers alles behalve eenduidig. Wat betekent immers ‘kort bij een partij staan’? Dat zou heel eenvoudig kunnen gemeten worden door rechtstreeks te peilen naar de partij-identificatie van de respondent. Dat is een interessant gegeven, maar is niet wat een stemtest wil doen. Partij-identificatie is een vrij vaag concept, dat uit de VS is komen overwaaien, en dat een algemene en eerder psychologische band met een politieke partij wil meten. Het is een sterke maar zeker niet perfecte voorspeller van het stemgedrag.
De stemtest wil echter concreter en inhoudelijker zijn, en zoeken naar de mate waarin de visies van de potentiële kiezer overeenkomen met het aanbod van de politieke partijen. Daarmee is alleen maar een nieuw probleem op de tafel gelegd: wat is precies het aanbod van de politieke partijen? Met welke indicatoren kan je dat meten? Hier zijn verschillende mogelijkheden, en dat vertaalt zich ook in verschillende stijlen en varianten van stemtesten. Een eerste mogelijkheid is het aanbod van de partijen op een zeer algemeen en theoretisch-ideologisch niveau te meten. Dat vraagt een ingreep van de stemtestbouwer die zelf moet bepalen welke de ideologische oriëntatie van de partijen is, om vervolgens indicatoren te ontwikkelen die deze kunnen meten. Zo wordt dan van een socialistische partij aangenomen dat ze inderdaad socialistisch is, en kunnen items in de stemtest gestopt worden die peilen naar de mate waarin de kiezers het al dan niet eens zijn met standpunten die betrekking hebben op de vrije markt, de rol van de overheid in de economie, de taak van de vakbonden, enzovoort. Met andere woorden: er worden dan algemene attitudes gemeten die samen beschouwd kunnen worden als een globale maat voor ‘socialisme’ of ‘liberalisme’ of ‘ecologisme’. Of de partijen het zelf inderdaad eens zijn met de standpunten die hen toegeschreven worden, is dan niet aan de orde. Het is gewoon een ingebouwde veronderstelling.
Aangezien een stemtest gemaakt wordt in tijden van en in functie van verkiezingen, kan de ‘inhoudelijke nabijheid’ ook gemeten worden door achterom te kijken. Verkiezingen zijn het begin van een beleidscyclus, maar tegelijk ook het einde ervan. Verkiezingen laten toe het gevoerde beleid en de verantwoordelijken ervoor te beoordelen. De items van een stemtest kunnen dan bestaan uit maatregelen die door het uittredend bestuur genomen werden, en waarvan de kiezer kan aangeven of hij of zij het er al dan niet mee eens is. De partij die het meest maatregelen genomen heeft waar de kiezer het mee eens is, komt dan als eerste uit de bus. Zij is dan de partij waar hij of zij het kortste bij staat. Er stelt zich hier echter een heel lastig probleem. In België - en in de meeste andere liberale democratieën - wordt het beleid niet door één enkele partij gemaakt, maar door een coalitie. Het is daarbij erg moeilijk (maar niet noodzakelijk onmogelijk) om te achterhalen welke partij in de coalitie aan de origine ligt van de verschillende beleidsbeslissingen. De stemtest wordt dan bijna vanzelf een test die peilt naar de mate waarin het uittredend bestuur dan wel de oppositiepartijen korter bij de overtuigingen en verwachtingen van een kiezer staat, maar binnen beide groepen is het moeilijk om te differentiëren. Daar waar de keuze voor algemene ideologische attitudes een eerder tijdloze meting van politieke attitudes oplevert, zou het kijken naar het gevoerde beleid een zeer tijdsgebonden meting van overtuigingen opleveren.
Voor de stemtest van de VRT hebben we geprobeerd grotendeels een andere weg te bewandelen. We hebben items gemaakt met beleidsvoorstellen, daarbij dus de verkiezingen beschouwend als het begin van de beleidscyclus. Die beleids_voorstellen_ hebben we gehaald uit de politieke actualiteit, uit de websites en uit de politieke programma’s van de politieke partijen. Het verschil met items die betrekking hebben op het gevoerde beleid is daarbij niet altijd heel scherp aan te houden. Sommige beleidsmaatregelen die debat opleveren zijn interessant en bruikbaar omdat ook in de volgende legislatuur de vraag blijft of dat beleid verder moet gezet worden, dan wel gewijzigd of verlaten moet worden. We hebben wel geprobeerd niet te veel items in de test te steken die alleen maar meerderheid en oppositie tegenover elkaar zetten.
Vooraleer dieper in de gaan op de werkwijze die we gevolgd hebben, is het ook nuttig even aan te geven wat een stemtest niet is en ook niet wil zijn, omdat bedenkingen erbij vaak kritiek leveren op doelstellingen die helemaal niet tot die van een stemtest behoren. Het allergrootste misverstand daarbij is dat de stemtest een voorspeller van het stemgedrag zou zijn. Dat is zeer zeker niet het geval. De beslissing om een stem op deze of gene politieke partij uit te brengen, berust op een veelheid aan factoren: traditie en gewoonte, diepe ideologische en filosofische overtuigingen, perceptie van wie best de eigen belangen kan verdedigen, evaluatie van de kandidaten, de campagne, enzovoort. Om stemgedrag te meten en te verklaren bestaan er geëigende methoden en technieken, en een stemtest heeft daar weinig of niets mee te maken. Een stemtest poogt te meten welke de verhouding is tussen de kiezer en het inhoudelijke aanbod van de politieke partijen. De stemtest kan dus ook niet geijkt worden door te vergelijken met het stemgedrag, en kan ook niet worden beoordeeld naar de mate waarin het resultaat van de meting overeenstemt met het stemgedrag of met de stemintentie.
De verwarring is begrijpelijk, omdat het resultaat van een stemtest op het eerste gezicht een beetje lijkt op een meting van stemgedrag. Het resultaat is een politieke partij die het kortste bij de kiezer staat. En dan is de (slechte) vergelijking snel gemaakt. Een stemtest kan ook resultaten opleveren die verrassend zijn. Het is de charme maar voor velen ook de ergernis van een stemtest dat het resultaat niet noodzakelijk overeenkomt met wat je zelf dacht. Dat is logisch, omdat je eigen inschatting van welke partij het kortste bij jou staat gebaseerd is - net als het stemgedrag - op een hele reeks elementen waarbij het inhoudelijke aanbod van de partijen niet noodzakelijk het meest doorslaggevende is.

2. De selectie en de weging van de stellingen

Bij het ijken van de VRT-stemtest hebben we ervoor gekozen om niet zelf te bepalen welke partijen welke standpunten innemen, maar de partijen de mogelijkheid te laten dit te bepalen. In de praktijk betekende dit dat alle voorzitters samengebracht werden en - eventueel met hulp van het thuisfront - voor alle beleidsvoorstellen konden aangeven of zij al dan niet akkoord gingen. Na afloop van die gezamenlijke sessies konden de partijen eventueel nog hun antwoord corrigeren. En dat is hier en daar ook gebeurd.
Om de items te selecteren gingen we niet over één nacht ijs. In eerste instantie maakten we de lijst op van alle beleidsdomeinen van het regionale niveau. Voor elk ervan bepaalden we of het een klein, een middelgroot of een groot thema was, met de bedoeling voor ‘grotere’ beleidsdomeinen meer items in de test te stoppen.¹
In 2004 werd de stemtest in drie stukken verdeeld. Dat wil zeggen dat er drie stemtesten gemaakt werden over drie verschillende grote thema’s: ‘Levenskwaliteit’, ‘Geld’, en ‘Waarden en Normen’. De drie stemtesten werden week na week via de televisie en via internet aangeboden. Na afloop kon ook de volledige test ingevuld worden. Om de drie stemtesten inhoudelijk verschillend te maken, verdeelden we de items per beleidsdomein disproportioneel over de drie thema’s. Tabel 1 maakt duidelijk hoe die verdeling eruit zag.

Tabel 1: Verdeling van het aantal items per beleidsdomein voor de drie VRT Stemtesten van 2004.

Voor elk van die slots streefden we ernaar dubbel zoveel items te maken als nodig. De reden daarvoor is dat we alleen die items wilden weerhouden die maximaal differentiëren tussen de partijen. Van een aantal items kon immers verwacht (of gevreesd) worden dat de meeste partijen hetzelfde antwoord zouden geven. Dat is ongetwijfeld interessante informatie, maar het maakt die items wel ongeschikt voor de stemtest.
Eenmaal de selectie van de items of stellingen afgewerkt, dienden de stellingen gewogen te worden. Het is zeker mogelijk om elke stelling in een stemtest hetzelfde gewicht te geven. Telkens wanneer je als deelnemer dan hetzelfde antwoord geeft als een partij, krijg je één punt voor die partij. Het maximaal aantal punten per partij is dan gelijk aan het aantal items in de test. Wij meenden echter dat je een stemtest niet op die vlakke en ongewogen wijze kan laten functioneren. De verschillende beleidsdomeinen en hun bijhorende stellingen zijn niet voor alle partijen even belangrijk. Wie akkoord gaat met stellingen die behoren tot de harde kern van een partijprogramma moet korter bij die partij uitkomen dan wie alleen maar akkoord gaat met stellingen die voor die partij van minder belang zijn. Ook hier is het mogelijk die gewichten zelf toe te kennen, d.w.z. zelf te bepalen welke domeinen voor een partij belangrijk zijn en welke niet. Een andere strategie bestaat erin de partijen zelf die oefening te laten maken. Dat gebeurde bijvoorbeeld in Waar stem ik op? van SBS6. Alle partijen kregen 100 punten die zij vrij konden verdelen over het veertigtal stellingen die in die stemtest zaten. Wij vreesden dat deze procedure (zeker in 2004, nu de partijen vertrouwd waren met het systeem) aanleiding zou kunnen zijn voor bewust sturen van het systeem. Partijen zouden immers veel gewicht kunnen toekennen aan stellingen waarvan zij menen dat ze veel steun genieten, eerder dan aan stellingen die echt voor hen heel belangrijk zijn.
Om de stellingen per partij te wegen, baseerden we ons op de partijprogramma’s. Een aantal maanden voor de stemtest werden alle partijen gecontacteerd met de vraag hun partijprogramma zo snel mogelijk door te sturen. Het was telkens de start van een lang en moeilijk proces om van elke partij een definitieve versie van hun programma te verkrijgen. Het ging vaak over versies die nog niet openbaar waren gemaakt of soms zelfs nog niet goedgekeurd waren door het congres. Er moest soms druk uitgeoefend worden door journalisten, en een aantal studiediensten hebben met het oog op de stemtest het document sneller afgewerkt. De codering werd afgesloten drie weken voor de eerste uitzending, dus zeven weken voor de verkiezingen. Alles wat een partij daarna nog veranderde aan haar programma, kon niet meer worden verwerkt in het systeem. In 2004 werd zowel het Vlaamse als het Europese gecodeerd. De lengte van de programma’s lag sterk uiteen naar gelang de partij en het jaar. In 2004 telde het Vivant-programma vier bladzijden en het Vlaams Blok-programma 323 bladzijden.
Vanaf het ogenblik dat er een partijprogramma was doorgestuurd werd er begonnen aan de codering. In 2003 gebruikten we een bestaand codeboek met 138 codes.² Hoewel dit codeboek exhaustief en zeer gedetailleerd was, was het nadien niet altijd vanzelfsprekend om de codes te groeperen in grotere categorieën. Daarom hebben we in 2004 het codeboek aangepast op basis van onze ervaring tot 26 hoofdcodes onderverdeeld in 85 subcategorieën. Dit codeboek was nog wel exhaustief,³ maar er werd bij het opstellen ook gekeken naar de volgende stappen in het vastleggen van de gewichten. Vlaamse en Europese thema’s werden zeer gedetailleerd gecodeerd, terwijl federale thema’s zeer ruw werden gecodeerd.Elke zin onderscheiden door een punt, punt komma of dubbel punt, kreeg één code toegewezen. Als er verschillende thema’s in één zin voorkwamen, werd de overkoepelende code gebruikt en anders naar de omliggende zinnen gekeken om een goed evenwicht tussen de themacodes te vinden. Twee codeurs deden telkens al het codeerwerk, het ging telkens om zeer ervaren mensen die al partijprogramma’s hadden gecodeerd of al uitgebreid gewerkt hadden met het codeboek. Moeilijkheden of twijfelgevallen werden telkens in overleg opgelost. In totaal zijn er in 2003 9.023 codes toegewezen (aan 471 bladzijden) en in 2004 18.228 codes toegewezen (aan 673 bladzijden).
De vele codes werden vervolgens gegroepeerd in een twintigtal ruimere categorieën. Zo werd er een tabel opgesteld met per partij het relatieve gewicht van elke categorie. De volgende stap was dan de stellingen allemaal toewijzen aan die twintig categorieën. Aan elke stelling konden twee categorieën worden toegewezen, eventueel tweemaal dezelfde. De stelling ‘De regering moet geld vrijmaken om de Olympische Spelen naar Vlaanderen te halen’ werd bijvoorbeeld toegewezen aan sport en economie. De stelling over het al dan niet aanleren van de Vlaamse Leeuw werd uitsluitend aan ‘Vlaanderen’ toegewezen. Het gewicht van een bepaalde categorie voor een partij werd dan gedeeld door het aantal keren dat een stelling in die categorie werd geplaatst. Indien bijvoorbeeld voor partij X de categorie milieu een gewicht van 20% had (d.w.z. 20% van de zinnen in het partijprogramma gaan over milieu), kregen alle milieustellingen samen voor die partij een gewicht van 20%. Indien er vijf milieustellingen waren, kregen die voor die partij elk een gewicht van 4%.
We stelden hoger dat we voor deze methode opteerden, en niet om een techniek waarbij de partijen zelf konden bepalen welk gewicht ze geven aan de verschillende stellingen. Toch gaven we partijen een mogelijkheid om per thematische stemtest één stelling aan te duiden waarvan zijzelf vonden dat die cruciaal was in hun programma. Deze stellingen werden in de televisie-uitzending voorgesteld als de ‘jokers’ van de partijen. De gewichten van de stellingen waarop een partij haar joker inzette, werden voor die partij verhoogd met 1/28e (3,57%) voor de thematische testen en 1/84e (1,19%) voor de volledige test. Dit extra gewicht werd dan van al de andere stellingen afgetrokken. We kozen voor een laag extra gewicht dat ook slechts een beperkte impact had op het systeem om te vermijden dat de (strategische) overwegingen van de partijen te zwaar op het systeem zouden wegen. Inhoudelijk gaven de jokers ook vooral een duidelijke meerwaarde. De partijen konden uitleggen waarom een bepaalde stelling voor hen zo belangrijk was en wat hun standpunt erover juist was.
Tabel 2 geeft de volledige matrix met alle stellingen en met hun respectieve gewichten, rekening houdend met de jokers. Dat zijn de gewichten voor de volledige stemtest. Voor de drie afzonderlijke thematische tests werd dezelfde logica gevolgd, maar dan alleen voor de stellingen in elke test apart. Dat wil zeggen dat voor elke stemtest apart de som van de gewichten per partij gelijk was aan 100. Door de disproportionele verdeling van de stellingen tussen de drie stemtests, maten ze alledrie inderdaad de nabijheid tussen deelnemers en partijen op drie afzonderlijke (maar niet onafhankelijke dimensies). Het bekomen resultaat kon dus variëren tussen de drie stemtests, terwijl ook het resultaat van de totale stemtest verschillend kon zijn van dat van de drie afzonderlijke.

Tabel 2: De stellingen en de wegingen per partij voor de VRT-stemtest van 2004
(pdf-file)

Dat het resultaat voor de totale stemtest niet zomaar de optelsom was van de drie thematische tests, lag ook aan het feit dat we in 2004 ook nog een andere weging gebruikten die alleen voor de totale stemtest gebruikt werd. In de stemtest van 2003 beperkten we ons tot het wegen van de stellingen aan de kant van de partijen. Tijdens de televisie-uitzending zegden we dat er eigenlijk ook een andere weging kan gemaakt worden. Ook aan de kant van de kiezers geldt immers dat niet alle thema’s even belangrijk zijn. En als we aan de kiezers willen zeggen welke de partijen zijn die het kortst aansluiten bij hun overtuigingen, is het logisch dat we ook rekening houden met de thema’s die de kiezer zelf belangrijk vindt. Hij of zij komt dan het kortst uit bij die partij als hij of zij akkoord gaat met stellingen die zowel voor die partij als voor hemzelf of haarzelf belangrijk zijn. Het wegen van elke stelling aan de kant van de deelnemers is echter niet zo vanzelfsprekend. Het vereist dat bij elke stelling niet alleen gevraagd wordt naar het standpunt van de deelnemer, maar ook naar de eigen visie op de salience ervan. Voor elke stelling moeten er dan twee antwoorden gegeven worden. Dat kan indien het instrument via internet aangeboden wordt. Beide dimensies kunnen keurig gevisualiseerd worden en voor elke stelling kunnen dan de twee antwoorden gegeven worden. Indien de stemtest moet ingevuld worden via vaste of mobiele telefoon, is deze procedure te zwaar. Een alternatief is achteraf, na het beoordelen van alle stellingen, aan de deelnemer te vragen om die thema’s aan te kruisen die voor hem of haar van groter belang zijn. Ook dit is weer perfect mogelijk via internet, maar erg zwaar wanneer het telefonisch moet.
In 2004 hebben we dan ook geprobeerd om de weging aan de kant van de kiezer te laten gebeuren door extra vragen in te lassen, die niet als items van stemtest gebruikt werden, maar wel als indicator van de beleidsdomeinen die de deelnemers belangrijker vinden. Die extra vragen kregen de vorm van zogenaamde dilemma’s, dit wil zeggen keuzes tussen twee beleidsvoorstellen. Je kon ze als deelnemer allebei wensen (en indien ze als gewone stellingen aangeboden werden zou je dan tweemaal akkoord gaan), maar hier was het de bedoeling die keuze aan te duiden die alles bij elkaar het belangrijkste was.
Een zwak punt is dat het aantal indicatoren per beleidsdomein hier erg klein moest blijven, waardoor de weging erg gevoelig was voor de formulering van de vraag. De enige manier om dit te vermijden was meer indicatoren per beleidsdomein te gebruiken, maar dat zou dan weer het aantal dilemma’s zeer groot gemaakt hebben, waardoor de methode opnieuw te zwaar zou worden om ze via televisie en via telefoon aan te bieden. We boden per thematische stemtest 5 dilemma’s aan, die zoals gezegd niet voor die afzonderlijke stemtest gebruikt werden. Enkel wie de drie tests invulde of nadien de volledige test invulde, kreeg een resultaat waarbij de antwoorden op de dilemma’s verrekend werden.
In tabel 3 hieronder staat de lijst met de dilemma’s en de thema’s waarvoor zij een indicator waren. De invloed op de gewichten door de dilemma’s is een iets moeilijker proces. Elk dilemma heeft twee opties. Elke optie staat voor een aantal thema’s. Elk dilemma kan 0,5% herverdelen, in totaal dus 7,5%. Als een deelnemer bijvoorbeeld bij het vierde dilemma zou kiezen voor ‘Beter onderwijs’, dan krijgen alle stellingen over onderwijs voor die respondent een extra gewicht dat gelijk is aan 0,5% gedeeld door het aantal stellingen over onderwijs. Alle onderwijsstellingen wegen dan iets sterker door, onafhankelijk van de partij waar je het mee eens bent. Als al deze extra gewichten bij de eerste scores werden geteld dan werden de totalen terug in percentages omgezet. Het gaat om bijzonder laag toegevoegd gewicht, toch bleek dit al een zekere rol te spelen. Het ging dan wel vaak maar om de volgorde van partijen die voor die respondent toch al dicht bij elkaar lagen.

Tabel 3: De dilemma’s voor bepaling van de salience van beleidsdomeinen bij deelnemers aan de stemtest

3. Analyse en evaluatie van de stemtest

De stemtest probeert het partijpolitieke aanbod in kaart te brengen, met het doel aan de kiezer te kunnen vertellen waar hij of zij zich daarin bevindt. We stelden hoger al dat de validiteit van een stemtest heel moeilijk kan getoetst worden. Het concept waarop het zich beroept - de nabijheid tussen de overtuigingen van de kiezers en het aanbod van de partijen - is immers niet eenduidig en kan derhalve op verschillende manieren gemeten worden. Wie naar aanleiding van een zelfde verkiezing meer dan één soort stemtest invult, merkt dan ook dat de resultaten ervan niet (helemaal) dezelfde zijn. Een mogelijke toets van de validiteit zou eventueel een vergelijkende analyse van verschillende varianten kunnen zijn. Indien een representatief staal van de kiezers de antwoorden op verschillende stemtests zou invullen, is het mogelijk om te kijken en te analyseren waar de verschillen liggen en waar ze vandaan komen. Voor zover we weten is een dergelijk onderzoek nooit gebeurd.
Een wat vagere toets van de validiteit van de stemtest kan gebeuren door de interne consistentie en logica te bekijken. Wij doen dit hier door de volledige VRT-stemtest van 2004 acht maal ‘homogeen’ in te vullen, dit wil zeggen: door voor de acht partijen hun antwoorden te geven, en dan te kijken welk resultaat dit oplevert. Op deze manier ontstaat een zicht op het partijlandschap zoals het in de stemtest is terecht gekomen aan de hand van stellingen, standpunten van de partijen daarop en de weging van die stellingen aan de kant van de partijen. In tabel 4 hieronder staan de resultaten van die oefening. Elke rij geeft het resultaat van de invulling per partij aan. De partij in kwestie krijgt uiteraard het maximum van 100 punten. We hebben de andere partijen dan per rij gerangschikt in aflopende volgorde.

Tabel 4: Resultaten van de VRT-Stemtest 2004, ingevuld per politieke partij

De resultaten zijn interessant, en ook bemoedigend. Ze zijn bemoedigend omdat ze zeker niet indruisen tegen onze intuïtieve inschatting van de onderlinge verhoudingen tussen de politieke partijen. Ze zijn ook interessant, omdat hieruit toch wel blijkt dat wanneer je als uitgangspunt de standpunten van de politieke partijen neemt en het belang dat zij er zelf aan hechten - gemeten aan de hand van hun verkiezingsprogramma’s - het Vlaamse politieke landschap als vrij sterk en duidelijk gestructureerd naar voor komt. Er zijn zonder meer twee grote clusters van partijen. Aan de ene kant zijn dat de sp.a, Spirit en Groen!. Wie alle antwoorden geeft zoals één van die partijen, krijgt altijd ook een zeer hoge score voor de twee andere. Telkens komt dezelfde top drie uit de bus.
De tweede cluster bestaat uit CD&V, VLD, N-VA en Vlaams Blok. Hier geldt hetzelfde. Wie perfect de antwoorden van één van die partijen geeft, krijgt de andere als tweede, derde of vierde. Er is evenwel één spelbreker in het prentje. Dat is Vivant. Vivant is in die bipolaire structuur niet echt te plaatsen. Dat is niet zo verwonderlijk. We mogen niet vergeten dat de weging van de stellingen voor Vivant gebeurd is op basis van een ‘verkiezingsprogramma’ van amper 4 bladzijden. Dat maakt de vergelijking tussen Vivant en de andere politieke partijen eigenlijk niet mogelijk. Vivant is niet alleen in dit prentje maar in de hele stemtest zonder meer een storend element. De keuze om Vivant erin op te nemen, was niet de onze, maar het resultaat van strategische beslissingen over de wijze waarop de VRT de diverse electorale kartels in de verkiezingsuitzendingen aan bod wou (of moest) laten komen.
Die kartels blijken overigens niet allemaal inhoudelijk even sterk te zijn. sp.a en Spirit bevinden zich zoals gezegd vrij kort bij elkaar, ook al zit Groen! daar voortdurend in de buurt. CD&V en N-VA sluiten dan weer niet zo nauw bij elkaar aan. Wie de antwoorden van de CD&V geeft, krijgt weliswaar N-VA als tweede partij, maar de afstand met de eerste is behoorlijk groot. En wie de antwoorden van de N-VA geeft, krijgt als tweede en derde Vlaams Blok en VLD en slechts als vierde partij CD&V. N-VA blijkt veel korter bij het Vlaams Blok te zitten dan bij de kartelpartner CD&V.
Naast het feit dat we in de VRT-stemtest geprobeerd hebben een aantal varianten op de gebruikelijke werkwijze in te bouwen (wegingen op basis van partijprogramma’s, jokers, dilemma’s), was het meest opvallende natuurlijk het feit dat de stemtest een televisieprogramma was, en in 2004 zelfs drie volle zondagavonden mocht vullen. Het is ook over die ‘verhuis’ naar het medium televisie dat vele debatten zich ontwikkeld hebben. Het is naar onze mening niet mogelijk om een eenvoudig antwoord te geven op de vraag of de verhuis van internet naar televisie (terwijl uiteraard ook de internetversie bestond) een goede zaak was.
Er zijn zeker een aantal positieve argumenten aan te geven. In de eerste plaats had de stemtest de bedoeling inhoudelijke stellingen en geen personen centraal te stellen. Dat is in grote mate gelukt. Door de stemtest werden politieke partijen verplicht - soms wat tegen hun zin - om duidelijke antwoorden te geven op een aantal voorstellen die zeer actueel waren of die ook later nog actueel gebleven zijn (de prijs van het onderwijs, de fiscale amnestie, integratie en talenkennis, opvang van asielzoekers door de Europese Unie, rookverbod in de horeca, het filmbeleid, superboetes, lonen van topmanagers, privatisering van de NMBS, wapenuitvoer, genetisch gewijzigde gewassen, gemeentelijk stemrecht voor vreemdelingen, enzovoort). Partijen konden door de keuze van hun ‘joker’ ook aangeven wat voor hen cruciaal was en waarom. De Stemtest heeft ongetwijfeld debatten aan de gang gehouden en aangescherpt.
Op de aard en de verwoording van de stellingen kan zeker kritiek geuit worden. Zij werden gemaakt en geselecteerd in de wetenschap dat ze in een programma voor een breed publiek moesten gebruikt worden. Ze reflecteren daardoor een (allicht niet altijd even coherente) mix van de soms verschillende inschatting van politicologen, journalisten en programmamakers over wat belangrijk en prioritair is.
De meeste stellingen vroegen ook om een simpel antwoord tussen twee mogelijkheden. Dat is soms, maar zeker niet altijd, een al te vergaande vereenvoudiging van de realiteit. Maar politiek gaat om het maken van keuzes, en door te opteren voor heel concrete beleidsvoorstellen hadden we ook stellingen die zich makkelijker leenden tot een ‘akkoord/niet akkoord’-antwoord dan wanner we stellingen hadden gebruikt die peilen naar algemenere visies en standpunten. Ook de dilemma’s die we gebruikten om het belang van beleidsdomeinen bij de deelnemers te meten, waren soms erg confronterend, omdat ze een keuze aanboden tussen twee voorstellen die elkaar niet noodzakelijk uitsluiten. Maar de keuze aanbieden tussen bijvoorbeeld nachtvluchten en DHL is achteraf bekeken toch niet zo’n slecht idee geweest.
Het grote voordeel van een stemtest is dat hij bijzonder veel nuance bevat. Nochtans is het gebrek aan nuance een van de vaakst geuite kritieken op de stemtest. Ofwel gaat een stelling over een heel simpel ding, en dan is ze ondraaglijk licht. Ofwel gaat ze over een zeer fundamenteel probleem, en dan kan je er niet zomaar met ja of neen op antwoorden. Die kritiek klopt en is inherent aan de manier van werken. Een stemtest bestaat echter niet uit één enkele stelling, maar uit een hele reeks. Hoe meer hoe liever. De limiet op het aantal zit in het medium dat je ervoor gebruikt. Zet je de test op internet, dan kan het aantal vragen hoger zijn. Vertaal je het instrument naar de televisie, dan legt dat format je op om het aantal stellingen te beperken. Dat was één van de problemen van de stemtest van 2003, die uit 36 stellingen bestond. In 2004 waren het er 84. Hoe meer stellingen je hebt, hoe beter je de verschillende aspecten van het politieke bedrijf kan bekijken. Elke stelling apart is immers arm en ongenuanceerd. De rijkdom en de nuance schuilt dus in het geheel, niet in de delen. Toch blijft het gegeven dat elke stelling tenslotte niet meer is dan één enkele uitspraak, en het spreekt vanzelf dat de formulering van dat item een sterk effect heeft op de antwoorden erop. Items staan dan ook niet op zichzelf, maar als één van de vele indicatoren van een bepaald beleidsdomein. Dat bij de presentatie van de stemtest en in de uitzending (en debatten achteraf) toch afzonderlijke items en hun score bij de bevolking in het algemeen sterk in het licht gezet worden, is één van de grootste nadelen van de vertaling van het instrument stemtest naar een televisieprogramma dat op een of andere manier de stemtest als een collectief eerder dan als een individueel gebeuren wil duiden.
Op dit punt leidt een televisieprogramma over de stemtest tot vragen en verwachtingen waar het instrument niet altijd kan aan voldoen zonder zichzelf enig geweld aan te doen. Het meest cruciale daarbij is inderdaad die collectivisering. In essentie is de stemtest een individuele aangelegenheid, waarbij elke afzonderlijke kiezer kijkt wat de meting van het instrument oplevert. Dat is - voor wie gelooft in het nut van het instrument - een zinvolle en misschien zelfs leerzame aangelegenheid. Vooral het ‘spelen’ met de stemtest om te kijken hoe verschillende eigen meningen tot variaties in de resultaten kunnen leiden, is heel zinvol, maar vereist wel dat de stemtest op een medium staat dat deze wijze van interactie mogelijk maakt. Internet kan dat zeker. Televisie kan dat veel minder. Terwijl de uitzending loopt, kunnen kijkers per mobiele of per vaste telefoon éénmaal hun ‘stemprofiel’ opvragen. Dat arriveert bij al die individuele kijkers, en is uiteraard in de uitzending zelf niet zichtbaar.
De televisie-uitzending bestond uit twee delen, waarbij in het tweede deel ‘resultaten’ moesten worden bekend gemaakt. Dat waren geen resultaten van de stemtest zelf, maar de resultaten van een telefonische peiling waarin alle stellingen en dilemma’s van de stemtest waren opgenomen. De antwoorden op sommige afzonderlijke stellingen - die zoals gezegd dienden als indicatoren om de diverse dimensies in de stemtest te meten - werden daarbij soms heel stevig in de verf gezet. Partijen werden in dat tweede deel niet alleen gevraagd om hun standpunten toe te lichten, maar vaak ook om zich te verantwoorden voor het feit dat hun standpunt blijkbaar - althans op basis van één enkele vraag - niet door een meerderheid van de bevolking werd gedragen. Het is een onbedoeld maar wel pervers effect van de poging om een instrument dat bedoeld is om individueel te worden gebruikt te vertalen naar een medium dat er behoefte aan heeft om iets collectiefs, iets veralgemenends aan te bieden. Duiding geven bij de structuur van de stemtest - bijvoorbeeld het beeld van het partijlandschap dat eruit te voorschijn komt of de consistentie van de kartels - is dan minder aantrekkelijk dan duiding geven bij antwoorden die het ‘het volk’ gegeven heeft op concrete vragen. Het debat wordt daardoor ook snel geduid als een debat met standpunten die ofwel voor ofwel tegen ‘het volk’ zijn. Dat is een consequentie van het kiezen voor televisie waarvoor wij niet blind mogen zijn. De vraag of een instrument als een stemtest - los nog van de vraag of het op zich zinvol of correct is - kan vertaald worden in een televisieprogramma, levert met andere woorden niet echt een eenduidig antwoord op. Er zijn veel positieve aspecten. Maar het meest negatieve is zonder meer de vermenging van de stemtest met een peiling, waardoor de stemtest twee betekenissen kreeg die eigenlijk niet met elkaar mogen verward worden. De essentie van de stemtest is het resultaat voor al wie deelneemt. De telefonische peiling die als ‘resultaat’ wordt meegeleverd is de stemtest niet.
Het belangrijkste van de stemtest is inderdaad het resultaat, het zogenaamde ‘stemprofiel’. Dat bestaat niet uit één partij, maar uit een rangschikking. Die volgorde van partijen is naar onze mening zeer leerrijk. Je ontdekt dat je eigenlijk van alle partijen iets hebt, maar van de ene wat meer dan van de andere. Je ontdekt misschien hoe het komt dat je bij je keuze in het stemhokje soms twijfelt tussen twee of drie partijen. Dat is normaal. Elke kiezer heeft immers een set van overtuigingen, en elke partij biedt er eentje aan. Die twee overlappen maar ten dele, en dus spreken verschillende partijen dezelfde kiezers aan. Met dat stemprofiel krijg je een klein stukje politieke informatie mee, en alle beetjes helpen. Dat is het steentje dat de stemtest bijdraagt. Niet meer, maar ook niet minder.

Kris Deschouwer
Politieke wetenschappen - VUB
Michiel Nuytemans
Politieke wetenschappen - UA

**Noten **
1/ Bij het bouwen van de stemtest van 2003 gingen we minder deductief te werk. Toen werden eerst een hele reeks items bedacht, en werd nadien - in functie van het belang van de beleidsdomeinen (in dit geval de federale) - gepoogd enig evenwicht in te bouwen. Dat is niet helemaal geslaagd, en te veel items bleven in de finale test omdat het ‘leuke’ beleidsvoorstellen waren. Er waren op die manier ook te veel items over (on)veiligheid en migratie. Het is die ervaring die ons ertoe heeft aangezet om, nog voor de vraag naar een nieuwe stemtest in 2004 kwam, voor de meer deductieve methode te opteren.
2/ Dit codeboek was ontworpen voor het DWTC-project agendasetting in België op basis van de EUROVOC-thesaurus en is binnen dat project al gebruikt voor het coderen van alle partijprogramma’s van de jaren 1990.
3/ Hier baseerden we ons op het nieuwe, gedetailleerde codeboek van het Electronisch Nieuws Archief.

stemtesten - verkiezingen - media en politiek

De Stemtest van de VRT: een kijk in de keuken

1. Wat is een stemtest (en wat is het niet)?

2. De selectie en de weging van de stellingen

3. Analyse en evaluatie van de stemtest

SAMPOL ONLINE

40€/jaar

Meest gekozen

SAMPOL COMPLEET

50€/jaar

SAMPOL STEUN

100€/jaar

SAMPOL SPONSOR

500€/jaar