KWANTITATIEF ONDERZOEK, STEEKPROEFOMVANG, STEEKPROEFFORMULE

KORTE EN DUIDELIJKE TIPS VOOR ONDERZOEKSOPDRACHTEN EN -TENTAMENSTOF (HBO/MBO+).


KWANTITATIEF ONDERZOEK EN HET BEREKENEN VAN DE STEEKPROEFOMVANG


Een aantal basisbegrippen :
Gebruik een app voor het berekenen van de steekproefomvang... 'Betrouwbaarheid’, ’Validiteit’, ’Representativiteit’ en ’Nauwkeurigheid’.
In de steekproefformule komen betrouwbaarheid en nauwkeurigheid terug. 


Met de formule berekent de onderzoeker de betrouwbaarheid en de nauwkeurigheid van het onderzoek. Dat doet de onderzoeker ook al vooraf om te bepalen hoeveel enquêtes er nodig zijn.


Betrouwbaarheid:  Ook wel aangeduid met ’herhaalbaarheid’.
Het geeft aan dat de onderzoeker het onderzoek op zo’n manier heeft gedaan dat een herhaling van het onderzoek (bijvoorbeeld door een andere onderzoeker) dezelfde uitkomsten zou opleveren. Dus als uit het onderzoek komt dat 75% van de klanten ontevreden is, dan zal hetzelfde onderzoek een dag later ook op ongeveer 75% uitkomen.


Een onderzoeker zorgt voor een betrouwbaar onderzoek door er op te letten dat de vragen duidelijk zijn en niet verkeerd kunnen worden uitgelegd door de respondenten. Vragen mogen ook niet ’sturend’ zijn, zodat de respondenten worden beïnvloed. Maar er zijn nog meer aandachtspunten:


Validiteit
Heeft ermee te maken dat je de vragen wel moet stellen aan de juiste mensen. Als je onderzoek doet naar de tevredenheid over babyshampoo en je vraagt het aan 20 mannen zonder kinderen dan heeft je onderzoek geen waarde. Omdat het niet VALIDE is. Dat geldt ook als je de verkeerde vragen stelt. Als je in een onderzoek over babyshampoo aan 100 jonge moeders vraagt wat ze vinden van de kleur van babykamers dan levert dat geen nuttige informatie op voor het babyshampoo-onderzoek. Dat noemen we dan ook NIET VALIDE.


Representativiteit
Ook moet je erop letten dat je de vragen stelt aan de juiste mix van respondenten. Stel bijvoorbeeld dat je onderzoek doet naar de tevredenheid van het publiek bij het optreden van Marco Borsato. En je vraagt 100 vrouwelijke bezoekers van boven de 40 jaar naar hun mening dan mis je de meningen van mannen, vrouwen jonger dan 40 en kinderen. Je onderzoek gaat dan dus niet over ’de bezoekers van Marco Borsato’ maar alleen over de ’vrouwelijke bezoekers van boven de 40 jaar’. We zeggen het onderzoek is NIET REPRESENTATIEF voor ALLE bezoekers. Representatief betekent ’ juiste afspiegeling/ vertegenwoordiging van alle elementen uit je populatie’.


Betrouwbaarheid en de toevallige fout.
Om de steekproefformule te begrijpen moet je goed snappen:
- Betrouwbaarheid heeft te maken met het aantal deelnemers aan een enquete.
- Betrouwbaarheid gaat over de betrouwbaarheid van de conclusie (dus de 'gemiddelde mening van alle deelnemers').


a). Hoe meer deelnemers er zijn hoe beter / hoe betrouwbaarder je conclusie. Dat is niet vreemd.
Voorbeeld: Wanneer je een enquête houdt en het gaat bijvoorbeeld over de smaak van bier. Dan kan de conclusie zijn dat 100% van de Nederlanders bier lekker vindt. Tenzij.... Je conclusie is gebaseerd op een enquete onder 3 respondenten. De kans is namelijk heel groot dat bij een herhaling van de enquete onder andere respondenten de conclusie heel anders zal zijn. (Let op: De definitie van 'betrouwbaarheid' is 'herhaalbaarheid' dus als de kans groot is dat de conclusie niet herhaald zal worden: is het onderzoek onbetrouwbaar).


b). Wat er ook nog meespeelt is de kans dat een kleine groep respondenten je conclusie onbetrouwbaar maakt. Als je maar 3 mensen enquêteert en deze drie mensen zijn TOEVALLIG allemaal tegen alcohol ... Dan is de conclusie '... 100% van de Nederlanders vindt bier slecht'. Deze conclusie is dus onjuist en je hebt de kans op een onjuiste conclusie groter gemaakt door maar een kleine groep mensen te enqueteren. (Hoe kleiner de groep, des te groter is de invloed van een kleine groep respondenten). Wanneer je 1000 mensen enquêteert is de kans dat je conclusie niet klopt veel kleiner. Ook al zitten er 3 (of desnoods 10) respondenten tussen die tegen alcohol zijn. Deze 10 hebben weinig invloed.


De onderzoeker krijgt een betrouwbaar idee van de mening van de gemiddelde Nederlander. De eigenschap dat je onderzoek onjuist is doordat er abnormaal veel mensen met een afwijkende mening meedoen heet 'de toevallige fout '.


Een oplossing die wiskundigen hebben bedacht: de kans op een toevallige fout.
Omdat je nooit kunt uitsluiten dat er een 'toevallige fout' gebeurt spreken we liever over 'wat is de KANS dat de toevallige fout je conclusies onjuist maakt?' Ze hebben het volgende bedacht: Laten we ervan uitgaan dat de meeste mensen 'het gemiddelde' antwoord geven; dat een kleiner percentage iets boven het gemiddelde antwoordt en dat een even groot percentage iets onder het gemiddelde zal antwoorden. Er blijft dan meestal zo'n 5% van de steekproef over die VEEL HOGER of VEEL LAGER antwoordt dan het gemiddelde.


Statistici zeggen : 68% van de steekproef zijn de antwoorden van mensen die het gemiddelde antwoord geven of iets erboven of iets eronder. 32% valt daar dus buiten. Het echte probleem zit echter in die 5% van de deelnemers die een zeer afwijkende mening heeft (waarvan dus 2,5% punt extreem hoger en 2,5% punt extreem lager).


Om deze kans op toevallige fout mee te nemen bij het berekenen van het aantal benodigde enquêtes hebben we de
Z-waarden tabel.
betrouwbaarheid            z-waarde
68%                                   1
80%                                1,28
90%                                1,65
95%                                1,96
99%                                2,57


Je kunt zelf bepalen hoe klein je de kans wilt hebben op een toevallige fout. Hiervoor kijk je in de linkerkolom. Vervolgens lees je de z-waarde af die daarbij hoort.
Als je wilt dat de kans op een toevallige fout slechts 5% is dan hoort daar een z-waarde bij van 1,96 (zie boven).


Als het heel belangrijk is dat er geen toevallige fout wordt gemaakt dan moet je kiezen voor een betrouwbaarheid van 99% (z=2,57). Als je berekent hoeveel enquêtes er ingevuld moeten worden (lees: hoeveel respondenten hun mening moeten geven) dan moet je dus in de formule aangeven wat het ’betrouwbaarheidsniveau’ moet zijn’. Dat doe je door de overeenkomstige z-waarde in de formule  in te vullen).


DE STEEKPROEFFORMULE
Voor het berekenen van het aantal enquêtes dat nodig is voor je onderzoek maken we gebruik van 2 formules. Soms heb je maar 1 van de 2 nodig. De eerste formule heet de FORMULE VOOR DE MINIMALE STEEKPROEFOMVANG


Formule:  n = p% x q% x (z/e%)²
n : de  minimale steekproefomvang (die ga je dus uitrekenen)
p%= percentage van de gespecificeerde categorie
q%= percentage dat niet tot de gespecificeerde categorie hoort
z= z-waarde (van betrouwbaarheidsniveau)
e%= de vereiste foutmarge/nauwkeurigheid

Deze eerste formule gebruik je altijd. Enwanneer je onderzoekspopulatie groter is dan 10 000 (personen/ elementen) dan heb je aan deze formule genoeg!!
De 'n' die je hiermee berekent is dan de steekproefgrootte/ het aantal deelnemers aan de enquete dat je nodig hebt voor je onderzoek.

Als er minder dan 10.000 elementen in de populatie zijn gebruik je ook nog de 2e formule.
Dit is de FORMULE VOOR DE GECORRIGEERDE STEEKPROEFOMVANG  


                                                                                                                                     n            
                                                                                                                            n’ = 1 + (n/N)


n’ = gecorrigeerde minimale steekproefomvang
n = minimale steekproefomvang
N = de totale populatie


Rekenvoorbeeld
Paula onderzoekt de tevredenheid van de vaste gasten van een Hotel. Het hotel heeft 1100 vaste gasten. Ze wil een enquête afnemen met vragen over de tevredenheid. Hoeveel enquêtes moet ze nu afnemen?
-Stap 1: Hoe betrouwbaar moet het onderzoek zijn? (Meeste onderzoekers kiezen voor een betrouwbaarheidsniveau van 95%). (5% kans op een verkeerde conclusie door toevallige fout)
-Stap 2: Hoe nauwkeurig moet het onderzoek zijn? We bedoelen daarmee dit: Wanneer uit het onderzoek komt dat 30% van de respondenten ontevreden is over het hotel. Mag de conclusie er een paar % naast zitten? Dus dat je in het rapport schrijft: Ik heb het niet helemaal precies kunnen meten maar tussen de 25% en 35% van alle gasten is ontevreden. (Dit is de nauwkeurigheidsmarge die je kiest. Hoe nauwkeuriger des te meer mensen moet je enqueteren.)
-Stap 3: Heeft de onderzoeker zelf al een sterke aanwijzing over de uitkomst? Dan kan het verwachte antwoordpercentage worden ingevuld (p%) maar meestal heb je geen zekere verwachting van de uitkomst / of vinden we het veiliger om niet te ’gokken’. In dat geval vullen we voor p de waarde 50 in en ook voor q de waarde 50.  (q is namelijk altijd 100 - p).
-Stap 4: Hoe groot is de populatie? (Populatie= totaal aantal mensen/elementen waar het onderzoek over gaat). In het geval van Paula gaat het in totaal dus om 1100 gasten. (populatiegrootte is 1100).
-Stap 5: Invullen van de formule voor de MINIMALE STEEKPROEFOMVANG.
Paula vult de formule als volgt in: n = p% x q% x (z/e%)²  >  n= 50 x 50 x (1,96/5) ²
Uitleg:
Paula heeft geen idee van de uitkomst van het onderzoek en vult voor p, 50 in en ook voor q, 50 in.
(Dit betekent dat onderzoeker de uitkomst niet van tevoren kan schatten).


Voor de betrouwbaarheid van 95% zoekt ze in de tabel de Z-waarde op en die is 1,96 Voor de nauwkeurigheid (marge) vult ze 5 in.
(Ze neemt hier de nauwkeurigheid die meestal aangenomen wordt voor onderzoek namelijk 5%). 
Dat betekent dat Paula egt: Ik ben al blij als ik er maximaal 5%-punt naast zit met mijn conclusie.
Uitrekenen van de formule geeft:     2500 x (0,392)x(0,392) = 384,16


Stap 6: Is het aantal van de popualtie groter dan 10 000? Dan is DIT het aantal enquêtes dat afgenomen moet worden: namelijk 385 (we ronden de uitkomst uit de berekening altijd naar boven af) Als de populatie kleiner is dan 10 000 moet Paula ook nog rekenen met formule 2 (De GECORRIGEERDE STEEKPROEFOMVANG).


Omdat het onderzoek van Paula over de vaste gasten gaat, is de populatie kleiner dan 10 000. De populatie is immers 1100.
En dus moet ze ook nog rekenen met de 2e formule.   


                                                                                               n     
                                                                                 n’ =  1 + (n/N)  > n’= 385 :  (1 +(385/1100)) = 385:(1 +0,35) = 385 : 1,35 = 285,18 =  286


Er zijn dus 286 ingevulde enquêtes nodig.
(We ronden de uitkomst uit de berekening weer naar boven af)

Paula kan haar berekening controleren met behulp van de Steekproefcalulator.


EINDE VAN DIT ARTIKEL.
Bekijk ook de andere artikelen. Klik hier voor een overzicht van alle artikelen.


The Research & Education Company BV is een full-service onderzoeksbureau. Bekijk hier inspirerende voorbeelden van innovatieve onderzoeksprojecten.
Voor junior onderzoekers hebben we de Steekproefcalculator die automatisch uitrekent hoeveel respondenten u netto moet realiseren voor een betrouwbaar en nauwkeurig onderzoek.

DEEL DEZE SITE MET MEDE-STUDENTEN
Er is veel zorg besteed aan deze uitleg. Het is begrijpelijk geschreven met duidelijk voorbeelden. Maandelijks bezoeken 4000 HBO (en WO) studenten onze site. Als je vindt dat de site je goed geholpen heeft, vergeet dan niet om dit te delen en te liken.



MEER NUTTIGE ARTIKELEN