Een "goede" steekproef hangt minder af van een vast percentage van de populatie en meer van de absolute grootte en de representativiteit. Een veelgebruikte vuistregel is om te streven naar 10% van de populatie, maar dit geldt vooral voor kleine populaties en moet niet meer dan 1000 respondenten overschrijden. tools4dev +1
Bijvoorbeeld: wanneer er bij een vragenlijst wordt gevraagd naar het geslacht van de respondent, kan de respondent hier 'man' of 'vrouw' op antwoorden. Een steekproef is nauwkeurig wanneer 50% van de respondenten man antwoord en 50% van de respondenten niet. In dit geval is de nauwkeurigheidsafwijking 5%.
Doelstellingen voor de steekproefomvang
Een goede algemene vuistregel die je vaak terugziet op websites over statistieken, is om te streven naar een steekproef van 10% van de populatie, met een minimale steekproefomvang van 100. We raden aan om deze algemene richtlijn waar mogelijk te volgen.
Het 95%-betrouwbaarheidsinterval geeft aan dat bij het steeds nemen van een nieuwe aselecte steekproef uit dezelfde populatie 95% van de daarbij opgestelde intervallen de populatieproportie bevat.
Als de steekproefomvang minder dan 10% van de populatieomvang bedraagt, kunnen de onderzoeken als onafhankelijk worden beschouwd, zelfs als dat niet het geval is . Onafhankelijke onderzoeken zijn onderzoeken waarbij de uitkomst van het ene onderzoek geen invloed heeft op de uitkomst van het andere.
De 95%-regel stelt dat ongeveer 95% van de waarnemingen binnen twee standaarddeviaties van het gemiddelde vallen in een normale verdeling . De normale curve illustreert deze empirische regel.
Bij steekproeven gebruiken we n – 1 in de formule, omdat het gebruik van n een vertekende schatting zou geven, waarbij de spreiding wordt onderschat. De steekproefvariantie is normaal gesproken lager dan de werkelijke populatievariantie.
Een betrouwbaarheid van 95% betekent dat 95 van de 100 eenheden de aangegeven gebruiksduur overleven en de vereiste/verwachte functie blijven vervullen, in de gebruikersomgeving en onder de gebruiksomstandigheden. Een betrouwbaarheidsinterval van 90% betekent dat de steekproef die we hebben gebruikt om de betrouwbaarheid te schatten, een grote kans heeft om onder de werkelijke waarde te liggen.
Een voorbeeld ter indicatie: als je een uitspraak wil doen over de gemiddelde Nederlander, met een foutenmarge van 2% en 95% betrouwbaarheidsniveau, heb je 2.401 respondenten nodig.
Voor een betrouwbaarheidsniveau van 90% komt de z-waarde op 1,64. Voor 95% op 1,96 en voor 99% op 2,57.
Stap 1: Bepaal de populatieomvang, , en bereken 10% van de populatieomvang, . Stap 2: Bepaal de steekproefomvang, . Stap 3: Vergelijk de steekproefomvang met 10% van de populatieomvang. Als n ≤ 0,1 N, dan is aan de 10%-regel voldaan.
Een goede maximale steekproefomvang is doorgaans ongeveer 10% van de populatie, zolang dit niet meer dan 1000 bedraagt . In een populatie van 5000 is 10% bijvoorbeeld 500. In een populatie van 200.000 is 10% 20.000.
Er bestaat geen universele overeenstemming en het blijft controversieel welk getal een kleine steekproefomvang aanduidt. Sommige onderzoekers beschouwen een steekproef van n = 30 als "klein", terwijl anderen n = 20 of n = 10 gebruiken om een kleine steekproefomvang te onderscheiden . "Klein" is bovendien relatief in statistische analyses.
Het hangt er eigenlijk vanaf welke statistische methode je gebruikt voor de data-analyse. Een steekproefomvang van 100 is voldoende voor een exploratieve factoranalyse, mits de modelparameters duidelijk zijn en betrouwbaar zijn afgeleid van een sterke theoretische basis . Voor complexere modellen is een steekproefomvang van meer dan 200 echter aan te raden.
De standaardafwijking of standaarddeviatie beschrijft de gemiddelde afwijking van alle scores van een variabele die is gemeten onder een steekproef of als waarde van een kenmerk van een populatie.
Statistische hypothesetoetsing wordt gebruikt om te bepalen of de resultaten van een dataset statistisch significant zijn. Een p-waarde van 5% of lager wordt over het algemeen als statistisch significant beschouwd .
MSS (Minimum Steekproefgrootte): Dit is het aantal waarnemingen dat nodig is om met een bepaalde nauwkeurigheid een schatting te geven van de kenmerken van een populatie.
Kort samengevat: een 95%-betrouwbaarheidsinterval geeft een bereik aan voor experimentele resultaten, met 95% zekerheid dat de werkelijke waarde binnen dat bereik valt. Het is de standaard geworden vanwege de balans tussen precisie en betrouwbaarheid , en werd ontwikkeld door statisticus Sir Ronald Fisher.
Het principe is eenvoudig toe te passen. Met een voldoende grote steekproefomvang zal de steekproefverdeling een normale verdeling benaderen en zal het steekproefgemiddelde het populatiegemiddelde benaderen. Dit suggereert dat als we een steekproefomvang van minstens 30 hebben, we de gegevens kunnen analyseren alsof ze een normale verdeling volgen .
Hoewel we zouden kunnen hopen dat 95% van de betrouwbaarheidsintervallen de meta-analytische gemiddelde waarde (en dus vermoedelijk ook de werkelijke waarde) zou bevatten, suggereert een recente meta-analyse van 512 meta-analyses in de ecologie en evolutie dat dit slechts in een ontnuchterende 45% van de gevallen het geval is .
Het is ook mogelijk om een betrouwbaarheidsniveau van 90% te hanteren voor zowel sociale als natuurlijke studies als de onderzoekspopulatie klein is . Bovendien, als de onderzoekspopulatie klein is en we een betrouwbaarheidsniveau van 95% hanteren, is de onderzoeker verplicht om de gehele onderzoekspopulatie als steekproef te gebruiken.
In 68 % van de steekproeven ligt de populatieproportie tussen p−σ en p+σ . Dit heet het 68 %-betrouwbaarheidsinterval van p en de 68 % heet de betrouwbaarheid. In 95 % van de steekproeven ligt de populatieproportie tussen p−2⋅σ p - 2 ⋅ σ en p+2⋅σ p + 2 ⋅ σ .
Een belangrijke eigenschap van de normale verdeling is de empirische regel (ook bekend als de 68-95-99.7 regel). Ongeveer 68% van de gegevens ligt binnen één standaardafwijking van het gemiddelde, ongeveer 95% ligt binnen twee standaardafwijkingen, en bijna 99,7% ligt binnen drie standaardafwijkingen.
Een steekproef is nauwkeurig wanneer 50% van de respondenten man antwoord en 50% van de respondenten niet. In dit geval is de nauwkeurigheidsafwijking 5%.
1 standaardafwijking van het gemiddelde, bevat 68% van alle data. 2 standaardafwijkingen van het gemiddelde, bevat 95% van alle data. 3 standaardafwijkingen van het gemiddelde, bevat 99,8% van alle data.