Provtagningsdistribution
Vad är provtagningsdistribution?En provtagningsfördelning är en sannolikhetsfördelning av en statistik erhållen genom ett stort antal prover som tas från en specifik population. Provtagningsfördelningen för en given population är fördelningen av frekvenser för en rad olika resultat som eventuellt kan uppstå för en statistik över en population.
Förstå provtagningsdistribution
Mycket data som dras och används av akademiker, statistiker, forskare, marknadsförare, analytiker etc. är faktiskt prover, inte populationer. Ett prov är en delmängd av en befolkning. Till exempel kan en medicinsk forskare som ville jämföra medelvikt för alla barn födda i Nordamerika från 1995 till 2005 med dem som föddes i Sydamerika inom samma tidsperiod inte inom rimlig tid dra data för hela befolkningen i över en miljon förlossningar som inträffade under tioårsperioden. Han kommer istället bara att använda vikten av, till exempel, 100 spädbarn, på varje kontinent för att göra en slutsats. Vikten på 200 spädbarn som används är provet och den genomsnittliga beräknade vikten är provmedlet.
Anta nu att i stället för att ta bara ett prov med 100 nyfödda vikter från varje kontinental, tar den medicinska forskaren upprepade slumpmässiga prover från den allmänna populationen och beräknar provmedlet för varje provgrupp. Så för Nordamerika hämtar han data för 100 nyfödda vikter registrerade i USA, Kanada och Mexiko enligt följande: fyra 100 prover från utvalda sjukhus i USA, fem 70 prover från Kanada och tre 150 poster från Mexiko, totalt av 1200 vikter av nyfödda barn grupperade i 12 uppsättningar. Han samlar också in ett urval av 100 födelsevikt från vart och ett av de 12 länderna i Sydamerika.
Varje prov har sitt eget provmedelvärde och fördelningen av provorganet kallas provfördelningen.
Medelvikten beräknad för varje provuppsättning är provtagningsfördelningen för medelvärdet. Inte bara medelvärdet kan beräknas från ett prov. Annan statistik, såsom standardavvikelse, varians, proportion och intervall kan beräknas utifrån provdata. Standardavvikelsen och variansen mäter variationen i provtagningsfördelningen.
Antalet observationer i en population, antalet observationer i ett prov och proceduren som används för att dra provuppsättningarna bestämmer variationen i en provtagningsfördelning. Standardavvikelsen för en samplingsfördelning kallas standardfelet. Medan medelvärdet för en provtagningsfördelning är lika med befolkningens medel, beror standardfelet på standardavvikelsen för populationen, befolkningsstorleken och provets storlek.
Att veta hur spridda medelvärdet för var och en av provuppsättningarna är från varandra och från befolkningsmedlet kommer att ge en indikation på hur nära provmedlet är populationsmedlet. Standardfelet för provtagningsfördelningen minskar när provstorleken ökar.
Särskilda överväganden
En population eller ett urval av siffror kommer att ha en normal fördelning. Eftersom en samplingsfördelning inkluderar flera uppsättningar av observationer kommer den emellertid inte nödvändigtvis att ha en klockböjd form.
I enlighet med vårt exempel har befolkningsgenomsnittsvikten för spädbarn i Nordamerika och i Sydamerika en normalfördelning eftersom vissa spädbarn kommer att vara underviktiga (under medelvärdet) eller överviktiga (över medelvärdet), med de flesta spädbarn som faller i mellan (runt medelvärdet) ). Om medelvikten för nyfödda i Nordamerika är sju kilo, kommer provets medelvikt i var och en av de 12 uppsättningarna av provobservationer som registrerats för Nordamerika också att ligga nära sju kilo.
Om du emellertid räknar upp varje medelvärde som beräknas i var och en av de 1200 provgrupperna, kan den resulterande formen resultera i en enhetlig fördelning, men det är svårt att förutse med säkerhet vad den faktiska formen kommer att visa sig vara. Ju fler prover forskaren använder från en befolkning på över en miljon viktsiffror, desto mer kommer grafen att börja bilda en normalfördelning.
- En provtagningsfördelning är en sannolikhetsfördelning av en statistik erhållen genom ett stort antal prover som tas från en specifik population.
- Provtagningsfördelningen för en given population är fördelningen av frekvenser för en rad olika resultat som eventuellt kan uppstå för en statistik över en population.
- Mycket data som dras och används av akademiker, statistiker, forskare, marknadsförare och analytiker är faktiskt prover, inte populationer.