Huvud » algoritmisk handel » Stratifierad stickprovtagning

Stratifierad stickprovtagning

algoritmisk handel : Stratifierad stickprovtagning
Vad är stratifierat slumpmässigt provtagning?

Stratifierad slumpmässig provtagning är en metod för provtagning som involverar uppdelningen av en befolkning i mindre undergrupper som kallas strata. Vid stratifierat slumpmässigt urval eller stratifiering bildas skikten baserat på medlemmarnas delade attribut eller egenskaper såsom inkomst eller utbildning.

Stratifierat slumpmässigt sampling kallas också proportionell slumpmässig sampling eller kvot slumpmässig sampling.

[Viktigt: Stratifierat sampling används för att lyfta fram skillnader mellan grupper i en befolkning, i motsats till enkel slumpmässig provtagning, som behandlar alla medlemmar i en befolkning som lika, med lika stor sannolikhet att ta stickprov.]

01:40

Stratifierad stickprovtagning

Hur fungerar stratifierat slumpmässigt provtagning

När man genomför analys eller forskning om en grupp enheter med liknande egenskaper kan en forskare upptäcka att befolkningsstorleken är för stor för att kunna fullfölja forskningen. För att spara tid och pengar kan en analytiker ta en mer genomförbar strategi genom att välja en liten grupp från befolkningen. Den lilla gruppen benämns ett provstorlek, som är en delmängd av befolkningen som används för att representera hela befolkningen. Ett prov kan väljas från en population på ett antal sätt, varav ett är den stratifierade slumpmässiga provtagningsmetoden.

En stratifierad slumpmässig provtagning innebär att man delar upp hela befolkningen i homogena grupper som kallas strata (plural för stratum). Slumpmässiga prover väljs sedan från varje stratum. Tänk till exempel på en akademisk forskare som vill veta antalet MBA-studenter 2007 som fick ett jobb erbjudande inom tre månader efter examen.

Han kommer snart att upptäcka att det fanns nästan 200 000 MBA-examen för året. Han kanske beslutar att bara ta ett enkelt slumpmässigt urval av 50 000 kandidater och genomföra en undersökning. Ännu bättre kunde han dela upp befolkningen i skikt och ta ett slumpmässigt urval från skikten. För att göra detta skulle han skapa befolkningsgrupper baserade på kön, åldersintervall, ras, nationalitetsland och karriärbakgrund. Ett slumpmässigt prov från varje stratum tas i ett tal som är proportionellt mot stratumets storlek jämfört med befolkningen. Dessa delmängder av stratorna samlas sedan för att bilda ett slumpmässigt prov.

Key Takeaways

  • Stratifierat slumpmässigt urval gör det möjligt för forskare att få en provpopulation som bäst representerar hela den population som studeras.
  • Stratifierat slumpmässigt provtagning innebär att man delar upp hela befolkningen i homogena grupper som kallas strata.
  • Stratifierad slumpmässig provtagning skiljer sig från enkel slumpmässig provtagning, vilket involverar slumpmässigt urval av data från en hel population, så att varje möjligt prov är lika sannolikt att inträffa.

Exempel på stratifierat slumpmässigt provtagning

Anta att ett forskarteam vill bestämma GPA för högskolestudenter i USA. Forskarteamet har svårt att samla in data från alla 21 miljoner studenter; den beslutar att ta ett slumpmässigt urval av befolkningen med 4 000 studenter.

Antag nu att teamet tittar på de olika attributen för provdeltagarna och undrar om det finns några skillnader i GPA: s och studenternas majors. Anta att det upptäcks att 560 studenter är engelska majors, 1.135 är vetenskapsmajor, 800 är datavetenskapliga majors, 1 090 är ingenjörsstorheter och 415 är matematikmajor. Teamet vill använda ett proportionellt stratifierat slumpmässigt prov där stratum av provet är proportionellt mot det slumpmässiga urvalet i befolkningen.

Anta att teamet undersöker demografin för högskolestudenter i USA och hittar procentandelen av vad studenterna har i 12% major i engelska, 28% major i science, 24% major in computer science, 21% major in engineering och 15% major in science i matematik. Således skapas fem lager från den stratifierade slumpmässiga samplingsprocessen.

Teamet måste sedan bekräfta att befolkningens stratum står i proportion till stratum i urvalet; emellertid finner de att proportionerna inte är lika. Teamet behöver sedan ta om prov på 4 000 studenter från befolkningen och slumpmässigt välja 480 engelska, 1 120 vetenskap, 960 datavetenskap, 840 ingenjörer och 600 matematikstudenter.

Med dessa har den ett proportionellt stratifierat slumpmässigt urval av högskolestudenter, vilket ger en bättre representation av studenternas högskolestoror i USA. Forskarna kan sedan lyfta fram specifika skikt, observera de olika studierna för amerikanska högskolestudenter och observera de olika betygsgraderna .

Enkla slumpmässiga kontra stratifierade slumpmässiga prover

Enkla slumpmässiga prover och stratifierade slumpmässiga prover är båda statistiska mätverktyg. Ett enkelt slumpmässigt prov används för att representera hela datapopulationen. Ett stratifierat slumpmässigt prov delar upp populationen i mindre grupper eller strata baserat på delade egenskaper.

Det enkla slumpmässiga exemplet används ofta när det finns mycket lite information om datapopulationen, när datapopulationen har alldeles för många skillnader för att delas upp i olika delmängder, eller när det bara finns ett distinkt kännetecken bland datapopulationen.

Till exempel kan ett godisföretag vilja studera sina kunders köpvanor för att bestämma framtiden för sin produktlinje. Om det finns 10 000 kunder kan det välja 100 av dessa kunder som ett slumpmässigt prov. Den kan sedan tillämpa vad den hittar från de 100 kunderna på resten av sin bas. Till skillnad från stratifiering kommer det att sampla 100 medlemmar rent slumpmässigt utan att ta hänsyn till deras individuella egenskaper.

Proportionerlig och oproportionerlig stratifiering

Stratifierat slumpmässigt provtagning säkerställer att varje undergrupp i en given population representeras tillräckligt inom hela samplingspopulationen i en forskningsstudie. Stratifiering kan vara proportionell eller oproportionerlig. I en proportionerlig stratifierad metod är provstorleken för varje stratum proportionell mot befolkningsstorleken på stratum.

Om till exempel forskaren ville ha ett prov på 50 000 kandidater som använder åldersintervall, kommer det proportionella stratifierade slumpmässiga provet att erhållas med denna formel: (provstorlek / populationstorlek) x stratumstorlek. Tabellen nedan antar en befolkningsstorlek på 180 000 MBA-examen per år.

Åldersgrupp


24-28


29-33


34-37


Total


Antal personer i stratum


90 tusen


60 tusen


30 tusen


180 tusen


Strata provstorlek


25 tusen


16, 667


8333


50 tusen


Stratprovstorleken för MBA-kandidater i åldersintervallet 24 till 28 år är beräknat som (50 000/180 000) x 90 000 = 25 000. Samma metod används för de andra åldersgrupperna. Nu när strataprovstorleken är känd kan forskaren utföra enkla slumpmässiga provtagningar i varje stratum för att välja sina undersökningsdeltagare. Med andra ord kommer 25 000 kandidater från åldersgruppen 24-28 att väljas slumpmässigt från hela befolkningen, 16 677 kandidater från åldersintervallet 29-33 kommer att väljas ur befolkningen slumpmässigt, och så vidare.

I ett oproportionerligt stratifierat prov är storleken på varje stratum inte proportionell mot dess storlek i befolkningen. Forskaren kan besluta att ta prov på 1/2 av kandidaterna inom åldersgruppen 34-37 år och 1/3 av examina inom åldersgruppen 29-33 år.

Det är viktigt att notera att en person inte kan passa in i flera lager. Varje enhet får bara passa in i ett lager. Att ha överlappande undergrupper innebär att vissa individer har högre chanser att bli utvalda för undersökningen, vilket fullständigt negerar begreppet stratifierat sampling som en typ av sannolikhetsprovtagning.

[Viktigt: Portföljförvaltare kan använda stratifierat slumpmässigt provtagning för att skapa portföljer genom att replikera ett index, t.ex. ett obligationsindex.]

Fördelar med stratifierat slumpmässigt provtagning

Den största fördelen med stratifierat slumpmässigt provtagning är att det fångar upp viktiga populationsegenskaper i provet. I likhet med ett viktat genomsnitt ger denna provtagningsmetod egenskaper i provet som är proportionella mot den totala populationen. Stratifierad slumpmässig provtagning fungerar bra för populationer med en mängd olika attribut men är annars ineffektiva om undergrupper inte kan bildas.

Stratifiering ger ett mindre fel i uppskattningen och större precision än den enkla slumpmässiga provtagningsmetoden. Ju större skillnader mellan skikten, desto större är vinsten i precision.

Nackdelar med stratifierat slumpmässigt provtagning

Tyvärr kan inte denna metod användas i varje studie. Metodens nackdel är att flera villkor måste vara uppfyllda för att den ska kunna användas korrekt. Forskare måste identifiera varje medlem i en befolkning som studeras och klassificera var och en av dem och en subpopulation. Som ett resultat är stratifierat slumpmässigt urval negativt när forskare inte med säkerhet kan klassificera varje medlem av befolkningen i en undergrupp. Att hitta en uttömmande och definitiv lista över en hel befolkning kan också vara utmanande.

Överlappning kan vara ett problem om det finns ämnen som faller in i flera undergrupper. När enkel slumpmässig provtagning utförs är det mer troligt att de som är i flera undergrupper väljs. Resultatet kan vara en felaktig presentation eller felaktig reflektion av befolkningen.

Ovanstående exempel gör det enkelt: grundutbildning, examen, manlig och kvinnlig är tydligt definierade grupper. I andra situationer kan det dock vara mycket svårare. Föreställ dig att du inkluderar egenskaper som ras, etnicitet eller religion. Sorteringsprocessen blir svårare, vilket gör stratifierat slumpmässigt urval en ineffektiv och mindre än idealisk metod.

Jämför investeringskonton Leverantörs namn Beskrivning Annonsörens upplysning × Erbjudandena som visas i denna tabell kommer från partnerskap där Investopedia erhåller ersättning.

Relaterade villkor

Exempel Ett prov är en mindre, hanterbar version av en större grupp. Prover används i statistiska tester när befolkningsstorlekarna är för stora. mer Hur enkla slumpmässiga prover fungerar Ett enkelt slumpmässigt prov är en delmängd av en statistisk population där varje medlem i delmängden har lika stor sannolikhet att bli vald. Ett enkelt slumpmässigt prov är tänkt att vara en opartisk representation av en grupp. mer Representativt prov används ofta för att extrapolera bredare känslor Ett representativt prov är en delmängd av en befolkning som återspeglar egenskaperna hos hela befolkningen. mer Ins och outs of Systematic Sampling Systematic sampling är en metod för sampling av sannolikhet där ett slumpmässigt urval från en större population väljs. mer Provtagning Definition Provtagning är en process som används i statistisk analys där en grupp observationer utvinns från en större population. mer Definition av T-test Ett t-test är en typ av inferensiell statistik som används för att bestämma om det finns en betydande skillnad mellan medel från två grupper, som kan vara relaterade till vissa funktioner. mer Partnerlänkar
Rekommenderas
Lämna Din Kommentar