Huvud » mäklare » Variansanalys (ANOVA)

Variansanalys (ANOVA)

Vad är analys av variation (ANOVA)?

Variansanalys (ANOVA) är ett analysverktyg som används i statistik som delar upp en observerad aggregerad variation som finns i en datamängd i två delar: systematiska faktorer och slumpmässiga faktorer. De systematiska faktorerna har ett statistiskt inflytande på den givna datamängden, medan slumpmässiga faktorer inte gör det. Analytiker använder ANOVA-testet för att bestämma påverkan som oberoende variabler har på den beroende variabeln i en regressionsstudie.

T- och z-testmetoderna som utvecklades under 1900-talet användes för statistisk analys fram till 1918, då Ronald Fisher skapade analysen av variansmetoden. ANOVA kallas också Fisher-variansanalysen, och det är förlängningen av t- och z-testerna. Begreppet blev välkänt 1925, efter att ha uppträtt i Fishers bok, "Statistiska metoder för forskningsarbetare." Det anställdes i experimentell psykologi och utvidgades senare till ämnen som var mer komplexa.

Formeln för ANOVA är:

F = MSTMSEwhere: F = ANOVA-koefficientMST = Genomsnittlig summa av rutor på grund av behandlingMSE = Medelsumma kvadrater på grund av fel \ begin {inriktad} & \ text {F} = \ frac {\ text {MST}} {\ text { MSE}} \\ & \ textbf {där:} \\ & \ text {F} = \ text {ANOVA-koefficient} \\ & \ text {MST} = \ text {Genomsnittlig summa av rutor på grund av behandling} \\ & \ text {MSE} = \ text {Genomsnittlig summa av kvadrater på grund av fel} \\ \ end {inriktad} F = MSEMST där: F = ANOVA-koefficientMST = Medelsumma kvadrater på grund av behandlingMSE = Medelsumma kvadrater på grund av fel

Vad avslöjar analysen av variation?

ANOVA-testet är det första steget i att analysera faktorer som påverkar en viss datauppsättning. När testet är avslutat utför en analytiker ytterligare tester på de metodiska faktorerna som mätbart bidrar till datasättets inkonsekvens. Analisten använder ANOVA-testresultaten i ett f-test för att generera ytterligare data som är i linje med de föreslagna regressionsmodellerna.

ANOVA-testet möjliggör en jämförelse av mer än två grupper samtidigt för att avgöra om det finns ett samband mellan dem. Resultatet av ANOVA-formeln, F-statistiken (även kallad F-förhållandet), möjliggör analys av flera datagrupper för att bestämma variationen mellan prover och inom prover.

Om det inte finns någon verklig skillnad mellan de testade grupperna, som kallas nollhypotesen, kommer resultatet av ANOVAs F-förhållandestatistik att vara nära 1. Fluktuationer i dess provtagning kommer sannolikt att följa Fisher F-distributionen. Detta är faktiskt en grupp distributionsfunktioner, med två karakteristiska nummer, kallad graden av frihet och graden av frihet.

Key Takeaways

Variansanalys, eller ANOVA, är en statistisk metod som separerar observerade variansdata i olika komponenter som ska användas för ytterligare test.
En enkelriktad ANOVA används för tre eller flera datagrupper för att få information om förhållandet mellan beroende och oberoende variabler.
Om det inte finns någon riktig varians mellan grupperna bör ANOVA: s F-förhållande vara lika nära 1.

Exempel på hur man använder ANOVA

En forskare kan till exempel testa studenter från flera högskolor för att se om studenter från en av högskolorna konsekvent överträffar studenter från de andra högskolorna. I en affärsapplikation kan en FoU-forskare testa två olika processer för att skapa en produkt för att se om en process är bättre än den andra när det gäller kostnadseffektivitet.

Vilken typ av ANOVA-test som används beror på ett antal faktorer. Det tillämpas när data måste vara experimentella. Variansanalys används om det inte finns någon tillgång till statistisk mjukvara som resulterar i beräkning av ANOVA för hand. Det är enkelt att använda och passar bäst för små prover. Med många experimentella konstruktioner måste provstorlekarna vara desamma för de olika faktornivåkombinationerna.

ANOVA är användbar för att testa tre eller flera variabler. Det liknar flera t-prov med två prov. Det resulterar dock i färre typ I-fel och passar för en rad problem. ANOVA grupperar skillnader genom att jämföra medel för varje grupp och inkluderar spridning av variationen i olika källor. Det används med personer, testgrupper, mellan grupper och inom grupper.

Envägs ANOVA kontra tvåvägs ANOVA

Det finns två typer av ANOVA: envägs (eller enkelriktad) och tvåvägs. Envägs eller tvåvägs hänvisar till antalet oberoende variabler i din variansanalys. En envägs ANOVA utvärderar effekten av en enda faktor på en enda svarsvariabel. Det avgör om alla prover är desamma. Envägs ANOVA används för att bestämma om det finns några statistiskt signifikanta skillnader mellan medel från tre eller fler oberoende (icke-relaterade) grupper.

En tvåvägs ANOVA är en förlängning av envägs ANOVA. Med en enkelriktning har du en oberoende variabel som påverkar en beroende variabel. Med en tvåvägs ANOVA finns det två oberoende. Till exempel tillåter en tvåvägs ANOVA ett företag att jämföra arbetarnas produktivitet baserat på två oberoende variabler, till exempel lön och kompetensuppsättning. Det används för att observera växelverkan mellan de två faktorerna och testa effekten av två faktorer samtidigt.

Jämför investeringskonton Leverantörs namn Beskrivning Annonsörens upplysning × Erbjudandena som visas i denna tabell kommer från partnerskap från vilka Investopedia erhåller ersättning.

Relaterade villkor

Tvåvägs ANOVA Ett tvåvägs ANOVA-test är ett statistiskt test som används för att bestämma effekten av två nominella prediktorvariabler på en kontinuerlig utfallsvariabel. mer Analys av varianter (ANOVA) Analys av varians (ANOVA) är en statistisk undersökning av skillnaderna mellan alla variabler som används i ett experiment. mer Definition av T-test Ett t-test är en typ av inferensiell statistik som används för att bestämma om det finns en betydande skillnad mellan medel från två grupper, som kan vara relaterade till vissa funktioner. mer Hur Least Squares-metoden fungerar Den minsta kvadratmetoden är en statistisk teknik för att bestämma linjen för bästa passning för en modell, specificerad av en ekvation med vissa parametrar för observerade data. mer Hur den återstående standardavvikelsen fungerar Den återstående standardavvikelsen är en statistisk term som används för att beskriva skillnaden i standardavvikelser för observerade värden kontra förutspådda värden som visas av punkter i en regressionsanalys. mer Vad är en feltermin? En feltermin definieras som en variabel i en statistisk modell som skapas när modellen inte helt representerar det faktiska förhållandet mellan de oberoende och beroende variablerna. mer Partnerlänkar

← hacktivism

Negativ bekräftelse →

Rekommenderas

Lämna Din Kommentar