Huvud » algoritmisk handel » Determinationskoefficient

Determinationskoefficient

Vad är bestämningskoefficienten?

Bestämningskoefficienten är ett mått som används i statistisk analys som utvärderar hur väl en modell förklarar och förutsäger framtida resultat. Det indikerar nivån på den förklarade variationen i datauppsättningen. Bestämningskoefficienten, även allmänt känd som "R-kvadrat", används som riktlinje för att mäta modellens noggrannhet.

Ett sätt att tolka denna siffra är att säga att variablerna som ingår i en given modell förklarar ungefär x% av den observerade variationen. Så om R2 = 0, 50, kan ungefär hälften av den observerade variationen förklaras av modellen.

01:58

R-Squared

Key Takeaways

Bestämningskoefficienten är en komplex idé centrerad på den statistiska analysen av en framtida datamodell.
Bestämningskoefficienten används för att förklara hur stor variation av en faktor som kan orsakas av dess relation till en annan faktor.

Förstå bestämningskoefficienten

Bestämningskoefficienten används för att förklara hur stor variation av en faktor som kan orsakas av dess relation till en annan faktor. Det förlitas starkt på trendanalys och representeras som ett värde mellan 0 och 1.

Ju närmare värdet är 1, desto bättre är passningen eller förhållandet mellan de två faktorerna. Bestämningskoefficienten är kvadratet för korrelationskoefficienten, även känd som "R", vilket gör att den kan visa graden av linjär korrelation mellan två variabler.

Denna korrelation är känd som "passformens godhet." Värdet 1, 0 indikerar perfekt passform, och det är alltså en mycket pålitlig modell för framtida prognoser, vilket indikerar att modellen förklarar alla observerade variationer. Ett värde på 0 å andra sidan skulle indikera att modellen inte alls modellerar data korrekt. För en modell med flera variabler, såsom en multipel regressionsmodell, är den justerade R2 en bättre bestämningskoefficient. I ekonomi ses ett R2-värde över 0, 60 som värt.

Fördelar med att analysera bestämningskoefficienten

Bestämningskoefficienten är kvadratet för korrelationen mellan de förutsagda poängen i en datamängd kontra den faktiska uppsättningen poäng. Det kan också uttryckas som kvadratet för korrelationen mellan X- och Y-poängen, där X är den oberoende variabeln och Y är den beroende variabeln.

Oavsett representation, betyder en R-kvadrat lika med 0 att den beroende variabeln inte kan förutsägas med hjälp av den oberoende variabeln. Omvänt, om det är lika med 1, betyder det att beroendet av en variabel alltid förutsägas av den oberoende variabeln.

En bestämningskoefficient som faller inom detta område mäter i vilken utsträckning den beroende variabelen förutsägs av den oberoende variabeln. En R-kvadrat på exempelvis 0, 20 betyder att 20% av den beroende variabelen förutsägs av den oberoende variabeln.

Passformens godhet, eller graden av linjär korrelation, mäter avståndet mellan en monterad linje på en graf och alla datapunkter som är spridda runt grafen. Den snäva uppsättningen av data kommer att ha en regressionslinje som är mycket nära punkterna och har en hög passningsnivå, vilket innebär att avståndet mellan linjen och data är mycket litet. En bra passform har en R-kvadrat som är nära 1.

R-kvadrat kan emellertid inte fastställa om datapunkterna eller förutsägelser är partiska. Det säger inte heller analytikern eller användaren om bestämningskoefficienten är bra eller inte. En låg R-kvadrat är till exempel inte dåligt, och det är upp till personen att fatta ett beslut baserat på R-kvadratnumret.

Bestämningskoefficienten bör inte tolkas naivt. Om till exempel R-kvadratens modell rapporteras till 75% är variansen för dess fel 75% mindre än den beroende variabelns varians, och standardavvikelsen för dess fel är 50% mindre än standardberoende för beroende variabel. Standardavvikelsen för modellens fel är ungefär en tredjedel av storleken på standardavvikelsen för de fel som du skulle få med en endast konstant modell.

Slutligen, även om ett R-kvadratvärde är stort, kan det inte finnas någon statistisk betydelse för de förklarande variablerna i en modell, eller den effektiva storleken på dessa variabler kan vara mycket liten i praktiska termer.

Jämför investeringskonton Leverantörs namn Beskrivning Annonsörens upplysning × Erbjudandena som visas i denna tabell kommer från partnerskap från vilka Investopedia erhåller ersättning.

Relaterade villkor

Vad är en feltermin? En feltermin definieras som en variabel i en statistisk modell som skapas när modellen inte helt representerar det faktiska förhållandet mellan de oberoende och beroende variablerna. mer Hur multipel linjär regression fungerar Multipel linjär regression (MLR) är en statistisk teknik som använder flera förklarande variabler för att förutsäga resultatet av en svarsvariabel. mer Line Of Best Fit Linjen för best fit är en utgång från regressionsanalys som representerar förhållandet mellan två eller flera variabler i en datamängd. mer R-kvadrat R-kvadrat är ett statistiskt mått som representerar andelen varians för en beroende variabel som förklaras av en oberoende variabel. mer Hur Least Squares-metoden fungerar Den minsta kvadratmetoden är en statistisk teknik för att bestämma linjen för bästa passning för en modell, specificerad av en ekvation med vissa parametrar för observerade data. mer Heteroskedasticitet I statistik inträffar heteroskedasticitet när standardavvikelserna för en variabel, övervakad under en viss tid, är icke-konstanta. mer Partnerlänkar

← Hur Amazon utnyttjar Taylor Swifts Star Power för Prime Day

McDonald's introducerar en stor Mac-baserad 'valuta' →

Rekommenderas

Lämna Din Kommentar