Huvud » algoritmisk handel » R-Squared Definition

R-Squared Definition

algoritmisk handel : R-Squared Definition
Vad är R-kvadrat?

R-kvadrat (R 2 ) är ett statistiskt mått som representerar andelen varians för en beroende variabel som förklaras av en oberoende variabel eller variabler i en regressionsmodell. Medan korrelation förklarar styrkan i förhållandet mellan en oberoende och beroende variabel, förklarar R-kvadrat i vilken utsträckning variansen för en variabel förklarar variansen för den andra variabeln. Så om R2 för en modell är 0, 50, kan ungefär hälften av den observerade variationen förklaras med modellens ingångar.

Vid investeringar tolkas R-kvadrat i allmänhet som andelen av en fond eller värdepappers rörelser som kan förklaras av rörelser i ett referensindex. Till exempel identifierar en R-kvadrat för en ränteförsäkring kontra ett obligationsindex säkerhetens andel av prisrörelsen som är förutsägbar baserat på en prisrörelse för indexet. Detsamma kan tillämpas på en aktie jämfört med S&P 500-indexet eller något annat relevant index.

Det kan också kallas bestämningskoefficienten.

Formeln för R-kvadrat är

R2 = 1 − Explained VariationTotal Variation \ börja {inriktad} & \ text {R} ^ 2 = 1 - \ frac {\ text {Explained Variation}} {\ text {Total Variation}} \\ \ end {inriktad} R2 = 1 − TotalvariationExplained Variation

Beräknar R-kvadrat

Den faktiska beräkningen av R-kvadrat kräver flera steg. Detta inkluderar att ta datapunkterna (observationer) för beroende och oberoende variabler och hitta linjen med bästa passform, ofta från en regressionsmodell. Därifrån beräknar du förutspådda värden, subtraherar verkliga värden och kvadraterar resultaten. Detta ger en lista med kvadratiska fel, som sedan summeras och är lika med den förklarade variationen.

För att beräkna den totala variansen, subtraherar du det genomsnittliga verkliga värdet från de förutsagda värdena, kvadrerar resultaten och summerar dem. Därifrån delar du den första summan av fel (förklarad varians) med den andra summan (total varians), subtraherar resultatet från ett, så har du R-kvadraten.

01:58

R-Squared

Vad säger R-Squared dig?

R-kvadratvärden sträcker sig från 0 till 1 och anges vanligen som procenttal från 0% till 100%. En R-kvadrat på 100% betyder att alla rörelser i en säkerhet (eller annan beroende variabel) förklaras fullständigt av rörelser i indexet (eller den oberoende variabeln (er) du är intresserad av).

Vid investeringar indikerar en hög R-kvadrat, mellan 85% och 100%, aktiens eller fondens resultat rör sig relativt i linje med indexet. En fond med låg R-kvadrat, 70% eller lägre, indikerar att säkerheten i allmänhet inte följer indexets rörelser. Ett högre R-kvadratvärde indikerar en mer användbar betatal. Till exempel, om en aktie eller fond har ett R-kvadratvärde på nära 100%, men har en beta under 1, erbjuder den sannolikt högre riskjusterade avkastningar.

Key Takeaways

  • R-Squared är ett statistiskt mått på passform som indikerar hur mycket variation av en beroende variabel förklaras av de oberoende variablerna i en regressionsmodell.
  • Vid investeringar tolkas R-kvadrat i allmänhet som andelen av en fond eller värdepappers rörelser som kan förklaras av rörelser i ett referensindex.
  • En R-kvadrat på 100% betyder att alla rörelser i en säkerhet (eller annan beroende variabel) förklaras fullständigt av rörelser i indexet (eller den oberoende variabeln (er) du är intresserad av).

Skillnaden mellan R-kvadrat och justerad R-kvadrat

R-Squared fungerar endast som avsett i en enkel linjär regressionsmodell med en förklarande variabel. Med en multipel regression som består av flera oberoende variabler måste R-Squared justeras. Den justerade R-kvadraten jämför den beskrivande kraften hos regressionsmodeller som inkluderar olika antal prediktorer. Varje prediktor som läggs till i en modell ökar R-kvadrat och minskar aldrig den. Således kan en modell med fler termer tyckas passa bättre bara för det faktum att den har fler termer, medan den justerade R-kvadraten kompenserar för tillsatsen av variabler och bara ökar om den nya termen förbättrar modellen ovanför vad som skulle vara erhålls med sannolikhet och minskar när en prediktor förbättrar modellen mindre än vad som förutses av en slump. I ett övermonterat tillstånd erhålls ett felaktigt högt värde på R-kvadrat, vilket leder till en minskad förmåga att förutsäga. Detta är inte fallet med den justerade R-kvadraten.

Medan standard R-kvadrat kan användas för att jämföra godheten hos två eller modellera olika modeller, är justerad R-kvadrat inte en bra metrisk för att jämföra icke-linjära modeller eller flera linjära regressioner.

Skillnaden mellan R-kvadrat och beta

Beta och R-kvadrat är två relaterade, men olika, mått på korrelation men beta är ett mått på relativ risk. En fonder med hög R-kvadrat korrelerar mycket med ett riktmärke. Om betaen också är hög, kan den ge högre avkastning än riktmärket, särskilt på tjurmarknaderna. R-kvadrat mäter hur nära varje förändring i priset på en tillgång korreleras med ett riktmärke. Beta mäter hur stora dessa prisförändringar är i förhållande till ett riktmärke. Tillsammans ger R-kvadrat och beta investerare en grundlig bild av kapitalförvaltarnas prestanda. En beta på exakt 1, 0 betyder att tillgångens risk (volatilitet) är identisk med dess riktmärke. I huvudsak är R-kvadrat en statistisk analysteknik för praktisk användning och pålitlighet av betas av värdepapper.

Begränsningar av R-kvadrat

R-kvadrat ger dig en uppskattning av förhållandet mellan rörelser för en beroende variabel baserat på en oberoende variabelns rörelser. Det berättar inte om din valda modell är bra eller dålig, och den kommer inte heller att säga dig om data och förutsägelser är partiska. En hög eller låg R-kvadrat är inte nödvändigtvis bra eller dålig, eftersom den inte förmedlar modellens tillförlitlighet, inte heller om du har valt rätt regression. Du kan få en låg R-kvadrat för en bra modell, eller en hög R-kvadrat för en dåligt monterad modell, och vice versa.

Jämför investeringskonton Leverantörs namn Beskrivning Annonsörens upplysning × Erbjudandena som visas i denna tabell kommer från partnerskap från vilka Investopedia erhåller ersättning.

Relaterade villkor

Hur bestämningskoefficienten fungerar Bestämningskoefficienten är ett mått som används i statistisk analys för att bedöma hur väl en modell förklarar och förutsäger framtida resultat. mer Vad regression mäter Regression är en statistisk mätning som försöker bestämma styrkan i förhållandet mellan en beroende variabel (vanligtvis betecknad med Y) och en serie andra förändrade variabler (känd som oberoende variabler). mer Hur multipel linjär regression fungerar Multipel linjär regression (MLR) är en statistisk teknik som använder flera förklarande variabler för att förutsäga resultatet av en svarsvariabel. mer Index Hugger En index hugger är en förvaltad fond som tenderar att fungera mycket som ett jämförelseindex. mer riktmärke för korrelationsvärden Ett riktmärke för korrelationsvärden är en referenspunkt som en investeringsfond använder för att mäta viktiga korrelationsvärden som beta eller R-kvadrat. mer Vad är en feltermin? En feltermin definieras som en variabel i en statistisk modell som skapas när modellen inte helt representerar det faktiska förhållandet mellan de oberoende och beroende variablerna. mer Partnerlänkar
Rekommenderas
Lämna Din Kommentar