Huvud » algoritmisk handel » Multipel linjär regression - MLR-definition

Multipel linjär regression - MLR-definition

algoritmisk handel : Multipel linjär regression - MLR-definition
Vad är multipel linjär regression - MLR?

Multipel linear regression (MLR), även känd helt enkelt som multipel regression, är en statistisk teknik som använder flera förklarande variabler för att förutsäga resultatet av en svarsvariabel. Målet med multipel linjär regression (MLR) är att modellera det linjära förhållandet mellan de förklarande (oberoende) variablerna och respons (beroende) variabel.

I huvudsak är multipel regression förlängningen av vanlig minst-kvadraters regression som involverar mer än en förklarande variabel.

Formeln för multipel linjär regression är

yi = β0 + β1xi1 + β2xi2 + ... + βpxip + ϵ var, för i = n observationer: yi = beroende variabelxi = expansionsvariabler beta0 = y-skärning (konstant term) pp = lutningskoefficienter för varje förklarande variabelϵ = modellens feltermin (även känd som rester) \ begin {inriktad} & y_i = \ beta_0 + \ beta _1 x_ {i1} + \ beta _2 x_ {i2} + ... + \ beta _p x_ {ip} + \ epsilon \\ & \ textbf {var, för} i = n \ textbf {observationer:} \\ & y_i = \ text {beroende variabel} \\ & x_i = \ text {expanderande variabler} \\ & \ beta_0 = \ text {y-avlyssning (konstant term)} \\ & \ beta_p = \ text {lutningskoefficienter för varje förklarande variabel} \\ & \ epsilon = \ text {modellens feltermin (även känd som rester)} \\ \ end {inriktad} yi = β0 + β1 xi1 + β2 xi2 + ... + βp xip + ϵ var, för i = n observationer: yi = beroende variabelxi = expanderande variabler p0 = y-skärning (konstant term) pp = Lutningskoefficienter för varje förklarande variabelϵ = modellens feltermin (även känd som rester)

Förklara multipel linjär regression

En enkel linjär regression är en funktion som gör att en analytiker eller statistiker kan göra förutsägelser om en variabel baserat på informationen som är känd om en annan variabel. Linjär regression kan endast användas när man har två kontinuerliga variabler - en oberoende variabel och en beroende variabel. Den oberoende variabeln är den parameter som används för att beräkna den beroende variabeln eller utfallet. En multipel regressionsmodell sträcker sig till flera förklarande variabler.

Den multipla regressionsmodellen är baserad på följande antaganden:

  • Det finns ett linjärt samband mellan de beroende variablerna och de oberoende variablerna.
  • De oberoende variablerna är inte för högt korrelerade med varandra.
  • y i- observationer väljs oberoende och slumpmässigt från befolkningen.
  • Residualer bör normalt fördelas med ett medelvärde på 0 och varians σ.

Bestämningskoefficienten (R-kvadrat) är en statistisk metrisk som används för att mäta hur mycket av variationen i utfallet kan förklaras med variationen i de oberoende variablerna. R 2 ökar alltid när fler prediktorer läggs till i MLR-modellen även om prediktorerna kanske inte är relaterade till utfallsvariabeln.

R 2 kan i sig inte användas för att identifiera vilka prediktorer som ska inkluderas i en modell och vilka som bör uteslutas. R2 kan endast vara mellan 0 och 1, där 0 indikerar att utfallet inte kan förutsägas av någon av de oberoende variablerna och 1 indikerar att utfallet kan förutsägas utan fel från de oberoende variablerna.

Vid tolkning av resultaten från en multipel regression är betakoefficienter giltiga medan alla andra variabler hålls konstant ("allt annat lika"). Utsignalen från en multipel regression kan visas horisontellt som en ekvation eller vertikalt i tabellform.

Exempel med användning av multipel linjär regression

Till exempel kanske en analytiker vill veta hur marknadens rörelse påverkar priset på Exxon Mobil (XOM). I detta fall kommer hans linjära ekvation att ha värdet på S&P 500-indexet som den oberoende variabeln eller prediktorn och priset på XOM som den beroende variabeln.

I verkligheten finns det flera faktorer som förutsäger resultatet av en händelse. Exxon Mobils prisrörelse beror till exempel på mer än bara prestandan på den totala marknaden. Andra prediktorer som oljepriset, räntorna och prisrörelsen på oljeterminer kan påverka priset på XOM och andelar i andra oljebolag. För att förstå en relation där mer än två variabler finns, används en multipel linjär regression.

Multipel linjär regression (MLR) används för att bestämma en matematisk relation mellan ett antal slumpmässiga variabler. I andra termer undersöker MLR hur flera oberoende variabler är relaterade till en beroende variabel. När var och en av de oberoende faktorerna har bestämts för att förutsäga den beroende variabeln, kan informationen om de multipla variablerna användas för att skapa en exakt förutsägelse om vilken effekt de har på utfallsvariabeln. Modellen skapar en relation i form av en rak linje (linjär) som bäst motsvarar alla enskilda datapunkter.

Med hänvisning till MLR-ekvationen ovan, i vårt exempel:

  • y i = beroende variabel: priset för XOM
  • x i1 = ränta
  • x i2 = oljepris
  • x i3 = värdet på S&P 500-index
  • x i4 = oljefuturespriset
  • B 0 = y-skärning vid tiden noll
  • B 1 = regressionskoefficient som mäter en enhetsförändring i den beroende variabeln när x i1 förändras - förändringen i XOM-pris när räntorna förändras
  • B 2 = koefficientvärde som mäter en enhetsförändring i den beroende variabeln när x i2 förändras - förändringen i XOM-priset när oljepriset förändras

De minsta kvadraters uppskattningar, B 0, B 1, B 2 ... B p, beräknas vanligtvis med statistisk mjukvara. Så många variabler kan inkluderas i regressionsmodellen där varje oberoende variabel är differentierad med ett tal — 1, 2, 3, 4 ... p. Den multipla regressionsmodellen tillåter en analytiker att förutsäga ett resultat baserat på information som tillhandahålls om flera förklarande variabler.

Fortfarande är modellen inte alltid helt exakt eftersom varje datapunkt kan skilja sig något från det resultat som modellen förutspådde. Restvärdet, E, som är skillnaden mellan det faktiska utfallet och det förutsagda utfallet, ingår i modellen för att redogöra för sådana små variationer.

Förutsatt att vi kör vår XOM-prisregressionsmodell genom en statistikberäkningsprogramvara som returnerar denna utgång:

En analytiker skulle tolka denna produktion så att om andra variabler hålls konstant, kommer priset på XOM att öka med 7, 8% om oljepriset på marknaderna ökar med 1%. Modellen visar också att priset på XOM kommer att sjunka med 1, 5% efter en räntehöjning på 1%. R 2 indikerar att 86, 5% av variationerna i aktiekursen på Exxon Mobil kan förklaras av förändringar i räntesats, oljepris, oljefutures och S&P 500-index.

Key Takeaways

  • Multipel linear regression (MLR), även känd helt enkelt som multipel regression, är en statistisk teknik som använder flera förklarande variabler för att förutsäga resultatet av en svarsvariabel.
  • Multipel regression är en förlängning av linjär regression (OLS) som bara använder en förklarande variabel.
  • MLR används i stor utsträckning inom ekonometrik och ekonomisk inferens.

Skillnaden mellan linjär och multipel regression

Linjär (OLS) regression jämför svaret från en beroende variabel med tanke på en förändring i någon förklarande variabel. Det är dock sällsynt att en beroende variabel förklaras av endast en variabel. I detta fall använder en analytiker multipel regression, som försöker förklara en beroende variabel med mer än en oberoende variabel. Flera regressioner kan vara linjära och olinjära.

Flera regressioner baseras på antagandet att det finns ett linjärt samband mellan både beroende och oberoende variabler. Den antar inte heller någon större korrelation mellan de oberoende variablerna.

Jämför investeringskonton Leverantörs namn Beskrivning Annonsörens upplysning × Erbjudandena som visas i denna tabell kommer från partnerskap från vilka Investopedia erhåller ersättning.

Relaterade villkor

Vad regression mäter Regression är en statistisk mätning som försöker bestämma styrkan i förhållandet mellan en beroende variabel (vanligtvis betecknad med Y) och en serie andra förändrade variabler (känd som oberoende variabler). mer Vad är en feltermin "> En feltermin definieras som en variabel i en statistisk modell, som skapas när modellen inte helt representerar det faktiska förhållandet mellan de oberoende och beroende variablerna. mer Hur Least Squares-metoden fungerar minst kvadratmetoden är en statistisk teknik för att bestämma linjen med bästa passform för en modell, specificerad av en ekvation med vissa parametrar för observerade data. mer Econometrics: What it Means, and How It's Used Econometrics är tillämpningen av statistiska och matematiska modeller på ekonomiska data för syftet att testa teorier, hypoteser och framtida trender. mer R-kvadrat R-kvadrat är ett statistiskt mått som representerar andelen av variansen för en beroende variabel som förklaras av en oberoende variabel. mer Hur bestämningskoefficient fungerar Bestämningskoefficienten är ett mått som används i statistisk analys för att bedöma hur väl en modell förklarar och förutsäger framtida resultat. Mer Pa rtner Länkar
Rekommenderas
Lämna Din Kommentar