Huvud » algoritmisk handel » Grundläggande regression för affärsanalys

Grundläggande regression för affärsanalys

algoritmisk handel : Grundläggande regression för affärsanalys

Om du någonsin undrat hur två eller flera uppgifter relaterar till varandra (t.ex. hur BNP påverkas av förändringar i arbetslöshet och inflation), eller om du någonsin har fått din chef att be dig att skapa en prognos eller analysera förutsägelser baserade på förhållanden mellan variabler, då skulle lärande av regressionsanalyser vara värt din tid.

I den här artikeln lär du dig grunderna i enkel linjär regression, ibland kallad "vanliga minsta kvadrater" eller OLS-regression - ett verktyg som vanligtvis används i prognoser och ekonomisk analys. Vi börjar med att lära oss de grundläggande principerna för regression, först lära oss om kovarians och korrelation och sedan gå vidare till att bygga och tolka en regressionsutgång. Populär affärsprogramvara som Microsoft Excel kan göra alla regressionsberäkningar och output för dig, men det är fortfarande viktigt att lära sig den underliggande mekaniken.

variabler

Kärnan i en regressionsmodell är förhållandet mellan två olika variabler, kallade beroende och oberoende variabler. Anta till exempel att du vill förutse försäljning för ditt företag och du har kommit fram till att ditt företags försäljning går upp och ner beroende på förändringar i BNP.

Försäljningen du förutspår är den beroende variabeln eftersom deras värde "beror" på värdet av BNP och BNP är den oberoende variabeln. Du måste då bestämma styrkan i förhållandet mellan dessa två variabler för att förutse försäljning. Om BNP ökar / minskar med 1%, hur mycket kommer din försäljning att öka eller minska?

Covariance

Cov (x, y) = ∑ (xn − xu) (yn − yu) N \ börja {inriktad} & Cov (x, y) = \ sum \ frac {(x_n - x_u) (y_n - y_u)} {N } \\ \ end {inriktad} Cov (x, y) = ∑N (xn −xu) (yn −yu)

Formeln för att beräkna förhållandet mellan två variabler kallas kovarians. Denna beräkning visar riktning för förhållandet. Om en variabel ökar och den andra variabeln tenderar att också öka, skulle samvariationen vara positiv. Om en variabel går upp och den andra tenderar att gå ner, skulle samvariationen vara negativ.

Det faktiska antalet du får genom att beräkna detta kan vara svårt att tolka eftersom det inte är standardiserat. En samvariation på fem kan till exempel tolkas som en positiv relation, men relationens styrka kan bara sägas vara starkare än om antalet var fyra eller svagare än om antalet var sex.

Korrelationskoefficient

Korrelation = ρxy = Covxysxsy \ börja {inriktad} & Korrelation = \ rho_ {xy} = \ frac {Cov_ {xy}} {s_x s_y} \\ \ end {inriktad} Korrelation = ρxy = sx sy Covxy

Vi måste standardisera samvariationen för att vi ska kunna tolka och använda den bättre i prognoser, och resultatet är korrelationsberäkningen. Korrelationsberäkningen tar helt enkelt samvariationen och delar den med produkten från standardavvikelsen för de två variablerna. Detta kommer att binda korrelationen mellan ett värde på -1 och +1.

En korrelation på +1 kan tolkas för att antyda att båda variablerna rör sig perfekt positivt med varandra och en -1 innebär att de är perfekt negativt korrelerade. I vårt tidigare exempel, om korrelationen är +1 och BNP ökar med 1%, skulle försäljningen öka med 1%. Om korrelationen är -1, skulle en ökning av BNP med 1% resultera i en minskning av försäljningen med 1% - precis motsatsen.

Regressions ekvation

Nu när vi vet hur det relativa förhållandet mellan de två variablerna beräknas kan vi utveckla en regressionsekvation för att förutsäga eller förutsäga den variabel vi önskar. Nedan är formeln för en enkel linjär regression. "Y" är det värde vi försöker förutspå, "b" är lutningen för regressionslinjen, "x" är värdet på vårt oberoende värde, och "a" representerar y-fånget. Regressionsekvationen beskriver helt enkelt förhållandet mellan den beroende variabeln (y) och den oberoende variabeln (x).

y = bx + a \ börja {inriktad} & y = bx + a \\ \ slut {inriktad} y = bx + a

Avlyssningen, eller "a", är värdet på y (beroende variabel) om värdet på x (oberoende variabel) är noll, och så kallas ibland helt enkelt 'konstanten'. Så om det inte skedde någon förändring i BNP, skulle ditt företag fortfarande göra en viss försäljning - detta värde, när förändringen i BNP är noll, är avlyssningen. Titta på grafen nedan för att se en grafisk skildring av en regressionsekvation. I denna graf finns det bara fem datapunkter som representeras av de fem punkterna på grafen. Linjär regression försöker uppskatta en linje som bäst passar uppgifterna (en linje med bästa passning) och ekvationen för den raden resulterar i regressionsekvationen.

Bild 1: Rad med bästa passform

Källa: Investopedia

Regressioner i Excel

Nu när du förstår en del av bakgrunden som går in i en regressionsanalys, låt oss göra ett enkelt exempel med Excel: s regressionsverktyg. Vi bygger på det föregående exemplet på att försöka förutse nästa års försäljning baserat på förändringar i BNP. I nästa tabell listas några konstgjorda datapunkter, men dessa nummer kan vara lättillgängliga i verkligheten.

ÅrförsäljningBNP
20141001, 00%
20152501, 90%
20162752, 40%
20172002, 60%
20183002, 90%

Bara ögonboll på bordet kan du se att det kommer att bli en positiv korrelation mellan försäljning och BNP. Båda tenderar att gå upp tillsammans. Med Excel behöver du bara klicka på rullgardinsmenyn Verktyg, välja Dataanalys och därifrån välja Regression . Pop-uprutan är lätt att fylla i därifrån; ditt Input Y-område är din "Försäljning" -kolumn och ditt Input X-område är förändringen i BNP-kolumnen; Välj utgångsområdet för var du vill att data ska visas i kalkylbladet och tryck på OK. Du bör se något liknande det som anges i tabellen nedan:

Regressionsstatistikskoefficienter

Multipel R0.8292243Snappa upp34, 58409

R Square


0.687613BNP88, 15552
justerat
R Square


0.583484

-


-


Standard fel51.021807-

-


observationer5

-


-


tolkning

De viktigaste utgångarna du behöver vara bekymrade för för enkel linjär regression är R-kvadrat, skärning (konstant) och BNP: s beta (b) -koefficient. R-kvadratnumret i detta exempel är 68, 7% - detta visar hur väl vår modell förutsäger eller förutspår den framtida försäljningen, vilket antyder att de förklarande variablerna i modellen förutspådde 68, 7% av variationen i den beroende variabeln. Därefter har vi en avlyssning på 34, 58, som säger att om förändringen i BNP förutsägs vara noll skulle vår försäljning vara cirka 35 enheter. Och slutligen berättar BNP-beta eller korrelationskoefficient på 88, 15 att om BNP ökar med 1%, kommer försäljningen sannolikt att öka med cirka 88 enheter.

Poängen

Så hur skulle du använda den här enkla modellen i ditt företag ">

Naturligtvis är detta bara en enkel regression och det finns modeller som du kan bygga som använder flera oberoende variabler som kallas flera linjära regressioner. Men flera linjära regressioner är mer komplicerade och har flera problem som skulle behöva en annan artikel för att diskutera.

Jämför investeringskonton Leverantörs namn Beskrivning Annonsörens upplysning × Erbjudandena som visas i denna tabell kommer från partnerskap från vilka Investopedia erhåller ersättning.
Rekommenderas
Lämna Din Kommentar