Huvud » algoritmisk handel » Summan av kvadrater

Summan av kvadrater

algoritmisk handel : Summan av kvadrater
Vad är summan av fyrkanter?

Summan av kvadrater är en statistisk teknik som används i regressionsanalys för att bestämma spridningen av datapunkter. I en regressionsanalys är målet att bestämma hur väl en dataserie kan anpassas till en funktion som kan hjälpa till att förklara hur dataserien genererades. Summan av rutor används som ett matematiskt sätt att hitta den funktion som bäst passar (varierar minst) från data.

Formeln för summan av fyrkanter är

För en uppsättning X med n-objekt: Summen av kvadrater = ∑i = 0n (Xi − X‾) 2 var: Xi = Den ith-posten i uppsättningen‾‾ = Medeltalet för alla objekt i uppsättningen (Xi − X‾) = Avvikelsen för varje objekt från medelvärdet \ börja {inriktat} & \ text {För en uppsättning} X \ text {av} n \ text {objekt:} \\ & \ text {Summen av rutorna} = \ sum_ {i = 0} ^ {n} \ vänster (X_i- \ överskridning {X} \ höger) ^ 2 \\ & \ textbf {var:} \\ & X_i = \ text {Den} i ^ {th} \ text {posten i set} \\ & \ overline {X} = \ text {Medelvärdet för alla objekt i uppsättningen} \\ & \ vänster (X_i- \ overline {X} \ höger) = \ text {Avvikelsen för varje objekt från medelvärde} \\ \ end {inriktad} För en uppsättning X med n-objekt: Summen av kvadrater = i = 0∑n (Xi −X) 2 var: Xi = Den i-posten i uppsättningen = Medeltalet för alla objekt i uppsättningen (Xi −X) = Avvikelsen för varje objekt från medelvärdet

Summan av rutorna kallas också variation.

Vad berättar summan av rutorna?

Summan av fyrkanter är ett mått på avvikelse från medelvärdet. I statistik är medelvärdet medelvärdet av en uppsättning siffror och är det mest använda måttet på central tendens. Det aritmetiska medelvärdet beräknas helt enkelt genom att summera värdena i datauppsättningen och dividera med antalet värden.

Låt oss säga att slutkurserna för Microsoft (MSFT) under de senaste fem dagarna var 74, 01, 74, 77, 73, 94, 73, 61 och 73, 40 i amerikanska dollar. Summan av de totala priserna är $ 369, 73 och medel- eller genomsnittspriset för läroboken skulle således vara $ 369, 73 / 5 = $ 73, 95.

Men att känna medelvärdet för en mätuppsättning räcker inte alltid. Ibland är det bra att veta hur mycket variation det finns i en uppsättning mätningar. Hur långt ifrån varandra de enskilda värdena är från medelvärdet kan ge viss insikt i hur passande observationerna eller värdena är för den regressionsmodell som skapas.

Om till exempel en analytiker ville veta om aktiekursen för MSFT rör sig i takt med priset på Apple (AAPL), kan han lista upp observationsuppsättningen för båda aktiernas process under en viss period, säga 1, 2, eller 10 år och skapa en linjär modell med var och en av observationerna eller mätningarna registrerade. Om förhållandet mellan båda variablerna (dvs priset på AAPL och priset på MSFT) inte är en rak linje, finns det variationer i datauppsättningen som måste granskas.

I statistik talar, om linjen i den linjära modellen som skapats inte passerar alla värderingsmätningar, är en del av variationen som observerats i aktiekurserna oförklarlig. Summan av rutor används för att beräkna huruvida ett linjärt samband finns mellan två variabler, och eventuella oförklarade variationer benämns restsumman av kvadrater.

Summan av kvadrater är summan av variationens kvadrat, där variation definieras som spridningen mellan varje enskilt värde och medelvärdet. För att bestämma summan av kvadraterna kvadreras avståndet mellan varje datapunkt och raden för bästa passning och summeras sedan. Linjen med bästa passform minimerar detta värde.

Hur man beräknar summan av fyrkanter

Nu kan du se varför mätningen kallas summan av kvadratavvikelser eller summan av kvadrater för kort. Med hjälp av vårt MSFT-exempel ovan kan summan av rutor beräknas som:

  • SS = (74, 01 - 73, 95) 2 + (74, 77 - 73, 95) 2 + (73, 94 - 73, 95) 2 + (73, 61 - 73, 95) 2 + (73, 40 - 73, 95) 2
  • SS = (0, 06) 2 + (0, 82) 2 + (-0, 01) 2 + (-0, 34) 2 + (-0, 55) 2
  • SS = 1, 0942

Att lägga till summan av avvikelserna ensam utan kvadrat kommer att resultera i ett tal lika med eller nära noll eftersom de negativa avvikelserna nästan perfekt kommer att kompensera de positiva avvikelserna. För att få ett mer realistiskt antal måste summan av avvikelser vara kvadratiska. Summan av rutor kommer alltid att vara ett positivt tal eftersom kvadratet för valfritt antal, vare sig det är positivt eller negativt, alltid är positivt.

Exempel på hur man använder summan av fyrkanter

Baserat på resultaten från MSFT-beräkningen indikerar en hög summa kvadrater att de flesta av värdena är längre bort från medelvärdet, och det finns därför stor variation i uppgifterna. En låg summa kvadrater avser låg variation i uppsättningen av observationer.

I exemplet ovan visar 1.0942 att variationen i aktiekursen för MSFT under de senaste fem dagarna är mycket låg och investerare som vill investera i aktier som kännetecknas av prisstabilitet och låg volatilitet kan välja MSFT.

Key Takeaways

  • Summan av rutorna mäter avvikelsen för datapunkter bort från medelvärdet.
  • Ett högre summa av kvadratresultat indikerar en stor grad av variation i datauppsättningen, medan ett lägre resultat indikerar att uppgifterna varierar avsevärt från medelvärdet.

Begränsningar för att använda summan av kvadrater

Att fatta ett investeringsbeslut om vilken aktie du ska köpa kräver många fler observationer än de som anges här. En analytiker kan behöva arbeta med många års data för att veta med högre säkerhet hur hög eller låg variationen i en tillgång är. När fler datapunkter läggs till i uppsättningen blir summan av kvadrater större när värdena sprids mer.

De mest använda variationerna i variationen är standardavvikelsen och variansen. Men för att beräkna någon av de två mätvärdena måste summan av kvadraterna först beräknas. Variansen är medelvärdet av summan av kvadrater (dvs. summan av rutorna dividerat med antalet observationer). Standardavvikelsen är kvadratroten av variationen.

Det finns två metoder för regressionsanalys som använder summan av kvadrater: den linjära minsta kvadratmetoden och den icke-linjära minsta kvadratmetoden. Minsta kvadratmetoden hänvisar till det faktum att regressionsfunktionen minimerar summan av kvadraterna för variansen från de faktiska datapunkterna. På detta sätt är det möjligt att rita en funktion som statistiskt ger den bästa passningen för data. Observera att en regressionsfunktion kan antingen vara linjär (en rak linje) eller icke-linjär (en böjd linje).

Jämför investeringskonton Leverantörs namn Beskrivning Annonsörens upplysning × Erbjudandena som visas i denna tabell kommer från partnerskap där Investopedia erhåller ersättning.

Relaterade villkor

Hur den minsta kvadratmetoden fungerar Den minsta kvadratmetoden är en statistisk teknik för att bestämma linjen med bästa passning för en modell, specificerad av en ekvation med vissa parametrar för observerade data. mer Hur Least Squares-kriteriemetoden fungerar Kriteriet med minst kvadrater är en metod för att mäta noggrannheten för en linje genom att skildra de data som användes för att generera den. Det vill säga, formeln bestämmer raden för bästa passform. mer Standardavvikelse Definition Standardavvikelsen är en statistik som mäter spridningen av ett datasats relativt dess medelvärde och beräknas som varvets kvadratrot. Det beräknas som kvadratroten av varians genom att bestämma variationen mellan varje datapunkt relativt genomsnittet. mer Använda Variationen Equation Variance är ett mått på spridningen mellan siffror i en datamängd. Investerare använder variansekvationen för att utvärdera en portföljs tillgångsallokering. mer Hur den återstående standardavvikelsen fungerar Den återstående standardavvikelsen är en statistisk term som används för att beskriva skillnaden i standardavvikelser för observerade värden kontra förutspådda värden som visas av punkter i en regressionsanalys. mer Hur bestämningskoefficienten fungerar Bestämningskoefficienten är ett mått som används i statistisk analys för att bedöma hur väl en modell förklarar och förutsäger framtida resultat. mer Partnerlänkar
Rekommenderas
Lämna Din Kommentar