Huvud » algoritmisk handel » Tre-Sigma-gränser

Tre-Sigma-gränser

algoritmisk handel : Tre-Sigma-gränser
Vad är en tre-Sigma gräns?

Tre-sigma-gränser är en statistisk beräkning som avser data inom tre standardavvikelser från ett medelvärde. I affärsapplikationer avser tresigma processer som fungerar effektivt och producerar föremål av högsta kvalitet.

Tre-sigma-gränser används för att ställa in de övre och nedre kontrollgränserna i statistiska kvalitetskontrolldiagram. Kontrolldiagram används för att fastställa gränser för en tillverknings- eller affärsprocess som är i statistisk kontroll.

Förstå tre-Sigma-gränser

Kontrolldiagram är också kända som Shewhart-diagram, uppkallad efter Walter A. Shewhart, en amerikansk fysiker, ingenjör och statistiker (1891–1967). Kontrolldiagram är baserade på teorin att även i perfekt utformade processer är en viss mängd variation i utgångsmätningar inneboende. Kontrolldiagram avgör om det finns en kontrollerad eller okontrollerad variation i en process. Variationer i processkvalitet på grund av slumpmässiga orsaker sägs vara kontrollerande; processer utan kontroll inkluderar både slumpmässiga och speciella orsaker till variation. Kontrolldiagram är avsedda att bestämma förekomsten av speciella orsaker.

För att mäta variationer använder statistiker och analytiker en metrisk känd som standardavvikelsen, även kallad sigma. Sigma är en statistisk mätning av variation, som visar hur mycket variation som finns från ett statistiskt genomsnitt.

[Viktigt: Sigma mäter hur långt en observerad data avviker från medelvärdet eller genomsnittet; investerare använder standardavvikelse för att mäta förväntad volatilitet, som kallas historisk volatilitet.]

För att förstå denna mätning, överväg den normala klockkurvan, som har en normal fördelning. Ju längre till höger eller vänster en data registreras på klockkurvan, desto högre respektive lägre är data än medelvärdet. Ur en annan synvinkel indikerar låga värden att datapunkterna faller nära medelvärdet; höga värden indikerar att uppgifterna är utbredda och inte nära genomsnittet.

Ett exempel på beräkning av tre-Sigma-gränser

Låt oss överväga ett tillverkningsföretag som kör en serie på 10 tester för att avgöra om det finns en variation i kvaliteten på dess produkter. Datapunkterna för de 10 testerna är 8.4, 8.5, 9.1, 9.3, 9.4, 9.5, 9.7, 9.7, 9.9 och 9.9.

  1. Beräkna först genomsnittet av observerade data. (8, 4 + 8, 5 + 9, 1 + 9, 3 + 9, 4 + 9, 5 + 9, 7 + 9, 7 + 9, 9 + 9, 9) / 10 vilket är lika med 93, 4 / 10 = 9, 34.
  2. För det andra beräkna uppsättningens varians. Variansen är spridningen mellan datapunkter och beräknas som summan av kvadraterna för skillnaden mellan varje datapunkt och medelvärdet dividerat med antalet observationer. Den första skillnaden kvadrat kommer att beräknas som (8.4 - 9.34) 2 = 0.8836, den andra skillnaden kvadrat kommer att vara (8.5 - 9.34) 2 = 0.7056, tredje kan beräknas som (9.1 - 9.34) 2 = 0.0576, och så vidare . Summan av de olika rutorna för alla 10 datapunkter är 2, 564. Variansen är därför 2, 564 / 10 = 0, 2564.
  3. För det tredje, beräkna standardavvikelsen, som helt enkelt är varianterns kvadratrot. Så standardavvikelse = √0.2564 = 0.5064.
  4. För det fjärde, beräkna tre sigma, vilket är tre standardavvikelser över medelvärdet. I numeriskt format är detta (3 x 0, 5064) + 9, 34 = 10, 9. Eftersom ingen av uppgifterna ligger på en så hög punkt har tillverkningstestprocessen ännu inte nått kvalitetsnivåer på tre sigma.

Särskilda överväganden

Termen "tre-sigma" pekar på tre standardavvikelser. Shewhart fastställde tre standardavvikelser (3-sigma) -gränser som "en rationell och ekonomisk guide till minimal ekonomisk förlust." Tre sigma-gränser sätter ett område för processparametern till 0, 27% kontrollgränser. Tresigma-kontrollgränser används för att kontrollera data från en process och om de ligger inom statistisk kontroll. Detta görs genom att kontrollera om datapunkter ligger inom tre standardavvikelser från medelvärdet. Den övre kontrollgränsen (UCL) är inställd på tre sigma-nivåer över medelvärdet och den nedre kontrollgränsen (LCL) är inställd på tre sigma-nivåer under medelvärdet.

Eftersom cirka 99, 99% av en kontrollerad process kommer att äga rum inom plus eller minus tre sigmas, borde data från en process ungefärliga en allmän fördelning kring medelvärdet och inom de fördefinierade gränserna. På en klockkurva representerar data som ligger över genomsnittet och bortom tresigma-linjen mindre än en procent av alla datapunkter.

Key Takeaways

  • Tre-sigma-gränser (3-sigma-gränser) är en statistisk beräkning som avser data inom tre standardavvikelser från ett medelvärde.
  • Tre-sigma-gränser används för att ställa in de övre och nedre kontrollgränserna i statistiska kvalitetskontrolldiagram.
  • På en klockkurva representerar data som ligger över genomsnittet och bortom tresigma-linjen mindre än en procent av alla datapunkter.
Jämför investeringskonton Leverantörs namn Beskrivning Annonsörens upplysning × Erbjudandena som visas i denna tabell kommer från partnerskap från vilka Investopedia erhåller ersättning.

Relaterade villkor

Att använda Variationen Equation Variance är ett mått på spridningen mellan siffror i en datamängd. Investerare använder variansekvationen för att utvärdera en portföljs tillgångsallokering. mer Definition av T-test Ett t-test är en typ av inferensiell statistik som används för att bestämma om det finns en betydande skillnad mellan medel från två grupper, som kan vara relaterade till vissa funktioner. mer Vad en Z-poäng säger oss En Z-poäng definieras som en statistisk mätning av en poängs förhållande till medelvärdet i en grupp poäng. mer Six Sigma minskar fel och sparar kapital Ett kvalitetskontrollprogram som utvecklades 1986 för att förbättra effektiviteten. Sedan dess har det utvecklats till en mer allmän filosofi för företagsledning. mer Definition av standardavvikelse Standardavvikelsen är en statistik som mäter spridningen av ett datasats relativt dess medelvärde och beräknas som varvets kvadratrot. Det beräknas som kvadratroten av varians genom att bestämma variationen mellan varje datapunkt relativt genomsnittet. mer Monte Carlo-simulering Monte Carlo-simuleringar används för att modellera sannolikheten för olika resultat i en process som inte lätt kan förutsägas på grund av ingripandet av slumpmässiga variabler. mer Partnerlänkar
Rekommenderas
Lämna Din Kommentar