Huvud » algoritmisk handel » Hypotestest i finans: koncept och exempel

Hypotestest i finans: koncept och exempel

algoritmisk handel : Hypotestest i finans: koncept och exempel

Din investeringsrådgivare föreslår en månatlig inkomstinvesteringsplan som lovar en rörlig avkastning varje månad. Du kommer bara att investera i det om du är säker på en genomsnittlig inkomst på $ 180 per månad. Din rådgivare berättar också att systemet under de senaste 300 månaderna hade investeringsavkastning med ett genomsnittligt värde på $ 190 och en standardavvikelse på $ 75. Ska du investera i detta system? Hypotesundersökning hjälper till att fatta sådana beslut.

Den här artikeln antar läsarnas kännedom om begrepp i en normal distributionstabell, formel, p-värde och relaterade grunder i statistik.

Vad är hypotesundersökning?

Hypotes eller signifikantestning är en matematisk modell för att testa ett påstående, en idé eller en hypotes om en parameter av intresse i en given populationsuppsättning, med hjälp av data som mäts i en provuppsättning. Beräkningar utförs på utvalda prover för att samla mer avgörande information om hela populationens egenskaper, vilket möjliggör ett systematiskt sätt att testa påståenden eller idéer om hela datasatsen.

Här är ett enkelt exempel: En skolchef rapporterar att elever i hennes skola får i genomsnitt 7 av 10 i tentor. För att testa denna "hypotes" registrerar vi poäng för säga 30 elever (prov) från hela elevpopulationen på skolan (säg 300) och beräknar medelvärdet för det provet. Vi kan sedan jämföra det (beräknade) provmedlet med det (rapporterade) populationsmedlet och försöka bekräfta hypotesen.

För att ta ett annat exempel är den årliga avkastningen för en viss fonder 8%. Anta att fonder har funnits i 20 år. Vi tar ett slumpmässigt urval av fondens årliga avkastning för, till exempel, fem år (urval) och beräknar dess medelvärde. Vi jämför sedan det (beräknade) provmedlet med (påstått) populationsmedlet för att verifiera hypotesen.

Beslutskriterierna måste baseras på vissa parametrar för datasätt.

Olika metoder finns för hypotesundersökning, men samma fyra grundläggande steg är involverade:

Steg 1: Definiera hypotesen

Vanligtvis anges det rapporterade värdet (eller skadestatistiken) som hypotesen och antas vara sant. För ovanstående exempel kommer hypotesen att vara:

  • Exempel A: Studenter i skolan får i genomsnitt 7 av 10 i tentor.
  • Exempel B: Den årliga avkastningen för fonden är 8% per år.

Denna angivna beskrivning utgör ” Nullhypotesen (H 0 ) ” och antas vara sant - det sätt som en tilltalad i en juryprövning antas oskyldig tills den bevisas skyldig i bevisen i domstol. På liknande sätt börjar hypotesundersökning med att ange och antaga en "nollhypotes", och sedan avgör processen om antagandet troligtvis är sant eller falskt.

Den viktiga punkten att notera är att vi testar nollhypotesen eftersom det finns ett element av tvivel om dess giltighet. Oavsett information som är mot den angivna nollhypotesen fångas i den alternativa hypotesen (H 1 ). För ovanstående exempel kommer den alternativa hypotesen att vara:

  • Studenter får ett medelvärde som inte är lika med 7.
  • Den årliga avkastningen för fonderna är inte lika med 8% per år.

Med andra ord är den alternativa hypotesen en direkt motsägelse av nollhypotesen.

Liksom i en rättegång antar juryn svarandens oskuld (nollhypotes). Åklagaren måste bevisa något annat (alternativ hypotese). På samma sätt måste forskaren bevisa att nollhypotesen är antingen sann eller falsk. Om åklagaren inte bevisar den alternativa hypotesen, måste juryn låta svaranden gå (basera beslutet på nollhypotesen). På samma sätt, om forskaren inte lyckas bevisa en alternativ hypotes (eller helt enkelt inte gör någonting), antas nollhypotesen vara sann.

Steg 2: Ställ in kriterierna

Beslutskriterierna måste baseras på vissa parametrar för datasätt och det är här anslutningen till normal distribution kommer in i bilden.

Enligt standardstatistik-postulatet om provtagningsfördelning, "För varje provstorlek n är provtagningsfördelningen för X̅ normal om populationen X från vilken provet tas ut normalt distribueras." Därför betyder sannolikheten för alla andra möjliga urval att man kan välja är normalt distribuerade.

Bestäm exempelvis om den genomsnittliga dagliga avkastningen, för alla aktier noterade på XYZ-aktiemarknaden, runt nyårsdagen är större än 2%.

H 0 : Null hypotes: medelvärde = 2%

H 1 : Alternativ hypotes: medelvärde> 2% (det är vad vi vill bevisa)

Ta provet (säga 50 lager av totalt 500) och beräkna provets medelvärde.

För en normalfördelning ligger 95% av värdena inom två standardavvikelser för befolkningsmedlet. Därför tillåter detta normala fördelning och antagande av centrala gränser för exempeldatabasen oss att fastställa 5% som en signifikansnivå. Det är meningsfullt att det under detta antagande är mindre än 5% sannolikhet (100-95) för att få outliers som ligger längre än två standardavvikelser från befolkningsmedlet. Beroende på datauppsättningens karaktär kan andra signifikansnivåer tas med 1%, 5% eller 10%. För finansiella beräkningar (inklusive beteendefinansiering) är 5% den allmänt accepterade gränsen. Om vi ​​hittar några beräkningar som går utöver de vanliga två standardavvikelserna, så har vi ett starkt fall av outliers för att avvisa nollhypotesen.

Grafiskt representeras det enligt följande:

I exemplet ovan, om genomsnittet för provet är mycket större än 2% (säg 3, 5%), avvisar vi nollhypotesen. Den alternativa hypotesen (medelvärde> 2%) accepteras, vilket bekräftar att den genomsnittliga dagliga avkastningen för aktierna verkligen är över 2%.

Men om genomsnittet för provet inte sannolikt kommer att vara betydligt större än 2% (och förblir vid, säg, cirka 2, 2%), kan vi INTE avvisa nollhypotesen. Utmaningen handlar om hur man ska fatta beslut om sådana fall inom nära håll. För att göra en slutsats från utvalda prover och resultat ska en nivå av betydelse fastställas, vilket möjliggör en slutsats om nollhypotesen. Den alternativa hypotesen möjliggör att fastställa nivån på betydelse eller "kritiskt värde" -konceptet för att avgöra sådana fall inom nära räckvidd.

Enligt standardbokdefinitionen i läroboken, ”Ett kritiskt värde är ett avgränsningsvärde som definierar gränserna utöver vilka mindre än 5% av provmedlen kan erhållas om nollhypotesen är sann. Exempel på medel som erhållits utöver ett kritiskt värde kommer att resultera i ett beslut att avvisa nollhypotesen. "I ovanstående exempel, om vi har definierat det kritiska värdet som 2, 1%, och det beräknade medelvärdet uppgår till 2, 2%, avvisar vi nollhypotesen Ett kritiskt värde fastställer en tydlig avgränsning av acceptans eller avslag.

Steg 3: Beräkna statistiken

Detta steg involverar beräkning av de erforderliga siffrorna, kända som teststatistik (som medelvärde, z-poäng, p-värde etc.) för det valda provet. (Vi kommer till dessa i ett senare avsnitt.)

Steg 4: Nå en slutsats

Med de beräknade värdena ska du bestämma om nollhypotesen. Om sannolikheten för att få ett provmedelvärde är mindre än 5%, är slutsatsen att avvisa nollhypotesen. Annars acceptera och behålla nollhypotesen.

Typer av fel

Det kan finnas fyra möjliga resultat i provbaserat beslutsfattande, med avseende på rätt tillämpbarhet för hela befolkningen:

Beslut om att behålla


Beslut att avvisa


Gäller hela befolkningen


Korrekt


Felaktig

(TYPE 1-fel - a)


Gäller inte hela befolkningen


Felaktig

(Fel 2 TYP - b)


Korrekt


De "korrekta" fallen är de där de beslut som fattats om proverna verkligen är tillämpliga för hela befolkningen. Felen uppstår när man beslutar att behålla (eller avvisa) nollhypotesen baserad på provberäkningarna, men det beslutet gäller inte riktigt för hela befolkningen. Dessa fall utgör typ 1 (alfa) och typ 2 (beta) -fel, såsom anges i tabellen ovan.

Att välja rätt kritiskt värde gör det möjligt att eliminera typ-1 alfafel eller begränsa dem till ett acceptabelt intervall.

Alfa betecknar felet på nivån av betydelse och bestäms av forskaren. För att upprätthålla standard 5% -sekvensen eller konfidensnivån för sannolikhetsberäkningar bibehålls detta på 5%.

Enligt tillämpliga riktmärken och definitioner för beslutsfattande:

  • ”Detta (alfa) -kriterium är vanligtvis inställt på 0, 05 (a = 0, 05), och vi jämför alfa-nivån med p-värdet. När sannolikheten för ett typ I-fel är mindre än 5% (p <0, 05), beslutar vi att avvisa nollhypotesen; annars behåller vi nollhypotesen. ”
  • Den tekniska termen som används för denna sannolikhet är p-värde . Det definieras som ”sannolikheten för att få ett provresultat, med tanke på att värdet som anges i nollhypotesen är sant. P-värdet för att få ett provresultat jämförs med signifikansnivån. "
  • Ett typ II-fel, eller betafel, definieras som "sannolikheten för att felaktig bibehålla nollhypotesen, när den faktiskt inte är tillämplig på hela befolkningen."

Några ytterligare exempel kommer att visa detta och andra beräkningar.

Exempel 1

Ett månatligt inkomstinvesteringssystem finns som lovar rörlig månadsavkastning. En investerare kommer bara att investera i den om han är säker på en genomsnittlig inkomst på $ 180 per månad. Han har ett urval av 300 månaders avkastning som har ett medelvärde på $ 190 och en standardavvikelse på $ 75. Ska han eller hon investera i detta system ">

Låt oss ställa in problemet. Investeraren kommer att investera i systemet om han eller hon är säker på sin önskade genomsnittliga avkastning på $ 180.

H 0 : Null hypotes: medelvärde = 180

H 1 : Alternativ hypotes: medelvärde> 180

Metod 1: Kritisk värderingsmetod

Identifiera ett kritiskt värde X L för provmedlet, som är tillräckligt stort för att avvisa nollhypotesen - dvs. avvisa nollhypotesen om provmedlet> = kritiskt värde X L

P (identifiera ett alfafel av typ I) = P (avvisa H 0 med tanke på att H 0 är sant),

Detta skulle uppnås när provmedlet överskrider de kritiska gränserna.

= P (med tanke på att H 0 är sant) = alfa

Grafiskt visas det enligt följande:

Ta alfa = 0, 05 (dvs. 5% signifikansnivå), Z 0, 05 = 1, 645 (från Z-tabellen eller normalfördelningstabellen)

=> X L = 180 + 1, 645 * (75 / sqrt (300)) = 187, 12

Eftersom provmedlet (190) är större än det kritiska värdet (187, 12), avvisas nollhypotesen, och slutsatsen är att den genomsnittliga månadsavkastningen verkligen är större än $ 180, så att investeraren kan överväga att investera i detta schema.

Metod 2: Använd standardiserad teststatistik

Man kan också använda standardiserat värde z.

Teststatistik, Z = (urvalsmedelvärde - populationsmedelvärde) / (std-dev / sqrt (antal prover).

Då blir avvisningsregionen följande:

Z = (190 - 180) / (75 / sqrt (300)) = 2, 309

Vårt avvisningsområde vid 5% signifikansnivå är Z> Z 0, 05 = 1, 645.

Eftersom Z = 2.309 är större än 1.645, kan nollhypotesen avvisas med en liknande slutsats som nämnts ovan.

Metod 3: Beräkning av P-värde

Vi strävar efter att identifiera P (provmedelvärde> = 190, när medelvärde = 180).

= P (Z> = (190-180) / (75 / sqrt (300))

= P (Z> = 2, 309) = 0, 0084 = 0, 84%

Följande tabell för att sluta beräkna p-värdet drar slutsatsen att det finns bekräftade bevis på att genomsnittlig månadsavkastning är högre än 180:

p-värde


Slutledning


mindre än 1%


Bekräftade bevis som stöder alternativ hypotese


mellan 1% och 5%


Starka bevis som stöder alternativ hypotes


mellan 5% och 10%


Svaga bevis som stöder alternativ hypotes


mer än 10%


Inga bevis som stöder alternativ hypotes


Exempel 2

En ny börsmäklare (XYZ) hävdar att hans mäklaravgift är lägre än din nuvarande aktiemäklares (ABC). Uppgifter tillgängliga från ett oberoende forskningsföretag indikerar att medelvärdet och std-dev för alla ABC-mäklarkunder är $ 18 respektive $ 6.

Ett urval av 100 kunder av ABC tas och mäklaravgifterna beräknas med de nya kurserna för XYZ-mäklare. Om medelvärdet för urvalet är $ 18, 75 och std-dev är detsamma ($ 6), kan någon slutsats göras om skillnaden i den genomsnittliga mäklaren mellan ABC och XYZ mäklare ">

H 0 : Null hypotes: medelvärde = 18

H 1 : Alternativ hypotes: medelvärde 18 (Detta är vad vi vill bevisa.)

Avvisningsregion: Z <= - Z 2, 5 och Z> = Z 2, 5 (antagande av 5% signifikansnivå, dela 2, 5 vardera på vardera sidan).

Z = (provmedelvärde - medelvärde) / (std-dev / sqrt (antal prover))

= (18, 75-18) / (6 / (kvm (100)) = 1, 25

Detta beräknade Z-värde faller mellan de två gränserna definierade av:

- Z 2, 5 = -1, 96 och Z 2, 5 = 1, 96.

Detta drar slutsatsen att det inte finns tillräckligt med bevis för att dra slutsatsen att det finns någon skillnad mellan kurserna för din befintliga mäklare och den nya mäklaren.

Alternativt är p-värdet = P (Z1, 25)

= 2 * 0, 1056 = 0, 2112 = 21, 12%, vilket är större än 0, 05 eller 5%, vilket leder till samma slutsats.

Grafiskt representeras det av följande:

Kritikpoäng för den hypotetiska testmetoden:

  • En statistisk metod baserad på antaganden
  • Felsökning som specificerad i alfa- och betafel
  • Tolkning av p-värde kan vara tvetydig, vilket kan leda till förvirrande resultat

Poängen

Hypotesundersökning tillåter en matematisk modell att validera ett påstående eller idé med en viss konfidensnivå. Men liksom majoriteten av statistiska verktyg och modeller är det bundet av några begränsningar. Användningen av denna modell för att fatta ekonomiska beslut bör övervägas med ett kritiskt öga och ha alla beroenden i åtanke. Alternativa metoder som Bayesian Inferens är också värda att utforska för liknande analys.

Jämför investeringskonton Leverantörs namn Beskrivning Annonsörens upplysning × Erbjudandena som visas i denna tabell kommer från partnerskap från vilka Investopedia erhåller ersättning.
Rekommenderas
Lämna Din Kommentar