Huvud » algoritmisk handel » kvartilen

kvartilen

algoritmisk handel : kvartilen
Vad är en kvartil?

En kvartil är en statistisk term som beskriver en indelning av observationer i fyra definierade intervaller baserat på värdena på data och hur de jämför med hela observationsuppsättningen.

Förstå kvartiler

För att förstå kvartilen är det viktigt att förstå medianen som ett mått på central tendens. Median i statistik är mittvärdet för en uppsättning siffror. Det är den punkt där exakt hälften av uppgifterna ligger under och över det centrala värdet.

Med tanke på en uppsättning med 13 nummer skulle medianen vara det sjunde numret. De sex siffrorna som föregår detta värde är de lägsta siffrorna i datan, och de sex siffrorna efter medianen är de högsta siffrorna i den angivna datauppsättningen. Eftersom medianen inte påverkas av extrema värden eller outliers i fördelningen är det ibland att föredra framför medelvärdet.

Medianen är en robust uppskattning av plats men säger ingenting om hur informationen på endera sidan av dess värde sprids eller sprids. Det är där kvartilen går in. Kvartilen mäter spridningen av värden över och under medelvärdet genom att dela upp fördelningen i fyra grupper.

Key Takeaways

  • Kvartilen mäter spridningen av värden över och under medelvärdet genom att dela upp fördelningen i fyra grupper.
  • En kvartil delar upp data i tre punkter - en nedre kvartil, median och övre kvartil - för att bilda fyra grupper av datauppsättningen.
  • Kvartiler används för att beräkna interkvartilområdet, vilket är ett mått på variationen runt medianen.

Hur kvartiler fungerar

Precis som medianen delar upp uppgifterna i hälften så att 50% av mätningen ligger under medianen och 50% ligger ovanför den, delar kvartilen upp data i kvartal så att 25% av mätningen är mindre än den nedre kvartilen, 50 % är mindre än medelvärdet och 75% är mindre än den övre kvartilen.

En kvartil delar upp data i tre punkter - en nedre kvartil, median och övre kvartil - för att bilda fyra grupper av datauppsättningen. Den nedre kvartilen eller den första kvartilen betecknas som Q1 och är det mellersta numret som faller mellan det minsta värdet på datamängden och median. Den andra kvartilen, Q2, är också median. Den övre eller tredje kvartilen, betecknad Q3, är den centrala punkten som ligger mellan medianen och det högsta antalet fördelningar.

Nu kan vi kartlägga de fyra grupperna som bildas från kvartilerna. Den första gruppen med värden innehåller det minsta antalet upp till Q1; den andra gruppen inkluderar Q1 till medianen; den tredje uppsättningen är median till Q3; den fjärde kategorin omfattar Q3 till den högsta datapunkten för hela uppsättningen.

Varje kvartil innehåller 25% av de totala observationerna. I allmänhet är uppgifterna ordnade från minsta till största:

  1. Första kvartilen: de lägsta 25% av siffrorna
  2. Andra kvartilen: mellan 25, 1% och 50% (upp till median)
  3. Tredje kvartilen: 51% till 75% (över median)
  4. Fjärde kvartilen: de högsta 25% av siffrorna

Kvartil Exempel

Låt oss arbeta med ett exempel. Anta att fördelningen av mattepoäng i en klass på 19 studenter i stigande ordning är:

59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98

Markera först medianen Q2, som i detta fall är det tionde värdet: 75.

Q1 är den centrala punkten mellan den minsta poängen och medianen. I detta fall faller Q1 mellan den första och femte poängen: 68. [Observera att medianen också kan inkluderas vid beräkning av Q1 eller Q3 för en udda uppsättning värden. Om vi ​​skulle inkludera medianen på vardera sidan av mittpunkten, kommer Q1 att vara mittvärdet mellan den första och den tionde poängen, vilket är medelvärdet för den femte och sjätte poängen - (femte + sjätte) / 2 = (68 + 69) / 2 = 68, 5].

Q3 är mittvärdet mellan Q2 och den högsta poängen: 84. [Eller om du inkluderar median, Q3 = (82 + 84) / 2 = 83].

Nu när vi har våra kvartiler, låt oss tolka deras antal. En poäng på 68 (Q1) representerar den första kvartilen och är den 25: e percentilen. 68 är medianen för den nedre halvan av poänguppsättningen i tillgängliga data, dvs medianen för poängen från 59 till 75.

Q1 berättar att 25% av poängen är mindre än 68 och 75% av klassens poäng är större. Q2 (medianen) är den 50: e percentilen och visar att 50% av poängen är mindre än 75, och 50% av poängen är över 75. Slutligen avslöjar Q3, den 75: e percentilen, att 25% av poängen är större och 75% är mindre än 84.

Särskilda överväganden

Om datapunkten för Q1 är längre bort från median än Q3 är från median, kan vi säga att det finns en större spridning mellan de mindre värdena i datauppsättningen än bland de större värdena. Samma logik gäller om Q3 är längre bort från Q2 än Q1 är från median.

Alternativt, om det finns ett jämnt antal datapunkter, kommer medianen att vara medelvärdet av de två mellersta siffrorna. I vårt exempel ovan, om vi hade 20 elever i stället för 19, kommer median av deras poäng att vara det aritmetiska genomsnittet för det tionde och elfte talet.

Kvartiler används för att beräkna interkvartilområdet, vilket är ett mått på variationen runt medianen. Interkvartilområdet beräknas helt enkelt som skillnaden mellan den första och tredje kvartilen: Q3 - Q1. I själva verket är det intervallet för den mellersta halvan av data som visar hur spridd informationen är.

För stora datauppsättningar har Microsoft Excel en QUARTILE-funktion för att beräkna kvartiler.

Jämför investeringskonton Leverantörs namn Beskrivning Annonsörens upplysning × Erbjudandena som visas i denna tabell kommer från partnerskap från vilka Investopedia erhåller ersättning.

Relaterade villkor

Så fungerar den decile kvantitativa metoden En decil är en kvantitativ metod för att dela upp en uppsättning rangordnade data i 10 lika stora underavsnitt. Denna typ av datarangering utförs som en del av många akademiska och statistiska studier inom ekonomi och ekonomi. mer Beskrivande statistik Beskrivande statistik är en uppsättning korta beskrivande koefficienter som sammanfattar en viss datauppsättning som är representativ för en hel- eller urvalspopulation. mer Quintiles Definition En kvintil är ett statistiskt värde för en datamängd som representerar 20% av en given population. mer Hur man använder det Winsoriserade medelvärdet Winsoriserade medelvärdet är en metod för medelvärde som initialt ersätter de minsta och största värdena med observationerna närmast dem. Detta görs för att begränsa effekten av onormala extrema värden, eller outliers, på beräkningen. mer Tre-Sigma-gränser: Vad du behöver veta Tre-Sigma-gränser är en statistisk beräkning som refererar till data inom tre standardavvikelser från ett medelvärde. mer Definition av standardavvikelse Standardavvikelsen är en statistik som mäter spridningen av ett datasats relativt dess medelvärde och beräknas som varvets kvadratrot. Det beräknas som kvadratroten av varians genom att bestämma variationen mellan varje datapunkt relativt genomsnittet. mer Partnerlänkar
Rekommenderas
Lämna Din Kommentar