Куартиле

алгоритамско трговање : Куартиле
Шта је квартил?

Четверац је статистички израз који описује поделу опажања у четири дефинисана интервала на основу вредности података и њиховог поређења са целим скупом опажања.

Разумевање квартила

Да бисмо разумели кватил, важно је схватити медијан као мерило централне тенденције. Медијан статистике је средња вредност низа бројева. То је тачка у којој тачно половина података лежи испод и изнад централне вредности.

Дакле, с обзиром на скуп од 13 бројева, медијан би био седми број. Шест бројева који претходе овој вредности су најнижи бројеви у подацима, а шест бројева после медијане највећи су бројеви у датом скупу података. Због тога што на средњу вредност не утичу екстремне вредности или одметници у дистрибуцији, понекад се преферира средња вредност.

Медијан је робустан процењивач локације, али не говори ништа о томе како се подаци са обе стране његове вредности шире или шире. Ту се улази у квартил. Кватил мери ширење вредности изнад и испод средње дељењем расподеле у четири групе.

Кључне Такеаваис

  • Квартил мери ширење вредности изнад и испод средње вредности тако што дели расподелу на четири групе.
  • Четврт дели податке на три тачке - доњи квартил, средњи и горњи квартил - да би формирао четири групе скупа података.
  • Кварел се користи за израчунавање интерквартилног распона, који је мерило варијабилности око медијане.

Како раде квартили

Баш као што средња дели податке на половину тако да 50% мерења лежи испод медијане и 50% лежи изнад ње, тако се и квартил раставља на четвртине тако да је 25% мерења мање од доњег квартила, 50 % су мање од просјека, а 75% мање од горњег квартила.

Четврт дели податке на три тачке - доњи квартил, средњи и горњи квартил - да би формирао четири групе скупа података. Доњи квартил или први квартил означен је као К1 и средњи је број који пада између најмање вредности скупа података и медијане. Други квартил, К2, је такође средњи. Горњи или трећи квартил, означен као К3, је централна тачка која лежи између средњег и највећег броја дистрибуције.

Сада можемо да прикажемо четири групе формиране из квартила. Прва група вредности садржи најмањи број до К1; друга група укључује К1 до медијана; трећи сет је средњи до К3; четврта категорија садржи К3 до највише тачке података читавог скупа.

Сваки квартил садржи 25% укупних запажања. Подаци су распоређени од најмањег до највећег:

  1. Први квартил: најнижих 25% бројева
  2. Други квартил: између 25, 1% и 50% (до медијана)
  3. Трећи квартил: 51% до 75% (изнад средње вриједности)
  4. Четврти квартил: највише 25% бројева

Квартилни пример

Радимо са примером. Претпоставимо да је расподјела математичких бодова у разреду од 19 ученика узлазним редоследом:

59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98

Прво означите средњу вредност К2, која је у овом случају десета вредност: 75.

К1 је централна тачка између најмање оцене и медијана. У овом случају К1 пада између првог и петог резултата: 68. [Имајте на уму да се средња вредност може укључити и у израчунавање К1 или К3 за непарни скуп вредности. Ако бисмо укључили средњу вредност са обе стране средње тачке, тада ће К1 бити средња вредност између првог и десетог поена, што је просек петог и шестог резултата - (пети + шести) / 2 = (68 + 69) / 2 = 68, 5].

К3 је средња вредност између К2 и највише оцене: 84. [Или ако укључите средњу вредност, К3 = (82 + 84) / 2 = 83].

Сад кад имамо своје квартиле, протумачимо њихов број. Резултат од 68 (К1) представља први квартил и представља 25- ти проценти. 68 је средња вредност доње половине оцене која је постављена у доступним подацима, тј. Средња вредност резултата од 59 до 75.

К1 нам говори да је 25% бодова мање од 68 и 75% резултата у класи је веће. К2 (средња вредност) је 50- ти процентитил и показује да је 50% резултата мање од 75, а 50% резултата изнад 75. Коначно, К3, 75- ти проценти, открива да је 25% резултата већи и 75% су мањи од 84.

Посебна разматрања

Ако је тачка података за К1 удаљенија од медијане, него што је К3 од медијане, тада можемо рећи да постоји већа дисперзија међу мањим вредностима скупа података него међу већим вредностима. Иста логика се примењује ако је К3 даље од К2, него што је К1 од медијана.

Алтернативно, ако постоји парни број тачака података, средња вредност ће бити просек средњих два броја. У нашем горњем примеру, ако смо имали 20 ученика уместо 19, средња вредност њихових резултата биће аритметички просек десетог и једанаестог броја.

Кварел се користи за израчунавање интерквартилног распона, који је мерило варијабилности око медијане. Интерквартилни распон се једноставно израчунава као разлика између првог и трећег квартила: К3 - К1. Заправо, распон средње половине података показује колико су подаци раширени.

За велике скупове података, Мицрософт Екцел поседује КУАРТИЛЕ функцију за израчунавање квартила.

Упоредите инвестиционе рачуне Име добављача Опис Откривање оглашивача × Понуде које се појављују у овој табели су од партнерстава од којих Инвестопедиа прима накнаду.

Сродни услови

Како функционира квантитативна метода децилице Децилен је квантитативни метод подјеле скупа рангираних података на 10 подједнаких величина. Ова врста рангирања података врши се као део многих академских и статистичких студија из области финансија и економије. више Дескриптивна статистика Описна статистика је скуп кратких описних коефицијената који сумирају дани скуп података који представља репрезентацију целе или узорка популације. више Дефиниција Квинтила Квинтил је статистичка вредност скупа података који представља 20% дате популације. више Како се користи Винсоризед Средња вредност Ворсонизирана средина је метода просечења која у почетку замењује најмање и највеће вредности са најближим опажањима. Ово се ради да би се на прорачун рачунао утицај ненормалних екстремних вредности или одметника. више Границе од три знака: Оно што требате да знате Три-сигма границе је статистички израчун који се односи на податке унутар три стандардна одступања од средње вриједности. више Дефиниција стандардног одступања Стандардна девијација је статистика која мери дисперзију скупа података у односу на његову средину и израчунава се као квадратни корен варијансе. Израчунава се као квадратни корен варијанце одређивањем варијације између сваке тачке података у односу на средњу вредност. више партнерских веза
Рецоммендед
Оставите Коментар