Оверфиттинг

алгоритамско трговање : Оверфиттинг
Шта је оверфиттинг?

Прекомерно уклапање је грешка у моделирању која се јавља када је функција превише уско уклопљена на ограничени скуп података. Прекомерно уклапање у модел обично има облик стварања превише сложеног модела да би се објасниле идиосинкразије у испитиваним подацима.

У стварности, подаци који се често проучавају у себи имају одређени степен грешака или случајног шума. Стога, покушај да се модел усклади преблизу с помало нетачним подацима може заразити модел значајним грешкама и умањити његову предвиђајућу снагу.

[Важно: Финансијски професионалци морају увек бити свесни опасности прекомерног намештања модела заснованог на ограниченим подацима.]

Разумевање оверфиттинга

На пример, чест проблем је коришћење компјутерских алгоритама за претраживање опсежних база података историјских података о тржишту како би се пронашли обрасци. С обзиром на довољно проучавања, често је могуће развити сложене теореме за које се чини да са блиском тачношћу предвиђају ствари попут повратка на берзи.

Међутим, када се примењују на податке изван узорка, такве теореме могу се показати да су само преклапање модела на оно што су у стварности само случајне појаве. У сваком случају, важно је тестирати модел на основу података који су изван узорка који се користи за његово развијање.

Кључне Такеаваис

  • Прекомерно уклапање је грешка у моделирању која се јавља када је функција превише уско уклопљена на ограничени скуп података.
  • Финансијски професионалци морају увек бити свесни опасности прекомерног уклапања модела заснованог на ограниченим подацима.
Упоредите инвестиционе рачуне Име добављача Опис Откривање оглашивача × Понуде које се појављују у овој табели су од партнерстава од којих Инвестопедиа прима накнаду.

Сродни услови

Зашто је статистичка значајност важна Статистички значај односи се на резултат који се вероватно неће појавити насумично, већ ће се вјероватно приписати одређеном узроку. више Како ради Смоотхинг Дата Заглађивање података врши се кориштењем алгоритма за уклањање буке из скупа података. То омогућава да се истичу важни обрасци. Изглађивање података може се користити за предвиђање трендова, попут оних који се налазе у ценама хартија од вредности. више Узорак Узорак је мања, управљана верзија веће групе. Узорци се користе у статистичком тестирању када су величине становништва превелике. више Хетероскедастичност У статистици се хетероскедастичност дешава када стандардна девијација променљиве, праћена током одређеног времена, није константна. више Читање у стратификовано случајно узорковање Стратификовано случајно узорковање је метода узорковања која укључује поделу популације на мање групе познате као слојеви. више Како раде једноставни случајни узорци Једноставни случајни узорак је подскуп статистичке популације у којој сваки члан подскупине има једнаку вероватноћу да буде изабран. Једноставни случајни узорак подразумева непристрасан приказ групе. више партнерских веза
Рецоммендед
Оставите Коментар