Mi az a fokozatos regresszió?
A regressziós elemzés széles körben alkalmazott statisztikai megközelítés, melynek célja a változók közötti kapcsolatok azonosítása. Az ötlet a releváns adatok összegyűjtése a tájékozottabb döntések meghozatala érdekében, és ez a befektetés világában általános gyakorlat. A fokozatos regresszió a regressziós modell lépésenkénti iteratív felépítése, amely magában foglalja a független változók automatikus kiválasztását. A statisztikai szoftvercsomagok elérhetősége fokozatos regressziót tesz lehetővé, még több száz változóval rendelkező modellek esetén is.
A fokozatos regresszió típusai
A fokozatos regresszió alapvető célja egy tesztsorozat (F-teszt, t-teszt) révén olyan független változók halmazának megtalálása, amelyek jelentősen befolyásolják a függő változót. Ezt a számítógépekkel iterációval hajtják végre, amely az eredmények vagy döntések megismétlése az ismételt körökben vagy elemzési ciklusokon keresztül. A tesztek automatikus elvégzése a statisztikai szoftvercsomagok segítségével azzal az előnnyel jár, hogy időt takarít meg az egyén számára.
Kulcs elvihető
- A regressziós elemzés olyan statisztikai megközelítés, amely megkísérli megérteni és mérni a független és függő változók közötti kapcsolatokat. A lépésenkénti regresszió olyan módszer, amely megvizsgálja a modellben lévő egyes független változók statisztikai szignifikanciáját. Az előre választási módszer hozzáad egy változót, majd teszteli a statisztikai szignifikancia szempontjából..A visszamenőleges eliminációs módszer sok változót betöltő modellel kezdődik, majd eltávolítja az egyik változót, hogy megvizsgálja annak fontosságát az általános eredményekhez viszonyítva.A lépcsőzetes regressziónak sok kritikája van, mivel az a megközelítés, amely az adatokat illeszti egy modellbe a kívánt eredmény elérése érdekében.
A fokozatos regressziót elérhetjük, ha egyszerre kipróbálunk egy független változót, és bevonjuk a regressziós modellbe, ha statisztikailag szignifikáns, vagy beépítjük az összes potenciális független változót a modellbe, és kiküszöböljük azokat, amelyek statisztikailag nem szignifikánsak. Egyesek mindkét módszer kombinációját használják, ezért három lépés van a fokozatos regresszióra:
- Az előreválasztás a modellben szereplő változókkal nem kezdődik, megvizsgálja az egyes változókat, ahogyan azokat hozzáadják a modellhez, majd megtartja azokat, amelyeket statisztikailag legjelentősebbnek tekintnek - megismételve a folyamatot, amíg az eredmények nem lesznek optimálisak. egyenként törli, majd teszteli annak megállapítására, hogy az eltávolított változó statisztikailag szignifikáns-e. A kétirányú kiküszöbölés az első két módszer kombinációja, amely azt vizsgálja, hogy mely változókat kell beépíteni vagy kizárni.
A visszamenőleges módszerrel történő fokozatos regresszió egy példája egy kísérlet a gyárban az energiafelhasználás megértésére olyan változók felhasználásával, mint például a berendezés futási ideje, a berendezés kora, a személyzet mérete, a külső hőmérséklet és az évszak. A modell tartalmazza az összes változót - mindegyiket egyenként eltávolítják annak meghatározása érdekében, hogy melyik statisztikailag legkevésbé szignifikáns. Végül a modell megmutathatja, hogy az évszak és a hőmérsékletek a legfontosabbak, ami arra utalhat, hogy a gyárban az energiafogyasztás a legnagyobb, amikor a légkondicionáló használata a legmagasabb.
A fokozatos regresszió korlátozásai
A regressziós elemzést, mind lineáris, mind többváltozós elemzést széles körben használják a befektetési világban. Az ötlet gyakran a múltban létező minták megtalálása, amelyek a jövőben is megismétlődhetnek. Egy egyszerű lineáris regresszió például megvizsgálhatja az ár / jövedelem arányt és a részvények hozamát sok év alatt annak meghatározására, hogy az alacsony P / E arányú (független változó) részvények magasabb hozamot nyújtanak-e (függő változó). Ennek a megközelítésnek az a problémája, hogy a piaci feltételek gyakran megváltoznak, és a múltban fennálló kapcsolatok nem feltétlenül igazak a jelenben vagy a jövőben.
Eközben a lépésenkénti regressziós folyamatnak sok kritikája van, sőt még felszólítások szólnak a módszer teljes leállításáról. A statisztikusok a megközelítés számos hátrányát rámutatnak, ideértve a helytelen eredményeket, a magában a folyamatban rejlő torzítást és a jelentős számítási teljesítmény szükségességét, hogy az iteráció révén komplex regressziós modelleket dolgozzon ki.