Mi a multikollinearitás?
A multikollinearitás a nagy interkorrelációk előfordulása a független változók között egy többszörös regressziós modellben. A multiklinearitás torz vagy félrevezető eredményekhez vezethet, amikor egy kutató vagy elemző megpróbálja meghatározni, hogy az egyes független változók mennyire lehetnek a leghatékonyabbak a statisztikai modell függő változójának előrejelzésére vagy megértésére. Általában véve a multikollinearitás szélesebb konfidencia intervallumokat és kevésbé megbízható valószínűségi értékeket eredményezhet a független változók számára. Vagyis a multikollinearitású modell statisztikai következtetései nem lehetnek megbízhatóak.
A multikollinearitás megértése
A statisztikai elemzők több regressziós modellt használnak egy meghatározott függő változó értékének előrejelzésére két vagy több független változó értékei alapján. A függő változót időnként kimenetel, cél vagy kritérium változónak nevezik. Példa erre a többváltozós regressziós modell, amely megpróbálja előre jelezni a részvények hozamát olyan tételek alapján, mint az ár / hozam arány, piaci kapitalizáció, múltbeli teljesítmény vagy egyéb adatok. A részvényhozam a függő változó, a pénzügyi adatok különböző bitjei pedig a független változók.
Kulcs elvihető
- A multikollinearitás olyan statisztikai fogalom, amelyben a modell független változói összefüggenek. A független változók közötti többszöröslinearitás kevésbé megbízható statisztikai következtetéseket eredményez. Jobb, ha két vagy több változót használó több regressziós modellt épít egymáshoz nem korreláló vagy ismétlődő független változókkal..
A multikollinearitás egy többszörös regressziós modellben azt jelzi, hogy a kolineáris független változók bizonyos módon kapcsolatban vannak, bár a kapcsolat lehet, hogy nem hétköznapi. Például a múltbeli teljesítmény összefügghet a piaci kapitalizációval, mivel a múltban jól teljesítő részvények piaci értéke növekszik. Más szavakkal, a multikollinearitás akkor létezhet, ha két független változó szorosan korrelál. Ez akkor is előfordulhat, ha egy független változót kiszámítanak az adatkészlet más változóiból, vagy ha két független változó hasonló és ismétlődő eredményeket szolgáltat.
A multikollinearitás problémájának kiküszöbölésének egyik leggyakoribb módja az, hogy először azonosítják a kolineáris független változókat, majd az összeset eltávolítják. A multikollinearitás kiküszöbölhető úgy is, hogy két vagy több kolináris változót egyetlen változóba egyesít. Ezután statisztikai elemzést lehet végezni a meghatározott függő változó és csak egyetlen független változó közötti kapcsolat tanulmányozására.
Példa a multikollinearitásra
A befektetésnél a multikollinearitás általános szempont, amikor műszaki elemzést végeznek egy értékpapír, például részvény vagy árucikk jövőbeni várható jövőbeli ármozgásának előrejelzésére. A piaci elemzők el akarják kerülni a kollineáris műszaki mutatók használatát, mivel nagyon hasonló vagy kapcsolódó inputokra épülnek; hajlamosak hasonló előrejelzéseket feltárni az ármozgás függő változójára vonatkozóan. Ehelyett a piaci elemzésnek jelentősen eltérő független változókon kell alapulnia annak biztosítása érdekében, hogy a piacot különböző független analitikai szempontból elemezzék.
John Bollinger, a Bollinger Bands indikátor alkotója, a technikai elemző megjegyzi, hogy "a technikai elemzés sikeres alkalmazásának kardinal szabálya megköveteli a multikollinearitás elkerülését a mutatók között".
A probléma megoldására az elemzők kerülnek kettő vagy több azonos típusú műszaki mutató használatát. Ehelyett egy típusú mutatóval, például egy lendület mutatóval elemezzék a biztosítékot, majd külön elemzést végeznek egy másik típusú mutató, például trend mutató felhasználásával.
A potenciális multikollinearitási probléma egy példája a technikai elemzés elvégzése, amely csak több hasonló mutatót használ, például sztochasztikákat, a relatív szilárdsági mutatót (RSI) és a Williams% R-t, amelyek mind olyan lendületmutatók, amelyek hasonló bemenetekre támaszkodnak és valószínűleg hasonló eredményeket produkálnak eredmények. Ebben az esetben jobb, ha eltávolítja az összes mutatót, kivéve az egyiket, vagy talál módot arra, hogy többet egyetlen mutatóba egyesítsen, miközben hozzáad egy olyan trendmutatót is, amely valószínűleg nem áll szorosan összefüggésben a lendület mutatójával.