Mi az inflációs variancia faktor?
Variációs infláció Az fVariance inflációs faktor (VIF) a multikollinearitás mennyiségének mérése egy több regressziós változó halmazában. Matematikailag a regressziós modellváltozó VIF-je megegyezik az általános modellvariancia és egy olyan modell varianciájának hányadosával, amely csak az egyetlen független változót tartalmazza. Ezt az arányt minden független változóra kiszámítják. A magas VIF azt jelzi, hogy a társított független változó nagyon kollineáris a modell többi változójával.
Kulcs elvihető
- A varianciaflációs faktor (VIF) a multikollinearitás mértékét mutatja a többváltozós regressziós modell független változói között. A multikollinearitás meghatározása fontos, mivel bár nem csökkenti a modell magyarázó képességét, csökkenti a független változók statisztikai szignifikanciáját. Egy nagy VIF egy független változón nagyon erős kolineáris kapcsolatot mutat a többi változóval, amelyeket figyelembe kell venni vagy módosítani kell a modell felépítésében és a független változók kiválasztásában.
A varianciaflációs faktor megértése
A többszörös regressziót akkor alkalmazzák, amikor egy személy meg akarja próbálni több változó hatását egy adott eredményre. A függő változó az az eredmény, amelyre a független változók reagálnak, amelyek a modell bemenetei. A multiklinearitás akkor létezik, ha egy vagy több független változó vagy bemenet között lineáris kapcsolat vagy korreláció van. A multikollinearitás problémát jelent a többes regresszióban, mivel mivel a bemenetek mind befolyásolják egymást, valójában nem függetlenek, és nehéz megvizsgálni, hogy a regressziós modellben mennyire befolyásolja a független változók kombinációja a függő változót vagy eredményt. Statisztikai szempontból egy többszörös regressziós modell, ahol magas multikollinearitás jellemzi, megnehezíti az egyes független változók és a függő változó közötti kapcsolat becslését. A felhasznált adatokban vagy a modell egyenletének kis változásai nagymértékű és szabálytalan változást okozhatnak a független változók becsült együtthatóin.
Annak biztosítása érdekében, hogy a modell pontosan meg legyen határozva és megfelelő módon működjön, vannak olyan tesztek, amelyek multikollinearitás szempontjából elvégezhetők. Az egyik ilyen mérési eszköz a varianciaflációs tényező. A variancia-inflációs tényezők használata segít meghatározni a multikollinearitással kapcsolatos kérdések súlyosságát, hogy a modell módosítható legyen. A variancia-inflációs faktor azt méri, hogy egy független változó viselkedését (varianciáját) befolyásolja vagy felfújja annak kölcsönhatása / korrelációja a többi független változóval. A variancia-inflációs tényezők lehetővé teszik annak gyors mérését, hogy egy változó mennyiben járul hozzá a regresszió standard hibájához. Ha jelentős multikollinearitási kérdések merülnek fel, a szórási inflációs tényező nagyon nagy lesz az érintett változóknál. Miután ezeket a változókat azonosították, számos megközelítést lehet használni a kolináris változók kiküszöbölésére vagy kombinálására, megoldva a multikollinearitás kérdését.
Noha a multikollinearitás nem csökkenti a modell általános prediktív erejét, a regressziós együtthatók becsléseit olyan statisztikailag nem szignifikánsnak tekintheti. Bizonyos értelemben úgy tekinthető, mint egyfajta kettős számolás a modellben. Ha két vagy több független változó szorosan kapcsolódik egymáshoz, vagy szinte ugyanazt mérik, akkor a mögöttes hatást kétszer (vagy annál több) a változókon át kell elszámolni, és nehéz vagy lehetetlen lesz megmondani, hogy melyik változó valóban befolyásolja a független változó. Ez problémát jelent, mivel sok ökonometriai modell célja, hogy pontosan megvizsgálja ezt a fajta statisztikai kapcsolatot a független változók és a függő változó között.
Például, ha egy közgazdász meg akarja vizsgálni, van-e statisztikailag szignifikáns kapcsolat a munkanélküliségi ráta (mint független változó) és az inflációs ráta (mint függő változó) között. A munkanélküliségi rátához kapcsolódó további független változók bevonásával, mint például egy új kezdeti munkanélküliségi igény, valószínűleg multikollinearitást vezet be a modellbe. Az átfogó modell erős, statisztikailag elegendő magyarázatot mutathat, de nem tudja azonosítani, hogy a hatás leginkább a munkanélküliségi ráta vagy az új kezdeti munkanélküliségi igények eredménye-e. A VIF ezt észlelné, és arra utalna, hogy az egyik változót ki lehet vonni a modellből, vagy lehet valamilyen módszert találni arra, hogy konszolidálja őket együttes hatásaik feltárására, attól függően, hogy a kutató milyen konkrét hipotézist érdekli a tesztelés.