Mi az a többszörös lineáris regresszió - MLR?
A többszörös lineáris regresszió (MLR), más néven egyszerűen többszörös regresszió, olyan statisztikai technika, amely több magyarázó változót használ a válaszváltozó kimenetelének előrejelzésére. A többszörös lineáris regresszió (MLR) célja a magyarázó (független) változók és a válasz (függő) változók közötti lineáris kapcsolat modellezése.
Lényegében a többszörös regresszió a rendes legkisebb négyzetek (OLS) regresszió kiterjesztése, amely egynél több magyarázó változót foglal magában.
A többszörös lineáris regresszió képlete van
Yi = β0 + β1 xi1 + β2 xi2 +… + βp xip + ϵhol, i = n megfigyelések esetén: yi = függő változóxi = expanzív változókβ0 = y-elfogás (állandó kifejezés) βp = az egyes magyarázó változók lejtő együtthatóiϵ = a modell hibatétele (maradványként is ismert)
A többszörös lineáris regresszió magyarázata
Az egyszerű lineáris regresszió olyan funkció, amely lehetővé teszi az elemzőnek vagy a statisztikusnak, hogy előrejelzéseket készítsen egy változóról egy másik változóról ismert információ alapján. A lineáris regresszió csak akkor használható, ha az egyiknek két folytonos változója van - egy független változó és egy függõ változó. A független változó az a paraméter, amelyet a függő változó vagy eredmény kiszámításához használnak. A többszörös regressziós modell számos magyarázó változóra kiterjed.
A többszörös regressziós modell a következő feltételezéseken alapul:
- A függő változók és a független változók között lineáris kapcsolat van. A független változók nem túl szorosan korrelálnak egymással.A megfigyeléseket egymástól függetlenül és véletlenszerűen választom meg a populációból.A maradványokat általában 0-val és varianciával kell eloszlatni. σ.
A meghatározási együttható (R-négyzet) egy olyan statisztikai mutató, amelyet arra használnak, hogy megmérjék az eredményváltozás nagy részét a független változók változásával. Az R 2 mindig növekszik, mivel több prediktort adnak az MLR modellhez, annak ellenére, hogy a prediktorok nem állnak kapcsolatban az eredményváltozókkal.
Az R 2 önmagában tehát nem használható annak meghatározására, hogy mely prediktorokat kell beépíteni a modellbe, és melyeket ki kell zárni. R2 csak 0 és 1 között lehet, ahol 0 azt jelzi, hogy az eredményt nem lehet megjósolni valamelyik független változóval, és 1 azt jelzi, hogy az eredmény a független változók hibája nélkül megjósolható.
A többszörös regresszió eredményeinek értelmezésekor a béta-együtthatók érvényesek, miközben az összes többi változót állandó értéken tartják („minden egyéb egyenlő”). A többszörös regresszióból származó kimenet vízszintesen, egyenletként vagy függőlegesen, táblázatokban jeleníthető meg.
Példa a többszörös lineáris regresszió használatára
Például egy elemző szeretné tudni, hogy a piac mozgása hogyan befolyásolja az Exxon Mobil (XOM) árát. Ebben az esetben a lineáris egyenletének értéke az S&P 500 index, mint független változó vagy prediktor, és az XOM ára, mint a függő változó.
A valóságban számos tényező előrejelzi egy esemény kimenetelét. Például az Exxon Mobil ármozgása nem csupán a teljes piac teljesítményétől függ. Más prediktorok, például az olaj ára, a kamatlábak és az olaj határidős ügyletek ármozgása befolyásolhatják az XOM árát és más olajtársaságok részvényárait. Egy olyan kapcsolat megértése érdekében, amelyben kettőnél több változó van jelen, többszörös lineáris regressziót kell használni.
A többszörös lineáris regresszió (MLR) a véletlenszerű változók közötti matematikai kapcsolat meghatározására szolgál. Más szavakkal az MLR megvizsgálja, hogy a több független változó hogyan kapcsolódik egy függő változóhoz. Miután minden egyes független tényezőt meghatároztunk a függő változó előrejelzésére, a több változóról szóló információk felhasználhatók pontos előrejelzés készítéséhez az eredményváltozóra gyakorolt hatás szintjén. A modell egy egyenes (lineáris) formában hoz létre kapcsolatot, amely a legjobban megközelíti az összes adatpontot.
Hivatkozva a fenti MLR egyenletre, példánkban:
- y i = függő változó: XOMx ára i1 = kamatlábak x i2 = olaj ára x i3 = az S&P 500 indexx értéke i4 = az olaj határidős áraB 0 = y-lehallgatás a nullapont időpontban 1 = regressziós együttható, amely az egység függvényében bekövetkező változást méri változó, ha x i1 változik - az XOM ár változása, amikor a kamatlábak változnakB 2 = olyan együttható érték, amely az egység függvényében bekövetkező változást méri x i2 változásakor - az XOM ár változása az olajárak változásakor
A legkevesebb négyzet becslését, B 0, B 1, B 2 … B p, rendszerint statisztikai szoftverrel kell kiszámítani. Mivel sok változó beépíthető a regressziós modellbe, amelyben az egyes független változókat egy-egy számmal differenciálják - 1, 2, 3, 4… p. A többszörös regressziós modell lehetővé teszi az elemzőnek, hogy több magyarázó változóval közölt információk alapján előre jelezze az eredményt.
Ennek ellenére a modell nem mindig tökéletesen pontos, mivel minden adatpont kissé eltérhet a modell által előre jelzett eredménytől. Az E maradványértéket, amely a tényleges és a várható eredmény közötti különbség, belefoglalják a modellbe az ilyen kis eltérések figyelembevétele érdekében.
Feltételezve, hogy az XOM árregressziós modellünket egy statisztikai számítási szoftver segítségével futtatjuk, amely a következő kimenetet adja vissza:
Egy elemző ezt az eredményt úgy értelmezi, ha más változókat állandó értéken tartanak, az XOM ára 7, 8% -kal növekszik, ha az olaj ára a piacon 1% -kal növekszik. A modell azt is mutatja, hogy az XOM ára 1, 5% -kal csökken a kamatlábak 1% -os emelkedését követően. Az R2 azt jelzi, hogy az Exxon Mobil részvényárfolyam-változásainak 86, 5% -a magyarázható a kamatlábak, az olajárak, az olaj határidős ügyletek és az S&P 500 index változásaival.
Kulcs elvihető
- A többszörös lineáris regresszió (MLR), más néven egyszerűen többszörös regresszió, olyan statisztikai technika, amely több magyarázó változót használ a válaszváltozó kimenetelének előrejelzésére. A többszörös regresszió a lineáris (OLS) regresszió kiterjesztése, amely csak egy magyarázó változót használ. Az MLR-t széles körben használják az ökonometria és a pénzügyi következtetések területén.
A különbség a lineáris és a többes regresszió között
A lineáris (OLS) regresszió összehasonlítja egy függő változó válaszát, ha valamely magyarázó változó megváltozik. Ritka azonban, hogy egy függő változó csak egy változóval magyarázható. Ebben az esetben az elemző többféle regressziót használ, amely megkísérel magyarázni egy függő változót egynél több független változó felhasználásával. A többszörös regresszió lehet lineáris és nemlineáris.
A többszörös regresszió azon a feltételezésen alapul, hogy lineáris kapcsolat van mind a függő, mind a független változók között. Ezenkívül nem feltételezi, hogy a független változók között jelentős korreláció lenne.