Mi az a lineáris regresszió?
A lineáris regresszió egy olyan grafikon, amely grafikonon ábrázolja a független és függő változó közötti lineáris kapcsolatot. Általában a kapcsolat erősségének és az eredmények eloszlásának vizuális megmutatására használják - mindezt a függő változó viselkedésének magyarázata céljából.
Tegyük fel, hogy meg akarjuk próbálni az elfogyasztott fagylalt mennyisége és az elhízás közötti kapcsolat erõsségét. Vegyük a független változót, a fagylalt mennyiségét, és összekapcsoljuk azt a függő változóval, az elhízással, hogy megnézzük, van-e kapcsolat. Ha a regresszió ennek a kapcsolatnak a grafikus ábrázolása, minél kisebb az adatok variabilitása, annál erősebb a kapcsolat és annál szorosabb illeszkedik a regressziós vonalhoz.
Kulcs elvihető
- A lineáris regresszió modellezi a függő és független változó (k) közötti kapcsolatot. A regressziós elemzés akkor érhető el, ha a változók függetlenek, nincs heteroszkedaszticitás, és a változók hibafogalma nem korrelál. A lineáris regresszió modellezése az Excelben könnyebb az adatelemző eszközkészlet.
Fontos szempontok
Néhány kritikus feltételezés van az adatkészlettel kapcsolatban, amelyeknek igaznak kell lenniük a regressziós elemzés folytatásához:
- A változóknak valóban függetleneknek kell lenniük (Chi-négyzet teszttel).Az adatoknak nem szabad eltérő hibavariánciákkal rendelkezniük (ezt heteroszkedaszticitásnak (másként speltált heteroszkedaszticitásnak nevezzük).). Az egyes változók hibafogalmainak korreláció nélkül kell lenniük. Ha nem, az azt jelenti, hogy a változók soros korrelációban vannak.
Ha ez a három dolog bonyolultnak hangzik, akkor az. De ezen megfontolások egyikének nem megfelelő hatása elfogult becslés. Alapvetően téves érvénytelenítené a mért kapcsolatot.
Regresszió kimenete Excelben
Az regressziós elemzés futtatásának első lépése az Excelben annak ellenőrzése, hogy az ingyenes Excel plugin Data Analysis ToolPak telepítve van-e. Ez a bővítmény nagyon egyszerűvé teszi a statisztikai adatok kiszámítását. Nem szükséges egy lineáris regressziós sort feltérképezni, de megkönnyíti a statisztikai táblázatok létrehozását. A telepítés ellenőrzéséhez válassza az eszköztár "Adatok" menüpontját. Ha az "Adatelemzés" opció, akkor a szolgáltatás telepítve van és készen áll a használatra. Ha nem telepítette, akkor ezt az opciót az Office gombra kattintással és az "Excel beállítások" lehetőség kiválasztásával kérheti.
Az Data Analysis ToolPak használatával néhány kattintással hozhat létre regressziós kimenetet.
A független változó az X tartományba esik.
Tekintettel az S&P 500 hozamokra, mondjuk, szeretnénk tudni, hogy meg tudjuk-e becsülni a Visa (V) részvényhozamok erejét és viszonyt. A Visa (V) készlet visszaadja az 1. oszlopot mint függő változót. Az S&P 500 az adatpopulációt adja vissza a 2. oszlopot független változóként.
- Válassza az "Adatok" lehetőséget az eszköztáron. Megjelenik az "Adatok" menü. Válassza az "Adatelemzés" lehetőséget. Megjelenik az Adatelemzés - Elemző eszközök párbeszédpanel.A menüből válassza a "Regresszió" lehetőséget, majd kattintson az "OK" gombra. A Regresszió párbeszédpanelen kattintson az "Input Y Range" mezőre, és válassza ki a függő változó adatokat (Visa (V) állomány). visszatér). Kattintson az "Input X Range" mezőre, és válassza ki a független változó adatait (S&P 500 visszatér). Kattintson az "OK" gombra az eredmények futtatásához.
Értelmezze az eredményeket
Ezen adatok felhasználásával (ugyanaz az R-négyzetű cikkünkből) a következő táblázatot kapjuk:
Az R 2 érték, más néven a meghatározási együttható, méri a variancia arányát a függő változóban, amelyet a független változó magyaráz meg, vagy hogy a regressziós modell mennyire felel meg az adatoknak. Az R2 érték 0-tól 1-ig terjed, és a magasabb érték a jobb illeszkedést jelzi. A p-érték vagy a valószínűségi érték szintén 0-tól 1-ig terjed, és jelzi, ha a teszt szignifikáns. Az R2 értékkel ellentétben egy kisebb p-érték kedvező, mivel korrelációt mutat a függő és a független változók között.
A regresszió ábrázolása az Excelben
Az regressziót az Excelben ábrázolhatjuk az adatok kiemelésével és szórási diagramként ábrázolásával. Regressziós sor hozzáadásához válassza a „Chart Tools” menü „Layout” parancsát. A párbeszédpanelen válassza a "Trendline", majd a "Linear Trendline" lehetőséget. Az R 2 érték hozzáadásához válassza a "Trendline menü" "More Trendline Options" menüpontját. Végül válassza a "R-négyzetérték megjelenítése az ábrán" elemet. A vizuális eredmény összefoglalja a kapcsolat erõsségét, bár annak elkerülése érdekében. annyi részlet, mint a fenti táblázat.