Mi a meghatározási együttható?
A meghatározási együttható a statisztikai elemzésben használt mérőszám, amely felméri, hogy a modell mennyire jól magyarázza és előrejelzi a jövőbeli eredményeket. Ez jelzi az adathalmaz magyarázatainak változékonyságát. A meghatározási együtthatót, más néven "R-négyzet" néven hívják fel a modell pontosságának mérésére.
Az ábra értelmezésének egyik módja az, hogy egy adott modellben szereplő változók a megfigyelt eltérés körülbelül x% -át magyarázzák. Tehát, ha az R 2 = 0, 50, akkor a megfigyelt eltérés körülbelül a fele magyarázható a modellel.
R-négyzet
Kulcs elvihető
- A meghatározási együttható egy komplex ötlet, amely a jövőbeli adatmodellek statisztikai elemzésére összpontosít. A meghatározási együttható segítségével megmagyarázható, hogy az egyik tényező mennyire változékonyságát okozhatja a másik tényezőhöz való viszony.
A meghatározási együttható megértése
A meghatározási együttható segítségével megmagyarázható, hogy az egyik tényező mennyire változtatható meg annak egy másik tényezőhöz való viszonya alapján. Erre támaszkodik a trend-elemzésben, és értéke 0 és 1 között van.
Minél közelebb van az érték 1-hez, annál jobb illeszkedés vagy kapcsolat áll fenn a két tényező között. A meghatározási együttható a korrelációs együttható négyzete, más néven "R", amely lehetővé teszi a két változó közötti lineáris korreláció mértékének megjelenítését.
Ezt a korrelációt "illeszkedés jóságának" hívják. Az 1, 0 érték a tökéletes illeszkedést jelzi, tehát nagyon megbízható modell a jövőbeli előrejelzésekhez, jelezve, hogy a modell megmagyarázza az összes megfigyelt variációt. A 0 érték viszont azt jelzi, hogy a modell egyáltalán nem tudja pontosan modellezni az adatokat. Több változóval rendelkező modellnél, például egy többszörös regressziós modellnél a korrigált R2 jobb meghatározási együttható. A közgazdaságtanban 0, 60 feletti R2 értéket érdemesnek tartani.
A meghatározási együttható elemzésének előnyei
A meghatározási együttható az adatkészletben a becsült pontszámok és a tényleges pontszámkészlet közötti korreláció négyzete. Ez kifejezhető az X és Y pontszámok közötti korreláció négyzetével is, ahol X jelentése független változó, Y pedig függő változó.
A reprezentációtól függetlenül az R-négyzet, amely egyenlő 0-val, azt jelenti, hogy a függő változót nem lehet előre megjósolni a független változóval. Fordítva, ha ez egyenlő 1-vel, ez azt jelenti, hogy a változó függőségét mindig a független változó előrejelzi.
A meghatározási együttható, amely ebbe a tartományba esik, azt méri, hogy a függő változót a független változó megjósolja. Például egy 0, 20 R-négyzet azt jelenti, hogy a függő változó 20% -át előrejelzi a független változó.
Az illesztés jósága vagy a lineáris korreláció mértéke méri a távolságot a grafikonon elhelyezkedő vonal és a grafikon körül szétszórt összes adatpont között. A szűk adathalmaznak olyan regressziós vonala lesz, amely nagyon közel áll a pontokhoz, és magas illeszkedési szinttel rendelkezik, ami azt jelenti, hogy a vonal és az adatok közötti távolság nagyon kicsi. A jó illeszkedésnek az R-négyzete megközelíti az 1-t.
Az R-négyzet azonban nem tudja meghatározni, hogy az adatpontok vagy a jóslatok torzultak-e. Azt sem mondja el az elemzőnek vagy a felhasználónak, hogy a meghatározási együttható jó-e vagy sem. Az alacsony R-négyzet például nem rossz, és az a személy feladata, hogy az R-négyzet alapján számítson el döntést.
A meghatározási együtthatót nem szabad naiv módon értelmezni. Például, ha egy modell R-négyzetének 75% -át jelentik, akkor a hibáinak szórása 75% -kal kisebb, mint a függő változó szórása, és hibáinak szórása 50% -kal kisebb, mint a függő függvény szórása. változó. A modell hibáinak szórása körülbelül egyharmadával megegyezik a hibák szórásának nagyságával, amelyet egy csak állandó modellnél kapnának.
Végül, még ha az R-négyzet értéke is nagy, lehet, hogy a magyarázó változóknak nincs statisztikai jelentősége egy modellben, vagy ezeknek a változóknak a tényleges mérete gyakorlati szempontból nagyon kicsi lehet.