Mi a homoskedasztikus?
A homoskedasztika (más néven "homoszkedasztikus") olyan állapotra utal, amelyben a fennmaradó, vagy hiba kifejezés varianciája egy regressziós modellben állandó. Vagyis a hiba kifejezése nem változik nagyban, mint az előrejelző változó értéke. A homoszkedaszticitás hiánya azonban arra enged következtetni, hogy a regressziós modellnek további prediktív változókat kell tartalmaznia, hogy megmagyarázza a függő változó teljesítményét.
Kulcs elvihető
- A homoszkedaszticitás akkor fordul elő, ha a hiba kifejezés szórása egy regressziós modellben állandó. Ha a hiba kifejezés varianciája homoszkedasztikus, akkor a modell pontosan meghatározásra került. Ha túl sok a szórás, akkor a modell nem definiálható jól. További prediktív változók hozzáadása segítséget nyújthat a függő változó teljesítményének magyarázatában. Ellenkező esetben, a heteroskedaszticitás akkor fordul elő, amikor a hiba kifejezés szórása nem állandó.
Hogyan működik a homoskedasztika?
A homoskedaszticitás a lineáris regresszió modellezésének egyik feltételezése. Ha a regressziós vonal körüli hibák szórása nagyban változik, akkor a regressziós modell rosszul definiálható. A homoszkedaszticitás ellentéte a heteroskedaszticitás, ugyanúgy, mint a "homogén" ellentéte "heterogén". A heteroszkedaszticitás (más néven „heteroszkedaszticitás”) azt az állapotot jelenti, amelyben a hiba kifejezés varianciája a regressziós egyenletben nem állandó.
Ha figyelembe vesszük, hogy a szórás az előrejelzett eredmény és az adott helyzet tényleges kimenetele között mért különbség, a homoskedaszticitás meghatározása segíthet meghatározni, hogy mely tényezőket kell a pontossághoz igazítani.
Különleges megfontolások
Egy egyszerű regressziós modell vagy egyenlet négy kifejezésből áll. A bal oldalon a függő változó. Ez azt a jelenséget képviseli, amelyet a modell "magyarázni" akar. A jobb oldalon egy állandó, egy előrejelző változó és egy maradék vagy hiba kifejezés található. A hiba kifejezés azt a változékonyságot mutatja a függő változóban, amelyet az előrejelző változó nem magyaráz meg.
Példa a homoskedasztikára
Tegyük fel például, hogy el akarja magyarázni a hallgatói teszt pontszámait azáltal, hogy mennyi időt töltött az egyes hallgatók a tanulásban. Ebben az esetben a teszt pontszáma a függő változó, és a tanulmányi idő az előrejelző változó lesz.
A hiba kifejezés megmutatja a teszt pontszámainak varianciáját, amelyet nem magyarázott meg a tanulmányi idő. Ha ez a szórás egységes vagy homoszkedasztikus, akkor ez azt sugallja, hogy a modell megfelelő magyarázat lehet a teszt teljesítményére - magyarázatot ad a tanulmányi időre.
De a szórás lehet heteroszkedasztikus. A hibatermékek adatainak ábrázolása azt mutatja, hogy a vizsgálati idő nagy része nagyon közel áll a magas teszt pontszámokhoz, de az alacsony vizsgálati idő teszt pontszámok nagyon változatosak voltak, sőt néhány nagyon magas pontszámot is tartalmaztak. Tehát a pontszámok szórását nem lehet jól magyarázni egyszerűen egy előrejelző változóval - a tanulmányi idővel. Ebben az esetben valószínűleg valamilyen más tényező is működik, és valószínűleg tovább kell fejleszteni a modellt annak vagy azok azonosításához. A további vizsgálatokból kiderül, hogy néhány hallgató korábban látta a tesztre adott válaszokat, vagy hogy korábban hasonló tesztet tettek, ezért nem kellett tanulniuk erre a tesztre.
A regressziós modell javítása érdekében a kutató ezért hozzáteszi egy további magyarázó változót, amely jelzi, hogy a hallgató látta-e a válaszokat a teszt előtt. A regressziós modellnek két magyarázó változója lenne - az idő tanulmányozása és az, hogy a hallgató előzetesen ismeri-e a válaszokat. Ezzel a két változóval a teszt pontszámainak varianciája több magyarázatot ad, és a hiba kifejezés varianciája akkor homoszkedasztikus lehet, ami arra utal, hogy a modell jól definiált.