Mi az varianciaanalízis (ANOVA)?
A varianciaanalízis (ANOVA) egy olyan statisztikai elemző eszköz, amely az adatkészletben található megfigyelt aggregált variabilitást két részre bontja: szisztematikus tényezők és véletlenszerű tényezők. A szisztematikus tényezők statisztikai hatással vannak az adott adatkészletre, míg a véletlenszerű tényezők nem. Az elemzők az ANOVA tesztet használják annak meghatározására, hogy a független változók milyen hatással vannak a függő változóra egy regressziós vizsgálatban.
A 20. században kifejlesztett t- és z-teszt módszereket statisztikai elemzéshez használták 1918-ig, amikor Ronald Fisher készítette a varianciaanalízis elemzését. Az ANOVA-t Fisher varianciaanalízisnek is nevezik, és ez a t- és z-teszt kiterjesztése. A kifejezés 1925-ben vált ismertté, miután megjelente a Fisher-féle "Statisztikai módszerek kutatók számára" című könyvében. A kísérleti pszichológiában alkalmazták, majd később bonyolultabb alanyokra terjesztették ki.
Az ANOVA képlete:
F = MSEMST ahol: F = ANOVA együtthatóMST = a kezelés miatt fellépő négyzetek átlagos összegeMSE = hiba miatt a négyzetek átlagos összege
Mit mutat a varianciaanalízis?
Az ANOVA teszt az adott adatkészletet befolyásoló tényezők elemzésének kezdeti lépése. A teszt befejezése után az elemző további teszteket végez azokkal a módszertani tényezőkkel, amelyek mérhető módon hozzájárulnak az adatállomány következetlenségéhez. Az elemző az ANOVA teszt eredményeit f-tesztként használja fel olyan kiegészítő adatok előállítása céljából, amelyek igazodnak a javasolt regressziós modellekhez.
Az ANOVA teszt lehetővé teszi egyidejűleg több mint két csoport összehasonlítását annak meghatározására, hogy van-e kapcsolat közöttük. Az ANOVA képlet eredménye, az F statisztika (más néven F-arány) több adatcsoport elemzését teszi lehetővé a minták közötti és a mintán belüli variabilitás meghatározása érdekében.
Ha nincs valódi különbség a vizsgált csoportok között, amelyet nullhipotézisnek hívunk, akkor az ANOVA F-arányának statisztikája eredménye megközelíti az 1-t. A mintavétel ingadozása valószínűleg a Fisher F eloszlást követi. Ez valójában egy eloszlási funkciók egy csoportja, két jellemző számmal, amelyeket úgy számolunk, hogy a szabadság fokát és a nevezőt a szabadság fokává nevezzük.
Kulcs elvihető
- A varianciaanalízis, vagy az ANOVA, egy statisztikai módszer, amely a megfigyelt varianciaadatokat különféle komponensekre bontja, további vizsgálatokhoz felhasználva. Az egyirányú ANOVA-t három vagy több adatcsoportra használják, hogy információt szerezzenek a függő és a függő között. független változók.Ha nem létezik valódi variancia a csoportok között, akkor az ANOVA F-arányának 1-nek kell lennie.
Példa az ANOVA használatára
Egy kutató például kipróbálhatja a több főiskolai hallgatókat annak ellenőrzése érdekében, hogy az egyik főiskola hallgatói folyamatosan felülmúlja-e a többi főiskola hallgatóit. Egy üzleti alkalmazásban egy K + F kutató kipróbálhatja a termék létrehozásának két különféle folyamatát, hogy kiderüljön, az egyik folyamat jobb-e a másiknál a költséghatékonyság szempontjából.
Az alkalmazott ANOVA teszt típusa számos tényezőtől függ. Akkor alkalmazzák, amikor az adatoknak kísérleti jellegűnek kell lenniük. A varianciaanalízist akkor kell alkalmazni, ha nincs hozzáférés a statisztikai szoftverhez, amelynek eredményeként az ANOVA kézi módon kiszámítható. Ez egyszerűen használható, és a legmegfelelőbb kis mintákhoz. Számos kísérleti tervnél a minta méretének azonosnak kell lennie a különféle tényező szintű kombinációk esetében.
Az ANOVA három vagy több változó tesztelésére szolgál. Hasonló a többszörös kétmintás t-teszthez. Azonban kevesebb I. típusú hibát eredményez, és számos kérdésre megfelelő. Az ANOVA a különbségeket az egyes csoportok átlagainak összehasonlításával csoportosítja, és magában foglalja a variancia különféle forrásokba történő elosztását. Személyekkel, tesztcsoportokkal, csoportok között és csoportokon belül alkalmazzák.
Egyirányú ANOVA versus kétirányú ANOVA
Kétféle ANOVA létezik: egyirányú (vagy egyirányú) és kétirányú. Az egyirányú vagy kétirányú a variancia-teszt elemzésében szereplő független változók számát jelenti. Az egyirányú ANOVA felméri az egyedüli tényező hatását az egyedüli válaszváltozóra. Meghatározza, hogy az összes minta azonos-e. Az egyirányú ANOVA-t annak meghatározására használják, hogy vannak-e statisztikailag szignifikáns különbségek három vagy több független (független) csoport átlagai között.
A kétirányú ANOVA az egyirányú ANOVA kiterjesztése. Egyirányú, ha van egy független változója, amely befolyásolja a függő változót. Kétirányú ANOVA-val két független személy létezik. Például egy kétirányú ANOVA lehetővé teszi a vállalat számára, hogy összehasonlítsa a munkavállalók termelékenységét két független változó, például bér és készségkészlet alapján. Használják a két tényező közötti kölcsönhatás megfigyelésére és két tényező együttes hatásának tesztelésére.