Mik a nem paraméteres statisztikák?
A nem paraméteres statisztika olyan statisztikai módszerre utal, amelyben az adatoknak nem szükséges a normál eloszlás illeszkedése. A nem paraméteres statisztikák gyakran rendkívüli adatokat használnak, ami azt jelenti, hogy nem számokra támaszkodik, hanem inkább rangsorra vagy rendezésre. Például egy olyan felmérést, amely a fogyasztói preferenciákat közvetíti a kedveltől az ellenszenvig terjedően, rendszeres adatnak tekintik.
A nem paraméteres statisztika magában foglalja a nem paraméteres leíró statisztikákat, statisztikai modelleket, következtetéseket és statisztikai teszteket. A nem paraméteres modellek modellszerkezetét nem előre határozzák meg, hanem az adatok alapján határozzák meg. A nem paraméteres kifejezés nem azt jelenti, hogy az ilyen modellekben hiányoznak a paraméterek, hanem hogy a paraméterek száma és jellege rugalmas és nem előre rögzítve. A hisztogram a valószínűség-eloszlás nem paraméteres becslésére mutat példát.
A nem paraméteres statisztikák megértése
A statisztikákban a parametrikus statisztikák olyan paramétereket tartalmaznak, mint az átlag, a medián, a szórás, a variancia stb. A statisztika e formája a megfigyelt adatokat használja az eloszlás paramétereinek becslésére. A paraméteres statisztikák szerint feltételezzük, hogy az adatok normális eloszlásnak felelnek meg μ (populáció átlag) és σ 2 (populáció variancia) ismeretlen paraméterekkel, amelyeket azután becsülünk meg a minta átlagának és a minta szórásának felhasználásával.
A nem paraméteres statisztikák nem tesznek feltételezést a minta méretéről vagy arról, hogy a megfigyelt adatok mennyiségi-e.
A nem paraméteres statisztika nem feltételezi, hogy az adatok normál eloszlásból származnak. Ehelyett a megoszlás alakját becsüljük meg a statisztikai mérés ezen formája alapján. Noha számos helyzetben feltételezhető a normál eloszlás, vannak olyan forgatókönyvek is, amelyekben nem lehet meghatározni, hogy az adatok szokásos-e.
Példák a nem paraméteres statisztikákra
Az első példában vegye fontolóra egy kutatót, aki azt szeretné, ha Észak-Amerikában barna szemmel született csecsemők számát becsülnék, úgy dönt, hogy 150 000 csecsemőből mintát vesz és elemzést végez az adatkészlettel kapcsolatban. Az általuk kapott mérést a következő évben született barna szemű csecsemők teljes populációjának becslésére használják.
Második példaként vegye figyelembe egy másik kutatót, aki meg akarja tudni, hogy korán vagy késõn feküdjön-e össze azzal, hogy milyen gyakran beteg. Feltételezve, hogy a mintát véletlenszerűen választják ki a populációból, a betegség gyakoriságának mintavételi eloszlása normálisnak tekinthető. Ugyanakkor nem feltételezhető, hogy az emberi test baktériumtörzsekkel szembeni rezisztenciáját mérő kísérlet normális eloszlású.
Ennek oka az, hogy egy véletlenszerűen kiválasztott mintaadatok ellenállhatnak a törzsnek. Másrészt, ha a kutató olyan tényezőket veszi figyelembe, mint a genetikai felépítés és az etnikai hovatartozás, akkor azt tapasztalhatja, hogy az e jellemzők alapján kiválasztott minta mérete nem ellenálló a törzsnek. Ezért nem lehet feltételezni a normál eloszlást.
Ez a módszer akkor hasznos, ha az adatoknak nincs egyértelmű numerikus értelmezése, és a legjobb a fajták rangsorolása esetén alkalmazni. Például, a személyiségértékelési teszt metrikáinak rangsorolása szerint határozottan nem ért egyet, nem ért egyet, közömbös, egyetértenek és határozottan egyetértenek. Ebben az esetben nem paraméteres módszereket kell alkalmazni.
Különleges megfontolások
A nem paraméteres statisztikák használatának könnyebbé vált. A paraméterek iránti igény csökkenésével az adatok jobban alkalmazhatók a sokféle tesztre. Az ilyen típusú statisztikák felhasználhatók az átlag, a minta mérete, a szórás vagy bármely egyéb kapcsolódó paraméter becslése nélkül, ha ezen információk egyike sem áll rendelkezésre.
Mivel a nem paraméteres statisztikák kevesebb feltevést tesznek a minta adataival kapcsolatban, alkalmazása szélesebb körű, mint a parametrikus statisztikák. Azokban az esetekben, amikor a paraméteres tesztelés megfelelőbb, a nem paraméteres módszerek kevésbé lesznek hatékonyak. Ennek oka az, hogy a nem paraméteres statisztikákból nyert eredmények alacsonyabb a megbízhatósági foka, mint ha az eredményeket paraméteres statisztikákkal kapnák.
Kulcs elvihető
- A nem paraméteres statisztikák könnyen használhatók, de nem biztosítják pontosan más statisztikai modellek pontosságát. Ez az elemzési módszer a legmegfelelőbb valami sorrendjének megfontolásakor, ahol a numerikus adatok megváltozása esetén az eredmények valószínűleg változatlanok maradnak.