Mi a mintavételi eloszlás?
A mintavételi eloszlás egy statisztika valószínűségi eloszlása, amelyet nagyszámú mintából nyernek egy adott populációból. Egy adott populáció mintavételi eloszlása a különböző eredmények tartományának gyakoriságának eloszlása, amely a populáció statisztikáinál előfordulhat.
A mintavételi elosztás megértése
Számos adat, amelyet akadémikusok, statisztikusok, kutatók, marketingszakemberek, elemzők stb. Készítettek és használtak, valójában minták, nem pedig populációk. A minta egy populáció egy részhalmaza. Például egy orvosi kutató, aki akart az Észak-Amerikában 1995 és 2005 között született csecsemők átlagos tömegét összehasonlítani a Dél-Amerikában ugyanabban az időtartamban született csecsemőknek, ésszerű időn belül nem képes összegyűjteni az adatokat a több mint egymillió szülés, amely a tízéves időtartam alatt történt. Ehelyett inkább csak, mondjuk, 100 csecsemő súlyát fogja felhasználni minden kontinensen, hogy következtetéseket vonjon le. A felhasznált 200 csecsemő súlya a minta, és a kiszámított átlagos súly a minta átlaga.
Tegyük fel, hogy ahelyett, hogy minden kontinensen csak 100 újszülött súlyt vett volna, az orvosi kutató ismételt véletlenszerű mintákat vesz az általános populációból, és kiszámítja az egyes mintacsoportok átlagát. Tehát Észak-Amerika vonatkozásában az Egyesült Államokban, Kanadában és Mexikóban rögzített 100 újszülött súlyra vonatkozó adatokat gyűjti az alábbiak szerint: négy 100 minta kiválasztott kórházakból az Egyesült Államokban, öt 70 minta Kanadából és három 150 adat Mexikóból, összesen 1200 súlyú újszülött 12 csoportba csoportosítva. Ezenkívül mintavételi adatokat gyűjt 100 születési súlyról a dél-amerikai 12 ország mindegyikéből.
Mindegyik mintának megvan a saját átlaga és a minta átlagának eloszlása mint minta eloszlása.
Az egyes mintasorozatokra kiszámított átlagos súly az átlag mintavételi eloszlása. Nemcsak az átlag számítható egy mintából. Egyéb statisztikák, például a szórás, variancia, arány és tartomány kiszámíthatók a mintaadatokból. A szórás és a szórás a mintavételi eloszlás változékonyságát méri.
A populáció megfigyeléseinek száma, a mintában levő megfigyelések száma és a mintakészletek felvételéhez alkalmazott eljárás határozza meg a mintavételi eloszlás variabilitását. A mintavételi eloszlás szórását standard hibának nevezzük. Noha a mintavételi eloszlás átlaga megegyezik a populáció átlagával, a standard hiba a populáció szórásától, a populáció méretétől és a minta méretétől függ.
Annak ismerete, hogy az egyes mintacsoportok átlaga eloszlik egymástól, és a populáció átlaga alapján megmutatja, hogy a minta átlaga milyen közel áll a populáció átlagához. A mintavételi eloszlás standard hibája csökken a minta méretének növekedésével.
Különleges megfontolások
Egy populáció vagy egy számkészlet mintája normál eloszlású lesz. Mivel azonban a mintavételi eloszlás több megfigyelési halmazt is magában foglal, nem feltétlenül kell harang alakú.
Példánkat követve, Észak-Amerikában és Dél-Amerikában a csecsemők népességének átlagos tömege normális eloszlású, mivel egyes csecsemők alsúlyosak (az átlag alatt vannak) vagy túlsúlyosak (az átlag feletti), a legtöbb csecsemő közöttük (az átlag körül). Ha Észak-Amerikában az újszülöttek átlagos tömege hét font, akkor az észak-amerikai térségben rögzített mintavételi megfigyelések mindkét tizenkét mintájának átlagos tömege megközelíti a 7 fontot.
Ha azonban ábrázolja az 1200 minta mindegyikében kiszámolt átlagokat, az eredményül kapott alak egyenletes eloszlást eredményezhet, de nehéz biztosan megjósolni, hogy mi lesz a valódi alak. Minél több mintát vesz fel a kutató a több mint egymillió tömegű népességből, annál inkább a grafikon kezd el normál eloszlást kialakítani.
- A mintavételi eloszlás egy olyan statisztika valószínűségi eloszlása, amelyet nagyszámú mintából nyernek egy adott populációból. Az adott populáció mintavételi eloszlása a különböző eredmények egy sorának gyakoriságának eloszlása, amely esetlegesen előfordulhat egy népesség. A tudósok, statisztikusok, kutatók, marketingszakemberek és elemzők által összegyűjtött és felhasznált sok adat valójában minták, nem pedig populációk.