Mi a kvartilis?
A kvartilis egy statisztikai kifejezés, amely leírja a megfigyelések négy meghatározott intervallumra történő megosztását az adatok értékei és az összehasonlításuk alapján a teljes megfigyeléskészlettel.
A kvartilek megértése
A kvartilis megértése érdekében fontos megérteni a mediánt, mint a központi tendencia mértékét. A statisztikákban a medián egy számkészlet középértéke. Az a pont, ahol az adatok pontosan fele a központi érték alatt és felett helyezkedik el.
Tehát, ha 13 számból áll, a medián a hetedik szám lenne. Az ezt az értéket megelőző hat szám az adatok legalacsonyabb száma, a medián utáni hat szám pedig a megadott adatkészlet legmagasabb száma. Mivel a mediánt nem befolyásolják az eloszlás szélsőséges értékei vagy túllépései, néha inkább az átlagot részesítik előnyben.
A medián egy megbízható becslés a helyről, de nem mond semmit arról, hogy az érték két oldalán lévő adatok hogyan oszlanak el vagy oszlanak el. A kvartilis itt lép be. A kvartilis az átlag feletti és alatti értékek elterjedését méri az eloszlás négy csoportra osztásával.
Kulcs elvihető
- A kvartilis az átlag feletti és alatti értékek eloszlását osztja négy csoportra osztva. A kvartilis az adatokat három pontra osztja - egy alsó kvartilisre, a medianra és a felső kvartilre -, hogy az adatkészlet négy csoportját képezzék. az intervartilis tartomány kiszámításához, amely a medián körüli variabilitás mérőszáma.
Hogyan működnek a kvartilek?
Csakúgy, mint a medián az adatokat felosztja úgy, hogy a mérés 50% -a a medián alatt fekszik, és 50% -a felette fekszik, a kvartilis az adatokat negyedre osztja, hogy a mérés 25% -a kevesebb, mint az alsó kvartilis. % -a kevesebb, mint az átlag, és 75% -a kevesebb, mint a felső kvartilis.
A kvartilis az adatokat három pontra osztja - alsó kvartilisre, medianre és felső kvartilre -, hogy az adatkészlet négy csoportját képezzék. Az alsó vagy az első kvartilis Q1-vel van jelölve, és az a középső szám, amely az adatkészlet legkisebb értéke és a medián közé esik. A második kvartilis, Q2, szintén a medián. A felső vagy harmadik kvartilis, amelyet Q3-nak nevezünk, az a középpont, amely a medián és az eloszlás legnagyobb száma között helyezkedik el.
Most felvázolhatjuk a kvartilekből kialakult négy csoportot. Az első értékcsoport a legkisebb számot tartalmazza Q1-ig; a második csoportban a Q1 a medián; a harmadik halmaz a Q3 mediánja; a negyedik kategória a Q3-t és a teljes készlet legmagasabb adatpontját tartalmazza.
Minden kvartilis az összes megfigyelés 25% -át tartalmazza. Az adatok általában a legkisebbtől a legnagyobbig vannak elrendezve:
- Első kvartilis: a számok legalacsonyabb 25% -a Második kvartilis: 25, 1% és 50% között (a mediánig) Harmadik kvartilis: 51% - 75% (a medián felett) Negyedik kvartilis: a számok legmagasabb 25% -a
Kvartilis példa
Dolgozzunk egy példával. Tegyük fel, hogy a matematikai pontszámok eloszlása növekvő sorrendben egy 19 tanulói osztályban:
59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98
Először jelölje meg a Q2 mediánt, amely ebben az esetben a tizedik érték: 75.
Q1 a legkisebb pontszám és a medián középpontja. Ebben az esetben a Q1 az első és az ötödik pontszám közé esik: 68..
Q3 a Q2 és a legmagasabb pontszám középértéke: 84..
Most, hogy megvannak a kvartiljeink, értelmezzük a számukat. A 68-as pontszám (Q1) az első kvartilet képviseli, és a 25. százalék. A 68 a rendelkezésre álló adatokban szereplő pontszám alsó fele, azaz a pontszámok mediánja 59 és 75 között.
Az 1. negyedév azt mondja nekünk, hogy a pontszámok 25% -a kevesebb, mint 68, az osztálypontok 75% -a pedig nagyobb. A Q2 (a medián) az 50. percentilis, és azt mutatja, hogy a pontszámok 50% -a kevesebb, mint 75, a pontszámok 50% -a pedig 75 felett van. Végül a Q3, a 75. percentilis azt mutatja, hogy a pontszámok 25% -a nagyobb és 75% kevesebb, mint 84.
Különleges megfontolások
Ha a Q1 adatpontja távolabb van a mediánhoz, mint a Q3 a mediánhoz, akkor azt mondhatjuk, hogy nagyobb az eloszlás az adatkészlet kisebb értékei között, mint a nagyobb értékek között. Ugyanez a logika érvényes, ha a Q3 távolabb van a Q2-től, mint a Q1 a mediánnál.
Alternatív megoldásként, ha páros számú adatpont van, a medián lesz a középső két szám átlaga. A fenti példánkban, ha 20 hallgatónk volt 19 helyett, akkor pontszámuk mediánja a tizedik és tizenegyedik szám számtani átlaga lesz.
A kvartileket használják az interkvartilis tartomány kiszámításához, amely a medián körüli variabilitás mérőszáma. Az interkvartilis tartományt egyszerűen az első és a harmadik kvartilis közötti különbséggel számítják: Q3 - Q1. Valójában az adatok középső tartománya mutatja, hogy az adatok hogyan oszlanak meg.
Nagy adatkészletek esetén a Microsoft Excel rendelkezik egy QUARTILE funkcióval a kvartilek kiszámításához.