Tartalomjegyzék
- Mi az a T-teszt?
- A T-teszt magyarázata
- Kétértelmű teszt eredmények
- T-teszt feltételezések
- A T-tesztek kiszámítása
- Összefüggő (vagy párosított) T-teszt
- Egyenlő szórású (Tárolt) T-teszt
- Egyenlőtlen variancia T-teszt
- A használni kívánt T-teszt meghatározása
- Egyenetlen variancia T-teszt példa
Mi az a T-teszt?
A t-teszt olyan következtetési statisztika, amelyet annak meghatározására használnak, hogy van-e szignifikáns különbség a két csoport átlaga között, amelyek bizonyos jellemzők között összefüggenek. Elsősorban akkor használják, amikor az adatkészletek, például az érme 100-szor történő megfordításának eredményeként rögzített adatkészletek normál eloszlást követnek, és ismeretlen eltérésekkel rendelkeznek. A t-tesztet hipotézis-tesztelő eszközként használják, amely lehetõvé teszi a populációra alkalmazható feltételezés tesztelését.
A t-teszt a t-statisztikát, a t-eloszlási értékeket és a szabadság fokát vizsgálja meg, hogy meghatározzuk a különbség valószínűségét a két adatcsoport között. Három vagy több változóval végzett teszt elvégzéséhez a varianciaanalízist kell elvégezni.
T-teszt
A T-teszt magyarázata
Alapvetően egy t-teszt lehetővé teszi a két adatkészlet átlagértékeinek összehasonlítását és annak meghatározását, hogy ugyanazon populációból származnak-e. A fenti példákban, ha mintát veszünk az A osztályból és egy másik mintából a B osztályból, akkor nem számíthatnánk számukra, hogy pontosan ugyanaz az átlag és a szórás. Hasonlóképpen a placebóval táplált kontrollcsoportból vett mintáknak és az előírt gyógyszercsoportból vett mintáknak kissé eltérő átlaggal és szórással kell rendelkezniük.
Matematikailag a t-teszt mintát vesz mind a két halmazból, és úgy hozza létre a probléma megállapítását, hogy nulla hipotézist feltételez, hogy a két eszköz egyenlő. Az alkalmazható képletek alapján bizonyos értékeket kiszámítanak és összehasonlítanak a standard értékekkel, és a feltételezett nullhipotézist ennek megfelelően elfogadják vagy elutasítják.
Ha a nullhipotézist el lehet utasítani, az azt jelzi, hogy az adatok leolvasása erős és nem véletlen. A t-teszt csak egy a sok erre a célra alkalmazott teszt közül. A statisztikusoknak emellett a t-próbától eltérő teszteket is alkalmazniuk kell, hogy több változót és nagyobb mintaméretű teszteket megvizsgáljanak. Nagy mintánál a statisztikusok z-tesztet használnak. Egyéb tesztelési lehetőségek közé tartozik a chi-square teszt és az f-teszt.
A t-tesztek három típusa létezik, és ezek függő és független t-tesztek kategóriájába sorolhatók.
Kulcs elvihető
- A t-teszt olyan következtetési statisztika, amelyet annak meghatározására használnak, hogy van-e szignifikáns különbség a két csoport átlaga között, amelyek bizonyos jellemzők között összefüggenek. A t-teszt egy a sok közül, amelyet a hipotézis tesztelésére használnak. A statisztikai adatok kiszámításához három fő adatértéket kell megadni. Ezek magukban foglalják az egyes adatkészletek átlagértékei közötti különbséget (az úgynevezett átlagkülönbséget), az egyes csoportok szórását és az egyes csoportok adatértékeinek számát. Többféle t-teszt létezik, amelyek elvégezhetők a szükséges adatokról és az elemzés típusáról.
Kétértelmű teszt eredmények
Vegye figyelembe, hogy egy gyógyszergyártó újonnan feltalált gyógyszert kíván kipróbálni. Ez követi a szokásos eljárást, amikor a gyógyszert kipróbálják az egyik betegcsoporton, és placebót adnak egy másik csoportnak, az úgynevezett kontrollcsoportnak. A kontrollcsoportnak adott placebo olyan anyag, amelynek nincs tervezett terápiás értéke, és referenciaértékként szolgál annak mérésére, hogy a másik csoport, amely a tényleges gyógyszert kapja, reagál.
A kábítószer-kísérlet után a placebóval táplált kontrollcsoport tagjai az átlagos várható élettartam három évvel megnövekedtek, míg az új gyógyszerrel felírt csoport tagjai az átlagos várható élettartam négy évvel növekedtek. Azonnali megfigyelés azt jelezheti, hogy a gyógyszer valóban működik, mivel az eredmények jobbak a drogot használó csoportnál. Ugyanakkor az is lehetséges, hogy a megfigyelés valószínűsége lehet egy esemény bekövetkezése miatt, különösen a meglepő szerencse miatt. A t-teszt hasznos annak megállapításához, hogy az eredmények valóban helyesek-e és alkalmazhatók-e az egész populációra.
Egy iskolában az A osztály 100 tanulója átlagosan 85% -ot kapott, 3% -os szórással. További 100, a B osztályba tartozó hallgató átlagosan 87% -ot ért el, 4% -os szórással. Noha a B osztály átlaga jobb, mint az A osztályé, nem lehet helyes azt a következtetést vonni, hogy a B osztályú diákok általános teljesítménye jobb, mint az A osztályú diákoké. Ennek oka az, hogy a átlagban a B osztály szórása szintén nagyobb, mint az A osztályé. Ez azt jelzi, hogy szélsőséges százalékaik az alsó és a felső oldalon sokkal szélesebbek voltak az A osztályhoz képest. A t-teszt segíthet meghatározni melyik osztály jobban teljesített.
T-teszt feltételezések
- A t-tesztekkel kapcsolatos első feltételezés a mérési skálára vonatkozik. A t-teszt feltételezése az, hogy a gyűjtött adatokra alkalmazott mérési skála folytonos vagy szokásos skálát követ, például IQ-teszt pontszámait. A második feltételezés egy egyszerű véletlenszerű minta, amely szerint az adatok a teljes populáció reprezentatív, véletlenszerűen kiválasztott részéből gyűjtött.A harmadik feltevés az, hogy az ábrázolás során az adatok normál eloszlású, harang alakú eloszlási görbét eredményeznek. A negyedik feltételezés ésszerűen nagy mintaszámot használ. A nagyobb mintaszám azt jelenti, hogy az eredmények eloszlása megközelítse a normál harang alakú görbét. A végső feltételezés a variancia homogenitása. Homogén vagy egyenlő variancia akkor létezik, ha a minták szórása megközelítőleg azonos.
A T-tesztek kiszámítása
A t-teszt kiszámításához három kulcsfontosságú adatértékre van szükség. Ezek magukban foglalják az egyes adatkészletek átlagértékei közötti különbséget (az úgynevezett átlagkülönbséget), az egyes csoportok szórását és az egyes csoportok adatértékeinek számát.
A t-teszt eredménye adja a t-értéket. Ezt a kiszámított t-értéket ezután összehasonlítják egy kritikus értéktáblázatból (T-eloszlási táblázatnak) kapott értékkel. Ez az összehasonlítás segít meghatározni, mennyire valószínű, hogy a különbség az eszközök között véletlenszerűen történt-e, vagy az adatkészletek valóban tartalmaznak-e belső különbségeket. A t-teszt megkérdezi, hogy a csoportok közötti különbség valódi különbséget jelent-e a vizsgálatban, vagy valószínűleg-e értelmetlen statisztikai különbség.
T-elosztó táblák
A T-eloszlási táblázat elérhető egy- és két farok formátumban. Az előbbit azoknak az eseteknek a felmérésére használják, amelyeknek rögzített értéke vagy egyértelmű irányú (pozitív vagy negatív) irányú tartomány van. Például milyen valószínűséggel fordul elő, hogy a kimeneti érték -3 alatt marad, vagy meghaladja a hétnél többet, ha egy kockát dobunk? Ez utóbbi a távolság-függő elemzéshez használható, például amikor megkérdezik, hogy a koordináták -2 és +2 közé esnek-e.
A számítások elvégezhetők a szükséges statisztikai funkciókat támogató szabványos szoftverekkel, mint például az MS Excel.
T-értékek és szabadságfokok
A t-teszt kimenetet eredményez két értékkel: t-érték és szabadságfok. A t-érték a két mintakészlet átlaga és a mintakészletekben fennálló különbség hányadosa. Míg a számláló értékét (a két minta halmazának átlaga közötti különbség) egyértelműen kell kiszámítani, a nevező (a minta halmazon belüli különbség) kissé bonyolulttá válhat az érintett adatértékek típusától függően. Az arány nevezője a diszperzió vagy a variabilitás mérése. A t-érték magasabb értékei, más néven t-pontok, azt jelzik, hogy nagy különbség van a két mintakészlet között. Minél kisebb a t-érték, annál nagyobb a hasonlóság a két mintakészlet között.
- A nagy t-pontszám azt jelzi, hogy a csoportok különböznek. Egy kis t-pontszám azt jelzi, hogy a csoportok hasonlóak.
A szabadságfok olyan értékekre utal, amelyek egy tanulmányban változhatnak, és amelyek nélkülözhetetlenek a nullhipotézis fontosságának és érvényességének értékeléséhez. Ezen értékek kiszámítása általában a mintakészletben rendelkezésre álló adatrekordok számától függ.
Összefüggő (vagy párosított) T-teszt
A korrelált t-tesztet akkor kell elvégezni, ha a minták jellemzően hasonló egységek párosított elemeiből állnak, vagy ha vannak esetek ismételt méréseknél. Például előfordulhatnak esetek, amikor ugyanazokat a betegeket ismételten tesztelik - egy adott kezelés előtt és után. Ilyen esetekben mindegyik beteget kontroll mintának használják maguk ellen.
Ez a módszer alkalmazandó azokra az esetekre is, amikor a minták valamilyen módon összefüggenek, vagy megfelelő tulajdonságokkal rendelkeznek, például összehasonlító elemzésen vesznek részt gyermekek, szülők vagy testvérek. A korrelált vagy párosított t-tesztek függő típusúak, mivel ezek olyan esetekre vonatkoznak, amelyekben a két minta halmaza összekapcsolódik.
A t-érték és a szabadságfok kiszámításának képlete egy párosított t-teszthez:
- Az átlag1 és az átlag2 az egyes mintakészletek átlagértékei, míg a var1 és a var2 az egyes mintakészletek szórását jelentik.
A fennmaradó két típus a független t-tesztekhez tartozik. Az ilyen típusú mintákat egymástól függetlenül választják ki, vagyis a két csoport adatkészletei nem ugyanazokra az értékekre vonatkoznak. Ide tartoznak olyan esetek, mint egy 100 betegből álló csoport, amely két, 50 betegből álló csoportra oszlik. Az egyik csoport a kontrollcsoportgá válik, és placebót kap, míg a másik csoport az előírt kezelést kapja. Ez két egymástól független mintacsoportot alkot.
Egyenlő szórású (vagy összekapcsolt) T-teszt
Az egyenlő szórású t-tesztet akkor kell használni, ha az egyes csoportokban a minták száma azonos, vagy a két adatkészlet szórása hasonló. A t-érték és a szabadság fokának kiszámításához a következő képletet kell alkalmazni az egyenlő szórású t-teszthez:
T-érték = n1 + n2−2 (n1−1) × var12 + (n2−1) × var22 × n11 + n21 átlag1 – átlag2, ahol: átlag1 és átlag2 = a mintakészlet1 mindegyikének átlagértékei és var2 = az egyes mintakészletek varianciájan1 és n2 = az egyes mintakészletek rekordjai száma
és, Szabadságfok = n1 + n2−2, ahol: n1 és n2 = rekordok száma mindegyik mintakészletben
Egyenlőtlen variancia T-teszt
Az egyenlőtlenség-t-tesztet akkor alkalmazzák, ha az egyes csoportokban eltérő a minták száma, és a két adatkészlet szórása is eltérő. Ezt a tesztet Welch-féle t-tesztnek is nevezik. A t-érték és a szabadság fokának kiszámításához a következő képletet kell alkalmazni az egyenlőtlen variancia t-tesztre:
T-érték = n1var12 + n2var22 átlag1-átlag2, ahol: átlag1 és átlag2 = a mintakészlet mindegyikének átlagos értékei, var2 és var2 = az egyes mintakészletek varianciájan1 és n2 = rekordok száma az egyes mintakészletekben
és, Szabadsági foka = n1−1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2 ahol: var1 és var2 = az egyes mintakészletek varianciájann1 és n2 = Szám rekordok az egyes mintákban
A megfelelő T-teszt meghatározása
A következő folyamatábra használható annak meghatározására, hogy melyik t-tesztet kell használni a mintakészletek jellemzői alapján. A legfontosabb szempont, amelyet figyelembe kell venni, hogy a mintarekordok hasonlóak-e, az adatrekordok száma az egyes mintakészletekben és az egyes mintakészletek varianciája.
Kép: Julie Bang © Investopedia 2019
Egyenetlen variancia T-teszt példa
Tegyük fel, hogy a művészeti galériában kapott festmények átlós méretét vesszük át. Az egyik mintacsoport 10 festményt tartalmaz, míg a másik 20 festményt tartalmaz. Az adatkészletek a megfelelő átlaggal és varianciaértékekkel a következők:
1. készlet | 2. készlet | |
19.7 | 28.3 | |
20.4 | 26.7 | |
19.6 | 20.1 | |
17.8 | 23.3 | |
18.5 | 25.2 | |
18.9 | 22.1 | |
18.3 | 17.7 | |
18.9 | 27.6 | |
19.5 | 20.6 | |
21.95 | 13.7 | |
23.2 | ||
17.5 | ||
20.6 | ||
18 | ||
23.9 | ||
21.6 | ||
24.3 | ||
20.4 | ||
23.9 | ||
13.3 | ||
Átlagos | 19.4 | 21.6 |
Variancia | 1.4 | 17.1 |
Noha a 2. készlet átlaga magasabb, mint az 1. készleté, nem vonhatjuk le azt a következtetést, hogy minden festmény átlagos hossza 21, 6 egység körül van, mivel a 2. készlet szórása lényegesen nagyobb, mint az 1. készlet. Ez véletlenszerű, vagy vannak-e különbségek? a művészeti galériában kapott festmények teljes lakosságában? A problémát azzal a nullhipotézissel feltételezzük, hogy az átlag megegyezik a két mintakészlet között, és egy t-tesztet hajtunk végre annak igazolására, hogy a hipotézis igaz-e.
Mivel az adatrekordok száma eltérő (n1 = 10 és n2 = 20), és a szórás is eltérő, a t-értéket és a szabadság fokát a fenti adatkészletre kiszámítják az Unequal Variance T-tesztben említett képlettel szakasz.
A t-érték -2, 24787. Mivel a mínuszjelet a két t-érték összehasonlításakor figyelmen kívül lehet hagyni, a számított érték 2, 224787.
A szabadság fokának 24, 38 értéke 24-re csökken, mivel a képlet meghatározása megköveteli az érték lekerekítését a lehető legkevesebb egész számra.
Ha normális eloszlást feltételezünk, meghatározhatjuk a valószínűségi szintet (alfa-szint, szignifikancia szint, p ) az elfogadás kritériumaként. A legtöbb esetben 5% -ot lehet feltételezni.
A szabadság fokának 24-ös és 5% -os szignifikancia-szintjének felhasználásával a t-érték eloszlási táblázat áttekintése 2, 064 értéket ad. Ha ezt az értéket összehasonlítják a 2.247 kiszámított értékkel, akkor azt jelzi, hogy a kiszámított t-érték nagyobb, mint 5% -os szignifikanciaszinten a táblázat értéke. Ezért biztonságos elutasítani a nullhipotézist, miszerint nincs különbség az eszközök között. A népességkészletben rejlő különbségek vannak, és nem véletlen.
A befektetési számlák összehasonlítása × A táblázatban szereplő ajánlatok olyan társulásoktól származnak, amelyektől a Investopedia kártérítést kap. Szolgáltató neve LeírásKapcsolódó feltételek
Hogyan működik a varianciaanalízis (ANOVA) A varianciaanalízis (ANOVA) egy statisztikai elemző eszköz, amely két elemre osztja az adatkészletben található teljes variabilitást: véletlenszerű és szisztematikus tényezők. további Z-teszt meghatározás A z-teszt egy statisztikai teszt, amelyet annak meghatározására használnak, hogy két populációs átlag különbözik-e, ha az eltérések ismertek és a minta mérete nagy. további szabadságfokok meghatározása A szabadságfokok a logikailag független értékek maximális számára vonatkoznak, amelyek az értékek változási szabadsággal rendelkeznek az adatmintában. több A T eloszlás megértése Az AT eloszlás egy olyan valószínűségfüggvény, amely alkalmas a populáció paramétereinek becslésére kis minták esetén vagy ismeretlen eltérések esetén. több, amit a félig eltérés mér: A félig eltérés egy módszer a beruházások megtérülésének átlag alatti ingadozásainak értékelésére. A szórás alternatívájaként alkalmazzák. tovább Bonferroni teszt A Bonferroni teszt egy statisztikai elemzésben alkalmazott többszörös összehasonlító teszt típusa. további partner linkekkapcsolódó cikkek
Közgazdaságtan
Milyen feltételezések történnek egy t-teszt elvégzésekor?
Kockázat kezelés
A történelmi volatilitás felhasználása a jövőbeli kockázat felméréséhez
Tőzsdei stratégia és oktatás
Az Excel használata a részvényárak szimulálására
Pénzügyi mutatók
Hogyan lehet kiszámítani az IRR-t Excelben?
Matematika és statisztikák
Mi a relatív standard hiba?
Pénzügyi mutatók