Mi a Winsorized átlag?
A Winsorizált átlag egy átlagolási módszer, amely kezdetben a legkisebb és legnagyobb értéket a hozzájuk legközelebbi megfigyelésekkel helyettesíti. Ennek célja az, hogy korlátozza a szokatlan szélsőséges értékek, vagy a túllépések hatását a számításra. Az értékek kicserélése után számtani átlagképletet kell használni a nyertes átlag kiszámításához.
A Winsorized középérték képlete
Winsorized átlag = Nxn… xn + 1 + xn + 2… xn ahol: n = a megfigyeléssel helyettesítendő legnagyobb és legkisebb adatpont száma
A Winsorized átlagot kétféle módon fejezik ki. A „k n ” nyertesített átlag a „k” legkisebb és legnagyobb megfigyelésének helyettesítésére utal, ahol „k” egy egész szám. Az "X%" nyertesített átlag magában foglalja az értékek egy bizonyos százalékának az adatok mindkét végéből való kicserélését.
Hogyan lehet kiszámítani a Winsorizált átlagot?
A nyertesített átlag kiszámításához a legkisebb és legnagyobb adatpontot cseréljük, majd összesítjük az összes adatpontot, és az összeget elosztjuk az összes adatponttal.
Mit mond neked a Winsorized?
A nyertesített átlag kevésbé érzékeny a kiugró értékekre, mivel helyettesítheti őket kevésbé szélsőséges értékekkel. Vagyis kevésbé érzékeny a körvonalakra az átlaggal szemben. Ha azonban az eloszlásnak zsíros farok van, akkor az eloszlásban a legmagasabb és a legalacsonyabb értékek eltávolításának kevés hatása van, mivel az eloszlási adatok nagymértékben változnak.
Kulcs elvihető
- Átlagoló módszer, amely magában foglalja a legkisebb és legnagyobb érték cseréjét a hozzájuk legközelebb eső megfigyelésekre. Kisebb az érzékenyek a kiugró értékekre, mert kevésbé szélsőséges értékekkel helyettesítheti őket. általában közel állnak egymáshoz.
Példa a Winsorized Mean használatára
Kiszámolható a nyertesített átlag a következő adatsorra: 1, 5, 7, 8, 9, 10, 14. Ebben a példában feltételezzük, hogy a nyertesített átlag elsőrendű, a legkisebb és legnagyobb értéket kicseréljük legközelebbi megfigyelések.
Az adatkészlet most az alábbiak szerint jelenik meg: 5, 5, 7, 8, 9, 10, 10. Az új halmaz számtani átlagának megadásakor a nyertesített átlag 7, 7, vagy (5 + 5 + 7 + 8 + 9 + 10 + 10) osztva 7-del.
Vagy fontoljon meg egy 20% -os nyereségre számított átlagot, amely a felső 10% -ot és az alsó 10% -ot veszi fel, és helyettesíti őket a következő legközelebbi értékkel. A következő adatkészletet nyerjük: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. a legkisebb és legnagyobb adatpontot, vagyis 10% -ot kicserélik a következő legközelebbi értékre. Így az új adatkészlet: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. az átlag 33, 9, vagy az összes adat (678) osztva az összes adatponttal (20).
A különbség a felszívódott átlag és a levágott átlag között
A nyertesített átlag magában foglalja az adatpontok módosítását, míg a levágott átlag magában foglalja az adatpontok eltávolítását. Gyakori, hogy a nyertesített és átváltott átlag közel áll.
A Winsorized Mean használatának korlátozásai
Az egyik legfontosabb hátránya a WinSorized eszközöknek, hogy torzítást vezetnek be az adatkészletbe. Nyilvánvaló, hogy az adatkészlet ideálisan kevésbé elfogult a módosítás után, mint ha a külső értékeket hagynánk benne.
Tudjon meg többet a Winsorized Mean-ról
Kapcsolódó betekintést a fő átlagszámítások közötti különbségekről.