Mi a négyzetek összege?
A négyzetek összege egy statisztikai módszer, amelyet a regressziós elemzésben használnak az adatpontok szóródásának meghatározására. A regressziós elemzés során a cél az, hogy meghatározzuk, hogy az adatsorok milyen jól illeszthetők egy olyan funkcióhoz, amely segít megmagyarázni az adatsorok létrehozásának módját. A négyzetek összegét matematikai módszerként használjuk annak a függvénynek a megkeresésére, amely az adatokhoz legjobban illeszkedik (legkevésbé változik).
A négyzetek összegének képlete van
Az n elem X sorozatához: Négyzetek összege = i = 0∑n (Xi −X) 2, ahol: Xi = A halmaz i-edik elemeX = a halmaz összes elemének átlaga (Xi −X) = Az egyes elemek eltérése az átlagtól
A négyzetösszeg variációként is ismert.
Mit mond neked a négyzetek összege?
A négyzetek összege az átlagtól való eltérés mértéke. A statisztikákban az átlag a számkészlet átlaga és a központi tendencia leggyakrabban használt mutatója. A számtani átlagot egyszerűen úgy kell kiszámítani, hogy az adatkészletben szereplő értékeket összegezzük, és elosztjuk az értékek számával.
Tegyük fel, hogy a Microsoft (MSFT) záró árai az elmúlt öt napban 74, 01, 74, 77, 73, 94, 73, 61 és 73, 40 voltak dollárban. A teljes árak összege 369, 73 USD, és a tankönyv átlagára vagy átlaga így 369, 73 USD / 5 = 73, 95 USD.
De a mérési halmaz átlagának ismerete nem mindig elegendő. Néha hasznos tudni, hogy mekkora a variáció a méréskészletben. Az, hogy az egyes értékek milyen távolságra vannak az átlagtól, bizonyos betekintést nyújthat ahhoz, hogy a megfigyelések vagy értékek megfeleljenek a létrehozott regressziós modellnek.
Például, ha egy elemző meg akarja tudni, hogy az MSFT részvényárak az Apple árával (AAPL) párhuzamosan mozognak -, felsorolhatja a megfigyelési sorozatot mindkét részvény folyamatának bizonyos időszakra, mondjuk 1, 2, vagy 10 év, és hozzon létre egy lineáris modellt az összes megfigyelt vagy mérési módszerrel. Ha a két változó (azaz az AAPL és az MSFT ára) közötti kapcsolat nem egyenes, akkor az adatkészletben eltérések vannak, amelyeket meg kell vizsgálni.
A statisztikák szerint ha a létrehozott lineáris modellben a sor nem halad át az összes értékmérést, akkor a részvényárakban megfigyelt variabilitás némelyike megmagyarázhatatlan. A négyzetek összegét arra használják, hogy kiszámítsák, létezik-e lineáris kapcsolat két változó között, és minden megmagyarázhatatlan változékonyságot négyzetek maradványösszegének neveznek.
A négyzetek összege a variáció négyzetének összege, ahol a variációt az egyes értékek és az átlag közötti eloszlásnak kell meghatározni. A négyzetek összegének meghatározásához az egyes adatpontok és a legjobban illeszkedő vonal közötti távolságot négyzetre osztják, majd összegezik. A legmegfelelőbb vonal minimalizálja ezt az értéket.
A négyzetek összegének kiszámítása
Most láthatja, hogy a mérést miért nevezik a négyzet eltérésének összegével, vagy a négyzetek összegével röviden. A fenti MSFT példa segítségével a négyzetek összegét a következőképpen lehet kiszámítani:
- SS = (74, 01 - 73, 95) 2 + (74, 77 - 73, 95) 2 + (73, 94 - 73, 95) 2 + (73, 61 - 73, 95) 2 + (73, 40 - 73, 95) 2 SS = (0, 06) 2 + (0, 82) 2 + (- 0, 01) 2 + (-0, 34) 2 + (-0, 55) 2 SS = 1, 0942
Ha önmagában hozzáadjuk az eltérések összegét kerekítés nélkül, akkor a szám nullával egyenlő vagy közel áll, mivel a negatív eltérések majdnem tökéletesen ellensúlyozzák a pozitív eltéréseket. Reálisabb szám elérése érdekében az eltérések összegét négyzetre kell állítani. A négyzetek összege mindig pozitív szám lesz, mivel bármilyen szám pozitív vagy negatív számának négyzete mindig pozitív.
Példa a négyzetek összegének használatára
Az MSFT számítás eredményei alapján a nagy négyzetek összege azt jelzi, hogy az értékek többsége távolabb esik az átlagtól, és ezért az adatok nagymértékben változnak. Az alacsony négyzetek összege a megfigyelések halmazának kis variabilitására utal.
A fenti példában az 1.0942 azt mutatja, hogy az MSFT részvényárfolyamának ingadozása az elmúlt öt napban nagyon alacsony, és az olyan befektetők, akik árstabilitással és alacsony volatilitással jellemezhető részvényekbe kívánnak befektetni, választhatják az MSFT-t.
Kulcs elvihető
- A négyzetek összegével az adatpontok eltérését mérjük az átlagtól. Egy magasabb négyzetösszegű eredmény az adatkészlet nagyfokú variabilitását jelzi, míg az alacsonyabb eredmény azt jelzi, hogy az adatok jelentősen eltérnek az átlagtól..
A négyzetek összegének korlátozása
Befektetési döntés meghozatala a vásárolni kívánt részvényekkel kapcsolatban sokkal több megfigyelést igényel, mint itt. Az elemzőnek évekig tartó adatokkal kell dolgoznia, hogy nagyobb biztonsággal megismerje, milyen magas vagy alacsony egy eszköz variabilitása. Ha több adatpontot adunk a készlethez, a négyzetek összege nagyobb lesz, mivel az értékek szélesebb körben eloszlanak.
A variáció legszélesebb körben alkalmazott mérése a szórás és a szórás. A két mutató egyikének kiszámításához előbb azonban a négyzetek összegét kell kiszámítani. A szórás a négyzetek összegének átlaga (azaz a négyzetek összegét osztva a megfigyelések számával). A szórás a variancia négyzetgyöke.
A regressziós elemzésnek két módszere van, amely négyzetek összegét használja: a legkevesebb négyzet módszer és a nemlineáris legkisebb négyzet módszer. A legkevesebb négyzet módszer arra a tényre utal, hogy a regressziós függvény minimalizálja a variancia négyzetének összegét a tényleges adatpontoktól. Ilyen módon lehet olyan funkciót rajzolni, amely statisztikailag a legjobban illeszkedik az adatokhoz. Vegye figyelembe, hogy a regressziós függvény lehet lineáris (egyenes) vagy nemlineáris (egy görbe).