most, ha mind a statisztikai intézkedések, az átlag és a medián, használják, hogy leírja a helyét egy sor adat, mi a helyzet az előnyök és hátrányok?
mint már említettük, az átlag a kettő gyakrabban használt mértéke. Ezenkívül számos fejlett statisztikai módszer alapja.
például az átlag szükséges a szórás kiszámításához, amely a legjelentősebb intézkedés az adatkészlet változékonyságának értékeléséhez., Ezenkívül számos statisztikai tesztelési eljárásra is szükség van, például a t-teszthez.
de akkor mi a medián előnye?
ennek szemléltetésére visszatérünk a korábban alkalmazott öt szisztolés vérnyomásértékhez:
142, 124, 121, 151, 132.
feltételezzük, hogy a 151 helyes érték, de az eszköz meghibásodása 171 hamis méréséhez vezet. Lássuk, mit jelent és mit jelent?,
a kapott öt érték átlaga most 134 helyett 138, az eredeti adatokból kiszámítva, így a helytelen mérés jelentős hatását mutatja.
a medián levezetéséhez az adatokat ismét méret szerint rendezzük:
121, 124, 132, 142, 171.
mint korábban, a 132 érték az adatsor közepén van, tehát a medián valójában nem változik a hamis méréssel.
ezért nevezik a mediánt “robusztusnak a kiugró értékekkel szemben”, míg az átlag valójában”érzékeny a kiugró értékekre”.,
“ferde” eloszlások
A medián másik előnye, amely az ilyen típusú robusztussághoz kapcsolódik, a “ferde” eloszlásokban látható.
egy ilyen eloszlásra példa egy megfigyelési vizsgálat összefüggésében az adott betegség kezdete óta eltelt idő. Sok esetben a diagnózis időpontja közel van a jelentéstétel idejéhez, azaz az alapszintű látogatás előtt vagy csak néhány nappal. A vizsgálati csoport azonban gyakran olyan betegeket is magában foglal, akik évek óta szenvednek a betegségben.,
ha kiszámítjuk a betegség kezdete óta eltelt egyéni idő átlagát, az ilyen nagy értékek óriási hatással vannak, így az átlag nagyobb, mint az adatok tényleges eloszlása.
a jó hír az, hogy a kiugró értékeknek nincs ilyen hatása a medián értékére. Ezért itt a medián reálisabb képet ad az adatokról.
Vélemény, hozzászólás?