teraz jeśli zarówno miary statystyczne, średnia i mediana, są używane do opisania lokalizacji zestawu danych, co z zalet i wad?
jak wspomniano powyżej, średnia jest częściej używaną miarą tych dwóch. Ponadto stanowi podstawę wielu zaawansowanych metod statystycznych.
na przykład średnia jest potrzebna do obliczenia odchylenia standardowego, które jest najbardziej widoczną miarą oceny zmienności w zestawie danych., Jest on również potrzebny dla wielu procedur badań statystycznych, np. dla testu T.
ale jakie są zalety mediany?
aby to zilustrować, wracamy do pięciu wartości skurczowego ciśnienia krwi użytych wcześniej:
142, 124, 121, 151, 132.
Zakładamy, że 151 jest poprawną wartością, ale awaria urządzenia prowadzi do fałszywego pomiaru 171. Zobaczmy, co się stanie ze średnią i medianą?,
średnia z wynikowych pięciu wartości wynosi teraz 138 zamiast 134, obliczonych na podstawie oryginalnych danych, co pokazuje znaczny wpływ nieprawidłowego pomiaru.
aby uzyskać medianę, ponownie sortujemy dane według rozmiaru:
121, 124, 132, 142, 171.
tak jak poprzednio, wartość 132 znajduje się w środku wiersza danych, więc mediana jest w rzeczywistości niezmieniona przez fałszywy pomiar.
dlatego mediana jest nazywana „odporną na odstające wartości”, podczas gdy średnia jest w rzeczywistości”wrażliwa na odstające wartości”.,
„Przekrzywione” dystrybucje
kolejną zaletę mediany, związaną z tego rodzaju wytrzymałością, można zobaczyć w dystrybucjach „przekrzywionych”.
przykładem takiego rozkładu w kontekście badania obserwacyjnego jest czas od wystąpienia danej choroby. W wielu przypadkach data diagnozy jest zbliżona do czasu zgłoszenia, tj. na lub zaledwie kilka dni przed wizytą wyjściową. Jednak do grupy badawczej często należą również pacjenci, którzy od wielu lat cierpią na tę chorobę.,
Jeśli obliczymy średnią z poszczególnych przedziałów czasowych od początku choroby, tak duże wartości mają ogromny wpływ, czyniąc średnią większą niż sugerowałby rzeczywisty rozkład danych.
dobra wiadomość jest taka, że wartości odstające nie mają takiego wpływu na medianę. Dlatego tutaj mediana daje bardziej realistyczny obraz danych.
Dodaj komentarz