Wenn nun beide statistischen Kennzahlen, der Mittelwert und der Median, verwendet werden, um die Position einer Reihe von Daten zu beschreiben, was ist mit Vor-und Nachteilen?
Wie oben erwähnt, ist der Mittelwert das häufiger verwendete Maß der beiden. Darüber hinaus ist es die Grundlage vieler fortschrittlicher statistischer Methoden.
Zum Beispiel wird der Mittelwert benötigt, um die Standardabweichung zu berechnen, die das prominenteste Maß ist, um die Variabilität in einem Datensatz zu bewerten., Und es wird auch für viele statistische Testverfahren benötigt, z. B. für den T-Test.
Aber was sind dann die Vorteile des Medians?
um dies Zu veranschaulichen, kehren wir zu den fünf systolischen Blutdruck-Werte verwendet, vor:
142, 124, 121, 151, 132.
Wir gehen davon aus, dass 151 ein korrekter Wert ist, aber dass ein Geräteausfall zur falschen Messung von 171 führt. Mal sehen, was passiert mit bedeuten und Median?,
Der Mittelwert der resultierenden fünf Werte beträgt nun 138 statt 134, wie aus den Originaldaten berechnet, was einen erheblichen Effekt der fehlerhaften Messung zeigt.
Um den Median abzuleiten, sortieren wir die Daten erneut nach Größe:
121, 124, 132, 142, 171.
Nach wie vor befindet sich der Wert 132 in der Mitte der Datenzeile, sodass der Median durch die falsche Messung tatsächlich unverändert bleibt.
Deshalb wird der Median als „robust gegen Ausreißer“ bezeichnet, während der Mittelwert tatsächlich „empfindlich gegenüber Ausreißern“ist.,
“ Schiefe „Verteilungen
Ein weiterer Vorteil des Medians, der mit dieser Art von Robustheit verbunden ist, kann in“ schiefe “ Verteilungen gesehen werden.
Ein Beispiel für eine solche Verteilung im Rahmen einer Beobachtungsstudie ist die Zeit seit dem Ausbruch einer bestimmten Krankheit. In vielen Fällen liegt das Datum der Diagnose nahe am Zeitpunkt der Meldung, d. H. An oder nur wenige Tage vor dem Basisbesuch. Die Studiengruppe umfasst jedoch oft auch Patienten, die seit vielen Jahren an der Krankheit leiden.,
Wenn wir den Mittelwert der einzelnen Zeitspannen seit dem Ausbruch der Krankheit berechnen, haben solche großen Werte einen enormen Einfluss, so dass der Mittelwert größer ist, als die tatsächliche Verteilung der Daten vermuten lässt.
Die gute Nachricht ist, dass die Ausreißer keinen solchen Effekt auf den Median haben. Daher gibt hier der Median ein realistischeres Bild der Daten.
Schreibe einen Kommentar