Ahora bien, si ambas medidas estadísticas, la media y la mediana, se utilizan para describir la ubicación de un conjunto de datos, ¿Qué hay de las ventajas y desventajas?
como se mencionó anteriormente, la media es la medida más comúnmente utilizada de los dos. Además, es la base de muchos métodos estadísticos avanzados.
por ejemplo, la media es necesaria para calcular la desviación estándar, que es la medida más prominente para evaluar la variabilidad en un conjunto de datos., Y también es necesario para muchos procedimientos de prueba estadística, por ejemplo, para la prueba T.
Pero entonces, ¿cuáles son las ventajas de la mediana?
para ilustrar esto, volvemos a los cinco valores de presión arterial sistólica utilizados anteriormente:
142, 124, 121, 151, 132.
asumimos que 151 es un valor correcto, pero que un fallo del dispositivo conduce a la medición falsa de 171. Veamos qué pasa con la media y la mediana.,
la media de los cinco valores resultantes ahora es 138 en lugar de 134, como se calcula a partir de los datos originales, lo que muestra un efecto considerable de la medición incorrecta.
para obtener la mediana, ordenamos los datos de nuevo por tamaño:
121, 124, 132, 142, 171.
como antes, el valor 132 está en el Centro de la fila de datos, por lo que la mediana en realidad no se altera por la medición falsa.
Es por eso que la mediana se llama «robusta contra valores atípicos», mientras que la media en realidad es «sensible a valores atípicos».,
«Sesgada» distribuciones
Otra de las ventajas de la mediana, asociados con este tipo de robustez, se puede ver en «sesgada» de las distribuciones.
un ejemplo de tal distribución en el contexto de un estudio observacional es el tiempo transcurrido desde la aparición de una enfermedad en particular. En muchos casos, la fecha del diagnóstico es cercana al momento de la notificación, es decir, en o solo unos días antes de la visita de referencia. Sin embargo, el grupo de estudio a menudo también incluye pacientes que han estado sufriendo de la enfermedad durante muchos años.,
si calculamos la media de los intervalos de tiempo individuales desde el inicio de la enfermedad, tales valores grandes tienen un impacto enorme, haciendo que la media sea mayor de lo que la distribución real de los datos sugeriría.
la buena noticia es que los valores atípicos no tienen tal efecto en la mediana. Por lo tanto, aquí la mediana da una imagen más realista de los datos.
Deja una respuesta