agora se ambas as medidas estatísticas, a média e a mediana, são usadas para descrever a localização de um conjunto de dados, o que sobre as vantagens e desvantagens?
Como mencionado acima, a média é a medida mais comumente usada dos dois. Além disso, é a base de muitos métodos estatísticos avançados.por exemplo, a média é necessária para calcular o desvio-padrão, que é a medida mais proeminente para avaliar a variabilidade de um conjunto de dados., E também é necessário para muitos procedimentos de testes estatísticos, por exemplo, para o teste T.
Mas então, quais são as vantagens da mediana?
para ilustrar isto, voltamos aos cinco valores da pressão arterial sistólica usados antes:
142, 124, 121, 151, 132.
assumimos que 151 é um valor correto, mas que uma falha do dispositivo leva à falsa medição de 171. Vamos ver o que acontece ao meio e mediano?,
A Média dos cinco valores resultantes é agora de 138 em vez de 134, conforme calculado a partir dos dados originais, mostrando assim um efeito considerável da medição incorrecta.
Para derivar a mediana, podemos classificar os dados novamente por tamanho:
121, 124, 132, 142, 171.
como antes, o valor 132 está no centro da linha de dados, pelo que a mediana não é alterada pela falsa medição.
é por isso que a mediana é chamada de “Robusta contra valores anómalos”, enquanto que a média realmente é “sensível a valores anómalos”.,
“Desviado” distribuições
Outra vantagem da mediana, associados com este tipo de robustez, pode ser visto em “desviado” distribuições.
um exemplo para tal distribuição no contexto de um estudo observacional é o tempo desde o início de uma doença particular. Em muitos casos, a data do diagnóstico está próxima da hora da notificação, ou seja, em ou apenas alguns dias antes da visita inicial. No entanto, o grupo de estudo muitas vezes também inclui pacientes que sofrem da doença por muitos anos.,se calcularmos a média dos intervalos de tempo individuais desde o início da doença, valores tão grandes têm um enorme impacto, fazendo com que a média seja maior do que a distribuição real dos dados sugere.
A boa notícia é que os valores anómalos não têm tal efeito na mediana. Portanto, aqui a mediana dá uma imagem mais realista dos dados.
Deixe uma resposta