Bloccato nella media-media vs. mediana

postato in: Articles | 0

Ora se entrambe le misure statistiche, la media e la mediana, vengono utilizzate per descrivere la posizione di un insieme di dati, che dire di vantaggi e svantaggi?

Come accennato in precedenza, la media è la misura più comunemente usata dei due. Inoltre, è la base di molti metodi statistici avanzati.

Ad esempio, la media è necessaria per calcolare la deviazione standard, che è la misura più importante per valutare la variabilità in un insieme di dati., Ed è anche necessario per molte procedure di test statistici, ad esempio per il t-test.

Ma allora, quali sono i vantaggi della mediana?

Per illustrare questo, torniamo ai cinque valori della pressione arteriosa sistolica usati prima:

142, 124, 121, 151, 132.

Assumiamo che 151 sia un valore corretto, ma che un guasto del dispositivo porti alla falsa misurazione di 171. Vediamo cosa succede a media e mediana?,

La media dei cinque valori risultanti è ora 138 invece di 134, come calcolato dai dati originali, mostrando così un notevole effetto della misurazione errata.

Per ricavare la mediana, ordiniamo nuovamente i dati per dimensione:

121, 124, 132, 142, 171.

Come prima, il valore 132 si trova al centro della riga di dati, quindi la mediana è effettivamente inalterata dalla misura falsa.

Ecco perché la mediana è chiamata “robusta contro i valori anomali”, mentre la media è in realtà “sensibile ai valori anomali”.,

Distribuzioni”distorte”

Un altro vantaggio della mediana, associato a questo tipo di robustezza, può essere visto nelle distribuzioni “distorte”.

Un esempio di tale distribuzione nel contesto di uno studio osservazionale è il tempo trascorso dall’inizio di una particolare malattia. In molti casi, la data della diagnosi è vicina al momento della segnalazione, cioè a o solo pochi giorni prima della visita di base. Tuttavia, il gruppo di studio spesso include anche pazienti che soffrono della malattia da molti anni.,

Se calcoliamo la media dei singoli intervalli di tempo dall’inizio della malattia, valori così grandi hanno un impatto enorme, rendendo la media più grande di quanto suggerirebbe l’effettiva distribuzione dei dati.

La buona notizia è che i valori anomali non hanno un tale effetto sulla mediana. Pertanto, qui la mediana fornisce un’immagine più realistica dei dati.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *