Nå hvis begge statistiske tiltak, gjennomsnittlig og median, er brukt til å beskrive plassering av et sett av data, hva om fordeler og ulemper?
Som nevnt ovenfor, mener er mer vanlig brukte mål på de to. Videre, det er grunnlaget for mange av de avanserte statistiske metoder.
For eksempel, den mener er nødvendig for å beregne standardavvik, som er den viktigste tiltaket for å vurdere variasjoner i et datasett., Og det er også behov for mange statistisk testing av prosedyrer, f.eks. for t-test.
Men så, hva er fordelene med median?
for Å illustrere dette kan vi gå tilbake til de fem systolisk blodtrykk verdier brukt før:
142, 124, 121, 151, 132.
Vi anta at 151 er en riktig verdi, men som en enhet svikt fører til falske måling av 171. La oss se hva som skjer til gjennomsnittlig og median?,
gjennomsnittet av den resulterende fem verdier nå er 138 i stedet for 134, som beregnes fra de opprinnelige dataene, noe som viser en betydelig effekt av feil måling.
for Å utlede median, vi sortere dataene på nytt etter størrelse:
121, 124, 132, 142, 171.
Som før, verdien 132 ligger i sentrum av data rad, så median faktisk er uendret av falske måling.
det er grunnen til At medianen er kalt «robust mot uteliggere», mens gjennomsnittlig faktisk er «følsom for ekstreme verdier».,
«Skjeve» fordelingen
en Annen fordel med median, som er assosiert med denne typen av robusthet, kan sees i «skjeve» fordelingen.
Et eksempel på en slik distribusjon i sammenheng med en observasjonsstudie er tiden siden utbruddet av en bestemt sykdom. I mange tilfeller, dato for diagnose er nær tidspunktet for rapportering, det vil si på, eller bare noen få dager før baseline besøk. Men studien gruppe som ofte også omfatter pasienter som har vært som lider av sykdommen i mange år.,
Hvis vi beregne gjennomsnittet av det enkelte tidsrom siden sykdommen utbruddet, så store verdier har en enorm innvirkning, noe som gjør det bety større enn den faktiske fordelingen av data skulle tilsi.
Den gode nyheten er at utenforliggende ikke har en slik effekt på medianen. Derfor, her er medianen gir et mer realistisk bilde av data.
Legg igjen en kommentar