nu, hvis begge statistiske mål, middel-og medianen, bruges til at beskrive placeringen af et sæt data, hvad med fordele og ulemper?
Som nævnt ovenfor er gennemsnittet det mere almindeligt anvendte mål for de to. Desuden er det grundlaget for mange avancerede statistiske metoder.for eksempel er gennemsnittet nødvendigt for at beregne standardafvigelsen, som er den mest fremtrædende foranstaltning til at vurdere variabiliteten i et sæt data., Og det er også nødvendigt for mange statistiske testprocedurer, f.eks. til T-testen.
men hvad er fordelene ved medianen?
for at illustrere dette vender vi tilbage til de fem systoliske blodtryksværdier, der blev brugt før:
142, 124, 121, 151, 132.
Vi antager, at 151 er en korrekt værdi, men at en enhedsfejl fører til den falske måling af 171. Lad os se, hvad der sker med middelværdi og median?,
gennemsnittet af de fem resulterende værdier er nu 138 i stedet for 134, som beregnet ud fra de oprindelige data, hvilket viser en betydelig effekt af den forkerte måling.
for at udlede medianen sorterer vi dataene igen efter størrelse:
121, 124, 132, 142, 171.
som før er værdien 132 i midten af datarækken, så medianen er faktisk uændret ved den falske måling.
derfor kaldes medianen “robust mod outliers”, mens middelværdien faktisk er “følsom over for outliers”.,
“ske .ed” distributioner
en anden fordel ved medianen, der er forbundet med denne form for robusthed, kan ses i “ske .ed” distributioner.
et eksempel på en sådan fordeling i forbindelse med en observationsundersøgelse er tiden siden begyndelsen af en bestemt sygdom. I mange tilfælde er diagnosedatoen tæt på rapporteringstidspunktet, dvs.ved eller kun få dage før baseline-besøget. Undersøgelsesgruppen inkluderer dog ofte også patienter, der har lider af sygdommen i mange år.,
Hvis vi beregner gennemsnittet af de individuelle tidsintervaller siden sygdomsdebut, har sådanne store værdier en enorm indflydelse, hvilket gør gennemsnittet større end den faktiske distribution af data antyder.
den gode nyhed er, at outliers ikke har en sådan effekt på medianen. Derfor giver medianen her et mere realistisk billede af dataene.
Skriv et svar