Nu om både statistiska åtgärder, medelvärdet och medianen används för att beskriva placeringen av en uppsättning data, hur är det med fördelar och nackdelar?
som nämnts ovan är medelvärdet det vanligaste måttet på de två. Dessutom är det grunden för många avancerade statistiska metoder.
till exempel behövs medelvärdet för att beräkna standardavvikelsen, vilket är den mest framträdande åtgärden för att bedöma variationen i en uppsättning data., Och det behövs också för många statistiska testförfaranden, t.ex. för t-testet.
men vad är fördelarna med medianen?
för att illustrera detta återgår vi till de fem systoliska blodtrycksvärdena som användes tidigare:
142, 124, 121, 151, 132.
vi antar att 151 är ett korrekt värde, men att ett enhetsfel leder till falsk mätning av 171. Låt oss se vad som händer med medel och median?,
medelvärdet av de resulterande fem värdena är nu 138 istället för 134, beräknat utifrån de ursprungliga uppgifterna, vilket visar en avsevärd effekt av den felaktiga mätningen.
för att härleda medianen sorterar vi data igen efter storlek:
121, 124, 132, 142, 171.
som tidigare är värdet 132 i mitten av dataraden, så medianen är faktiskt oförändrad av den falska mätningen.
det är därför medianen kallas ”robust mot extremvärden”, medan medelvärdet faktiskt är ”känsligt för extremvärden”.,
”skev” distributioner
en annan fördel med medianen, associerad med denna typ av robusthet, kan ses i ”skev” distributioner.
ett exempel på en sådan fördelning i samband med en observationsstudie är tiden sedan starten av en viss sjukdom. I många fall är diagnosdatumet nära rapporteringstiden, dvs. vid eller bara några dagar före baslinjebesöket. Studiegruppen innehåller emellertid ofta även patienter som har lider av sjukdomen i många år.,
om vi beräknar medelvärdet av den individuella tiden sträcker sig sedan sjukdomsuppkomsten, har sådana stora värden en enorm inverkan, vilket gör medelvärdet större än den faktiska fördelningen av data skulle föreslå.
den goda nyheten är att extremvärden inte har en sådan effekt på medianen. Därför ger medianen en mer realistisk bild av data.
Lämna ett svar