Gjennomsnittet er det mest brukte målet i sentrum, men det er tider når det anbefales å bruke medianen til datavisning og analyse. Når kan det være hensiktsmessig å bruke medianen i stedet for gjennomsnittet?

Gjennomsnittet er det mest brukte målet i sentrum, men det er tider når det anbefales å bruke medianen til datavisning og analyse. Når kan det være hensiktsmessig å bruke medianen i stedet for gjennomsnittet?
Anonim

Når det er noen ekstreme verdier i datasettet.

Eksempel:

Du har et datasett på 1000 tilfeller med verdier som ikke er for langt fra hverandre. Deres gjennomsnitt er 100, som er deres median. Nå erstatter du bare ett tilfelle med et tilfelle som har verdi 100000 (bare for å være ekstrem). Den gjennomsnittlige vil stige dramatisk (til nesten 200), mens medianen vil være upåvirket.

beregning:

1000 tilfeller, gjennomsnitt = 100, summen av verdier = 100000

Tab en 100, legg til 100000, summen av verdier = 199900, gjennomsnitt = 199,9

Median (= sak 500 + 501) / 2 forblir den samme.