Vergleich zweier Standardabweichungen

Im Berechnungsbeispiel wurde deutlich, in welchen Schritten sich die Ermittlung der Standardabweichung vollzieht. In diesem Abschnitt soll nun anhand eines weiteren Datensatzes gezeigt werden, wie man die Standardabweichung zum Vergleich zweier Mittelwerte verwendet und wieso gilt, dass Mittelwert nicht gleich Mittelwert ist.

Da wir für einen Vergleich einen weiteren Datensatz benötigen, hat sich Person B dazu bereit erklärt, ihre Schlafdauer ebenfalls über einen Zeitraum von einer Woche zu dokumentieren.

Es ergeben sich wiederum folgende Werte in Stunden (h):

TagSchlafdauer (h)
14
23,5
33
411
510
69,5
78



Die Berechnung der Standardabweichung erfolgt über die zuvor vorgestellten drei Schritte.

(1) Berechnung des arithmetischen Mittels


X(B) = (4 + 3,5 + 3 + 11 + 10 + 9,5 + 8) : 7 = 7

Es ergibt sich wiederum ein Mittelwert von X(B) = 7.


(2) Berechnung der Varianz


s²(B) = [(4 - 7)² + (3,5 - 7)² + (3 - 7)² + (11 - 7)² + (10 - 7)² + (9,5 - 7)² + (8 - 7)²] : 7 = 9,93

Dies ergibt eine Varianz s²(B) = 9,93.

Aufgrund der offensichtlich höheren Streuung s²(B) > s²(A) bei diesem Datensatz im Vergleich zum ersten, wird bereits an dieser Stelle deutlich, dass sich bei Person B größere Schlafdauerschwankungen ergeben. Um dies konkret numerisch interpretieren zu können, folgt noch die Berechnung der Standardabweichung von Person B.


(3) Berechnung der Standardabweichung


s(B) = √s²(B) = √9,93 = 3,15

Es ergibt sich eine Standardabweichung von s(B) = 3,15.


Was sagt mir das nun?


Wir können feststellen, dass die Schlafdauern von Person B deutlich mehr um den Mittelwert von 7 streuen, als die von Person A. Der Mittelwert von Person B ist für die Einschätzung der tatsächlichen Schlafdauer dieser Person an einem Tag also nicht gut geeignet. Konkret sagt die vergleichsweise hohe Standardabweichung von 3,15h von Person B aus, dass die tatsächliche Schlafdauer um durchschnittlich 3,15 Stunden vom Gesamtmittelwert von sieben Stunden abweicht. In den meisten Fällen hat die Person B also deutlich mehr oder deutlich weniger als sieben Stunden geschlafen.


Das Wichtigste in Kürze


Mittels der Standardabweichung können wir eine eindeutige Aussage darüber treffen, ob der Mittelwert eines Datensatzes einen repräsentativen Erwartungswert darstellt. Auf unser Beispiel bezogen bedeutet dies, dass die relativ niedrige Standardabweichung von Person A uns die Aussage erlaubt, dass über den Mittelwert eine gute Schätzung der täglichen Schlafdauer dieser Person abgegeben werden kann. Im Gegensatz hierzu impliziert die relativ hohe Standardabweichung von Person B eine große Schwankung der Daten um den Mittelwert. Es wäre daher riskant, den Mittelwert als Erwartungswert der Schlafdauer an einem Tag heranzuziehen.
Die Standardabweichung hilft uns also zu verstehen, wieso Mittelwert nicht gleich Mittelwert ist.