Statistik: Erwartungswert und Standardabweichung
Inhaltsverzeichnis
Der Erwartungswert ist der theoretisch erwartete Mittelwert in einer Messung. Erwartungswert \( \class{red}{\mu} \) einer Zufallsgröße \(X\) mit \(n\) Messwerten \(x_1\), \(x_2\), \(x_3\), ..., \(x_n\) und zugehörigen Wahrscheinlichkeiten \(p_1\), \(p_2\), \(p_3\), ..., \(p_n\) diese Werte herauszubekommen ist gegeben durch die folgende Formel: $$ \class{red}{\mu} ~=~ x_1 \, p_1 ~+~ x_2 \, p_2 ~+~ ... ~+~ x_n \, p_n $$
In einem Experiment kennen wir die Wahrscheinlichkeiten nicht, daher verwenden wir für die Berechnung des Erwartungswerts den empirischen Mittelwert. Empirischer Mittelwert \(\class{red}{\bar{x}}\) ist die Summe der Messwerte \(x_1\), \(x_2\), \(x_3\), ..., \(x_n\) dividiert durch die Anzahl der Messwerte \(n\): $$ \class{red}{\bar{x}} ~=~ \frac{x_1 ~+~ x_2 ~+~ ... ~+~ x_n}{n} $$
Varianz \(\sigma^2\) gibt die Summe der quadratischen Abweichungen \( (x_1 - \class{red}{\mu})^2 \), \( (x_2 - \class{red}{\mu})^2 \) und so weiter vom Erwartungswert \(\class{red}{\mu}\): $$ \sigma^2 ~=~ (x_1 - \class{red}{\mu})^2 p_1 ~+~ (x_2 - \class{red}{\mu})^2 p_2 ~+~ ... ~+~ (x_n - \class{red}{\mu})^2 p_n $$
Die empirische Varianz \(\sigma_{\text e}^2\) können wir in einem Experiment dann folgendermaßen berechnen: $$ \sigma_{\text e}^2 ~=~ \frac{(x_1 - \class{red}{\bar{x}})^2 ~+~ (x_2 - \class{red}{\bar{x}})^2 ~+~ ... ~+~ (x_n - \class{red}{\bar{x}})^2}{n-1}$$
Die Wurzel aus der Varianz ergibt die (Empirische) Standardabweichung \(\sigma\) bzw. \(\sigma_{\text e}\). Die Standardabweichung gibt an, wie stark die Messwerte \(x_1\), \(x_2\), \(x_3\), ..., \(x_n\) im Durchschnitt von dem Erwartungswert \(\class{red}{\mu}\) bzw. Mittelwert \(\class{red}{\bar{x}}\) abweichen: $$ \sigma ~=~ \sqrt{(x_1 - \class{red}{\mu})^2 p_1 ~+~ (x_2 - \class{red}{\mu})^2 p_2 ~+~ ... ~+~ (x_n - \class{red}{\mu})^2 p_n} $$ $$ \sigma_{\text e} ~=~ \sqrt{\frac{(x_1 - \class{red}{\bar{x}})^2 ~+~ (x_2 - \class{red}{\bar{x}})^2 ~+~ ... ~+~ (x_n - \class{red}{\bar{x}})^2}{n-1}}$$
Wenn \(\class{red}{\bar{x}}\) der Mittelwert ist und die Messwerte normalverteilt sind, dann:
- Im Bereich \(\class{red}{\bar{x}} \pm \sigma\) liegen 68% aller Messwerte.
- Im Bereich \(\class{red}{\bar{x}} \pm 2\sigma\) liegen 95.4% aller Messwerte.
- Im Bereich \(\class{red}{\bar{x}} \pm 3\sigma\) liegen 99.7% aller Messwerte.
Die Standardabweichung \(\sigma(\class{red}{\bar{x}})\) des Mittelwerts \(\class{red}{\bar{x}}\) bei \(n\) Messwerten ist gegeben durch die folgende Formel: $$ \sigma(\class{red}{\bar{x}}) ~=~ \frac{\sigma_{\text e}}{\sqrt{n}} $$
Die Verdopplung der Genauigkeit braucht eine Vervierfachung der Anzahl der Messwerte!
- Bei Multiplikation \( \class{red}{\bar{x}_1} \cdot \class{red}{\bar{x}_2}\) und Division \(\frac{\class{red}{\bar{x}_1}}{\class{red}{\bar{x}_2}}\) zweier Mittelwerte, addieren sich ihre relativen Fehler \(f_1\) und \(f_2\) zu einem gesamten relativen Fehler: \(f = f_1 + f_2\).
- Bei Addition \( \class{red}{\bar{x}_1} + \class{red}{\bar{x}_2}\) und Subtraktion \( \class{red}{\bar{x}_1} - \class{red}{\bar{x}_2}\) zweier Mittelwerte, addieren sich ihre absoluten Fehler \(\Delta x_1\) und \(\Delta x_2\) zu einem gesamten absoluten Fehler: \(\Delta x = \Delta x_1 + \Delta x_2\).
Übungen mit Lösungen
Nutze diese Formelsammlung, wenn du Probleme mit Physikaufgaben hast.Aufgabe #1: Mittelwert und Standardabweichung einer Messung
Es wurden 10 folgende Messwerte aufgenommen:
\( i \) | Messwert \( x_i \) |
---|---|
1 | 45.0 |
2 | 45.7 |
3 | 44.6 |
4 | 45.2 |
5 | 45.6 |
6 | 44.5 |
7 | 44.9 |
8 | 45.2 |
9 | 45.8 |
10 | 44.7 |
- Wie groß ist der Mittelwert \( \bar{x} \) der Stichprobe?
- Wie groß ist die empirische Standardabweichung \( s \) der Stichprobe?
- Wie stark weicht der Mittelwert vom wahren Wert \( x \) ab, mit einer Sicherheit von 95%?
Tipps:
- Benutze dazu die Formel für den Mittelwert.
- Standardabweichung ist gegeben durch: \[ s ~=~ \sqrt{ \frac{1}{N-1} \sum_{i=1}^N (x_i - \bar x)^2 } \]
- Benutze die sogenannte (Studentsche) t-Verteilung. Für Deinen Fall \( N = 10 \) ist \( t = 2.30 \). Berechne: \[ x ~=~ \bar{x} \pm \frac{s}{\sqrt N} \, t \]
Lösung zur Aufgabe #1.1
Mit der Formel für den Mittelwert: \[ \bar x ~=~ \frac{1}{N} \sum_{i=1}^N x_i \] bekommst Du durch Einsetzen der 10 Messwerte aus der Tabelle: \[ \bar x ~=~ \frac{1}{10} \cdot (45.0 + 45.7 + 44.6 + 45.2 + 45.6 + 44.5 + 44.9 + 45.2 + 45.8 + 44.7) \] Eingetippt in den Taschenrechner, lautet der Mittelwert konkret \( \bar x ~=~ 45.12 \)
Lösung zur Aufgabe #1.2
Mit der Formel für Standardabweichung aus den Lösungstipps: \[ s ~=~ \sqrt{ \frac{1}{N-1} \sum_{i=1}^N (x_i - \bar x)^2 } \] findest Du die empirische Standardabweichung der Stichprobe heraus. Benutze außerdem den in der Aufgabe #1.1 berechneten Mittelwert und die Messwerte aus der Tabelle: \[ s ~=~ \sqrt{ \frac{1}{9} \sum_{i=1}^{10} (x_i - 45.12)^2 } \]
Eingegeben in den Taschenrechner: \[ s ~=~ 0.463 \]
Lösung zur Aufgabe #1.3
Um herauszufinden wie stark der in Aufgabe #1.1 berechnete Mittelwert vom wahren Wert abweicht; und zwar mit einer Sicherheit von 95%, benutzt Du den t-Wert aus der t-Verteilung, der für Deine Stichprobe angemessen ist. Das heißt: \( N = 10 \) und \( P = 95 \)%. Die t-Verteilung benutzt Du immer dann, wenn die Standardabweichung der Grundgesamtheit nicht bekannt ist. Die t-Verteilung ist also bei einer Stichprobe wie in dieser Aufgabe sinvoll.
Für Deinen Fall \( N = 10 \) und \( P = 95 \)% ist \( t = 2.30 \). Mit der Formel aus dem Hinweis: \[ x ~=~ \bar{x} \pm \frac{s}{\sqrt N} \, t \] findest Du heraus, wie stark der wahre Wert \( x \) vom Mittelwert \( \bar{x} \) abweicht: \[ x ~=~ 45.12 \pm \frac{0.463}{\sqrt{10}} \cdot 2.30 \] Also um \( \pm 0.337 \).
Aufgabe #2: Häufigkeitsverteilung - relative Summenhäufigkeit
Aus einer Produktion wurde eine Stichprobe von 200 Kondensatoren entnommen, um eine Qualitätskontrolle der Kapazitäten \( C_i \) durchzuführen. Dabei wurden die Kapazitäten der Kondensatoren gemessen und in der folgenden Tabelle in Klassenmitten eingeteilt.
Klasse | Klassenmitte in \( \text{nF} \) | Anzahl der Kondensatoren |
---|---|---|
1 | 841 | 3 |
2 | 842 | 4 |
3 | 843 | 3 |
4 | 844 | 10 |
5 | 845 | 2 |
6 | 846 | 35 |
7 | 847 | 70 |
8 | 848 | 50 |
9 | 849 | 23 |
- Bestimme die relativen Häufigkeiten \( h_i \) in Prozent.
- Bestimme die relativen Summenhäufigkeiten \( H_i \) in Prozent.
Tipps: Die relative Häufigkeit \( h_i \) sagt aus, welchen prozentualen Anteil machen die Kondensatoren einer Klassenmitte von der Gesamtzahl der Stichprobe aus.
Die relative Summenhäufigkeit \( H_i \) ist die Summe aller relativen Häufigkeiten bis zur \(i\)-ten Klassenmitte.
Lösung zur Aufgabe #2.1
Die relative Häufigkeit \( h_i \) berechnet sich bei einer Stichprobe von 200 Kondensatoren, folgendermaßen: \[ h_i ~=~ \frac{\text{Anzahl in einer Klasse}}{200} ~\cdot~ 100 \]
Zum Beispiel für die 1. Klasse: \begin{align} h_1 &~=~ \frac{3}{200} ~\cdot~ 100 \\\\ &~=~ \frac{3}{2} \, \% \\\\ &~=~ 1.5 \, \% \end{align}
Wenn du genauso für jede Klasse vorgehst, bekommst du folgende Tabelle mit relativen Häufigkeiten:
Klasse | Anzahl der Kondensatoren | Relative Häufigkeit \( h_i \) in % |
---|---|---|
1 | 3 | 1.5 |
2 | 4 | 2 |
3 | 3 | 1.5 |
4 | 10 | 5 |
5 | 2 | 1 |
6 | 35 | 17.5 |
7 | 70 | 35 |
8 | 50 | 25 |
9 | 23 | 11.5 |
Lösung zur Aufgabe #2.2
Um die relative Summenhäufigkeit \( H_n \) zu berechnen, summierst Du alle relativen Häufigkeiten \( h_i \) bis zur \(n\)-ten Klasse. \[ H_n ~=~ h_1 ~+~ h_2 ~+~...~+~ h_n \]
Zum Beispiel relative Summenhäufigkeit bis zur 3. Klasse: \begin{align} H_3 &~=~ h_1 + h_2 + h_3 \\\\ &~=~ 2.5\% + 2\% + 2.5\% \\\\ &~=~ 7\% \end{align}
Klasse | Anzahl der Kondensatoren | Relative Summenhäufigkeit \( H_n \) in % |
---|---|---|
1 | 3 | 2.5 |
2 | 4 | 3.5 |
3 | 3 | 5 |
4 | 10 | 10 |
5 | 2 | 11 |
6 | 35 | 28.5 |
7 | 70 | 63.5 |
8 | 50 | 88.5 |
9 | 23 | 100 |