Der Erwartungswert beschreibt mit welchem Ergebnis in einem Zufallsexperiment zu rechnen ist, wenn es sehr häufig wiederholt wird. Der Begriff kommt aus der Wahrscheinlichkeitsrechnung, der sogenannten Stochastik. Bei einem Würfelwurf gibt der Erwartungswert beispielsweise Auskunft darüber mit welchem Wert man langfristig rechnen kann, wenn man sehr oft hintereinander würfelt.
Merke: Im Allgemeinen sind der Erwartungswert und das arithmetische Mittel zwei unterschiedliche Konzepte, die sich in den meisten Fällen auch für dasselbe Zufallsexperiment unterscheiden werden. Nur wenn ein Zufallsexperiment unendlich oft wiederholt wird, haben der Erwartungswert und das arithmetische Mittel denselben Wert.
Wie wird er für diskrete Zufallsvariablen berechnet?
Ein Zufallsexperiment mit einer diskreten Zufallsvariable ist dadurch gekennzeichnet, dass es nur eine endliche Menge an Ergebnissen gibt. Im Falle eines Würfelwurfs bedeutet das, dass das Ergebnis eine der sechs Zahlen zwischen 1 und 6 sein muss. Die Augenzahlen haben dabei die folgenden Eintrittswahrscheinlichkeiten:
x | 1 | 2 | 3 | 4 | 5 | 6 |
P(X = x) | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 |
Für eine diskrete Zufallsvariable X, welche die Werte x1, x2, …, xn mit den Wahrscheinlichkeiten P(X = xi) annimmt, berechnet man den Erwartungswert E(X) wie folgt:
\(\) \[E(X) = x_1 \cdot P(X = x_1) + x_2 \cdot P(X = x_2) + … + x_n * P(X = x_n)\]
In Worten: Der Erwartungswert ist die Summe aus allen Werten der Zufallsvariablen multipliziert mit deren Wahrscheinlichkeiten.
Für unser Beispiel bedeutet das:
\(\) \[E(X) = 1 \cdot \frac{1}{6} + 2 \cdot \frac{1}{6} + 3 \cdot \frac{1}{6} + 4 \cdot \frac{1}{6} + 5 \cdot \frac{1}{6} + 6 \cdot \frac{1}{6} = \frac{21}{6} = 3,5 \]
Das bedeutet, dass man langfristig beim Werfen eines einzelnen Würfels einen Wert von 3,5 erwarten kann.
Wie wird er für stetige Zufallsvariablen berechnet?
Wenn die Zufallsvariable in dem Experiment jeden Wert innerhalb eines gewissen Intervalls einnehmen kann, spricht man von einer stetigen Zufallsvariable. Stetige Zufallsvariablen sind beispielsweise Körpergrößen, die mittlere Temperatur in einem Kühlschrank oder die Geschwindigkeit eines Autos an einer Radarkontrolle. Stetige Zufallsvariablen treten vor allem dann auf, wenn der Wert durch ein Messverfahren zustande kommt und der Prozess durch Störgrößen beeinflusst wird.
Wenn wir den Erwartungswert für eine stetige Zufallsvariable berechnen wollen, können wir dies nicht tun, indem wir alle möglichen Werte der Zufallsvariablen multipliziert mit der entsprechenden Wahrscheinlichkeit aufsummieren, da es theoretisch unendliche viele Werte gibt, die die Variable annehmen kann. Deshalb wird die Wahrscheinlichkeitsverteilung einer Zufallsvariablen durch die Dichtefunktion beschrieben und deren Integral der Verteilungsfunktion. Diese kennen wir bereits von der Normalverteilung.
Die Verteilungsfunktion kann genutzt werden, um den Erwartungswert berechnen zu können. Dazu wird der Bereich, in dem die Zufallsvariable liegen soll als Intervallgrenzen genutzt.
Was ist ein Beispiel für die Nutzung des Erwartungswertes?
Die Kühlschranktemperatur variiert zwischen 0 und 4 Grad Celsius, wenn die Tür geöffnet wird oder weil Strom gespart werden soll. Viele moderne Kühlschränke lassen den Innenraum gezielt ein bisschen aufwärmen, bevor sie wieder starten zu kühlen, um möglichst effizient zu arbeiten und Strom zu sparen. Diese Schwankungen können durch diese Dichtefunktion beschrieben werden:
\(\) \[f (x) = \left\{
\begin{array}{ll}
-0,125x + 0,5 & 0 \leq x \leq 4 \\
0 & \, \textrm{sonst} \\
\end{array}
\right. \]
Wenn wir dafür das Intervall mit den Grenzen 0 und 4 berechnen, erhalten wir den Erwartungswert:
\(\) \[E(X) = \int_{0}^{4} x \cdot (-0,125x + 0,5) \text{dx} = \left[-124x³ + 14x²\right]_{ 0}^{ 4}= \frac{4}{3} – 0 = \frac{4}{3}\]
Somit beträgt die zu erwartende Temperatur im Kühlschrank etwa 1,3 Grad Celsius.
Welche Rechenregeln gelten?
In der Realität können auch mehrere Erwartungswerte zusammen genutzt werden. Bei der Anwendung in Kapitalmärkten beispielsweise ist die Entwicklung einer einzelnen Aktie der Erwartungswerte. Jedoch besteht ein Aktienportfolio aus vielen einzelnen Aktien, sodass es die Summe von vielen einzelnen Zufallsexperimenten darstellt. Von der mathematischen Betrachtung her gibt es einige Regeln, die man beim Umgang mit vielen Erwartungswerten beachten muss:
Für die Summe von Zufallsvariablen gilt die folgende Regel. Dabei sind die beiden Zufallsvariablen X und Y unabhängig voneinander.
\(\) \[E(X + Y) = E(X) + E(Y)\]
Für eine konstante Zahl d gilt:
\(\) \[E(d \cdot X) = d \cdot E(X)\]
Somit ergibt sich daraus auch, dass E(d) = d ist. Dies ist wenig verwunderlich, denn eine Konstante ist keine Zufallsvariable und man erwartet somit, dass diese immer den konstanten Wert d annimmt.
Für das Produkt aus zwei Erwartungswerten gilt analog zu der Summe:
\(\) \[E(X \cdot Y) = E(X) \cdot E(Y)\]
Was sind die Erwartungswerte von bekannten Zufallsverteilungen?
In der Statistik gibt es verschiedene Arten von Zufallsverteilungen, die in der Realität häufig vertreten sind. Deshalb haben diese besondere Namen und man sollte auch deren Erwartungswerte kennen.
Bernoulli-Verteilung
In vielen Fällen gibt es in einem Zufallsexperiment lediglich zwei mögliche Ausgänge. Beispielsweise beim Wurf einer Münze kann diese entweder auf der Zahl oder dem Kopf landen, unter der Annahme, dass sie nicht auf dem Rand landet. Die Bernoulli Verteilung beschreibt genau diese Arten von Zufallsfunktionen.
Der Erwartungswert der Bernoulli-Verteilung ist einfach die Wahrscheinlichkeit p für das Ereignis. Bei dem Münzwurf beispielsweise erwartet man zu 50 %, dass die Münze auf der Zahl landet.
Binomialverteilung
Für einen einzelnen Münzwurf wird die Wahrscheinlichkeit durch die Bernoulli-Verteilung beschrieben. Wenn man den Wurf jedoch mehrmals wiederholt ändert sich auch die Verteilung. Diese gilt immer dann, wenn ein Zufallsexperiment n Werte mit den Wahrscheinlichkeiten p annehmen kann. Beim Münzwurf ergeben sich die n-Werte durch die Wiederholung des Experiments und die verschiedenen Reihenfolgen von Münzpositionen, die sich durch das mehrmalige Werfen ergeben können.
Dabei ist der Erwartungswert einer Binomialverteilung einfach das Produkt aus der Anzahl der Wiederholungen n und der entsprechenden Eintrittswahrscheinlichkeit.
Wofür kann man den Erwartungswert nutzen?
Diese Kennzahl wird in den verschiedensten Anwendungen genutzt:
- Glücksspiel: Um herauszufinden, ob ein Spiel fair ist oder nicht wird der Erwartungswert berechnet, abhängig von den möglichen Spielausgängen. Wenn er größer als Null ist, spricht man von einem Spiel, das für den Spieler günstig ist, da er langfristig Geld gewinnen kann. Bei einem Erwartungswert kleiner 0 spricht man von einem ungünstigen Spiel, da der Spieler langfristig Geld verliert.
- Wirtschaft: In vielen betriebswirtschaftlichen Entscheidungssituationen sind Parameter involviert, die einer Wahrscheinlichkeit unterliegen. Wird die Maschine in den nächsten drei Monaten ausfallen? Wie wahrscheinlich ist es, dass ein bestimmter Mitarbeiter die Firma in den nächsten 12 Monaten verlässt? In solchen Situation wird der Erwartungswert berechnet, um feststellen zu können, ob ein Investment einen Gewinn abwerfen wird oder nicht.
- Kapitalmarkt: Auch hier müssen die Finanzinstitute mit vielen Unsicherheiten rechnen und können nicht fest von einem Kursgewinn oder -verlust ausgehen. Bei der Portfolioerstellung, also der Zusammenstellung von verschiedenen Aktien zu einem Portfolio, wird unter anderem auf den gewichteten Mittelwert vertraut.
Welche Herausforderungen gibt es bei der Nutzung des Erwartungswerts?
Der Erwartungswert ist ein nützliches mathematisches Instrument zur Berechnung des langfristigen Durchschnittswerts einer Zufallsvariablen. Er hat jedoch einige Einschränkungen, die beachtet werden müssen, darunter:
- Abhängig von Annahmen: Der Erwartungswert hängt von den Annahmen ab, die über die zugrunde liegende Wahrscheinlichkeitsverteilung getroffen wurden. Wenn die Annahmen falsch sind, kann der Erwartungswert den tatsächlichen Wert nicht genau wiedergeben.
- Keine vollständigen Informationen: Die Kennzahl gibt Aufschluss über die zentrale Tendenz einer Verteilung, aber nicht über die Form, die Streuung oder andere wichtige Merkmale der Verteilung.
- Kann irreführend sein: Die Zahl kann irreführend sein, wenn er zum Vergleich von zwei oder mehr Verteilungen verwendet wird. Beispielsweise können zwei Verteilungen den gleichen Erwartungswert haben, aber eine Verteilung kann eine viel größere Streuung aufweisen als die andere.
- Begrenzte Nützlichkeit bei nicht linearen Beziehungen: Der Erwartungswert setzt eine lineare Beziehung zwischen den Variablen voraus. Liegt eine nicht lineare Beziehung vor, liefert der Erwartungswert möglicherweise keine nützlichen Informationen.
- Er ist möglicherweise für die Entscheidungsfindung nicht relevant: Der Wert ist ein nützliches Instrument für die Analyse von Daten, aber er ist nicht immer die wichtigste Kennzahl für die Entscheidungsfindung. Andere Faktoren, wie Risiko und Ungewissheit, müssen unter Umständen berücksichtigt werden.
Zusammenfassend lässt sich sagen, dass der Erwartungswert zwar ein nützliches Instrument zur Berechnung des langfristigen Durchschnittswerts einer Zufallsvariablen ist, jedoch einige Einschränkungen aufweist, die berücksichtigt werden müssen. Zu diesen Einschränkungen gehören die Annahmen, die über die zugrunde liegende Wahrscheinlichkeitsverteilung gemacht werden, die begrenzten Informationen, die über die Verteilung bereitgestellt werden, und das Potenzial für irreführende Ergebnisse.
Das solltest Du mitnehmen
- Der Erwartungswert und das arithmetische Mittel (umgangssprachlich: Durchschnitt) sind nur in wenigen Grenzfällen dasselbe.
- Der Erwartungswert drückt aus, mit welchem Ergebnis man langfristig rechnen kann, wenn man ein Zufallsexperiment oft ausführt.
- Für diskrete Zufallsvariablen gilt: Der Erwartungswert ist die Summe aus allen Werten der Zufallsvariablen multipliziert mit deren Wahrscheinlichkeiten.
- Für stetige Zufallsvariablen nutzen wir die Verteilungsfunktion und bilden das Intervall für den Bereich, den wir untersuchen wollen.
Was ist Gibbs-Sampling?
Erforschen Sie Gibbs-Sampling: Lernen Sie die Anwendungen kennen und erfahren Sie, wie sie in der Datenanalyse eingesetzt werden.
Was ist ein Bias?
Auswirkungen und Maßnahmen zur Abschwächung eines Bias: Dieser Leitfaden hilft Ihnen, den Bias zu verstehen und zu erkennen.
Was ist die Varianz?
Die Rolle der Varianz in der Statistik und der Datenanalyse: Verstehen Sie, wie man die Streuung von Daten messen kann.
Was ist die KL Divergence (Kullback-Leibler Divergence)?
Erkunden Sie die Kullback-Leibler Divergence (KL Divergence), eine wichtige Metrik in der Informationstheorie und im maschinellen Lernen.
Was ist MLE: Maximum-Likelihood-Methode?
Verstehen Sie die Maximum-Likelihood-Methode (MLE), ein leistungsfähiges Werkzeug zur Parameterschätzung und Datenmodellierung.
Was ist der Varianzinflationsfaktor (VIF)?
Erfahren Sie, wie der Varianzinflationsfaktor (VIF) Multikollinearität in Regressionen erkennt, um eine bessere Datenanalyse zu ermöglichen.
Andere Beiträge zum Thema Erwartungswert
- Eine andere Herangehensweise mit Beispielen findest Du hier.