Der NiedersachsenTrend- richtig gelesen!

Am 22. Januar 2003 wurden vom NDR Umfrageergebnisse von Forsa zur bevorstehenden Landtagswahl in Niedersachsen veröffentlicht, die - richtig gelesen - so aussehen:

CDU SPD Bündnis90/Grüne FDP
43,6 - 52,4 31,6 - 40,4 4,8 - 9,2 2,8 - 7,2

Fazit: Die Union führt haushoch vor der SPD, aber Rotgrün kann möglicherweise die Wahl gewinnen, weil die FDP wieder an der 5%-Hürde scheitern könnte.

In der Sendung des NDR werden die Umfrageergebnisse als genau präsentiert, von Fehlern keine Rede. Der Internetseite von Infratest-dimap kann man allerdings entnehmen, daß die Zahlen höchst ungenau sind. Für große Parteien sollen die Fehler bis zu +/- 3,1% betragen, für kleine bis zu +/- 1,4%. In Wirklichkeit sind sie größer, denn die Fehler-Berechnung von Infratest-dimap ist falsch: Da wird klammheimlich und unverfroren vorausgesetzt, daß nur zwei Parteien an den Wahlen teilnehmen und daß die Wahlbeteiligung 100% beträgt. Die Fehler rühren wie erwähnt davon her, daß Infratest-dimap für die Umfrage 1000 Telefonnummern von Wahlberechtigten ausloste und dann eine Befragung durchführte. Wären aber andere Wahlberechtigte ausgelost und befragt worden, dann hätte das Umfrageresultat anders ausgesehen. Selbst wenn man nur die eingestandenen Fehler in Rechnung stellt - die von der Zufallsauswahl verursachten werden und unvermeidbar sind - , dann müßte das Umfrageergebnis wie folgt dargestellt werden:

CDU SPD Bündnis90/Grüne FDP
44,9 - 51,1 32,9 - 39,1 5,6 - 8,4 3,6 - 6,4

Damit wäre allerdings die Schlagzeile im NDR "Schwarz-gelb deutlich vorn " ad absurdum geführt worden, denn gemäß den eigenen Zahlen könnte Rotgrün die Wahl gewinnen, wenn die FDP wieder an der 5%-Hürde scheitert.


Technische Information:

Die in der gelben Tabelle angegeben Fehler, die durch die Zufallsauswahl der befragten Wahlberechtigten verursacht werden, kann man auch als Laie mit Hilfe der Mißerfolgs-Statistik von Umfragen verifizieren. Man gibt in der Input-Spalte (linke Seite der Tabelle) die von Infratest angeführten Parteistärken (CDU 48, SPD 36, FDP 5, Grüne 7 Prozent) ein. Um das Ergebnis nicht zu verfälschen, sollte man für die PDS den Wert 0 eingeben. Im Block oben rechts gibt man als "Anzahl der Wahlberechtigten pro Umfrage" 1000 an - laut NDR wurden von Infratest 1000 Wahlberechtigte in Niedersachsen vom 16. bis 20. Januar befragt. Für die Wahlbeteiligung setzt man 74% ein - das war nämlich bei den letzten beiden Niedersachsen-Wahlen der Fall (Der NiedersachsenTrend schweigt sich darüber aus, wie groß die Wahlbeteiligung gemäß Umfrage diesmal sein würde). Für die Anzahl der Umfragen wähle man zunächst 1000 - bei größeren Zahlen kann die Berechnung sehr lange dauern. Mit "LOS" wird die Simulation gestartet. In der unteren Tabellenzeile "Mißerfolgsstatistik" kann man das Resultat der Simulation ablesen. Es zeigt sich, daß etwa 89% der Umfragen die Toleranzen von +/- 4% für die großen und +/- 2% für die kleinen Parteien einhalten.
Detaillierte Ergebnisse kann man der Tabelle unten auf dieser Seite entnehmen: Es zeigt sich, daß knapp 95% der Umfragen die Toleranzen von +/- 4,4% bzw. +/- 2,2% einhalten. Aber 5% der Umfragen schaffen nicht einmal das. Mit anderen Worten: In jeder 20. Umfrage ist der Fehler für eine große Partei größer als +/- 4,4% oder für eine kleine Partei größer als +/- 2,2%!

Scherzfrage: Wie viele von 100 Umfragen schaffen es, die von Infratest vermarkteten Parteistärken (CDU 48, SPD 36, FDP 5, Grüne 7 Prozent) zu treffen?

Scherzfrage: Wie viele von 10000 Umfragen schaffen es, die von Infratest vermarkteten Parteistärken (CDU 48, SPD 36, FDP 5, Grüne 7 Prozent) zu treffen?

Maximale Abweichung
eingehalten von
für große Parteien für kleine Parteien (in Prozent von 100000 Umfragen)
1,0% 0,5% 8%
1,2% 0,6% 13%
1,4% 0,7% 19%
1,6% 0,8% 25%
1,8% 0,9% 33%
2,0% 1,0% 41%
2,2% 1,1% 48%
2,4% 1,2% 55%
2,6% 1,3% 62%
2,8% 1,4% 69%
3,0% 1,5% 74%
3,2% 1,6% 79%
3,4% 1,7% 83%
3,6% 1,8% 87%
3,8% 1,9% 89%
4,0% 2,0% 92%
4,2% 2,1% 94%
4,4% 2,2% 95%
4,6% 2,3% 96%
4,8% 2,4% 97%
5,0% 2,5% 98%
5,2% 2,6% 98,5%
5,4% 2,7% 98,9%
5,6% 2,8% 99,2%
5,8% 2,9% 99,4%
6,0% 3,0% 99,6%
>6% >3% 0,4%
Grundlage der Simulation: 100000 Wiederholungen, Parteistärken laut Infratest, ebenso Stichprobenumfang (1000) und Wahlbeteiligung (74%).