XI Schlußfolgerungen 

Die statistischen Grundlagen von Wahlprognosen und Meinungsumfragen basieren u.a. auf dem sogenannten schwachen Gesetz der großen Zahlen, vor allem aber auf dem unersättlichen Bedarf der zahlengläubigen Demoskopie-Endverbraucher.

Als Meßinstrument dient den Meinungsforschungs-Instituten eine Elle, nämlich die "schwach repräsentativen" Tausender-Querschnitte, die mit einem nicht gerade stubenreinen Zufallsverfahren erstellt werden. Sie suggerieren aber durch die Präsentation ihrer Resultate, sie könnten damit Millimeter-Bruchteile messen, als hätten sie eine Schieblehre.

Nach den Gesetzen der Statistik ist jedes Meßresultat auch ein potentielles Miß-Resultat. Weil

  1. die Ausfälle und Verzerrungen unkontrollierbar sind,
  2. die Elle gegenüber den Schwächen der Interviewer und des Fragebogens immun ist,
  3. bei der Zufallsauswahl aus Kostengründen erhebliche Abstriche gemacht werden,
  4. kein Demoskop das Ausmaß des auslosungsbedingten Spielraums eingestehen will und kann,

wird aus Furcht vor dem Mißresultat der untaugliche Versuch gemacht, das Meßresultat mit dem Gewichtungs-Vorschlaghammer ins Lot zu rücken. Wen wundert es dann, wenn diese "Hau den Lukas"- Prognosen nicht immer auf dieser Welt landen?

Wenn ein Wahlforscher oder ein Meinungsforscher eine Prozentzahl nennt - mit oder ohne Nachkommastelle - oder eine solche dem Auftraggeber zum freien öffentlichen Gebrauch überläßt, dann ist dies unlauterer Wettbewerb, wahrscheinlich sogar Betrug. Er weiß doch ganz genau, daß er mit seinen Methoden grundsätzlich nicht in der Lage ist - auch unter idealen Voraussetzungen nicht -, eine gesicherte Prozentzahl zu ermitteln. Er hat Bereiche für die auslosungsbedingten Abweichungen seiner Ergebnisse und die zugehörige Chance anzugeben und auf die anderen Fehlerquellen hinzuweisen. Das Meßverfahren ist ausreichend zu beschreiben, damit eine Beurteilung der Resultate möglich wird.

Die von der Gewichtung und dem Mißbrauch des Begriffes "repräsentativer Querschnitt" ausgehende Gefahr für die Öffentlichkeit liegt nicht so sehr in der Manipulation, denn die bevorstehenden Wahlen und die Rückwirkung von Fehlprognosen auf das umsatzmäßig dominante kommerzielle Alltagsgeschäft wirken ausreichend als Korrektiv, oft sogar schon als Über-Korrektiv.

Die eigentliche Gefahr besteht in der nicht beabsichtigten Irreführung durch Falsch-Informationen als Folge einer mißglückten Gewichtung und des Verschweigens der unvermeidlichen Fehler, die durch das Interview und die Auslosung des repräsentativen Querschnittes verursacht werden. Man gibt vor, etwas wissenschaftlich gemessen zu haben, während man in Wirklichkeit nur spekuliert hat.

Besondere Bedeutung kommt der Tatsache zu, daß durch die Gewichtung der Umfrageergebnisse die unabhängige Berichterstattung der verschiedenen Meinungs-forschungsinstitute zerstört wird. Welches Institut wagt es schon, auf die Dauer Umfrageergebnisse herauszugeben, die sich wesentlich vom Gros der anderen Institute unterscheiden? Die Rohergebnisse sind und bleiben zwar "unabhängige Zeugen", aber durch den Konformitätsdruck werden diese Zeugen mit der Gewichtung oft mundtot gemacht. Die Ausschaltung der unabhängigen Berichterstattung hinterläßt keine Spuren, weil das Ausmaß der Abänderung verschwiegen wird und damit die Symptome des Angleichungsprozesses unterdrückt werden. Meines Erachtens gehen die Kollektiv-Fehlprognosen zum Teil auf diesen "Meinungsklimadruck" unter den Instituten zurück. Die Rohdaten möglichst vieler Institute über einen längeren Zeitraum stellen die bestmögliche Information dar.

Die für die Öffentlichkeit bestimmten Wahlprognosen werden meist mit besonderem Aufwand betrieben, weil sie durch die Wahl überprüft werden und der Ruf des Instituts dabei auf dem Spiel steht. Um beim gegenwärtigen Kräfteverhältnis in der Bundesrepublik politisch interessante Aussagen betreffend der Stärken der vier relevanten Parteien machen zu können, ist eine Genauigkeit erforderlich, die die Möglichkeiten der Demoskopie weit übersteigt. Diese Genauigkeit läßt sich, wie in diesem Artikel dargelegt wurde, auch mit erhöhten Aufwand nicht erreichen, denn der erforderliche Stichprobenumfang ist praktisch nicht realisierbar und der Interviewfehler wird dadurch nicht aus der Welt geschafft. Wegen des auslosungsbedingten Spielraums vermögen Meinungsumfragen kaum mehr an gesicherter Information zu liefern, als was man aufgrund der relativen politischen Stabilität in der Bundesrepublik ohnehin schon weiß. Graphische Darstellungen des zeitlichen Verlaufs von Parteistärken, Popularitätswerten usw. sollte man im allgemeinen als Zeichentrickfilme oder "Comic strips" betrachten.

Der Unterschied zwischen den Meinungsforschungsinstituten in der Wahlforschung besteht hauptsächlich darin, daß die einen mit mehr Glück und einem etwas besseren Riecher als die anderen spekulieren, wobei nicht zu bestreiten ist, daß Frau Noelle-Neumann der Konkurrenz manchmal um eine Nasenbreite voraus ist. Aber Spekulation bleibt es allemal.

Entscheidend für Erfolg bzw. Mißerfolg von Prognosen sind die politische Stabilität, der gute Riecher bzw. etwas Glück bei der Gewichtung und die Launen des Zufalls. Mit Wissenschaft hat das Ganze nichts zu tun, die "Wissenschaft" dient lediglich als Aushängeschild.

Bei kommerziellen Umfragen schlägt keine Stunde der Wahrheit, gibt es keine Wahl. Wehrlos ist ein Auftraggeber allerdings nicht. Er kann als Teil seines Auftrages verlangen, daß Wiederholungen der Befragung simuliert werden, wie dies auf S. III/16-19 dargestellt wurde. Bei den handelsüblichen Meinungsumfragen mit einigen hundert bis 2000 Interviews werden dann viele der oft zu Hunderten abgelieferten, angeblich so harten Zahlen wie Butter unter der Simulations-Sonne schmelzen. Dann werden die durch die Auslosung des "repräsentativen Querschnittes" verursachten Abweichungen in einer Weise zu Tage treten, welche die in den Abschnitten VI bis IX angeführten Spielräume als vergleichsweise "mustergültig" erscheinen lassen. Je mehr Fragen in einer "Repräsentativumfrage" gestellt werden und je umfangreicher die Antwortmöglichkeiten sind, desto mehr weicht der "repräsentative Querschnitt" von einem Miniaturbild ab. Nicht nur weil die Länge des Fragebogens bei den Interviewern und Befragten Erschöpfungssymptome auslöst, sondern weil die statistische Qualität ausgehöhlt wird. Aufgrund vorläufiger Resultate ist mit einer Vergrößerung der Konfidenzintervalle ( = lotteriebedingte Spielräume ) um bis zu einem Faktor zwei und mehr zu rechnen. Dies wird demnächst ausführlich behandelt werden.

Als Auftraggeber würde ich kommerzielle Umfragen grundsätzlich bei zwei verschiedenen Instituten in Auftrag geben - um grobe Fehler eher diagnostizieren zu können - und dabei sicherstellen, daß die Institute, was die Meßmethoden betrifft, unabhängig voneinander arbeiten. Unterschiede von ein bis zehn Prozent sind - je nach Anzahl und Umfang der gestellten Fragen und Größe des repräsentativen Querschnittes (1000-2000) - nicht als signifikant, sondern als methodenbedingt zu betrachten.

 

weiter zu "XII. Nachwort, Danksagung und Zusammenfassung"

zurück zu "X. Die Gewichtung"

zurück zum Inhaltsverzeichnis

zurück zum Archiv