Der Generator hat 30 Kippschalter. Die Reihe beginnt mit 15 Volt und endet mit 450 Volt. Über dem ersten Schalter ist ein Schild angebracht: "Leichter Schock". Über dem 30. Schalter steht: "Achtung: Schwerer Schock".
Bevor das Experiment begann, prognostizierten mehrere Psychologen, dass im Schnitt nur eine von 1000 Personen den 30. Schalter betätigen würde, und bei dieser Person könne es sich nur um einen "krankhaften Sadisten" handeln. Als das Experiment vorbei war, waren im Protokoll folgende Zahlen zu lesen: 26 der 40 Versuchspersonen hatte den Schalter für den "schweren Schock" betätigt.
Das Experiment wurde in den frühen 1960er Jahren vom Psychologen Stanley Milgram an der Yale-Universität in den USA durchgeführt. Milgram wollte herausfinden, wie Menschen Konflikte zwischen der eigenen Moral und den Forderungen einer Autorität lösen. Überspitzt formuliert: Er wollte wissen, ob man mit Befehlen das Gewissen brechen kann.
Der Versuchsaufbau wurde mehrfach variiert, folgte aber immer dem gleichen Prinzip. Es gab jeweils einen Versuchsleiter, einen Schüler und einen Lehrer. Der Versuchsleiter überwachte den Ablauf und gab dem Lehrer Instruktionen. Der Lehrer stellte dem Schüler Fragen und bestrafte ihn für jede falsche Antwort mit einem Stromschlag. Bei jedem Fehler steigerte der Lehrer die Intensität des Stromschlags um 15 Volt. Dachte er jedenfalls – man hatte ihm vorher erzählt, dass es darum ginge, den Zusammenhang zwischen Bestrafung und Lernerfolg zu erforschen.
In Wirklichkeit gab es gar keine Stromschläge und die Schmerzensschreie der Schüler waren nur gespielt. Die eigentlichen Versuchspersonen waren die Lehrer. Ziel des Versuchs war es, herauszufinden, wie lange sie weitermachen würden. Und obwohl viele der Lehrer während des Versuchs Bedenken äußerten, konnte der Versuchsleiter zwei Drittel von ihnen dazu bringen, bis zum Ende zu gehen – sie alle legten den 450-Volt-Schalter um.
Das Milgram-Experiment wird bis heute als Beispiel für die experimentelle Psychologie angeführt. Es wurde in mehreren Ländern wiederholt, die Ergebnisse waren ähnlich. Und damit galt der Versuch als reproduzierbar. Um als wissenschaftlich haltbar zu gelten, muss ein psychologisches Experiment wiederholbar sein – ein ähnlicher Versuchsaufbau sollte ähnliche Versuchsergebnisse liefern.
Um diese Reproduzierbarkeit zu gewährleisten, ist es wichtig, potentielle Störfaktoren zu identifizieren und zu kontrollieren beziehungsweise zu eliminieren. Störfaktoren sind Variablen, die das Ergebnis eines Experiments auf unerwünschte Art und Weise beeinflussen. Idealerweise gibt es in einem psychologischen Experiment nur zwei Variablen: eine unabhängige und eine abhängige. Die unabhängige Variable ist ein Impuls, der vom Versuchsleiter erzeugt wird, um dann die Reaktion bei der Versuchsperson zu beobachten – diese Reaktion ist die abhängige Variable. Ein Störfaktor ist eine dritte Variable, die entweder die unabhängige oder die abhängige Variable verändert.
Da ein Experiment aber darauf abzielt, Zusammenhänge zwischen unabhängigen und abhängigen Variablen zu ermitteln, müssen mögliche Störfaktoren erkannt und dann überwacht beziehungsweise ausgeschlossen werden. Andernfalls könnten sie die zu ermittelnden Zusammenhänge zwischen unabhängigen und abhängigen Variablen verschleiern oder verfälschen. Das wäre fatal, denn diese Zusammenhänge zwischen Ursache und Wirkung, die sogenannte Kausalität, stellen normalerweise den eigentlichen Erkenntnisgewinn eines Experiments dar.
Im Fall des Milgram-Experiments sollten die unabhängigen Variablen die Anweisungen des Versuchsleiters und die Reaktionen des Schülers sein. Die abhängige Variable war das Verhalten des Lehrers. Ein möglicher Störfaktor wäre es gewesen, wenn die Schmerzensschreie des Schülers mal lauter, mal leiser ausgefallen wären. Ob allerdings die Anweisungen des Versuchsleiters wirklich standardisiert und damit frei von Störfaktoren waren, zogen spätere Autoren in Zweifel und forderten eine Neubewertung der Milgram-Ergebnisse.
Denn nur wenn in einem Experiment die Störfaktoren möglichst effizient kontrolliert werden, erfüllt es die Bedingung der internen Validität – es können also gültige Aussagen über die Zusammenhänge von unabhängigen und abhängigen Variablen gemacht werden. Um dieses Ziel zu erreichen, bedarf es einer sorgfältigen wissenschaftlichen Methodik.
Eine Möglichkeit, die Störfaktoren zu kontrollieren ist die Unterteilung der Versuchspersonen in eine Kontroll- und eine Experimentalgruppe. Wichtig dabei ist, dass die Verteilung der Versuchspersonen auf die beiden Gruppen zufällig erfolgt – nur dann handelt es sich bei dem Versuch um ein Experiment. Bei einer bewussten, also nicht zufälligen Verteilung der Versuchspersonen auf die beiden Gruppen spricht man hingegen von einem Quasi-Experiment.
Nach der Aufteilung der Versuchspersonen wird bei der Experimentalgruppe ein Impuls gesetzt. Das bedeutet, dass die unabhängige Variable verändert wird, um dann den Effekt auf die abhängige Variable zu beobachten. Bei der Kontrollgruppe wird kein Impuls gesetzt – die unabhängige Variable bleibt also unverändert. Sollte es bei der Kontrollgruppe aber dennoch einen Effekt auf die abhängige Variable geben, liegt irgendwo ein Störfaktor vor. Beim Milgram-Experiment gab es trotz verschiedener Variationen des Versuchsaufbaus keine Kontrollgruppe, sondern nur eine Experimentalgruppe, bestehend aus den Lehrern.
Statt die Störfaktoren zu kontrollieren, gibt es auch die Möglichkeit, sie weitestgehend auszuschließen. Die besten Voraussetzungen dafür bietet das Laborexperiment. Wenn ein Psychologe ein Experiment in einem Labor durchführt, kann er fast alle Bedingungen selbst bestimmen und damit die Zahl der möglichen Störfaktoren sehr gering halten. Dies ist die Variante, für die Stanley Milgram sich entschied.
Das Gegenteil des Laborexperiments ist das Feldexperiment – hier begibt sich der Psychologe in die natürliche Umgebung der Versuchspersonen und führt dort sein Experiment durch. Da er nur geringen Einfluss auf die äußeren Bedingungen nehmen kann, ist die Zahl der potentiellen Störfaktoren höher als im Laborexperiment. Die interne Validität ist also schwerer zu gewährleisten. Der Vorteil des Feldexperiments liegt in der besseren Verallgemeinerbarkeit der Ergebnisse: Da sich die Versuchspersonen in ihrer natürlichen Umgebung befinden, lassen sich bei einem Feldexperiment eher Rückschlüsse auf die Wirklichkeit ziehen, als es bei einem Laborexperiment mit seiner künstlichen Umgebung möglich wäre.
Ein weiteres Gütekriterium von psychologischen Experimenten ist neben der internen die externe Validität. Mit externer Validität ist die Übertragbarkeit der Ergebnisse von den Versuchspersonen auf andere Personen gemeint. Um diese externe Validität zu gewährleisten sollte die Gruppe der Versuchspersonen bezüglich des Alters, des Geschlechts, der Herkunft etc. eine ähnliche Zusammensetzung aufweisen wie die Gruppe der Personen, über die man mit dem Experiment letztlich Erkenntnisse gewinnen will.
Beim klassischen Milgram-Experiment war die Gruppe der Versuchspersonen recht homogen. Es handelte sich um Männer im Alter zwischen 20 und 50 aus der Gegend um New Haven, Connecticut. Eine Übertragung dieser Ergebnisse auf alle Amerikaner und Amerikanerinnen oder gar die Weltbevölkerung war also nicht möglich. Allerdings führte Milgram das Experiment in der Folge auch mit Versuchspersonen durch, die andere Persönlichkeitsmerkmale aufwiesen als die Teilnehmer am ursprünglichen Experiment. Unter anderem nahmen auch Frauen die Rolle der Lehrerinnen ein. Es zeigte sich, dass diese ähnlich häufig bereit waren, die Schüler auf Befehl mit schweren Schocks zu bestrafen.
Andere Wissenschaftler wiederholten das Experiment außerdem in Europa, Australien und Afrika und erzielten ähnliche Resultate wie Milgram. Angesichts dieser Ergebnisse liegt also die Vermutung nah, dass Milgrams klassisches Experiment, trotz seiner mangelnden externen Validität und der späteren Kritik, durchaus Rückschlüsse auf die Autoritätshörigkeit der Menschen im Allgemeinen zulässt.
Neben diesen methodischen Vorgaben, die empirisch einwandfreie Experimente erfüllen müssen, gibt es noch einen weiteren Punkt, den Psychologen bei der Planung und Durchführung von Experimenten berücksichtigen sollten: die Ethik. Prinzipiell gilt es als unethisch, Versuchspersonen zu schädigen oder zu täuschen
Diese ethischen Maßstäbe scheinen aber bis zu einem gewissen Grad auch subjektiver Art zu sein. Bezüglich des Milgram-Experiments etwa gibt es verschiedene Ansichten. Dr. Hans Ueckert, emeritierter Professor im Fachbereich für Psychologie der Universität Hamburg, findet das Experiment ethisch einwandfrei: "Täuschen muss man die Versuchspersonen in der experimentellen Psychologie fast immer. Und eine dauerhafte Schädigung hat meiner Meinung nach nicht stattgefunden."
Dr. Anita Jain, wissenschaftliche Mitarbeiterin am Department Psychologie der Universität zu Köln, ist anderer Ansicht. Dass die Versuchspersonen über das wahre Ziel des Experiments getäuscht wurden, findet sie schon problematisch – räumt jedoch ein: "Das ist zwar ein ethisches Problem, aber manchmal geht es eben nicht anders." Was ihrer Ansicht nach viel schwerer wiegt, ist die Tatsache, dass Milgram eine Schädigung der Versuchspersonen in Kauf genommen hat: "Man darf keine negative Veränderung ihrer Persönlichkeit verursachen." Genau das könnte ihrer Ansicht nach aber geschehen sein: "Bei den Versuchspersonen sind vermutlich schwere Schuldgefühle erzeugt worden." Und das, betont sie, sei ethisch sehr bedenklich.