Statistische Auswertung in der Psychologie

Die wissenschaftlichen Psychologie ist eine empirische Wissenschaft. Das bedeutet, dass Theorien einerseits anhand von Beobachtungen gebildet werden. Andererseits werden Theorien jedoch auch mittels Beobachtungen überprüft. Dazu werden aus den Theorien prüfbare Hypothesen abgeleitet, welche dann mit unterschiedlichen Untersuchungsmethoden getestet werden können.

Bei diesen Methoden kann es sich beispielsweise um Experimente, Fragebögen oder Beobachtungen handeln. Egal um welche Methode es sich handelt, alle sammeln Daten. Diese Daten werden durch statistische Verfahren ausgewertet, um anschließend die angenommene Hypothese zu bestätigen – oder eben nicht. Wenn die Hypothese verworfen wird, steht auch die Theorie auf einem zunehmend wackliger werdenden Fundament. Werden die aus einer Theorie abgeleiteten Hypothesen allerdings bestätigt, wird auch die Theorie untermauert. Einen ersten Einblick in die statistische Auswertung soll dieser Artikel liefern.

Inhalt

1 Daten können zum Beispiel per Fragebogen erhoben werden
2 Datenbeschreibung mittels der Maße der zentralen Tendenz und der Variabilität
- 2.1 Maße der zentralen Tendenz
- 2.2 Maße der Variabilität
3 Statistische Signifikanz
4 Was ist ein signifikanter Unterschied?
- 4.1 Zwei Fragen zum Schluss
5 Zusammenfassung

Daten können zum Beispiel per Fragebogen erhoben werden

Nehmen wir an, es sollten sich im Rahmen einer Studie rund 300 Menschen per Fragebogen zu einem bestimmten Thema äußern.
Viele Fragebögen sind so aufgebaut, dass den Befragten Argumente dargelegt werden, unter oder neben denen sich eine Skala befindet. Die befragte Person kreuzt dann an, wie sehr sie der Aussage zustimmt oder es ablehnt. Dabei kann es sich beispielsweise um eine Skala mit 5 Punkten handeln. Diese Skalen sind abgestuft, von 1 für „trifft gar nicht zu“ bis 5 „trifft vollkommen zu“.

Wenn die Befragten nun alle Bögen ausgefüllt und abgegeben haben, werden diese sogenannten Rohdaten zunächst gesammelt und geordnet. Dafür kann zum Beispiel ein einfaches Säulendiagramm genutzt werden, welches die Verteilung der Werte anzeigt.

Datenbeschreibung mittels der Maße der zentralen Tendenz und der Variabilität

Maße der zentralen Tendenz

Es gibt verschiedene Maße der zentralen Tendenz. Mit ihrer Hilfe wird die Gesamtmenge der Werte dargestellt, welche sich aus den zuvor gesammelten Daten ergeben. Es werden mehrere Maße der zentralen Tendenz unterschieden: Modalwert, Mittelwert und Median.

Der Modalwert ist der einfachste Wert. Es handelt sich dabei lediglich um die Zahl beziehungsweise den Wert, der am häufigsten in der Datenmenge zu finden ist. Der Median hingegen teilt die Daten in zwei Hälften auf. Dabei liegt der Median in der Mitte zwischen den ersten 50 Prozent und den zweiten 50 Prozent. Er entspricht daher dem 50. Perzentil (Prozentrang).

Das bekannteste Maß ist allerdings der Mittelwert. Er wird auch als arithmetisches Mittel bezeichnet und entsteht aus der Summe aller Werte, welche anschließend durch die Gesamtzahl der Werte geteilt wird.

Diese Maße unterscheiden sich in ihrer „Stabilität“. So kann sich der Mittelwert durch einige Extremwerte bereits verschieben. Der Median ist gegenüber solchen Ausreißern unempfindlicher.

Maße der Variabilität

Die Maße der zentralen Tendenz liefern uns bereits einige Informationen über unseren Datensatz. Allerdings ist die Variabilität der Daten auch noch von Interesse. Diese wird auch als Streuung bezeichnet und gibt an, wie weit die unterschiedlichen Daten auseinander liegen. Rein vom Informationsgehalt her könnte man auch sagen: Die Maße der zentralen Tendenz beziehungsweise die Mittelwerte der Daten sagen mehr aus, je geringer die Variabilität der Daten ist.

Mit der Variationsbreite ist der Abstand beziehungsweise die Differenz zwischen dem höchsten und den niedrigsten Wert einer Verteilung gemeint. Allerdings liefert die Variationsbreite keine sehr genaue Schätzung. Sie spiegelt die Spannbreite an Werten wider, die sich stark unterscheiden können. So kann es auch dazu kommen, dass sogenannte „Ausreißer“ das Bild von einer eigentlich recht einheitlichen Gruppe an Werten fälschlicherweise verzerren.

Mittels der Standardabweichung lässt sich besser erfassen, wie stark sich die Werte in der Verteilung voneinander unterscheiden. Da für ihre Berechnung Informationen jedes einzelnen Messwerts genutzt werden, lässt sich die Nähe der Daten zueinander eher erkennen. Für die Standardabweichung ist es relevant, wie stark sich jeder einzelne Wert von dem gesamten Mittelwert unterscheidet.

Hierzu ein Beispiel: Für viele Studiengänge kann man sich nur mit einem bestimmten Notendurchschnitt einschreiben. Würdest du nun in so einem Studiengang einen Test zum Bildungsniveau durchführen, bekämst du das Ergebnis einer recht homogenen Gruppe. Der Wert jedes Einzelnen würde sich nicht sonderlich stark vom Mittelwert der gesamten Gruppe unterscheiden. Anders sähe es aus, wenn du denselben Test in der Fußgängerzone mit beliebigen Passanten machen würdest. Vielleicht käme ein ähnlicher Mittelwert wie beim ersten Test heraus. Doch die Gruppe ist wesentlich durchmischter und die individuellen Werte der Einzelpersonen können stark von diesem abweichen.

Mit anderen Worten: In der studentischen Gruppe würden sich vermutlich alle Befragten eng um den Mittelwert herum bewegen. Bei der Gruppe in der Fußgängerzone wäre die Streuung um den Mittelwert größer, da unter den Befragten Menschen mit sehr niedrigem, mittlerem oder sehr hohem Bildungsniveau sein können.

Warum die Standardabweichung ein wichtiges Thema ist, zeigt die unendliche Fülle an Daten. Dabei unterliegen viele Sorten von Datenmengen einer Normalverteilung. Dazu gehören beispielsweise die Werte zu Intelligenz oder Größe und Gewicht. Diese und andere Werte bilden eine symmetrische und glockenförmige Kurve, welche als Normalverteilung bezeichnet wird.

Die „Spitze“ dieser Kurve stellt den Mittelwert dar, um den sich die meisten anderen Werte der Verteilung bewegen. So liegen links und rechts neben dem Durchschnittswert rund 68 Prozent der anderen Werte. Die Kurve wird nach links und rechts immer flacher. Das bedeutet nichts anderes als dass sich in diesen Extrembereichen immer weniger Werte befinden. Es befinden sich zudem etwa 95 Prozent der Werte innerhalb von zwei Standardabweichungen.

Um das Ganze etwas zu veranschaulichen, nehmen wir die Ergebnisse eines Intelligenztests als Beispiel. Wenn der Mittelwert bei 100 liegt, erzielen 68 Prozent der Getesteten einen Wert, der sich im Bereich zwischen 85 (100 minus 15) und 115 (100 plus 15) bewegt. Diese 68 Prozent zählen zu den 95 Prozent der Getesteten, die sich noch innerhalb von zwei Standardabweichungen befinden – also im Intelligenzwertbereich von 70 bis 130.

Statistische Signifikanz

Mit der Signifikanz ist die Wahrscheinlichkeit gemeint, mit der das Untersuchungsergebnis dem Zufall geschuldet ist. Bei der Datenerhebung und -auswertung kommen eine Menge Informationen zum Vorschein. Diese können auf Zusammenhänge zwischen bestimmten Ereignissen hindeuten. Dennoch stellt sich dabei die Frage, ob diese Ergebnisse wirklich zutreffend sind oder nicht doch einfach purer Zufall. Um die Aussagekraft von Ergebnissen zu prüfen, kann neben der Signifikanz auch noch die Reliabilität herangezogen werden. Ob ein Ergebnis reliabel und damit zuverlässig ist, hängt von verschiedenen Faktoren ab.

Zum einen sollte die Stichprobe, aus der die Daten gewonnen wurden, möglichst repräsentativ sein. Damit ist gemeint, dass die untersuchte Gruppe heterogen ist und viele verschiedene Menschentypen in sich vereint. Nur so lässt sich von der Stichprobe auf eine größere Population schließen. Das im Abschnitt zur Standardabweichung genannte Beispiel zeigt das recht deutlich: Du kannst die Ergebnisse des Bildungsniveautests, den du mit der Studierendengruppe gemacht hast, nicht auf die Gesamtbevölkerung übertragen. Die Gruppe der Befragten ist zu einseitig, um repräsentativ für alle anderen Menschen zu stehen.

Zum anderen spielt die Variation der Beobachtung eine Rolle. Du hast weiter oben die Streuung kennengelernt. Ein Durchschnittswert ist zuverlässiger, wenn die Streuung gering ausfällt.

Außerdem ist die Anzahl der Fälle entscheidend und damit die Größe der Stichprobe. Die Ergebnisse sind zuverlässiger, wenn sie sich auf eine große Datenmenge beziehen. Schlussfolgerungen anhand von Einzelfällen sind weniger reliabel, da sie nur wenig Informationen mit sich bringen.

Was ist ein signifikanter Unterschied?

Ergebnisse sollten mit Signifikanztests geprüft werden. Diese geben Aufschluss darüber, wie groß der Zufallsanteil an den gefundenen Ergebnissen wahrscheinlich ist. Wenn sich zwei Stichproben im selben Test stark voneinander unterscheiden könnte das am Zufall oder an dem Merkmal liegen, das die Gruppen voneinander unterscheidet.

Welche Idee steckt hinter der Signifikanz? Die Mittelwerte der Stichproben sollten reliabel sein und der Unterschied zwischen diesen Mittelwerten relativ groß. In diesem Fall ist von einer statistischen Signifikanz die Rede. In der Psychologie gibt es verschiedene Regeln, ab wann ein Ergebnis als signifikant gilt. Meist bewegen sich die Zufallswahrscheinlichkeiten von 0,1 bis 5 Prozent.

Zwei Fragen zum Schluss

Wie können die Maße der zentralen Tendenz und der Variabilität Daten beschreiben?
Bei einem Maß der zentralen Tendenz handelt es sich um einen Wert, der alle Werte der Gesamtmenge repräsentiert. Hierzu zählen der Modalwert, der Mittelwert und der Median. Die Variabilitätsmaße geben an, wie stark sich die Daten voneinander unterscheiden. Es gibt zwei Maße der Variabilität: Variationsbreite und Standardabweichung.

Wie kann man feststellen, ob sich ein beobachteter Unterschied von der Stichprobe auf eine Population übertragen lässt?
Hier spielt die Repräsentativität eine Rolle. Außerdem müssen die beobachteten Werte eine geringe Variation aufweisen und die Stichprobe sollte relativ groß sein. Aus wenigen Einzelfällen lassen sich keine verlässlichen Schlüsse ziehen. Außerdem sollten die Ergebnisse statistisch signifikant sein. Unterschiede zwischen untersuchten Gruppen dürfen also kein Produkt des Zufalls sein. Stattdessen müssen die Unterschiede in den Ergebnissen auf die verschiedenen Merkmale der jeweiligen Gruppen zurückgehen.

Zusammenfassung

Da die Psychologie eine empirische Wissenschaft ist, nutzt sie bei der Datenauswertung statistische Verfahren.
Zur Datensammlung bieten sich verschiedene Verfahren an, ein Beispiel sind Fragebögen.
Die anhand von Skalen erhobenen Daten werden geordnet und statistisch ausgewertet. Zur ersten Übersicht über die Verteilung der Daten in der Stichprobe dienen die Maße der zentralen Tendenz und der Variabilität.
Die Maße der zentralen Tendenz umfassen den Median, den Modalwert und den Mittelwert.
Zu den Variabilitätsmaßen gehören die Variationsbreite und die Standardabweichung.
Die Maße der zentralen Tendenz geben einen Wert an, der stellvertretend für alle Werte der Stichprobe steht.
Hingegen geben die Maße der Variabilität die Unterschiede zwischen den Daten an.
Um die Zuverlässigkeit der Ergebnisse einschätzen zu können, sind Reliabilität und Signifikanz wichtige Faktoren.
Bei der Reliabilität geht es darum, dass die Stichprobe möglichst repräsentativ und ausreichend groß ist.
Mit der Signifikanz ist die Wahrscheinlichkeit gemeint, dass die Ergebnisse nicht zufällig sind. Stattdessen basieren die Unterschiede zwischen den untersuchten Gruppen auf deren jeweiligen Merkmalen.

Über den Autor

Folge Sciodoo und bleibe stets auf dem Laufenden. Schließ dich uns an und abonniere unseren Instagram-Kanal ein. Wir stellen täglich neue Artikel für dich rein. Weiter zum Kanal>>>