Inhaltsverzeichnis
von Erik Kirst, Berater für Statistik und professionelle Datenanalysen, Inhaber von PHIMEA
Welche Skalenniveaus gibt es?
In der medizinischen und sozialwissenschaftlichen Forschung hat man es oft mit Daten zu tun, die nur nominales oder ordinales Niveau aufweisen – im Gegensatz zu metrischen Daten. Zur Erinnerung: Wir unterscheiden bei Variablen grob zwischen 3 sogenannten Skalenniveaus: Bei nominalen Merkmalen, wie z. B. dem Geschlecht, einer Partei oder einem Ort können wir nur Unterschiede ausmachen, also Aussagen darüber tätigen, ob etwas gleich oder ungleich ist. Ordinale Variablen erlauben darüber hinaus noch, eine Rangfolge festzulegen, wie z. B. der Einlauf beim Pferderennen oder auch Schulnoten.
Metrische Variablen, die noch weiter in Intervall-, Verhältnis- und Absolutskala eingeteilt werden können, bieten aus statistischer Sicht die besten Eigenschaften. Beispiele dafür sind z. B. das Alter in Jahren, die Zeit in Sekunden, die Anzahl an Fehlern in einem Test oder der Blutdruck in mmHg.
Worum es in diesem Blog gehen soll
In diesem Artikel wollen wir uns mit sogenannten kategorialen Variablen befassen, damit meint man die Zusammenfassung nominaler und ordinaler Merkmale. Letztere allerdings nur dann, wenn es nicht zu viele Ausprägungen gibt, wie z. B. bei Altersklassen. Kategoriale Merkmale werden meist über Häufigkeiten ausgewertet, also wie oft eine bestimmte Ausprägung aufgetreten ist. Hier unterscheiden wir zwischen der absoluten Häufigkeit (= Fallzahl N) und der relativen Häufigkeit (= Anteil in %). Geht es uns darum, eine Abhängigkeit zwischen 2 kategorialen Merkmalen zu untersuchen, sind Kreuztabellen eine geeignete statistische Methode. Darüber hinaus kann neben der rein deskriptiv-explorativen Darstellung auch ein Signifikanztest eingesetzt werden, wie wir später sehen werden.
Ein empirisches Beispiel
In unserem fiktiven Szenario geht es um den Zusammenhang zwischen dem Geschlecht und dem ausgeübten Beruf in einem Krankenhaus. Wir halten es mit Absicht einfach und gehen bei beiden Variablen davon aus, dass sie nur 2 Stufen haben: Das Geschlecht ist entweder weiblich oder männlich, der Beruf im Krankenhaus Krankenschwester (-pfleger) oder Arzt/Ärztin. Im örtlichen Krankenhaus haben wir das Personal bezüglich dieser beiden Variablen untersucht und stellen die gefundenen Ergebnisse in einer Kreuztabelle dar:
Geschlecht | Gesamt | ||||
Frauen | Männer | ||||
Beruf | Krankenschwester/-pfleger | N | 68 | 34 | 102 |
% | 81.9 % | 59.6 % | 72.9 % | ||
Arzt/Ärztin | N | 15 | 23 | 38 | |
% | 18.1 % | 40.4 % | 27.1 % | ||
Gesamt | N | 83 | 57 | 140 | |
% | 100.0 % | 100.0 % | 100.0 % |
Insgesamt konnten 140 Mitarbeiter bezüglich des Berufs und des Geschlechts untersucht werden. Davon sind N = 83 Frauen (59.3 %) und N = 57 Männer (40.7 %). Darüber hinaus gibt es wie zu erwarten deutlich mehr Krankenschwestern (N = 102) und -pfleger als Ärzte bzw. Ärztinnen (N = 38). Diese Betrachtungen waren bisher nur univariat, das heißt, wir haben jede Variable nur für sich betrachtet.
Wollen wir nun aber die Abhängigkeit (= Zusammenhang) zwischen beiden Variablen untersuchen, so hilft uns die erstellte Kreuztabelle, es handelt sich nun um eine bivariate Analyse. Da das Geschlecht eher als unabhängige Variable fungiert, schreiben wir diese Variable in die Spalten. Beachten Sie, dass die Prozentwerte daher auch spaltenweise berechnet wurden. Generell können wir die Anteile (in Prozent) auf 3 Arten berechnen: Zeilenweise, spaltenweise oder anhand der Gesamtsumme. Da das Geschlecht aber nur auf den Beruf wirken kann und nicht umgekehrt, der Beruf also die abhängige Variable darstellt, schreiben wir diese in die Zeilen.
Warum neben den Fallzahlen die Anteile entscheidend sind
Bei der Betrachtung der Kreuztabelle interessiert uns die Abhängigkeit der beiden Variablen Beruf und Geschlecht. Oder anders formuliert: Sind die Berufsanteile zwischen Frauen und Männern gleich verteilt oder gibt es Unterschiede?
Würden wir nur die absoluten Häufigkeiten (N) betrachten, um zu sehen, ob diese in den beiden Berufen gleich sind, wäre das irreführend. Beispielsweise gibt es 68 Frauen, die als Krankenschwestern tätig sind, aber nur 34 Krankenpfleger. Die Schlussfolgerung, dass Frauen doppelt so oft in diesem Beruf arbeiten, wäre falsch, da ja insgesamt schon mehr Frauen im Krankenhaus arbeiten als Männer. Wir müssen also für unseren Vergleich die relativen Häufigkeiten heranziehen, konkret sind dies die Anteile in Prozent. Da diese spaltenweise errechnet wurden, wird also immer dargestellt, wieviel Prozent eines Geschlechts im jeweiligen Beruf arbeiten.
Der Anteil der Krankenschwestern an allen Frauen im Krankenhaus liegt bei 81.9 %, bei den Männern hingegen nur bei 59.6 %, eine Differenz von 22.3 % – nicht gerade wenig. Dementsprechend machen im Ärzteberuf die Männer den größeren Anteil aus, 40.4 % im Gegensatz zu den Frauen mit 18.1 %. Da wir jeweils nur 2 Ausprägungen beim Geschlecht als auch beim Beruf berücksichtigen, muss die Differenz zwischen Frauen und Männern korrespondierend zur ersten Differenz nun −22.3 % betragen.
Offensichtlich bestehen also Unterschiede zwischen den Geschlechtern, der Anteil der Männer am Ärzteberuf ist größer, analog gibt es anteilig mehr Krankenschwestern als Krankenpfleger. Zur Visualisierung bieten sich gruppierte oder gestapelte Balkendiagramme an, letzteres zeigt die folgende Abbildung: Für jedes Geschlecht sind die unterschiedlichen Anteile gut zu erkennen. Hätten wir übrigens das Geschlecht als Zeilenvariable und den Beruf als Spaltenvariable definiert, so hätten wir uns die Anteile zeilenweise ausgeben lassen müssen. Je nach Art der Variablen müssen Sie entscheiden, ob Sie die Anteile zeilen- oder spaltenweise oder gar an der Gesamtsumme berechnen wollen. Dies hängt vor allem davon ab, was Sie untersuchen möchten. Hat man es mit einer 2 x 2 Kreuztabelle zu tun, so spricht man auch von einer 4-Felder-Tafel.
Ist die Abhängigkeit statistisch signifikant?
Zum Abschluss wollen wir prüfen, ob der offensichtliche Zusammenhang zwischen beiden Variablen auch statistisch signifikant ist, dafür verwenden wir den Chi-Quadrat-Unabhängigkeitstest. Wie Sie wissen, wird stets die Nullhypothese auf Signifikanz geprüft. Ist die Wahrscheinlichkeit (p-Wert) unserer oder noch extremerer Ergebnisse bei gültiger Nullhypothese kleiner als 5 % (= .05), so verwerfen wir die Nullhypothese und nehmen die Alternativhypothese an. Das bedeutet, dass eine Abhängigkeit zwischen Beruf und Geschlecht besteht.
In unserem Beispiel ist dies tatsächlich der Fall, χ²(1) = 8.48, p = .004. Wir können die Abhängigkeit also auch statistisch nachweisen. Bedenken Sie immer, dass bei nicht signifikantem Ergebnis keine Unabhängigkeit nachgewiesen worden ist, sondern nur keine Abhängigkeit nachgewiesen werden konnte. Ein kleiner, aber methodisch wichtiger Unterschied!