Normwerte in Leistungstests: Prozentränge richtig interpretieren

Das Ergebnis in einem Leistungstest wird mit Normwerten (T-Wert, IQ-Wert etc.) und/oder Prozenträngen ausgedrückt. Dabei kann es einen großen Unterschied machen, ob die Interpretation anhand eines T-Wertes oder eines Prozentranges vorgenommen wird. Woran das liegt und was genau man beachten muss, erklärt unsere Autorin und Hogrefe-Lektorin Anne Wyschkon.

Prozentränge können manchmal in die Irre führen
Prozentränge können manchmal in die Irre führen

Das Ziel von traditionellen Leistungstests (z. B. Intelligenztests, Rechtschreibtests, Lesetests, Sprachtests) besteht darin, einzuschätzen, wie kompetent ein Proband im betreffenden Leistungsbereich relativ zu Gleichaltrigen ist.

Warum kann der Rohwert nicht interpretiert werden?

Bei der Untersuchung der fraglichen Leistungen wird in standardisierten Leistungstests so vorgegangen, dass den Probanden ein Set an Aufgaben vorgegeben wird. Im Vorhinein wird festgelegt, welche Lösungen als richtig und welche als fehlerhaft zu bewerten sind. Auf diese Weise kann für jeden Probanden ein sogenannter Rohwert berechnet werden. Dieser gibt an, wie viele Aufgaben richtig gelöst wurden.

Allerdings ist der Rohwert für die Frage nach der Kompetenz einer Person bedeutungslos, so lange man nicht weiß, wie viele Punkte Probanden der betreffenden Altersgruppe üblicherweise bei diesen Testaufgaben bekommen (hier spielen die Zahl der Aufgaben und die Verteilung der Aufgabenschwierigkeiten eine bedeutsame Rolle). In einem sehr leichten Test werden beispielsweise viele Personen einen Großteil der Aufgaben richtig lösen und so einen hohen Rohwert erhalten. Dies spricht dann aber nicht für eine herausragende Leistung, da ja die meisten Testkandidaten sehr gut abschneiden.

Repräsentative Normstichproben bilden die Grundlage

Um die Leistung des Einzelnen ins Verhältnis zu der von Gleichaltrigen setzen zu können, werden im Zuge der Testentwicklung möglichst große und für die Fragestellung des Tests repräsentative Stichproben von Probanden untersucht.

Repräsentativ bedeutet dabei vereinfacht ausgedrückt Folgendes: Das zu untersuchende Merkmal (z. B. Intelligenz) ist in dieser Stichprobe etwa so verteilt wie in der Gesamtbevölkerung oder der Personengruppe, für die der Test gelten soll. In der Stichprobe für einen Schultest sollten also nicht nur Schüler aus Begabtenklassen mit vermutlich sehr hoher Intelligenz enthalten sein, sondern auch solche aus Regel- und Förderschulen. Die Anteile der Schüler in der Klasse sollten außerdem den Anteilen in der Bevölkerung entsprechen.

Von der Normstichprobe zum Normwert

Anhand dieser sogenannten Normstichproben oder Eichstichproben werden der Mittelwert pro Altersgruppe und die Streuungen der Rohwerte in den Altersgruppen bestimmt. Daraus können dann die gängigen Normwerte berechnet werden. Normwerte sind dabei ein Maßstab, um die individuelle Leistung eines Probanden zu den Ergebnissen einer Vergleichsgruppe in Beziehung zu setzen.

Wie werden Normwerte interpretiert?

Üblicherweise verwendete Normwertskalen sind IQ-Werte, T-Werte, Standardwerte, c-Werte oder Stanine-Werte. Jede dieser Normwertskalen weist einen fest definierten Wertebereich auf. Beispielsweise liegt bei den T-Werten der Durchschnittsbereich zwischen 40 und 59 Punkten. Der Mittelwert entspricht einem T-Wert von 50, die Standardabweichung beträgt 10 T-Wert-Punkte.

T-Werte unterhalb von 40 (Mittelwert minus 1 Standardabweichung: 50 – 10 = 40) gelten nach den gängigen Konventionen als unterdurchschnittlich. T-Werte ab 60 (Mittelwert plus 1 Standardabweichung: 50 + 10 = 60) sind als überdurchschnittlich gute Leistung zu bewerten.

Normwerte sind intervallskaliert

Normwerte weisen ein Intervallskalenniveau auf. Dies bedeutet, dass eine Steigerung um einen bestimmten Betrag (z. B. 10 T-Wert-Punkte) an jeder Stelle der Verteilung gleichermaßen hoch ist. Man kann damit also sagen, dass die Verbesserung eines Probanden durch ein Training von 20 auf 30 T-Wert-Punkte genau so groß ist, wie die Verbesserung einer anderen Person von einem T-Wert von 40 auf einen T-Wert von 50.

Wie werden Prozentränge interpretiert?

Aus den Leistungen der Probanden der Normstichprobe können neben den eben genannten Normwerten auch Prozentränge bestimmt werden. Prozentränge geben an, wie viel Prozent der Vergleichsgruppe mindestens genauso viele Punkte erzielt haben wie der getestete Proband. Der mögliche Wertebereich reicht von einem Prozentrang von 0 bis zum Prozentrang von 100.

Beispielsweise bedeutet ein Prozentrang von 1, dass ein Prozent der Personen aus der Normstichprobe genauso viele oder weniger Punkte erreicht haben. Der Proband gehört also zu dem einen Prozent der schwächsten Aufgabenlöser seiner Altersgruppe.

Im Unterschied dazu verweist ein Prozentrang von 99 darauf, dass 99 Prozent der Eichstichprobe schwächere oder gleich gute Leistungen wie die getestete Person erreichten. Es gibt in dieser Altersgruppe also nur noch ein Prozent Personen, die bessere Leistungen erzielen als dieser Proband.

Prozentränge sind rangskaliert

Für die Interpretation sehr bedeutsam ist, dass Prozentränge lediglich die relative Position (den Rang) einer Person innerhalb der Normstichprobe anzeigen (Sponsel, 2004). Sie sagen also nichts zu der Frage, wie groß die Abstände zwischen benachbarten Prozentrangplätzen sind.

Zur Veranschaulichung dieses Problems verwendet Sponsel die Körpergröße: Wenn 100 verschieden große Menschen der Größe nach aufgereiht werden, wird dem Kleinsten der Prozentrang von 1, dem Mittleren der Prozentrang von 50 und dem Größten der Prozentrang von 100 zugeordnet. Es ist dabei völlig unerheblich, wie groß die Personen bei einer exakten Messung in cm sind oder wie bedeutsam die Größenunterschiede zwischen benachbarten Probanden sind. Entscheidend ist einzig die Frage der Rangfolge. Prozentränge weisen also ein so genanntes Rangskalenniveau auf. Man kann – bezogen auf die Leistungsmessung – lediglich feststellen, wer höhere Punktwerte erzielt hat als andere. Über die Größe der Unterschiede zwischen verschiedenen Prozentrangplätzen lassen sich jedoch keine Aussagen treffen.

Der wichtigste Unterschied zwischen Rang- und Intervallskala

Anhand der Prozentrangplätze kann man also nicht sagen, dass eine Verbesserung von einem Prozentrang 2 auf den Prozentrang 12 (10 Prozentrangplätze Differenz) genauso viel wert ist, wie eine Verbesserung von einem Prozentrang 50 auf den Prozentrang 60 (ebenfalls 10 Prozentrangplätze Differenz). Um dies zu veranschaulichen, zeigt die folgende Abbildung, welche T-Werte welchen Prozenträngen entsprechen, wenn eine Normalverteilung der Daten vorliegt. Dabei sind durchschnittliche Leistungen (T-Werte zwischen 40 und 59) in Grün, unterdurchschnittliche Leistungen (T-Werte zwischen 36 und 39) in Gelb und deutlich unterdurchschnittliche Ergebnisse (T-Werte von 35 oder niedriger) in Rot dargestellt.

Bei einem Blick auf die Verteilung der Prozentränge in einer Normalverteilung wird deutlich, dass die Abstände zwischen den verschiedenen Prozentrangplätzen an den Randbereichen der Verteilung sehr viel größer sind als in der Mitte. Es ist daher viel schwieriger, sich von einem Prozentrang 2 (T-Wert = 30) auf einen Prozentrang 12 (T-Wert = 38) zu steigern (Differenz: 8 T-Wert-Punkte), als von einem Prozentrang 50 (T-Wert = 50) auf den Prozentrang 60 (T-Wert = 52), was lediglich einer Differenz von 2 T-Wert-Punkten entspricht.

Verteilung von T-Werten und Prozenträngen in einer Normalverteilung
Verteilung von T-Werten und Prozenträngen in einer Normalverteilung

Was bedeutet das für die Interpretation von Prozenträngen?

Die Prozentrangskala führt also bei der Bewertung von Unterschieden zwischen den Leistungen verschiedener Probanden oder bei der Beurteilung von Veränderungen nach einem gewissen Zeitraum leicht zu falschen Einschätzungen. Das liegt daran, dass Differenzen – anders als intuitiv angenommen – auf der Prozentrangskala eben nicht sinnvoll interpretierbar sind. Daher müssen Prozentränge immer in Normwerte umgerechnet werden, wenn es um die Beurteilung von Leistungsunterschieden geht.

Umrechnung von T- oder IQ-Werten in Prozentränge

Eine leicht handhabbare Tabelle, anhand derer die Zuordnung der Prozentrangplätze zu den verschiedenen Normwerten abgelesen werden kann, können Sie hier downloaden: Tabelle zur Transformation von Testnormen (Prozentrang in Normwert umrechnen).

Literatur
Sponsel, R. (2004). ProzentRANG. Bedeutung, Berechnung, Problemlösungen, Literatur, Links. Verfügbar unter www.sgipt.org/wisms/mtt/pr.htm.


Dr. Anne Wyschkon

ist Diplom-Psychologin sowie Kinder- und Jugendlichenpsychotherapeutin. Sie ist stellvertretende Ambulanzleiterin in der Akademie für Psychotherapie und Interventionsforschung Potsdam (API) und Lektorin im Hogrefe Verlag.

 


  • Ressort Im Fokus
  • Testdiagnostik
  • Ressort Klinik Testzentrale