A-Z Navigation
Begriff Erklärung
»faking good«-Bedingung

Probanden werden in einer Untersuchung aufgefordert, einen Fragebogen so zu bearbeiten, dass sie einen möglichst guten Eindruck machen.

16 PF-R: 16-Persönlichkeits-Faktoren-Test – Revidierte Fassung

Ausgehend von psycholexikalischen Studien und gestützt auf faktorenanalytische Prinzipien hat Cattell seit Ende der 40er-Jahre 16 grundlegende Dimensionen für die Beschreibung von Persönlichkeitsunterschieden propagiert. Der zur Erfassung dieser Dimensionen konzipierte amerikanische Fragebogen wurde im Laufe der Jahre kontinuierlich aktualisiert und liegt nunmehr bereits in der 5. Auflage vor, an der sich auch die deutsche Fassung (Schneewind & Graf, 1998) orientiert. Neben den 16 Primärskalen werden auch fünf globale Sekundärskalen gebildet.

Abweichungsnormen

Siehe Variabilitätsnormen

Adaptives Intelligenz Diagnostikum 2 (AID 2)

Das Adaptive Intelligenz Diagnostikum 2 (AID 2) von Kubinger und Wurst (2000) bzw. Kubinger (2009) ist konzeptuell eng an die Wechsler-Tests angelehnt. Die Aufgabentypen des HAWIK finden auch im AID 2 Verwendung; die Subtests tragen aber andere Namen. Einige der elf obligatorischen und drei fakultativen Subtests stellen jedoch eine Erweiterung gegenüber dem HAWIK dar. Das Verfahren zeichnet sich durch vier Besonderheiten aus: es ist adaptiv, die Items sind Rasch-Modell-konform, es existieren eine Kurzform und eine spezielle Normierung für Kinder und Jugendliche, deren Muttersprache Türkisch ist.

Adaptives Testen

Zur Steigerung der Testökonomie werden bei den einzelnen Probanden nur diejenigen Testitems zur Anwendung gebracht, welche für das Fähigkeitsniveau des einzelnen Probanden eine hohe Messgenauigkeit (Iteminformation) aufweisen. Auf die anderen Items wird hingegen verzichtet.

Aggregation

Mittelung prinzipiell ein und desselben Verhaltens über mehrere Beobachtungszeitpunkte

AHA Arbeitshaltungen – Kurze Testbatterie: Anspruchsniveau, Frustrationstoleranz, Leistungsmotivation, Impulsivität/Reflexivität

Bei dem Test AHA von Kubinger & Ebenhöh (1996) handelt es sich um einen am Computer durchzuführenden Objektiven Persönlichkeitstest. Die Bearbeitung der drei Untertests (z. B. »Figuren vergleichen«) liefert zahlreiche Kennwerte wie »Entschlussfreudigkeit« oder »Frustrationstoleranz«.

Alertness

Das Konzept »Alertness« spielt v. a. in der Neuropsychologie eine Rolle. Darunter wird eine basale Wachheit oder Ansprechbarkeit auf Reize jeder Art verstanden. Eine extreme Verminderung der Alertness ist bei komatösen Patienten zu beobachten. Alertness bezeichnet im Grunde nicht eine bestimmte Form der Aufmerksamkeit, sondern vielmehr eine generelle Voraussetzung für Aufmerksamkeit (im Sinne von Reizselektion).

Allgemeine Büroarbeitstest (ABAT-R)

Der Allgemeine Büroarbeitstest (ABAT-R; Lienert & Schuler, 1994) soll Fähigkeiten und Fertigkeiten prüfen, die bei Bürotätigkeiten relevant sind. Der ABAT-R besteht aus sechs Aufgabengruppen wie dem Sortieren von Kundenbriefen, dem Überprüfen von Summen und dem Erkennen von Rechtschreibfehlern.

Allgemeine Leistungstests

Siehe Aufmerksamkeits- und Konzentrationstests

Anamnese

Unter einer Anamnese oder einer Anamneseerhebung wird in Anlehnung an den Sprachgebrauch der Medizin die gesprächsweise Erkundung der Vorgeschichte einer Erkrankung oder Störung verstanden.

änderungs-sensitive Verfahren

Um tatsächliche Veränderungen abbilden zu können, benötigt man änderungssensitive Verfahren. Liegen entsprechende Validitätsbelege vor, sind diese für die Auswahl eines Verfahrens hilfreich. Bei Fragebögen erkennt man eventuell an den Items, ob sie zur Veränderungsmessung geeignet sind. Formulierungen wie »In meinem Leben habe ich …« oder »Normalerweise bin ich …« beziehen sich offensichtlich auf lange Zeiträume. Aussagen wie »Ich bin momentan mit meinem Leben zufrieden« betreffen dagegen den momentanen Zustand. Manchmal wird in der Instruktion explizit festgelegt, dass sich die Aussagen auf einen bestimmten Zeitraum (z. B. die letzten zwei Wochen) beziehen sollen.

Anforderungsanalyse

»Die Anforderungsanalyse sollte die Merkmale eines Arbeitsplatzes, einer Ausbildung bzw. eines Studiums, eines Berufs oder einer beruflichen Tätigkeit ermitteln, die für den beruflichen Erfolg oder die berufliche Zufriedenheit bedeutsam sind. Aus der Anforderungsanalyse sollten diejenigen Eignungsmerkmale … mitsamt ihren Ausprägungen abgeleitet werden, die zur Erfüllung der Anforderungen nötig sind« (DIN 33430; in Reimann, 2009, S. 99).

Anforderungsprofil

Bei vielen Fragestellungen bietet es sich an, Anforderungen festzulegen, die erfüllt sein müssen. Bei eignungsdiagnostischen Fragestellungen wird explizit der Begriff »Anforderungen« bzw. »Anforderungsprofil« für die Gesamtheit aller Anforderungen verwendet.

Annahmequoten

Festgelegte Annahmequoten liegen vor, wenn z. B. nur eine bestimmte Zahl von Therapie- oder Ausbildungsplätzen zur Verfügung steht. Ist die Zahl der Bewerber größer als die der vorhandenen Plätze, erfolgt eine Auswahl. Hingegen ist bei nichtfestgelegten oder variablen Annahmequoten bei jeder Entscheidung das Ergebnis offen. Beispielsweise erhalten alle Personen eine Therapie, die als therapiebedürftig beurteilt worden sind.

Äquivalentnormen

Bei der Bildung von Äquivalentnormen erfolgt eine Zuordnung der Rohwerte zu bestimmten Referenzgruppen. Ein typisches Beispiel sind Altersgruppen.

Arbeitsanalyse

»Mit Arbeitsanalyse wird ganz allgemein die systematische Erfassung und Bewertung von Informationen über die Interaktion von Mensch und Arbeitsbedingungen bezeichnet (…). In der psychologischen Arbeitsanalyse geht es um die Analyse und Bewertung der Arbeitsaufgabe(n) und der Arbeitsbedingungen« (Dunckel & Resch, 2010, S. 1111 und 1112).

arbeitsplatzanalytisch-empirische Methode

Bei der arbeitsplatzanalytisch-empirischen Methode werden mithilfe von standardisierten Verfahren Informationen über die Stelle erhoben.

Arbeitszeugnis

Es gibt verschiedene Varianten von Arbeitszeugnissen: Arbeitsbescheinigung, einfaches Zeugnis, Zwischenzeugnis, qualifiziertes Zeugnis, Berufsausbildungszeugnis sowie Ferien-, Aushilfs- und Nebenjobzeugnis. Arbeitszeugnisse werden auf Geschäftspapier mit vollständiger Adresse des Arbeitsgebers geschrieben, haben eine Überschrift (z. B. »Arbeitszeugnis«) und enthalten die persönlichen Daten des Beurteilten (vor allem Vor- und Zuname und Geburtsdatum). Ein qualifiziertes Arbeitszeugnis enthält darüber hinaus eine Beurteilung sowie weitere Angaben (Beschäftigungsdauer, Tätigkeitsbeschreibung, Gründe für Auflösung des Arbeitsverhältnisses etc.)

Assessment Center

Ein Assessment Center (AC) ist ein - bis dreitägiges Seminar mit acht bis zwölf Mitarbeitern oder Bewerbern, die von Führungskräften und Personalfachleuten in Rollenübungen und Fallstudien beobachtet und beurteilt werden. Diese Rollenübungen und Fallstudien sind charakteristisch für bestehende oder zukünftige Arbeitssituationen und Aufgabenfelder (Obermann, 2009, S. 8).

Aufmerksamkeit

Schmidt-Atzert et al. (2004) plädieren dafür, Aufmerksamkeit und Konzentration nicht gleichzusetzen. Aufmerksamkeit soll allein mit Wahrnehmung in Verbindung gebracht werden und sich auf das selektive Beachten relevanter Reize oder Informationen beziehen.

Aufmerksamkeits- und Konzentrationstests

Die Konstrukte »Aufmerksamkeit« und »Konzentration« sind bislang nicht gut definiert; zumindest haben sich noch keine konsensfähigen Definitionen durchgesetzt. Viele Autoren vermeiden deshalb eine begriffliche Festlegung und nennen Aufmerksamkeits- und Konzentrationstests in einem Atemzug. In einem einflussreichen Beitrag hatte Bartenwerfer (1964) vorgeschlagen, diese Tests als »Allgemeine Leistungstests« zu bezeichnen.

Aufmerksamkeitstests

Tests zu verschiedenen Formen der Aufmerksamkeit haben ein gemeinsames Merkmal: Sie erfassen, wie schnell und genau Probanden kritische Reize entdecken. Die Tests unterscheiden sich vor allem darin, welche kritischen Reize verwendet und unter welchen Bedingungen diese dargeboten werden. Die Bedingungen sind ausschlaggebend dafür, welche »Form« der Aufmerksamkeit gemessen wird.

Aufwärmphase

In der Regel ist vor der Durchführung von Leistungstests eine Aufwärmphase nützlich, die mit Testsituation und -verfahren vertraut macht. Die meisten Tests bieten daher Einführungsaufgaben oder sog. Eisbrecheritems, die die Prüflinge mit der Testart bekannt machen, deren Ergebnis aber nicht gewertet wird.

Augenscheinvalidität

Gemeint ist damit die Nachvollziehbarkeit für Testpersonen oder auch für psychologische Laien, die einen Test anschaffen: Der Laie glaubt zu erkennen, was der Test misst, und entwickelt daher eher Vertrauen in das Verfahren. Unter Marketinggesichtspunkten kann dies nützlich sein; für die Unverfälschbarkeit ist die Nachvollziehbarkeit allerdings abträglich.

Ausgangswertgesetz

Die Höhe eines Anfangswertes ist negativ mit dem Zuwachs korreliert. Dafür sind – je nach Sachverhalt – teils biologische Faktoren verantwortlich, teils auch Limitierungen von Seiten der vorgegebenen Skalen, im Weiteren aber auch unzureichende Reliabilitäten.

Auslassungsfehler

Von einem Auslassungsfehler spricht man, wenn ein kritischer Reiz vorliegt und der Proband nicht darauf reagiert.

Auswertungsobjektivität

Gleiches Verhalten der Testpersonen wird in einem objektiven Test nach stets exakt denselben Regeln abgebildet. Für die Auswertungsobjektivität ist entscheidend, dass das Vorgehen im Manual mit klaren und unmissverständlichen Anweisungen beschrieben wird. Dazu gehören auch Anweisungen, wie mit Auslassungen, Korrekturen und Doppelankreuzungen (»richtig« und »falsch« angekreuzt) zu verfahren ist.

Behandlung

Unter Behandlung werden sehr unterschiedliche Interventionen subsumiert. Es mag sich dabei um eine eng umschriebene Maßnahme handeln (wie z. B. die Therapie eines Klienten) oder um eine Kombination vieler einzelner »treatments« (wie z. B. den Einbezug der Familie oder der Arbeitskollegen in den Behandlungsplan).

Behaviorismus

Siehe Verhaltenstheorie

Beobachterdrift

Von Beobachterdrift spricht man, wenn die Genauigkeit der Beobachtung über die Beobachtungsphase hinweg entweder nachlässt (z. B. wegen Ermüdung) oder zunimmt (z. B. wegen zunehmender Geübtheit).

beobachteter Wert

Der Testwert, der aus der einmaligen Testung einer Person resultiert. Er setzt sich zusammen aus dem wahren Wert der Person und einem Fehlerwert.

Berliner Intelligenzstruktur-Test (BIS)

Dem Berliner Intelligenzstruktur-Test (Form 4; BIS-4) von Jäger et al. (1997) liegt mit dem »Berliner Intelligenzstrukturmodell« ein Strukturmodell zugrunde, das sich deutlich von dem anderer Tests unterscheidet. Dieses Modell erweist sich auch als nützlich, um andere Intelligenztests oder Aufgabengruppen konzeptuell einzuordnen. Die Autoren unterscheiden vier Arten von »Operationen«, die jeweils mit drei unterschiedlichen »Inhalten« kombinierbar sind. Zur Hochbegabungsdiagnostik steht mit dem BIS-HB (Jäger et al., 2006) eine Testversion zur Verfügung, die nicht nur an durchschnittlich begabten, sondern auch an über 500 hochbegabten Schülern normiert wurde.

Berufseignungsdiagnostik

»Berufseignungsdiagnostik bezeichnet die Methodologie der Entwicklung, Prüfung und Anwendung psychologischer Verfahren zum Zwecke eignungsbezogener Erfolgsprognosen und Entscheidungshilfen im beruflichen Kontext« (Schuler & Höft, 2007, S. 102).

Big Five

Nach heutigem Stand kann man die Begriffe zur Beschreibung von Persönlichkeit fünf globalen Dimensionen zuordnen: Neurotizismus, Extraversion, Verträglichkeit, Offenheit für Erfahrung und Gewissenhaftigkeit.

BIP: Bochumer Inventar zur berufsbezogenen Persönlichkeitsbeschreibung

Das BIP (Hossiep & Paschen, 2003) ist ein mehrdimensionaler Persönlichkeitsfragebogen speziell für die berufliche Eignungsdiagnostik. Es liegt in einer Selbst- und einer Fremdbeurteilungsform vor und soll 14 berufsrelevante Dimensionen der Persönlichkeit erfassen.

Bochumer Matrizentest – advanced (BOMAT)

Der Bochumer Matrizentest – advanced (Hossiep et al., 1999) verwendet den gleichen Typ von Matrizenaufgaben wie der CFT 20 und soll die Allgemeine Intelligenz erfassen. Die Aufgaben bestehen immer aus einer 5 × 3-Matrix mit einem leeren Feld, das durch eines von sechs zur Auswahl stehenden Mustern zu ergänzen ist. Der Test wurde für den oberen Intelligenzbereich konstruiert und an 303 Studierenden und Absolventen von Universitäten und Fachhochschulen normiert.

Centil-Werte (C-Werte)

Siehe Normwerte

CFT 20-R mit WS/ZF-R: Grundintelligenztest Skala 2 – Revision; mit Wortschatztest und Zahlenfolgentest

Beim CFT 20-R (von »Culture Fair Test«) von Weiß (2008) handelt es sich um ein Mitglied einer ganzen »Testfamilie« zur sprachfreien Messung der fluiden Intelligenz mit langer Tradition. Der CFT 20-R umfasst vier Aufgabengruppen: Figurenreihen fortsetzen, Figuren klassifizieren, Figurenmatrizen vervollständigen und topologische Schlussfolgerungen ziehen. Wortschatz- und Zahlenfolgentest stellen fakultative Zusatztests zur Messung der kristallinen Intelligenz dar.

Computer-Test

Test, der am Computer durchgeführt wird.

Daueraufmerksamkeit

Einige Testautoren sprechen von Daueraufmerksamkeit, wenn die selektive bzw. geteilte Aufmerksamkeit über einen längeren Zeitraum aufrechterhalten werden muss.

Deduktive Methode/Rationale Konstruktion

Das Prinzip der deduktiven Methode stellt für viele Testentwickler wohl die ideale Lösung dar. Man verlässt sich auf eine Theorie, die eine gute Beschreibung des Merkmals liefert. Aus der Definition des Kontraktes heraus werden schließlich typische Verhaltensweisen abgeleitet, die als Indikatoren für das interessierende Merkmal dienen.

Diagnostischer Prozess

Als diagnostischer Prozess wird die Abfolge von Maßnahmen zur Gewinnung diagnostisch relevanter Informationen und deren Integration zur Beantwortung einer Fragestellung bezeichnet.

Diagnostisches Interview

Diagnostisches Interview ist der Überbegriff für Methoden zur Erhebung von diagnostisch relevanten Informationen mittels Gespräch. Mit Begriffen wie Anamnese, Exploration, Einstellungsgespräch oder Auswahlgespräch kann der Verwendungszweck oder die Zielsetzung eines diagnostischen Interviews näher bestimmt werden. Diagnostische Interviews unterscheiden sich durch den Grad ihrer Standardisierung.

Diagnostisches Interview bei psychischen Störungen (DIPS)

Das DIPS von Margraf et al. (1994; Schneider et al., 2006) ist ein standardisiertes klinisches Interview, welches wie das SKID das ganze Spektrum psychischer Störungen abdeckt. Es existieren auch eine Kurz- und eine Kinderversion.

Diagnostisches Urteil

Als diagnostisches Urteil wird die Beantwortung einer Fragestellung unter Verwendung von bereits vorliegenden diagnostischen Informationen bezeichnet.

dichotome Items

Items mit zweifach gestufter Antwortmöglichkeit (z.B. Ja-Nein-Antwortformat)

DIN 33430

Deutsche Norm zu Anforderungen an Verfahren und deren Einsatz bei berufsbezogenen Eignungsbeurteilungen

direkte Veränderungsmessung

Eine direkte Veränderungsmessung erfolgt in Form einer Einmalerhebung. Mit der Zielerreichungsbeurteilung (»goal attainment scaling«) kann eingestuft werden, inwieweit die zu Beginn oder im Verlauf der Therapie gesetzten Ziele tatsächlich realisiert werden konnten.

direkte Verhaltensbeobachtung

Die direkte Verhaltensbeobachtung bietet gegenüber der Verwendung einer Kamera den Vorteil, dass man seinen Blick dahin richten kann, wo das Geschehen interessant ist. Der Beobachter kann seinen Standpunkt so verändern, dass er ungehindert das beobachten kann, was er sehen will, und wird nicht auf den starren Blickwinkel einer Kamera eingeengt.

diskriminante Validität

Als diskriminante Validität (entspricht der divergenten Validität bei Cronbach & Meehl, 1955) bezeichnet man den Zusammenhang mit Indikatoren anderer Konstrukte.

DSM-IV

Das Diagnostische und Statistische Manual Psychischer Störungen in der vierten Revision in einer überarbeiteten Form (»text revision«) (DSM-IV TR; American Psychiatric Association, deutsch: Saß et al., 2003) ist ein aktuell gültiges und in Wissenschaft und klinischer Praxis eingesetztes Klassifikationssystem für psychische Störungen.

Durchführungsobjektivität

Die Durchführungsobjektivität ist gegeben, wenn ein Verfahren immer auf die gleiche Weise durchgeführt wird. Zur Standardisierung der Durchführung gehört, dass das Testmaterial (Testhefte, Antwortbögen etc.), die Instruktionen und die Randbedingungen der Untersuchung festgelegt sind.

Durchstreichtests

Konzentrationstests mit Suchaufgaben, bei denen Zielobjekte durchzustreichen sind. Die Bezeichnung »Durchstreichtests« leitet sich vom Antwortmodus (bestimmte Zeichen durchstreichen) her.

Dyskalkulie

Rechenstörung; Eine Teilleistungsstörung, die seit Beginn des Rechenlernens besteht und nicht auf mangelnde Intelligenz oder unzureichende Beschulung zurückzuführen ist.

Effektstärke d

Die Effektstärke d gibt an, wie stark sich die Mittelwerte zweier Messwerte-Verteilungen voneinander unterscheiden. Die Differenz wird in Streuungseinheiten (gemittelten Standardabweichungen beider Verteilungen) ausgedrückt. Bei Standardwerten beträgt die Standardabweichung 10; d = .56 entspricht 0,56 Streuungseinheiten und somit 5,6 Standardwertpunkten.

Eigenschaftsmodell

"Nach dem Eigenschaftsmodell lässt sich das Verhalten und Erleben von Menschen in Form von Eigenschaften (""traits"") beschreiben, welche relativ breite und zeitlich stabile Dispositionen zu bestimmten Verhaltensweisen darstellen, die konsistent in verschiedenen Situationen auftreten können. Eigenschaften sind hypothetische, gedankliche, konstruierte Gebilde (Konstrukte), die nicht direkt beobachtbar sind und somit aus direkt beobachteten Verhaltensweisen nur erschlossen werden können."

Eingangsdiagnostik

Statusdiagnostik, die vor einer Intervention durchgeführt wird, um zu überprüfen, ob bestimmte Maßnahmen erforderlich sind.

Einsichtnahme

Sind Auftraggeber und Begutachtete nicht identisch, kann das Gutachten bzw. der Untersuchungsbericht den Begutachteten nur mit Einwilligung des Auftraggebers zugänglich gemacht werden. Psychologen sind gehalten, darauf einzuwirken, dass die Begutachteten ihr Gutachten bzw. den Untersuchungsbericht auf Wunsch einsehen können, sofern für sie kein gesundheitlicher Schaden zu befürchten ist. Falls der Auftrag eine Einsichtnahme von vorneherein ausschließt, müssen die Begutachteten vorab davon in Kenntnis gesetzt werden.

einstufiges oder sequentielles Testen

Im Fall von einstufigem Testen erfolgt die Zuordnung eines Probanden zu einer Behandlung auf der Basis einer punktuell-einmaligen Diagnose, bei sequentiellem Testen hingegen als Resultat eines gestuften Vorgehens in mehreren Schritten.

Einzeluntersuchung

Test, der nur mit einer einzelnen Person durchgeführt wird

Elterliche Sorge

Die elterliche Sorge gilt von der Geburt bis zur Volljährigkeit des Kindes und umfasst die Personen- und die Vermögensfürsorge. Zur Personenfürsorge gehören die Fürsorge für das körperliche Wohl des Kindes, die Erziehung, Aufenthaltsbestimmung, Aufsichtspflicht und die Umgangsbestimmung. Die Vermögensfürsorge betrifft die Vertretung des Kindes in finanziellen Angelegenheiten. Die Ausübung der elterlichen Fürsorge ist nicht nur ein Recht, sondern auch eine Pflicht.

Entwicklungstests

Mit Entwicklungstests soll festgestellt werden, ob sich ein Kind allgemein oder in einem speziellen Bereich altersgemäß entwickelt hat. Solche Tests sollten deshalb Items aufweisen, die vor allem mit dem Lebensalter hoch korrelieren, also beispielsweise zwischen benachbarten Altersstufen differenzieren. Durch Vergleich der individuellen Ergebnisse mit den Leistungen Gleichaltriger lassen sich Hinweise auf eventuell behandlungsbedürftige Entwicklungsretardierungen finden.

erfahrungsgeleitet-intuitive Methode

Unter der erfahrungsgeleitet-intuitiven Methode versteht man die freie, nicht formalisierte Beurteilung der Anforderungen an einen Beruf oder eine Stelle. Sie verlangt gründliche Kenntnisse der Stelle und ihrer organisatorischen Einbettung.

Erfolgskontrolle

Statusdiagnostik nach Beendigung einer Intervention, die der Feststellung der Erreichung des angestrebten Zieles dient, welches durch die Messung vor der Intervention (Eingangsdiagnostik) festgelegt wurde

Error Score

Siehe Fehlerwert

Erwartungsbereich

Siehe Konfidenzintervall

Erwartungswert

Stochastischer Begriff; arithmetisches Mittel einer Variablen, das sich bei unendlich vielen Wiederholungen theoretisch ergibt.

Evaluation

Eine Evaluation dient der Bewertung einer Maßnahme, etwa eines Trainings oder eines Therapieprogramms. Sofern psychische Merkmale von Menschen oder deren Verhalten verändert werden sollen, können dazu psychologisch-diagnostische Methoden eingesetzt werden.

Event sampling

Eine exakte Bestimmung der Dauer einer Verhaltensweise erfolgt nur beim Eventsampling. Dazu werden Anfang und Ende der Verhaltenssequenz zeitlich genau bestimmt, um daraus die Dauer zu berechnen. In der Regel ist dazu eine Videoaufnahme nötig, in die die Zeit eingeblendet ist. Durch eventuell wiederholtes Betrachten der Aufnahme im Slow-Motion-Modus gelingt es, den Zeitpunkt des Beginns und des Endes sehr genau festzustellen.

EWL: Die Eigenschaftswörterliste

Bei der EWL (Janke & Debus, 1978) handelt es sich um ein mehrdimensionales Verfahren zur quantitativen Beschreibung des aktuellen Befindens mit Hilfe von Adjektiven (z. B. »energisch«, »traurig«). Die »Normalversion« umfasst 15 Skalen.

Exploration

Der Begriff »Exploration« stammt ursprünglich aus der Psychiatrie und bezeichnet die Erkundung des subjektiven Lebensraums eines Probanden.

EXPLORIX: Das Werkzeug zur Berufswahl und Laufbahnplanung – Deutschsprachige Adaptation und Weiterentwicklung des Self-Directed Search (SDS) nach John Holland

EXPLORIX (Joerin-Fux et al., 2003) wurde zur Unterstützung bei der Berufswahl und der Laufbahnplanung entwickelt. Der Fragebogen wird auch online zur Selbsttestung mit anschließendem Ergebnisbericht angeboten. Theoretischer Hintergrund ist die Berufswahltheorie von John Holland, der zufolge sechs berufsrelevante Interessens- bzw. Persönlichkeitstypen (z. B. »Realistic«: realistisch, handwerklich-technisch) zu unterscheiden sind. Die Ausprägung der sechs Merkmale wird in einen Code übersetzt, der zu bestimmten Berufen führt.

Externale Konstruktion

Ansatzpunkt der externalen oder auch kriteriumsbezogenen Skalenentwicklung (nicht zu verwechseln mit kriteriumsorientierten Tests) ist das Vorliegen verschiedener Gruppen von Personen als Teil der sozialen Realität. Den Mitgliedern derartiger Gruppen wird eine möglichst große und inhaltlich breit gefächerte Zahl von Items vorgelegt, in der Hoffnung, dass sich darunter einige befinden werden, die zwischen den Gruppen empirisch diskriminieren, also verschiedene Beantwortungsrichtungen oder Lösungswahrscheinlichkeiten zeigen. Jene Items werden schließlich selegiert und zu Skalen zusammengestellt, die zwischen den Gruppen statistisch bedeutsam unterscheiden und bei denen diese Diskrimination einer Kreuzvalidierung an weiteren Personen standhält.

fachspezifischer Studierfähigkeitstest

In Deutschland war für das Fach Medizin ein fachspezifischer Studierfähigkeitstest (Test für Medizinische Studiengänge, TMS) entwickelt worden. Allerdings wurde beschlossen, ihn 1997 letztmalig einzusetzen, weil durch die Beschränkung der Niederlassungsfreiheit für Ärzte nunmehr weniger Studienbewerber in das Fach drängten, was den Aufwand nicht mehr rechtfertigen würde. Inzwischen kommt ein Nachfolgetest an einigen Universitäten in Deutschland sowie in Österreich und der Schweiz (unter dem Namen EMS) wieder zum Einsatz.

Fahreignungsdiagnostik

Die Fahreignungsdiagnostik befasst sich mit unterschiedlichen Aspekten der Fahreignung. Je nach Begutachtungsanlass und Fragestellung liegt der Schwerpunkt etwa auf Verhaltensgewohnheiten im Umgang mit Alkohol, der Persönlichkeit des Fahrers oder auf bestimmten Merkmalen der Leistungsfähigkeit. Im Fall der Fahrerlaubnis zur Fahrgastbeförderung oder bei Zweifeln an der psychischen Leistungsfähigkeit stehen eindeutig kognitive Leistungsmerkmale im Vordergrund. Bei Straftaten, die im Zusammenhang mit der Kraftfahreignung oder der Teilnahme am Straßenverkehr stehen, können Persönlichkeitsmerkmale wie die Bereitschaft zu ausgeprägt impulsivem Verhalten begutachtungsrelevant sein. Damit kommt wieder das diagnostische Interview (»Exploration«) als Methode infrage, eventuell auch Fragebögen, die jedoch verfälschbar sind.

Fahrerlaubnisverordnung

Die rechtliche Grundlage für eine Begutachtung der Fahreignung stellt die »Verordnung über die Zulassung von Personen zum Straßenverkehr« (kurz Fahrerlaubnisverordnung) vom 18.08.1998 (BGBl. I, S. 2214) in der Fassung des Inkrafttretens vom 01.01.2011 dar.

Fairness

Das Gütemerkmal »Fairness« spielt eine Rolle, wenn ein Test zur Auswahl von Bewerbern eingesetzt wird. Ein Test gilt als fair, wenn er nicht bestimmte Personengruppen systematisch benachteiligt.

Familie in Tieren

Für diesen projektiven Test (Brehm-Gräser, 2001) aus der Gruppe der zeichnerischen- und Gestaltungsverfahren benötigt man ein Blatt Papier und Stifte. Das Kind wird aufgefordert, sich seine Familie als Tiere vorzustellen und sie zu malen. Die Zeichnung wird inhaltlich und formal gedeutet; das Manual bietet dazu jedoch keine wissenschaftlich fundierten Auswertungs- und Interpretationsregeln.

Familiendiagnostik

Schneewind (2010) betrachtet Familien als sich entwickelnde, sich selbst regulierende soziale Systeme. Erfolgen Interventionen, kann die familienpsychologische Diagnostik den Zustand vor der Intervention, den Verlauf und den Zustand danach beschreiben.

Farbe-Wort-Interferenztest (FWIT)

Beim Farbe-Wort-Interferenztest (FWIT) nach J. R. Stroop (Bäumler, 1985) werden in der sog. Interferenzbedingung Farbwörter (rot, grün …) vorgegeben, die farbig gedruckt sind. Die Probanden werden aufgefordert, die Druckfarbe zu benennen.

Fehlerwert

Die Abweichung eines beobachteten Testwerts vom wahren Wert einer Person. Diese kommt durch Messfehler zustande, welche von Messung zu Messung variieren - der Erwartungswert (Mittelwert der Messfehler bei unendlich vielen Messungen) beträgt 0. Inhaltlich umfasst das Konzept des Messfehlers die Gesamtheit aller unsystematischen Einflussgrößen, die auf das Messergebnis einwirken können.

FKS: Familienklimaskalen

Die »Family Environment Scale« (FES) ist von Schneewind (1987a) für den deutschen Sprachraum adaptiert und zu den »Familienskalen« weiterentwickelt worden. Die zehn Skalen der FKS betreffen die Beziehung (z. B. »Zusammenhalt«), Persönlichkeitsreifung (z. B. »Selbstständigkeit«) und die Systemerhaltung (z. B. »Kontrolle«).

fluide Intelligenz

Fähigkeit, schnell und richtig zu denken. Sie führt dazu, dass man sich effizient Wissen aneignen kann, wenn hinreichend Lernmöglichkeiten bestehen.

FPI-R: Freiburger Persönlichkeitsinventar – Revidierte Fassung

Das FPI-R (Fahrenberg et al., 2010) ist ein in der Praxis vielverwendeter Persönlichkeitsfragebogen mit langer Tradition; die erste Auflage des FPI erschien bereits 1970. Es handelt sich um eine eigenständige Entwicklung, die sich nicht dem Big-Five-Ansatz verpflichtet sieht. Das FPI-R umfasst zehn Standardskalen (z. B. Lebenszufriedenheit, Gehemmtheit) und zwei globale Zusatzskalen (Emotionalität und Extraversion).

Fragebögen zur Partnerschaftsdiagnostik

Hahlweg (1996) hat drei Fragebögen zur Partnerschaftsdiagnostik entwickelt, darunter den PFB (siehe dort). Sie dienen als diagnostische Instrumente für die Eheberatung und die psychotherapeutische Behandlung von psychischen Störungen (wie Depressionen, Ängste, psychosomatische Störungen u. a.), wenn der Partner hinzugezogen werden soll.

Fragebogenmethode

Die Fragebogenmethode zeichnet sich dadurch aus, dass vorformulierte Fragen oder Feststellungen in schriftlicher Form vorgelegt werden. In einer Instruktion kann festgelegt sein, dass die Fragen in der vorgegebenen Reihenfolge ehrlich und ohne langes Überlegen zu beantworten sind. Das Antwortformat ist ebenfalls festgelegt. Prinzipiell können freie Antworten vorgesehen sein oder das Ankreuzen einer von mehreren Alternativantworten. Die freie Beantwortung spielt jedoch praktisch keine Rolle, weil sie eine aufwendige Auswertung nach sich zieht.

Fraktionierung

Methode bei der Suche nach Moderatorfunktionen: Die Gesamtstichprobe wird nach einer theoretisch bedeutsamen Variablen in (meist zwei bis drei) homogenere Subgruppen aufgeteilt (z. B. männlich - weiblich). Für jede dieser Untergruppen werden getrennt die Test-Kriteriums-Korrelationen ermittelt. Unterscheiden sich diese Validitätskoeffizienten signifikant, so übt die Teilungsvariable einen Moderatoreffekt aus.

Frankfurter Adaptiver Konzentrationsleistungs-Test (FAKT-II)

Beim FAKT-II (Moosbrugger & Goldhammer, 2005) handelt es sich um eine Computerversion des FAIR (siehe dort). Die Konzentrationsfähigkeit wird adaptiv gemessen, indem das Schwierigkeitsniveau der Items »maßgeschneidert« an das individuelle Konzentrationsvermögen des Einzelnen angepasst wird: Je höher die Konzentrationsleistung liegt, desto rascher werden die Items vorgegeben.

Frankfurter Aufmerksamkeits-Inventar (FAIR)

Das Frankfurter Aufmerksamkeits-Inventar (FAIR) von Moosbrugger und Oehlschlägel (1996) verwendet als Testitems vier Zeichen, von denen zwei als Zielitems fungieren (in Testform A »Kreis mit 3 Punkten« sowie »Quadrat mit 2 Punkten«; in Testform B sind Ziel- und Nicht-Zielitems vertauscht). Im Sinne des »vollständigen Markierungsprinzips« haben Testpersonen die Aufgabe, auf dem Testbogen unter jeder Zeile eine Linie zu ziehen und diese bei Zielitems zackenförmig hochzuziehen.

freie Verhaltensbeobachtung

Von einer freien Verhaltensbeobachtung spricht man, wenn der Beobachter selbst entscheidet, welche Verhaltensweisen er beobachtet. Für die Beobachtung gibt es in der Regel einen Anlass, und sie dient meist einem bestimmten Zweck (evtl. Überprüfung konkreter Hypothesen bzw. Beantwortung von Fragen). Selbst wenn sie explorativ ist, wird nicht jedes beliebige Verhalten beobachtet, sondern die Aufmerksamkeit gilt meist bestimmten Bereichen wie Arbeits-, Sozial-, Zwangs- oder Spielverhalten oder der Vermeidung von Angst auslösenden Reizen. Das Ergebnis ist ein mehr oder weniger detaillierter schriftlicher Bericht.

Gefälligkeitsgutachten

Unter Gefälligkeitsgutachten versteht man Gutachten, bei dem das Ergebnisinteresse des Auftraggebers oder das einer anderen Person bzw. Institution über fachlichen Gesichtspunkten steht. Sie sind nicht zulässig.

gemeinsame Methodenvarianz

Häufig wird ein Validitätskriterium mit dem gleichen Methodentypus erfasst wie der Test. (z.B. wird ein Leistungstest an einem anderen Leistungstest validiert). In diesen Fällen kommt die Korrelation mit dadurch zustande, dass Test und Validitätskriterium gemeinsame Methodenvarianz aufweisen. Aus Gründen, die nichts mit dem gemessenen Merkmal zu tun haben (z.B. Motivation, soziale Erwünschtheit, Antwortstile), erreichen manche Personen in beiden Verfahren eher hohe oder eher niedrige Testwerte.

Genogramm

In einem Genogramm werden die Beziehungen zwischen den Mitgliedern einer Familie grafisch dargestellt. Dabei können auch bereits verstorbene oder auch Personen, die nicht der Familie angehören, mit aufgenommen werden. Merkmale der Personen (z. B. Geschlecht) können durch grafische Symbole dargestellt werden.

GES: Griffiths Entwicklungsskalen zur Beurteilung der Entwicklung in den ersten beiden Lebensjahren

Die GES (Brandt & Sticker, 2001) stellen den einzigen Entwicklungstest für die ersten beiden Lebensjahre dar, der an deutschen Kindern standardisiert ist . Untersucht werden die Bereiche Motorik, sozialer Kontakt, Hören und Sprechen, Auge-Hand-Koordination und kognitive Entwicklung.

Geschwindigkeitstests

Geschwindigkeitstests (Speed-Tests) sind Leistungstests, bei welchen bei unbegrenzter Zeitvorgabe alle Items von allen Probanden gelöst würden. Die Differenzierung zwischen den Probanden wird nur durch die Begrenzung der Bearbeitungszeit erreicht. Solche Tests werden häufig zur Prüfung der Konzentration eingesetzt.

Goldberg-Index

"Index, um bei der sog. ""mechanischen Urteilsbildung"" anhand von MMPI-Testergebnissen festzustellen, ob ein Patient psychotisch ist oder nicht. Die individuellen Testwerte aus fünf Skalen werden nach einer Formel addiert und teils auch subtrahiert; bei Überschreitung eines Grenzwertes gilt der Patient als psychotisch."

Gruppenuntersuchung

Test, der mit mehreren Personen gleichzeitig durchgeführt wird

GT: Gießen-Test

Der Gießen-Test (Brähler & Brähler, 1993) ist ein vor einem psychoanalytischen Hintergrund entwickelter Fragebogen mit 40 Items. Er wird vor allem für die Paardiagnostik verwendet. In verschiedenen Varianten kann damit eine realistische oder eine ideale Beschreibung der eigenen Person oder des Partners erhoben werden. Die Items werden zu fünf Skalen (z. B. Dominanz) verrechnet.

Guttman-Modell

Siehe Skalogramm-Modell

Halo-Effekt

Die wohl bedeutsamste Fehlerquelle bei der Verhaltensbeobachtung/-beurteilung ist der Halo-Effekt. Er äußert sich in unangemessen hohen Korrelationen der Urteile über verschiedene Merkmale einer Person. Er soll dadurch zustande kommen, dass das Urteil über ein herausragendes Merkmal die Beurteilungen anderer Merkmale einer Person »überstrahlt«. Beispielsweise wirkt eine Person sehr freundlich; andere Merkmale werden daraufhin positiver beurteilt.

HAWIK-IV: Hamburg-Wechsler-Intelligenztest für Kinder

Beim HAWIK-IV (Petermann & Petermann, 2007) handelt es sich um die deutsche Version der amerikanischen Wechsler Intelligence Scale for Children-IV von 2003. Der Test dient der Messung der Allgemeinen Intelligenz und liefert zusätzlich Informationen über vier kognitive Fähigkeiten, die als Teilaspekte der Intelligenz aufzufassen sind: Sprachverständnis, Wahrnehmungsgebundenes Logisches Denken, Arbeitsgedächtnis und Verarbeitungsgeschwindigkeit.

HCR-20

Die Checkliste HCR-20 (Historical, Clinical, and Risk Management-20 von Webster et al., 1997) liegt auch in einer deutschen Fassung vor (Müller-Isberner et al., 1998). Sie soll zukünftiges gewalttätiges Verhalten vorhersagen. Ein Beurteiler stuft 20 Risikofaktoren (= Items) aus der Vorgeschichte, zu gegenwärtigen klinischen Symptomen und zum künftigen Risiko-Management auf einer dreistufigen Skala (0 = Item trifft definitiv nicht zu; 1 = Item trifft möglicherweise/teilweise zu; 2 = Item trifft sicher zu) ein. Er soll dabei auf alle denkbaren Informationsquellen wie Berichte von Behörden, Ämtern, Polizei und Staatsanwaltschaft oder auf Stellungnahmen von Psychologen, Psychiatern, Sozialarbeitern und Krankenpflegepersonal zurückgreifen; auch ein Interview ist möglich.

Hochbegabung

»Die Feststellung einer intellektuellen Hochbegabung orientiert sich als Richtwert an einem Intelligenzquotienten (IQ) von 130 bzw. einem Prozentrang (PR) von 98« (Amtsblatt des Hessischen Kultusministeriums, 2001, S. 518; zit. nach Rost et al., 2006).

Hofeffekt

Siehe Halo-Effekt

Homogenität

Gemeint ist hiermit das Ausmaß von formaler und inhaltlicher Einheitlichkeit. Sofern der Itemtypus gleich bleibt und dessen Inhalt offenkundig ein- und demselben Aspekt einer Merkmalsdimension gilt, sind die Items (und damit die Skala, die sie konstituieren) homogen. Nach dem Ansatz von Guttman sind Skalen dann homogen, wenn jene Probanden, die ein Item bestimmter Schwierigkeit lösen, auch alle Items geringerer (»darunterliegender«) Schwierigkeit meistern.

ICD-10

Die Internationale Klassifikation psychischer Störungen (»International Classification of Diseases«) in ihrer zehnten Revision (ICD-10; Kapitel V), die von der Weltgesundheitsorganisation (WHO) herausgegeben wird, ist ein aktuell gültiges und in Wissenschaft und klinischer Praxis eingesetztes Klassifikationssystem für psychische Störungen.

Ideografische Prognose

Fehlen geeignete Instrumente, die auf einer statistischen Vorhersage basieren, oder entscheidet sich der Diagnostiker aus grundsätzlichen Überlegungen gegen »starre« statistische Erklärungsansätze, kann mithilfe des ideografischen Ansatzes eine Prognose erstellt werden. Ziel dieses Ansatzes ist es, ein individuelles Erklärungsmodel für den Probanden auszuarbeiten, um damit zu einer Prognose zu gelangen.

impression management

Verzerrung bei Selbstbeschreibungen in Richtung eines sozial erwünschten Bildes. Dabei ist der Wunsch entscheidend, vor anderen einen guten Eindruck machen zu wollen.

indirekte Veränderungsmessung

Bei der indirekten Veränderungsmessung werden die relevanten (meist symptomorientierten) Verfahren, die zu Beginn der Therapie eingesetzt wurden, am Ende der Behandlung erneut vorgegeben.

Induktive Konstruktion

Bei der sog. induktiven Entwicklung von Skalen stützt sich der Konstrukteur im Wesentlichen auf die Korrelationsrechnung bzw. die explorative Faktorenanalyse. Die Items werden aufgrund relativ vager Vorstellungen über das Konstrukt formuliert. Items, die miteinander hoch, aber niedrig mit anderen Items korrelieren (Einfach-Struktur) werden zu einer Skala zusammengefasst.

informierte Einwilligung

Die Teilnahme an einer diagnostischen Untersuchung ist grundsätzlich freiwillig. Die Teilnehmer sollen vor Beginn der Untersuchung über Art und Umfang der Verfahren sowie über die Weitergabe ihrer Ergebnisse informiert werden. Sie können dann entscheiden, ob sie sich der Untersuchung unterziehen oder nicht bzw. ob sie die Teilnahme an einem bestimmten Verfahren verweigern.

Inhaltsvalidität

Unter Inhaltsvalidität versteht man, wie repräsentativ die Items eines Tests für das zu messende Merkmal sind.

Inkrementelle Validität

Bei Anwendung mehrerer diagnostischer Verfahren, die sich ergänzen, ist entscheidend, welcher Zuwachs an Validität mit einem weiteren Verfahren erzielt wird. Diesen Zuwachs nennt man inkrementelle Validität. Das zusätzliche Verfahren erfasst in diesem Fall einen bisher noch nicht berücksichtigten Aspekt des Kriteriums.

Integrative Diagnostik

Die integrative Diagnostik verbindet die Diagnosen auf verschiedenen Ebenen in einer Organisation. Ebenen können die Individual-, Gruppen-, Abteilungs- und die Gesamtorganisationsebene sein.

Integritätstests

Eine spezielle Variante von Persönlichkeitstests findet in Deutschland kaum Verwendung: die Integritätstests. Diese Verfahren wurden entwickelt, um kontraproduktives Verhalten im Unternehmen (Diebstahl, Alkohol- oder Drogenkonsum, Beschädigung oder Zerstörung von Sachen etc.) vorherzusagen.

Intelligenztests (Systematik)

Intelligenztests unterscheiden sich in vielerlei Hinsicht. Messintention: Die Tests sollen die allgemeine Intelligenz oder eine Intelligenzkomponente messen, ein Globalmaß der Intelligenz und/oder Informationen zur Intelligenzstruktur bzw. über einzelne Intelligenzkomponenten liefern, die Intelligenz sprachfrei/kulturfair oder bildungsabhängig messen. Durchführungsbedingungen: Einige können nur als Einzeltest durchführt werden, viele aber auch als Gruppentest, sie betonen unterschiedlich stark speed und power, sind als Papier-und-Bleistift-Test und/oder als Computertest verfügbar und dauern unterschiedlich lange. Zielgruppe: Ein Tests kann für einen bestimmten Alters- oder einen bestimmten Intelligenzbereich vorgesehen sein, sich aber auch für die Gesamtbevölkerung oder für spezielle Personengruppen eignen.

Interaktionismus

Der Interaktionismus betont die Interaktion von Situation und Eigenschaften, ignoriert jedoch die Haupteffekte dieser beiden Faktoren. Demnach wird menschliches Verhalten stets durch das Zusammenwirken von Situation und Persönlichkeitseigenschaften bestimmt.

Interaktionsdiagnostik

Zur unserer Umwelt gehören auch andere Personen, mit denen wir mehr oder weniger kontinuierlich in Kontakt stehen. Daraus ergeben sich, weil davon jeweils mehrere Personen betroffen sind, soziale Konstellationen: Paare, Familien, Gruppen am Arbeitsplatz (Teams) etc. Deshalb sind Verfahren nützlich, die sich auf die soziale Interaktion in diesen Gruppen richten.

Interaktionsprozessanalyse

Zur Erforschung von Interaktionen in Kleingruppen hat Bales bereits 1950 die sog. Interaktionsprozessanalyse (s. Bales, 1975) entwickelt. Die Systematik ist theoretisch fundiert und führt zu insgesamt zwölf Kategorien des Verhaltens. Beobachter, die mit einem solchen Kategoriensystem arbeiten, müssen jede Verhaltensweise einer dieser Kategorien zuordnen – eine Restkategorie gibt es nicht.

Interne Konsistenz

Die interne Konsistenz ist eine Variante der Reliabilität. Sie gibt an, wie gut alle Teile des Tests das gleiche Merkmal messen. Der Test kann dazu in zwei Hälften (Testhalbierungsmethode) oder auch in so viele Teile zerlegt werden, wie Items vorhanden sind. Cronbachs Alpha ist die bekannteste Formel zur Schätzung der internen Konsistenz.

Interpretationsobjektivität

Interpretationsobjektivität ist dann gegeben, wenn alle Testanwender einen bestimmten Rohwert in die gleiche Aussage über die Testperson transformieren. Dazu benötigen sie lediglich zwei Informationen: Erstens, welches Merkmal hier gemessen wurde bzw. wie es zu benennen ist, und zweitens, wie die Ausprägung des Merkmals der Testperson in Relation zu anderen Personen festzustellen ist.

Interview

Interviews dienen generell der Erhebung von Informationen mittels Gespräch. Interviews werden beispielsweise von Journalisten eingesetzt, um politische Standpunkte in Erfahrung zu bringen, oder von Marktforschern, um Einstellungen gegenüber bestimmten Produkten zu erkunden. In anderen Kontexten nennt man Interviews beispielsweise Verhör oder Zeugenbefragung. Der Zusatz »diagnostisches« Interview macht klar, dass es sich um ein Interview zu diagnostischen Zwecken handelt.

Inventar für Interpersonelle Probleme IIP

Mit dem IIP (Horowitz et al., 2000) werden Schwierigkeiten in sozialen Beziehungen auf mehreren Ebenen erfasst: Intimität, Aggressivität, Assertivität, Unabhängigkeit und Geselligkeit.

Inventar komplexer Aufmerksamkeit (INKA)

Das Inventar komplexer Aufmerksamkeit (INKA) von Heyde (1995) zählt zu den Konzentrationstests. Es kombiniert zwei Aufgabentypen: Suchen (von bestimmten Konsonanten in einer Zeile) und Transformation (in andere Konsonanten (z. B. wird B zu Z). Die Aufgabe ist sehr komplex.

In-vivo-Beobachtungen

In-vivo-Beobachtungen finden meist in natürlichen Umgebungen statt. Anwendungsbeispiele sind etwa die Beobachtung aggressiven Verhaltens von Kindern im Kindergarten oder in der Schule oder – bei Erziehungsproblemen – die Beobachtung der Interaktionen von Eltern und Kindern in ihrer Wohnung.

IST-2000-R: Intelligenz-Struktur-Test 2000 – Revision

Der I-S-T 2000-R (erw.) (Liepmann et al., 2007) ist ein breit angelegter Intelligenztest, der mehrere Kennwerte zur Intelligenz liefert. Er besteht aus zwei separat einsetzbaren Teilen: Das »Grundmodul« dient der Messung des schlussfolgernden Denkens, der fluiden Intelligenz sowie bei Bedarf, mit zwei separaten Subtests, auch der Merkfähigkeit. Das »Erweiterungsmodul« erfasst allgemeines Wissen; daraus kann die kristallisierte Intelligenz geschätzt werden. Der Test liefert darüber hinaus auch Kennwerte für die verbale, numerische und figurale Intelligenz.

Itemformat

Die Items eines Leistungs- oder eines Persönlichkeitstests können auf unterschiedliche Weise zu beantworten sein. Eine wichtige Unterscheidung ist die zwischen freien und gebundenen Antworten. Ein Test, der freie Antworten verlangt, ist der Rorschach-Test (s. Abschn. 3.5). Dem Probanden wird ein Tintenklecks mit der Frage vorgelegt »Was könnte das sein?« (die Antwort, z. B. »eine Fledermaus«, wird hier vom Testleiter protokolliert). Das andere Extrem ist die Vorgabe eines Items wie »Ich bin ein ehrgeiziger Mensch« und die Einengung der Antwortwortmöglichkeiten auf das Ankreuzen von »Ja« oder »Nein«. Zwischen diesen beiden Extremen gibt es weitere Varianten.

Item-Response-Theorie (IRT)

Die Item-Response-Theorie (probabilistische Testtheorie) geht explizit der Frage nach, welche Rückschlüsse von den Itemantworten (»responses«) der Probanden auf latente Variablen wie Einstellungen, Persönlichkeits- oder Fähigkeitsmerkmale gezogen werden können. Die Items gelten als homogen bezüglich der latenten Variablen, wenn bestimmte Bedingungen wie lokale stochastische Unabhängigkeit erfüllt sind.

Itemschwierigkeit

Die Itemschwierigkeit gibt an, wie groß der Anteil an Personen ist, die das Item im Sinne des Merkmals beantwortet haben.

Itemvalidität

Berechnet wird der Zusammenhang eines Items mit einem Außenkriterium. Bei external konstruierten Tests ist dieser Kennwert sogar wichtiger als die Trennschärfe. Die Itemvalidität kann sowohl als Korrelation mit einem Kriteriumswert berechnet werden als auch durch einen Mittelwertsvergleich.

Job design module

Mit diesem Modul sollen Merkmale einzelner Arbeitsplätze einschließlich ihrer strukturellen Anforderungen sowie Einstellung und Zufriedenheit der Arbeitenden erfasst werden. Ein Item des Vorgesetztenfragebogens betrifft beispielsweise die Anzahl der schriftlichen Anweisungen und Verfahrensweisen für die Hauptarbeitsaufgabe.

Kaufman-Assessment Battery for Children (K-ABC)

Die K-ABC (Kaufman-Assessment Battery for Children, deutsche Version von Kaufman et al., 2001) stellt ein eigenständiges, nicht an die Wechsler-Tests angelehntes Verfahren dar. Im Gegensatz zum HAWIK-IV wird beim K-ABC strikt zwischen Intelligenz im Sinne einer kognitiven Leistungsfähigkeit und erworbenen Fertigkeiten unterschieden. Die K-ABC kann bereits im Vorschulalter eingesetzt werden, des Weiteren stehen vier sprachfreie Untertests zur Verfügung.

Kieler Änderungssensitive Symptomliste KASSL

Die Kieler Änderungssensitive Symptomliste KASSL wurde im Kontext der Gesprächspsychotherapie entwickelt und erfasst mit 50 Fragebogenitems eine Reihe von Beschwerden. Auf faktorenanalytischer Basis wurden die Skalen sozialer Kontakt, Stimmung, Beruf sowie Leistung und Konzentration etabliert. Zusätzlich kann ein Gesamtwert zur Symptombelastung gebildet werden

Klassifikation

Spezialfall der Beschreibung, bei dem Menschen zu vordefinierten Klassen zugeordnet werden.

Klassische Testtheorie

Die KTT ist eine Reliabilitätstheorie, liefert also eine theoretische Begründung der Reliabilität (Messgenauigkeit) eines Tests. Eine grundlegende Annahme ist, dass Testwerte, also die Ergebnisse, die uns Persönlichkeitsfragebögen, Intelligenztests, Konzentrationstests etc. liefern, fehlerbehaftet sind.

Klinische Psychologie

Gegenstand der Klinischen Psychologie ist die Erforschung von Entstehung und Aufrechterhaltung psychischer Störungen sowie auch körperlicher Störungen, bei denen psychische Faktoren eine bedeutsame Rolle spielen. Zur Klinischen Psychologie gehören die Diagnostik der entsprechenden Erkrankungen und Probleme sowie die Entwicklung und Überprüfung psychologischer bzw. psychotherapeutischer Behandlungen. Dabei werden Erkenntnisse und Forschungsmethoden aus den Grundlagenfächern der wissenschaftlichen Psychologie genutzt.

KLT-R: Konzentrations-Leistungs-Test – Revidierte Fassung

Dem KLT-R von Düker et al. (2001) liegt das Konzept der Koordination zugrunde. Darunter verstehen die Autoren das geordnete Zusammenwirken von Einzeltätigkeiten, die zur Erreichung eines bestimmten Zweckes erforderlich sind. Bei der Bearbeitung der Items des KLT sind die Einzeltätigkeiten »Auffassen«, »Rechnen«, »Merken«, »Regelabruf« und »Entscheiden« zu koordinieren.

kompensatorisches Entscheidungsmodell

Ein kompensatorisches Entscheidungsmodell bedeutet, dass sich die Prädiktoren gegenseitig ausgleichen (kompensieren) können. Es wird ein Gesamtwert berechnet, in den die Merkmale gleich gewichtet oder auch mit unterschiedlichen Gewichten eingehen. Die optimale Gewichtung kann man empirisch u. a. mittels multipler Regression ermitteln.

Konfidenzintervall

Als Konfidenzintervall (auch Erwartungsbereich oder Vertrauensintervall) bezeichnet man den Bereich, in dem der wahre Testwert einer Person bei einer zuvor festgelegten Sicherheits- bzw. Irrtumswahrscheinlichkeit liegt.

Konstruktvalidität

Unter Konstruktvalidität versteht man empirische Belege dafür, dass ein Test das Konstrukt erfasst, welches er erfassen soll – und nicht ein anderes.

Kontrollskalen

Um eine Verfälschung bei der Bearbeitung von Fragebögen zu entdecken, steht eine Reihe von Kontrollskalen zur Verfügung, die in unterschiedlichem Maße »self-deception« und »impression management« erfassen.

konvergente Validität

Den Zusammenhang mit weiteren Indikatoren des Konstrukts, das man erfassen will, nennt man konvergente Validität.

Konzentration

Schmidt-Atzert et al. (2004) haben vorgeschlagen, den Begriff »Konzentration« auf alle Stufen der Verarbeitung von Informationen zu beziehen: von der selektiven Wahrnehmung (= Aufmerksamkeit) über die Kombination und Speicherung bis hin zur Handlungsplanung. Konzentration wird als Fähigkeit verstanden, unter Bedingungen schnell und genau zu arbeiten, die das Erbringen einer kognitiven Leistung normalerweise erschweren.

Konzentrationstest für 3. und 4. Klassen – Revision (KT 3-4 R)

Die Items des Konzentrationstests für 3. und 4. Klassen – Revision (KT 3-4 R) von Nell et al. (2004) beinhalten Würfel, die zeichnerisch so dargestellt sind, dass man immer drei Flächen mit jeweils 1 bis 6 Punkten sehen kann. Jedes Item ist mit den vier Musterwürfeln zu vergleichen.

Konzentrationstests

Konzentrationstests lassen sich – beispielsweise im Gegensatz zu Intelligenztests – nicht nach theoretischen Modellen unterscheiden, da solche Modelle bisher nicht ausgearbeitet wurden. Für Anwender ist vor allem relevant, welche Art von Aufgaben verwendet wird und für welche Zielgruppe ein Test vorgesehen ist. Die Art der Testaufgaben ist wichtig, da häufig nicht »die« Konzentrationsfähigkeit (als allgemeine und breite Fähigkeit) gefragt ist, sondern die Fähigkeit, sich unter näher bestimmbaren Bedingungen zu konzentrieren.

Konzentrierte Aufmerksamkeit

Tests, die von Schmidt-Atzert et al. (2008) der konzentrierten Aufmerksamkeit zugeordnet werden, erfordern die Aufrechterhaltung der Aufmerksamkeit. Der entscheidende Unterschied zur Daueraufmerksamkeit besteht darin, dass die Probanden ihr Arbeitstempo selbst bestimmen können. Nicht der Computer gibt vor, wann das nächste Item erscheint, sondern der Proband bearbeitet alle Aufgaben nacheinander in dem von ihm gewählten Arbeitstempo.

kristalline Intelligenz

entspricht dem durch Lernen angeeigneten Wissen

kriteriumsbezogene Skalenentwicklung

Siehe externale Konstruktion

kriteriumsorientierte Tests

Kriteriumsorientierte Tests sind inhaltsvalide Testverfahren, die nicht die Position einer Person in Relation zu einer Vergleichsnorm, sondern das Erreichen oder Verfehlen eines konkreten Kriteriums ermitteln wollen.

Kriteriumsvalidität

Unter Kriteriumsvalidität versteht man den Zusammenhang zwischen Testergebnis und konkreten Leistungen oder Verhaltensweisen außerhalb der Testsituation. Das Kriterium muss für den vorgesehenen Einsatzbereich des Tests relevant sein. Die Erhebung des Kriteriums kann im gleichen Zeitraum erfolgen wie die Testdurchführung, aber auch deutlich später. Man spricht in diesem Zusammenhang dann von Übereinstimmungsvalidität (»concurrent validity«) bzw. prognostischer Validität oder Vorhersagevalidität (»predictive validity«).

Kritische Differenz

"In der Praxis werden manchmal zwei Testwerte eines Probanden verglichen. Mithilfe der Berechnung einer ""Kritischen Differenz"" kann man herausfinden, wie groß eine Differenz zwischen zwei Testwerten sein muss, um nicht mehr alleine mit Messfehlern erklärt werden zu können. "

Künstliche Neuronale Netze

Künstliche Neuronale Netze unterscheiden sich von den üblichen Regressionsmodellen zunächst dadurch, dass zwischen den Prädiktoren und dem Kriterium eine Zwischenschicht mit eingefügt wird, die den Zusammenhang zwischen ihnen vermittelt. Die Anzahl der »Neurone« in der Zwischenschicht ist frei wählbar. Zunächst werden die Verbindungen mit Zufallszahlen gewichtet; die Neurone »lernen« durch Variation der Gewichtung der einzelnen Pfade, wie sie das Kriterium optimal vorhersagen können. Nutzbringende Pfade werden iterativ verstärkt, während andere abgeschwächt werden. Das Modell wird so lange optimiert, bis die von ihm vorgesagten Kriteriumswerte gut zu den tatsächlichen passen. Künstliche Neuronale Netze sind robuste mathematische Algorithmen, für die nur relativ wenige Voraussetzungen erfüllt sein müssen. Allerdings besteht grundsätzlich immer die Gefahr, dass sie überangepasste Lösungen erzeugen, also Zufallsvarianz ausbeuten.

latente Variablen

Bei den latenten Variablen handelt es sich im Kontext der IRT um die Merkmalsausprägung in nicht beobachtbaren, dahinterliegenden Dispositionen (Einstellungen, Persönlichkeitsmerkmalen, Fähigkeiten), von welchen das manifeste Verhalten als abhängig angesehen wird.

Latent-Trait-Modelle

Latent-Trait-Modelle gehen davon aus, dass sowohl die Ausprägungen verschiedener Probanden auf den latenten Traits als auch die traitbezogenen Anforderungen der Items an die Personen jeweils durch einen Parameter, nämlich einen einzelnen numerischen Kennwert, charakterisiert werden können. Ersterer wird als Personenparameter bezeichnet (Fähigkeits-, Einstellungs-, Dispositionsparameter, nämlich die Fähigkeit des Probanden hinsichtlich des latenten Traits), letzterer als Itemparameter. Üblicherweise werden die numerischen Ausprägungen der beiden Parameter auf einer gemeinsamen Skala (»joint scale«) angegeben.

Leistungsbeurteilung

Viele Unternehmen nehmen regelmäßig, meist einmal im Jahr, eine Personal- oder Mitarbeiterbeurteilung vor. Anlass für eine Mitarbeiterbeurteilung können auch der Ablauf der Probezeit eines Mitarbeiters oder der Weggang einer Führungskraft sein. Da meist die Beurteilung der Leistung im Vordergrund steht, wird dafür häufig auch der Begriff »Leistungsbeurteilung« verwendet. Die Beurteilung kann schriftlich in Form eines Zwischenzeugnisses oder in einem Gespräch erfolgen.

Leistungsprüfsystem (LPS)

Das Leistungsprüfsystem LPS (Horn, 1983) ist ein Intelligenztest mit 15 Untertests. Diese sollen die Thurstone-Faktoren Verbal Comprehension (Tests 1, 2, 5, 6, 12), Reasoning (3, 4), Word Fluency (5, 6), Closure (10, 11), Space (8, 9, 10), Perceptual Speed (13, 14) und Number (Arbeitskurve) erfassen.

Leistungstest

In Leistungstests müssen die Testpersonen arbeiten: Sie rechnen, vergleichen geometrische Figuren miteinander, suchen Fehler in Texten oder bestimmte Figuren unter ähnlichen etc. Gemessen wird, wie viele solcher Aufgaben sie in einer feststehenden Bearbeitungszeit lösen oder wie viel Zeit sie zur Bearbeitung einzelner oder auch aller Aufgaben brauchen. Die geleistete Arbeit ist damit quantifizierbar; das Ergebnis nennen wir Testleistung.

LMI: Leistungsmotivationsinventar

Schuler & Prochaska (2001) verfolgten bei der Entwicklung des LMI das Ziel, ein Verfahren zur »breiten« Messung der berufsbezogenen Leistungsmotivation bereit zu stellen. Dem entsprechend liefert das LMI nicht nur einen Gesamtwert, sondern auch eine Beschreibung der individuellen Leistungsmotivation auf 17 Skalen.

logischer Fehler

Der logische Fehler kommt basiert auf der unangemessen Annahme, das hohe Interkorrelationen zwischen zwei oder mehr Merkmalen oder Verhaltensweisen bestehen. Anstatt die Ausprägung eines Verhaltens oder Merkmals unabhängig einzuschätzen, wird sie aufgrund impliziter Zusammenhangsannahmen aus anderen Variablen mit erschlossen.

macroorganizational module

Das Modul der Messung der Gesamtstruktur der Organisation; dazu gehören etwa die Anzahl der Hierarchieebenen und der Vorgesetzten/Untergebenen-Quotient.

manifeste Variablen

Bei den manifesten Variablen handelt es sich im Kontext der IRT um das beobachtbare Antwortverhalten auf verschiedene Testitems.

Mannheimer Test zur Erfassung des physikalisch-technischen Problemlösens (MTP)

Ein Test zum technischen Verständnis. Der MTP (Conrad et al., 1980) erfasst damit einen Aspekt der kristallisierten Intelligenz.

Marburger Modell

In der Diagnostikausbildung am Fachbereich Psychologie der Universität Marburg hat sich ein Modell zur Erläuterung von normbasierten Testergebnissen bewährt. Zur Klassifikation der Ausprägung eines Merkmals werden fünf Bereiche unterschieden: sehr niedrig – niedrig – durchschnittlich – hoch – sehr hoch. Der mittlere Bereich (»durchschnittlich«) umfasst den Mittelwert +/– eine halbe (!) Standardabweichung, bei Standardwerten also den Bereich von 95–105. Damit werden 38 Prozent der Personen als durchschnittlich klassifiziert. Die weiteren Bereiche umfassen jeweils eine ganze Standardabweichung (z. B. hoch = 106–115). Die Merkmalsausprägung kann auf einer fünfstufigen Skala visualisiert werden, was insbesondere bei mehrdimensionalen Verfahren angebracht ist. Die Konfidenzintervalle werden ebenfalls visualisiert. Bei der Verbalisierung wird immer Bezug auf die herangezogene Referenzgruppe genommen.

Medizinische Diagnostik

Medizinische Diagnostik befasst sich mit dem Menschen als Merkmalsträger, fokussiert jedoch überwiegend auf körperliche Merkmale und nur selten auf Verhalten und Erleben.

Mehrfachwahl-Wortschatz-Test (MWT)

Der MWT liegt in zwei Versionen vor: MWT-A (Lehrl et al., 1974) und MWT-B (Lehrl & Gallwitz, 1977) und soll über den Wortschatz die kristallisierte Intelligenz messen.

Methode des zirkulären Fragens

Mit der Methode des zirkulären Fragens werden Familienmitglieder (bzw. Mitglieder des untersuchten »Systems«) nacheinander über persönliche Sichtweisen und Mutmaßungen über die jeweils anderen Beteiligten befragt. Dadurch erhalten alle Beteiligten gleichzeitig Informationen zu den unterschiedlichen Sichtweisen der Einzelnen auf die jeweiligen Beziehungen und zu den interaktionellen Motiven.

Milde-Fehler

Eine Antworttendenz; ein Mildefehler wird darin sichtbar, dass ein Beobachter insgesamt positivere Urteile abgibt als andere Beobachter.

Minderungskorrektur

Wenn Messwerte fehlerbehaftet sind, wirkt sich dies mindernd auf die Höhe der Korrelation mit einer anderen Variablen aus. Die doppelte Minderungskorrektur liefert eine Schätzung für die Korrelation der wahren Werte zweier Variablen, wenn deren Reliabilitätskoeffizienten bekannt sind. Damit wird gleichsam die »Minderung« korrigiert, welcher Korrelationskoeffizienten unterliegen, wenn die miteinander korrelierten Messwerte fehlerbehaftet sind. Die einfache Minderungskorrektur liefert eine Schätzung für die Korrelation eines Tests mit einem Kriterium unter der Annahme, dass das Kriterium messfehlerfrei erfasst wird. Damit wird gleichsam die »Minderung« korrigiert, die durch die fehlerbehaftete Messung des Kriteriums entsteht.

MMPI-2: Minnesota-Multiphasic-Personality-Inventory-2

"Beim MMPI-2 (Hathaway et al., 2000) handelt es sich um einen Persönlichkeitsfragebogen für den klinischen

Bereich. Es dient hauptsächlich dazu, Probanden diversen psychiatrischen Kategorien zuzuordnen oder um festzustellen, dass sie zur unauffälligen »Normal«-Population gehören. "
Moderatoreffekt

Ein Moderatoreffekt liegt vor, wenn die Korrelation einer Variablen (z.B. Berufserfolg) mit einer zweiten Variablen (z.B. Abiturnote) von einer dritten Variablen (z.B. dem sozioökonomischen Status der Probanden) abhängt. Die Höhe der Validität eines Tests hängt also von einer Drittvariablen ab.

Multimethodales Vorgehen

Multimethodales Vorgehen bedeutet, dass ein Merkmal mit verschiedenen Arten von Verfahren (z. B. Leistungstest, diagnostisches Interview) erfasst wird.

Multimodales Einstellungsinterview

Schuler (1992) hat mit dem sog. »Multimodalen Einstellungsinterview« ein Konzept zur Gestaltung von Einstellungsgesprächen vorgelegt. Das Attribut »multimodal« weist darauf hin, dass dem Interview unterschiedliche Methoden (z. B. situative und biografiebezogene Fragen) zugrunde liegen. Soll eine Stelle besetzt werden, kann das Einstellungsgespräch nach diesem Modell geplant und bei allen Bewerbern angewandt werden.

multiple cutoff

Siehe Und-Strategie

Multiple-Choice-Aufgaben

Für eine Frage stehen mehrere Antwortmöglichkeiten zur Verfügung. Der Proband soll die richtige(n) anzukreuzen. Dieser Aufgabentyp findet bei Leistungstests sehr oft Verwendung.

Multitrait-Multimethod-Analyse

Jede Eigenschaft wird mit unterschiedlichen Methoden (z. B. Fragebogen, Fremdbeurteilung) erfasst. Die resultierende Korrelationsmatrix ist die Multitrait-Multimethod-Matrix. Die Korrelationen geben Aufschluss über die diskriminante und die konvergente Validität.

Negativer Prädiktionswert

Wahrscheinlichkeit, mit der eine negative Diagnose zutreffend ist

Neglect

Patienten mit dieser Störung erkennen Reize, die auf einer Seite des Wahrnehmungsfeldes dargeboten werden, nicht. Sie reagieren nicht auf entsprechende Reize und stoßen beispielsweise mit der Schulter am Türrahmen an.

NEO-PI-R: NEO-Persönlichkeitsinventar nach Costa und McCrae – Revidierte Fassung

Das NEO-PI-R (Ostendorf & Angleiter, 2004) ist ein Persönlichkeitstest, der dem Big-Five-Modell verpflichtet ist. Zu jeder der großen Dimensionen Neurotizismus, Extraversion, Offenheit für Erfahrung, Verträglichkeit und Gewissenhaftigkeit liegen zusätzlich sechs Subskalen (Facetten) vor.

Neuropsychologische Diagnostik

Die neuropsychologische Diagnostik befasst sich mit Störungen, die auf (angeborene oder erworbene) Defekte im Zentralnervensystem zurückzuführen sind. »Ziel der neuropsychologischen Diagnostik ist die Erfassung und Objektivierung von kognitiven und affektiven Funktionsstörungen nach einer Hirnfunktionsstörung oder Hirnschädigung und ggf. der emotionalen Reaktionen des Patienten auf diese Störungen« (Gesellschaft für Neuropsychologie et al., 2005, S. 185).

Neyman-Pearson-Kriterium

Eine Entscheidungsregel, um die Fehler bei Zuordnungsverfahren gering zu halten. Das Neyman-Pearson-Kriterium erlaubt es, unterschiedliche Risiken von Fehlentscheidungen in die Klassenzuordnungsunterscheidung mit einzubeziehen. Sein Prinzip besteht darin, das Modell der statistischen Hypothesenprüfung auf die Klassenzuordnungsentscheidung anzuwenden.

nichtsequentielle Batterie

Die gesamte Batterie von diagnostischen Verfahren wird an alle Probanden vorgegeben, und es werden diejenigen Probanden ausgewählt, die in dem zugrunde gelegten Entscheidungsmodell die höchsten Werte erzielen. Zur Auswahl kann etwa der (optimal gewichtete) Summenwert herangezogen werden.

Nichtsprachliche Persönlichkeitstests

Wie ein Proband auf ein Item reagiert, hängt auch davon ab, wie er die Iteminhalte versteht und interpretiert. Mit nichtsprachlichen Tests soll die Abhängigkeit vom Sprachverstehen reduziert werden. Im Leistungsbereich haben sprachfreie Verfahren eine lange Tradition. Nichtsprachliche Persönlichkeitstests verwenden Bilder anstatt Worte, um eine Situation und ein Verhalten zu beschreiben. Der Proband gibt an, ob er sich so verhalten würde, wie es auf dem Bild zu sehen ist.

nichtteilnehmende Verhaltensbeobachtung

Der Beobachter ist in der Beobachtungssituation anwesend, verhält sich jedoch passiv.

Niveautests

Niveautests (Power-Tests) sind Leistungstests, bei welchen auch bei unbegrenzter Zeitvorgabe von keinem Testteilnehmer alle Aufgaben gelöst würden. Die Items sind meist nach ihrer Schwierigkeit gereiht; die Aufgaben werden gegen Ende immer schwerer lösbar.

nomologisches Netzwerk

Unter einem nomologischen Netzwerk werden Aussagen oder Gesetze verstanden, die die Beziehung zwischen (a) beobachtbaren Merkmalen, (b) theoretischen Konstrukten und Beobachtbarem oder (c) verschiedenen theoretischen Konstrukten beschreiben. Es kann sich dabei um feste, deterministische Zusammenhänge handeln oder auch um statistische.

Nomothetische Prognose

Bei der Begutachtung können statistische Erkenntnisse über viele vergleichbare Fällen genutzt werden. Beispielsweise kann eine Rückfallprognose damit begründet werden, dass Straftäter mit ähnlicher Vorgeschichte, gleichem Geschlecht und etwa gleichem Alter häufig rückfällig werden.

Normierung

Die Normierung eines Tests liefert ein Bezugssystem, um die individuellen Testwerte im Vergleich zu denen einer größeren und meist repräsentativen Stichprobe von Testteilnehmern einordnen zu können. Normen sind wichtig, wenn ein Test zur Individualdiagnostik eingesetzt wird.

Normwerte

Die Rohwerte in einem Test (z. B. die Summe richtiger Antworten) werden zur Interpretation in Normwerte transformiert. Diese geben an, wie viele Standardabweichungen ein Proband unter oder über dem Mittelwert der Vergleichsgruppe liegt. Es gibt verschiedene Normwerte, die sich darin unterscheiden, welcher Zahlenwert für eine genau durchschnittliche Ausprägung (Mittelwert der Vergleichsgruppe) steht und welcher für eine Standardabweichung. Bei IQ-Werten etwa beträgt der Mittelwert 100 und eine Standardabweichung entspricht 15 Punkten, bei T-Werten betragen diese Werte 50 und 10. Weitere gebräuchliche Normwerte sind Z-Werte (Standardwerte), Centil- und Stanine-Werte. Ein Normwert kann in einen anderen umgerechnet werden (Beispiel: IQ 115 entspricht T-Wert 60). Prozentrangwerte (siehe dort) stellen eine besondere Art von Normen dar.

Nürnberger-Alters-Inventar (NAI)

Eine Testbatterie, die speziell für ältere Menschen entwickelt und normiert wurde, ist das Nürnberger-Alters-Inventar (NAI; Oswald & Fleischmann, 1997). Es handelt sich um eine Auswahl altersgerechter Leistungstests zur kognitiven Schnelligkeit (u. a. ein Zahlen-Symbol-Test) und zum Gedächtnis sowie Skalen zur Selbst- und Fremdbeurteilung.

Objektive Persönlichkeitstests

Objektive Persönlichkeitstests werden heute in der Regel computergestützt durchgeführt. Der Test wirkt meist wie ein Leistungstest: Die Probanden sollen auf bestimmte Aufgaben reagieren und haben dabei nur einen kleinen Verhaltensspielraum, können also nur zwischen wenigen Optionen wählen. Dadurch werden die Durchführung und die Auswertung standardisiert. Letztere besteht beispielsweise darin, dass ein Kennwert für die Häufigkeit risikoreicher Entscheidungen oder für die Ausdauer bei einer gleichförmigen Aufgabe berechnet wird. Die Testperson ist sich dabei in der Regel nicht über die Bedeutung ihres Verhaltens im Klaren, so dass es ihr schwerfallen würde, sich sozial erwünscht darzustellen. Objektive Persönlichkeitstests sind stärker verbreitet als nichtsprachliche Persönlichkeitstests.

Objektivität

Objektivität bedeutet, dass die Ergebnisse eines diagnostischen Verfahrens unabhängig davon zustande kommen, wer die Untersuchung, die Auswertung und die Interpretation durchführt.

Oder-Strategie

Bei einer »Oder-Strategie« genügen entsprechend hohe Punktwerte in einem von mehreren Prädiktoren. Eine solche Auswahlstrategie liegt dann nahe, wenn die durch das Kriterium geforderte Leistung entweder auf die eine oder auf die andere Weise erbracht werden kann.

Offenbarungspflicht

Gesetzliche Regelung (§ 138 StGB), die die Pflicht zur Anzeige bestimmter geplanter Straftaten betrifft

OLMT: Objektiver Leistungsmotivations Test

Der Objektive Leistungsmotivations Test OLMT (Schmidt-Atzert, 2007) soll die Leistungsmotivation über eine kognitiv wenig anspruchsvolle Aufgabe messen: Durch Drücken von zwei Tasten ist auf dem Bildschirm wiederholt eine »Straße« möglichst schnell abzufahren. Der Test liefert mit vier Hauptkennwerten (z. B. »Anspruchsniveau«, »Motivation durch Konkurrenz«) Informationen zur individuellen Leistungsmotivation.

Operationalisierte Psychodynamische Diagnostik OPD

Ziel dieses Ansatzes ist, diagnostische Konzepte der psychodynamischen Theorie und Psychotherapie möglichst reliabel zu erfassen. Über nichtformalisierte oder standardisierte diagnostische Gespräche werden theoretisch relevante Bereiche auf fünf Achsen (z. B. zeitlich überdauernde Konflikte) abgebildet.

Organigramm

Mit dem Organigramm können Organisationen und Verbände in ihrer hierarchischen Struktur und den wechselseitigen formellen und informellen Abhängigkeiten von Stellen bzw. Personen grafisch dargestellt werden.

Organisationsdiagnostik

»Die [psychologische] O-Diagnose dient dazu, die psychologischen Aspekte des Erlebens und Verhaltens von Mitgliedern in Organisationen zu diagnostizieren, um Regelhaftigkeiten im Erleben, im Verhalten und in den Interaktionen zu beschreiben, zu erklären und zu prognostizieren« (Büssing, 2007, S. 558).

Overachiever

Messfehlerbedingt mögen sich unter den diagnostizierten Hochbegabten auch Personen mit einem wahren IQ von etwas weniger als 130 befinden. Es sind normal begabte Overachiever, die durch herausragende Leistungen aufgefallen sind und in der diagnostischen Untersuchung die magische IQ-Grenze von 130 erreicht haben.

PAI 30: Test zur Praktischen Alltagsintelligenz

Praktische Alltagsintelligenz wird, so vermuten die Autoren (Mariacher & Neubauer, 2005), in der Regel nicht durch eine bestimmte Ausbildung, sondern durch die Auseinandersetzung mit der eigenen Lebensumwelt erworben. Diese Fähigkeit zeige sich »in der Auffindung von praktischen Problemlösungen bezogen auf materielle Gegebenheiten im Alltag« (S. 11). Die Autoren grenzen das Konzept von dem der Praktischen Intelligenz ab, das auch den effizienten Umgang mit der sozialen Umwelt einschließe. Der Test umfasst 30 Aufgaben, in denen jeweils ein alltagspraktisches Problem beschrieben und durch eine Skizze oder Foto veranschaulicht wird; die Lösung ist frei zu beschreiben oder durch Ankreuzen einer Antwortalternativen einzutragen.

Papier-und-Bleistift-Test

Test, für dessen Bearbeitung man lediglich Papier (z.B. Fragebogen) und ein Schreibutensil (z.B. Bleistift) benötigt

Paralleltest-Reliabilität

Die Vorgabe paralleler Versionen eines Tests an ein und dieselbe Gruppe von Personen gilt als »Königsweg« der Reliabilitätsbestimmung. Wie bei der Retest-Methode wird an zwei Zeitpunkten gemessen. Die Reliabilität des Tests ergibt sich aus der Korrelation der beiden Tests. Der zweite Test ist jedoch nicht mit dem ersten identisch, sondern nur inhaltlich äquivalent. Da Übungs- und Erinnerungseffekte keine Rolle spielen, kann ein relativ kurzes Zeitintervall gewählt werden. Das Problem der Merkmalsfluktuation (Veränderung eines Merkmals über die Zeit) verliert damit an Bedeutung.

Partnerschaftsfragebogen PFB

Der Partnerschaftsfragebogen von Hahlweg (1996) zielt auf die Erfassung der Ehequalität ab. Die Items betreffen überwiegend das Verhalten des Partners und werden zu den Skalen »Streitverhalten«, »Zärtlichkeit« und »Gemeinsamkeit/Kommunikation« verrechnet.

Part-whole-Korrektur

Wenn bei der Berechnung der Trennschärfe (Korrelation Item - Testwert) das Item im Testwert enthalten ist, kommt es partiell zu einer Korrelation des Items mit sich selbst. Die Korrelation des Items mit dem Test wird dadurch künstlich erhöht. Bei der manuellen oder EDV-gestützten Berechnung der Trennschärfe wird der Wert für das Item immer vom Gesamtwert subtrahiert, bevor die Korrelation berechnet wird.

personenbezogen-empirische Methode

Die personenbezogen-empirische Methode nutzt empirisch ermittelte Zusammenhänge zwischen Personenmerkmalen wie Intelligenz oder Persönlichkeitsmerkmalen und Kriterien des Ausbildungs- oder Berufserfolgs. Idealerweise stammen die Validitätsbefunde aus dem eigenen Unternehmen. Da die eingestellten Bewerber in der Regel nach den erhobenen Merkmalen ausgewählt wurden, ist die Streuung der Prädiktoren eingeschränkt. Für eine angemessene Bewertung der Korrelationen muss unbedingt die Varianzeinschränkung rechnerisch korrigiert werden.

Personenlizenzen

Im Rahmen der berufsbezogenen Eignungsbeurteilung nach DIN 33430 wurden Personenlizenzen eingeführt, zu deren Erwerb man erfolgreich an einer Prüfung teilnehmen muss. Neben einer umfassenden Lizenz ist es möglich, eine Lizenz »Mitwirkende an Eignungsinterviews« und eine Lizenz »Mitwirkende an Verhaltensbeobachtungen« zu erwerben. Dahinter verbirgt sich das Konzept, Personen, die ausschließlich Eignungsinterviews durchführen bzw. die als Beobachter in einem Assessment Center fungieren, speziell für diese Aufgabe zu schulen und durch eine Prüfung ihre Qualifikation festzustellen.

Platzierung

Bei einer Platzierungsentscheidung verbleiben alle Probanden im System. Sie werden lediglich einer von mehreren Bedingungen zugeordnet. Dies kann eine Personalentwicklungsmaßnahme, eine Schulklasse oder etwa (in der klinischen Psychologie) eine bestimmte Therapie sein.

polytome Items

Items mit mehrfach gestufter Antwortmöglichkeit

Positiver Prädiktionswert

Wahrscheinlichkeit, mit der eine positive Diagnose zutreffend ist

Power-Tests

Siehe Niveautests

Primacy- und Recency-Effekt

Unter Primacy- und Recency-Effekt versteht man, dass sich Beurteiler übermäßig stark von den Beobachtungen beeinflussen lassen, die sie am Anfang bzw. am Ende der Beobachtungsphase gemacht haben.

Probabilistische Testtheorie

Siehe Item-Response-Theorie

Problemanalyse

Die Problemanalyse beginnt auf der Ebene des »Verhaltens in Situationen« (ViS). Zentraler Schritt ist dabei zunächst die genaue Exploration und Beschreibung des Problems bzw. der Symptomatik auf den drei zentralen Ebenen: Physiologie (Welche körperlichen Vorgänge treten auf?), Kognition und Emotion (Welche Gedanken und Gefühle gehören zur Symptomatik bzw. gehen mit ihr einher?), Verhalten (Was tut die Person?).

Projektion

Der Begriff der Projektion geht auf Freud zurück und meint ursprünglich die Verlegung einer Eigenschaft, die das Ich bedroht und an der eigenen Person nicht wahrgenommen wird, auf eine Person der Außenwelt.

Prototypenansatz

Die Objekte der Umwelt werden von uns in Kategorien wie z. B. Möbel, Früchte oder Tiere gruppiert. Innerhalb jeder dieser Kategorien gibt es Exemplare, die das Gemeinsame der jeweiligen Klasse in besonderer Klarheit in sich vereinigen (Prototypen). Weitere Objekte werden in eine Kategorie aufgenommen, wenn sie den Prototypen ähnlich sind. Bei nur geringer Ähnlichkeit wird die Kategorie am Rand unscharf, und es stellen sich Überlappungen mit anderen Kategorien ein. Cantor und Mischel (1979) haben diesen Ansatz mit Erfolg auf Typen von Menschen wie z. B. »eine modische Frau« oder »eine emotional stabile Person« usw. übertragen. Auch Eigenschaften bzw. die sie konstituierenden Verhaltensweisen können Kategorien zugeordnet werden, wobei sich prototypische und weniger prototypische Beispiele finden lassen.

Prozentränge

Bei Prozenträngen (PR) sind keinerlei Annahmen über die Verteilung der Testwerte nötig. Die Transformation besteht darin, dass dem Testwert die relative Position auf der nach Größe ranggereihten Messwerteskala der Bezugsgruppe zugeordnet wird.

Prozessdiagnostik

Diagnostik mit kontinuierlicher Erfassung des zu verändernden Merkmals während einer Intervention. Sie erlaubt die Anpassung der Intervention an die Veränderungen.

Prüfsystem für Schul- und Bildungsberatung (PSB)

Das PSB ist eine gekürzte Fassung des Leistungsprüfsystems LPS (Horn, 1983), die jene zehn von 15 Untertests vereinigt, die sich am besten zur Trennung von Schülern nach den drei Schularten (Haupt-, Realschule, Gymnasium) eignen. Mit dem PSB-R 4-5 Horn et al., 2002) und PSB-R 6-13 (Horn et al., 2003) liegen revidierte und neu normierte Nachfolgeverfahren für die Klassen 4-5 bzw. 6-13 vor.

Pseudoparallelformen

Um in Gruppentestungen Abschreiben zu verhindern, kann man Paralleltests einsetzen. Echte Paralleltests sind selten. Pseudoparallelformen enthalten exakt dieselben Aufgaben; diese werden jedoch in einer anderen Reihenfolge dargeboten.

Psychische Störungen

Zentrale Komponenten für die Definition psychischer Störungen sind: Das Erleben und Verhalten stellt eine deutliche Abweichung von Normen (statistisch, gesellschaftlich, individuell) dar, geht mit einer verhaltensmäßigen, psychischen oder biologischen Funktionsstörung einher, führt zu Beeinträchtigungen (Funktionseinschränkung) in wichtigen Lebensbereichen, ist mit persönlich empfundenem Leid verbunden und geht mit einer Selbst- oder Fremdgefährdung einher.

Psychischer und Sozial-Kommunikativer Befund PSKB

Mit dem PSKB stufen Therapeuten auf der Basis des anamnestischen Gesprächs einerseits psychische Störungen hinsichtlich ihrer Symptomatik (psychischer Befund) ein, andererseits das Ich-Erleben, die soziale Bewältigung sowie Reaktionen auf belastende Lebensereignisse. Das Verfahren kann auch als Fragebogen eingesetzt werden.

Psychologisch-diagnostisches Gutachten

Ein psychologisch-diagnostisches Gutachten ist ein Bericht über die Beantwortung von konkreten Fragestellungen, die eine Person oder eine Gruppe von Personen betreffen. Die Antwort kommt durch Anwendung wissenschaftlich anerkannter Methoden und Kriterien nach feststehenden Regeln der Gewinnung und Interpretation von Daten zustande. Der zur Beantwortung der Fragestellung führende diagnostische Prozess wird transparent und nachvollziehbar dargestellt. Er umfasst die Herleitung psychologischer Fragen, die Auswahl und Anwendung von Erhebungsmethoden, die Darstellung und Interpretation der Ergebnisse sowie die Beantwortung der Fragestellung(en).

Psychologische Diagnostik

Psychologische Diagnostik ist eine Teildisziplin der Psychologie. Sie dient der Beantwortung von Fragestellungen, die sich auf die Beschreibung, Klassifikation, Erklärung oder Vorhersage menschlichen Verhaltens und Erlebens beziehen. Sie schließt die gezielte Erhebung von Informationen über das Verhalten und Erleben eines oder mehrerer Menschen sowie deren relevanter Bedingungen ein. Die erhobenen Informationen werden für die Beantwortung der Fragestellung interpretiert. Das diagnostische Handeln wird von psychologischem Wissen geleitet. Zur Erhebung von Informationen werden Methoden verwendet, die wissenschaftlichen Standards genügen.

psychologische Fragen

Hypothesen in einem Gutachten, die aus der Fragestellung des Auftraggebers abgeleitet sind. Bei der Formulierung von konkreten psychologischen Fragen kommt es darauf an, die im vorliegenden Fall naheliegenden Faktoren zu erkennen (deshalb benötigt man Vorinformationen). Die psychologischen Fragen müssen so gewählt werden, dass sie grundsätzlich durch geeignete diagnostische Verfahren geklärt werden können.

Psychologischer Test

Ein psychologischer Test ist eine Messmethode, mit der ein psychologisches Merkmal (oder auch mehrere Merkmale) erfasst werden soll(en). Es handelt sich um ein standardisiertes Verfahren, welches die Erhebung einer Verhaltensstichprobe einschließt. Das Verhalten wird durch die spezifischen im Test realisierten Bedingungen hervorgerufen und seine Variation soll weitgehend auf die Variation des zu messenden Merkmals zurückzuführen sein. Das Ziel eines Tests ist eine quantitative und/oder qualitative Aussage über das Merkmal.

Q-Sort-Technik

Hierbei sortiert der Proband auf Karten vorgegebene Aussagen nach dem Grad, wie sie auf ihn zutreffen. Neben dem auf diese Art erfassten (realen) Selbstkonzept können die Karten auch entsprechend eines idealen Selbstkonzepts sortiert werden. Da in der klientenzentrierten Gesprächspsychotherapie eine Annäherung von realem und idealem Selbstbild angestrebt wird, kann dieses Verfahren zur Kontrolle des Therapieverlaufs und -erfolgs im Rahmen der Gesprächspsychotherapie eingesetzt werden.

Rasch-Modell

Als Rasch-Modelle bezeichnet man eine Gruppe von probabilistischen Latent-Trait-Modellen, welche neben der lokalen stochastischen Unabhängigkeit über weitere vorteilhafte Modelleigenschaften verfügen. Zu nennen sind vor allem die erschöpfenden Statistiken, die Stichprobenunabhängigkeit der Parameterschätzungen und die spezifische Objektivität der Vergleiche.

Ratekorrektur

Siehe Zufallskorrektur

Ravens Progressive Matrizen

Unter dem Überbegriff »Ravens Progressive Matrizen« lassen sich drei sprachfreie Matrizentests zusammenführen, die dem gleichen Konstruktionsprinzip folgen, sich aber in ihrer Schwierigkeit und ihrem Einsatzbereich unterscheiden: Die Standard Progressive Matrices (SPM) sind deutlich leichter als die Advanced Progressive Matrices (APM), im Gegensatz zu diesen beiden Versionen decken die Coloured Progressive Matrices (CPM) den Altersbereich von 3;9–11;8 Jahren ab.

Reaktivität

Reaktivität ist ein Fehler, bei dem der Beobachter durch seine Anwesenheit oder auch durch unangemessenes Auftreten das Verhalten der zu beobachtenden Person verändert.

Realkennzeichen

Jede Aussage kann inhaltsanalytisch untersucht werden. Der Gutachter sucht dabei nach sog. »Realkennzeichen«. Diese Realkennzeichen differenzieren zwischen Aussagen, die auf selbst erlebten Ereignissen versus erfundenen beruhen. Das Vorliegen vieler Realkennzeichnen in einer Aussage spricht dafür, dass der Zeuge das Ereignis selbst erlebt hat und keine »Erfindungen« präsentiert. Ein Problem besteht darin, dass es keine verbindlichen Standards (Normen) dafür gibt, wie viele Realkennzeichen vorliegen müssen, damit eine Aussage als sehr wahrscheinlich authentisch eingestuft werden kann.

Rechtspsychologische Diagnostik

Klassische diagnostische Aufgaben in der Rechtspsychologie sind die Erstellung von Gerichtsgutachten zu Fragen der Schuldfähigkeit von Straftätern, der Glaubhaftigkeit von Zeugenaussagen oder etwa des Sorgerechts in Scheidungsverfahren sowie die Untersuchung von Straftätern, die bereits überführt sind und sich nun in einer Haftanstalt befinden. Damit soll eine fundierte Auswahl von Behandlungsmaßnahmen gewährleistet und gegebenenfalls gegen Ende des Strafvollzugs eine Rückfallprognose erstellt werden.

Regression zur Mitte

Bei der wiederholten Messung psychologischer Merkmale weist – sofern keine Übungs- oder Gedächtniseffekte auftreten – die Verteilung aller Messwerte als Ganzes zwar dieselbe Gestalt auf, doch sind die anfänglich extrem hohen oder extrem niedrigen Messwerte bei der zweiten Messung etwas zur Mitte regrediert; ihren ursprünglichen Platz in der Verteilung haben andere Messwerte eingenommen. Ursächlich dafür ist, dass die Extremität unter anderem durch die ungewöhnliche Kombination vieler förderlicher bzw. hinderlicher Fehlerfaktoren bewirkt wird, die in dieser spezifischen Konstellation kaum wieder auftritt.

Reliabilität

"Das Gütemaß ""Reliabilität"" (auch Messgenauigkeit) beschreibt die Genauigkeit, mit der ein Test ein Merkmal erfasst, und zwar unter Vernachlässigung des Umstandes, ob es sich dabei auch wirklich um die Merkmalsdimension handelt, deren Erfassung intendiert ist. Die Reliabilität eines Tests ist der Anteil der Varianz der wahren Werte (T) an der Varianz der beobachteten Werte (X). "

Reliabilitäts-Validitäts-Dilemma

Um Veränderungen zu messen, wird manchmal ein Test vor und nach einer Intervention durchgeführt. Die Reliabilität der Differenz zwischen den Testwerten liegt immer dann unter derjenigen der originalen Testwerte, wenn die Korrelation zwischen den Messungen/Zeitpunkten positiv und größer als Null ist; je höher die Tests korrelieren, desto niedriger fällt die Reliabilität der Differenz aus. Je höher die Korrelation zwischen Test 1 und 2 ist, desto mehr wahre Varianz haben sie gemeinsam; die Differenz spiegelt dann primär Fehlervarianzanteile wider. Eine niedrige Korrelation zwischen zwei Tests bedeutet, dass sie nicht das Gleiche messen; hier wäre zwar eine hohe Reliabilität der Differenzen gewährleistet, aber für Test-Scores von fragwürdiger Validität (weil deren Reliabilität nicht gegeben ist).

Retest-Reliabilität

Eine Methode zur Schätzung der Reliabilität ist die Testwiederholung (Retest). Dabei wird ein und derselbe Test ein und derselben Stichprobe von Probanden wiederholt dargeboten. Die Korrelation zwischen zwei Vorgaben gibt das Ausmaß der Retest- oder Testwiederholungsreliabilität an.

ROC-Kurve

Mithilfe der sog. ROC-Kurve (von Receiver-Operating Characteristic aus der Signal-Entdeckungs-Theorie) lassen sich simultan Spezifität und Sensitivität unabhängig von den Basisraten für verschiedene Testtrennwerte bestimmen, sofern aufgrund empirischer Untersuchungen die Verteilungskennwerte der unterschiedlichen Gruppen ermittelt werden konnten.

Rorschach-Test

Der Rorschach-Test (Rorschach, 1921) ist ein Formdeuteverfahren, bei dem der Testperson nacheinander zehn Klecksbilder vorgelegt werden. Die Frage dazu lautet immer »Was könnte das sein?«. Der Testleister protokolliert die Antworten und beurteilt (»signiert«) sie anschließend nach verschiedenen Kriterien. Daraus werden verschiedene Kennwerte berechnet, die der Interpretation durch einen erfahrenen Experten bedürfen.

Schuleingangstests

Sie sind auch als Schulreifetests bekannt und haben die Aufgabe, zu prüfen, ob ein schulpflichtiges Kind den Anforderungen der Schule gewachsen ist.

Schulleistungstest

Schulleistungstests wurden konstruiert, um schulische Leistungen unter standardisierten Bedingen zu erfassen und sie anhand von überregionalen Normen zu beurteilen.

Schulreifetests

Siehe Schuleingangstests

Schultests

Schultests unterscheiden sich nicht grundsätzlich von Entwicklungstests, sondern vor allem hinsichtlich der Spezifität ihrer Anforderungen. Während Entwicklungstests eher allgemeine Fähigkeiten erfassen, dienen Schultests dazu, Fähigkeiten und Fertigkeiten zu erfassen, die eine Voraussetzung für das Erbringen schulischer Leistungen darstellen, oder sie erfassen direkt schulische Leistungen.

Schweigepflicht

Gesetzliche Regelung (§ 203 StGB), die den Schutz von Privatgeheimnissen regelt

Screening des Entwicklungsstandes bei Einschulungsuntersuchungen (S-ENS)

Das S-ENS von Döpfner et al. (2005) soll Hinweise auf mögliche Entwicklungsdefizite in folgenden Bereichen liefern: Körperkoordination, Visuomotorik, Visuelle Wahrnehmung und Informationsverarbeitung, Sprachkompetenz und auditive Informationsverarbeitung und Artikulation.

Selbstbeobachtung

Beobachtung des eigenen Verhaltens und Erlebens

Selektion

Prozess, der der Auswahl von Personen oder Bedingungen dient, so dass eine optimale Passung zwischen beiden Elementen entsteht

Selektionskennwert

Der Selektionskennwert korrigiert die Trennschärfen für die Itemstreuung (die sich aus der Itemschwierigkeit herleitet).

Selektive und geteilte Aufmerksamkeit

Die Abgrenzung der geteilten von der selektiven Aufmerksamkeit basiert auf bestimmten Eigenschaften der kritischen Reize: Stammen sie aus zwei unterschiedlichen Reizklassen (meist akustisch und visuell), spricht man von geteilter Aufmerksamkeit. Empirisch ist die Unterscheidung zwischen selektiver und geteilter Aufmerksamkeit schwer zu begründen: Die entsprechenden Tests laden meist auf einem Faktor (Schmidt-Atzert et al., 2008). Gemeinsam ist diesen Tests, dass sie das selektive Beachten relevanter Reize verlangen.

Self-Assessment

"Über das Internet können Persönlichkeitsfragebögen und Leistungstests so dargeboten werden, dass ein Proband sie zu Hause an seinem Computer bearbeitet. Dabei sind zwei Varianten zu unterscheiden: Der Proband bleibt anonym und erhält eine Rückmeldung über seine Ergebnisse. Diese Variante ist unter dem Begriff »Self-Assessment« bekannt. Universitäten und Unternehmen wollen damit einerseits potenzielle Bewerber bei ihrer Studien- oder Berufswahl unterstützen und anderseits geeignete Personen zu einer Bewerbung anregen, während sie hoffen, dass ungeeignete von einer Bewerbung Abstand nehmen. Zu der anderen Variante s. das Stichwort ""Vorselektion"". "

self-deception

Verzerrung bei Selbstbeschreibungen in Richtung eines sozial erwünschten Bildes. Paulhus (1984) hat dieses »Vor-sich-selbst-gut-dastehen-Wollen« Selbsttäuschung (»self-deception«) genannt

Sensitivität

Wahrscheinlichkeit, mit der ein vorliegender »positiver Zustand« (z. B. geeignet, krank) als solcher erkannt wird.

Simulation

Bei bestimmten Untersuchungsanlässen können die Probanden ein Interesse daran haben, dass bei ihnen eine Störung oder ein Defizit festgestellt wird. Sie versuchen dann vielleicht, »schlechte« Ergebnisse zu erzielen. Leistungstests können leicht nach unten verfälscht werden, und Fragebögen sind ohnehin verfälschbar. Es gibt jedoch Möglichkeiten, Simulation zu erkennen.

Skalogramm-Modell

Sofern man die Items nach ihrer Schwierigkeit reiht, besagt das Skalogramm-Modell, »dass eine einheitliche Ordnung von Personen und Items existiert. Diese Ordnung hat die Eigenschaft, dass eine Person, die auf ein bestimmtes Item positiv reagiert, auch auf alle vorhergehenden Items positiv reagiert. Ferner wird eine Person, die auf ein bestimmtes Item negativ reagiert, auch auf alle nachfolgenden Items negativ reagieren«.

Sonderpädagogischer Förderbedarf

Sonderpädagogischer Förderbedarf besteht, wenn Kinder und Jugendliche »in ihren Bildungs-, Entwicklungs- und Lernmöglichkeiten so beeinträchtigt sind, dass sie im Unterricht der allgemeinen Schule ohne sonderpädagogische Unterstützung nicht hinreichend gefördert werden können« (Kultusministerkonferenz, 1994, S. 5; zit. nach Witt-Brummermann, 2010).

Sorgfaltspflicht

Allgemein gilt, dass die Erstellung und Verwendung von Gutachten und Untersuchungsberichten von Psychologen größtmögliche sachliche und wissenschaftliche Fundiertheit, Sorgfalt und Gewissenhaftigkeit erfordern. Gutachten und Untersuchungsberichte sind frist- und formgerecht anzufertigen. Die föderativen Richtlinien für die Erstellung von Gutachten sind zu beachten.

Spearman-Brown-Formel

Mit der Spearman-Brown-Formel lässt sich allgemein die Höhe der Reliabilität bei Verlängerung oder Verkürzung des Tests um k Testteile bestimmen. Umgekehrt lässt sich auch die erforderliche Testlänge (Itemanzahl) ermitteln, um eine gewünschte Höhe der Reliabilität zu erreichen.

Speed-Tests

Siehe Geschwindigkeitstests

Spezifität

Wahrscheinlichkeit, mit der ein vorliegender »negativer Zustand« (z. B. ungeeignet, gesund) als solcher erkannt wird.

Split-Half-Reliabilität

Der Test wird nach der Durchführung in zwei möglichst äquivalente Hälften aufgeteilt. So erhält man für jeden Probanden zwei Testwerte. Für die Halbierung kommen mehrere Techniken in Betracht: Aufteilung nach ungerader und gerader Nummer der Items, Aufteilung in die erste und zweite Testhälfte, Halbierung auf Basis von Itemkennwerten. Wenn die Schnelligkeit der Testbearbeitung entscheidend ist, kann der Test auch vor der Durchführung nach einer der genannten Methoden in zwei Hälften aufgeteilt werden.

STAI: State-Trait-Angst-Inventar

Das STAI (Laux et al., 1981) soll mit zwei separaten Skalen Angst als Zustand und als Eigenschaft messen.

Standardmessfehler

Der Standardmessfehler gibt an, wie stark die Messfehler um die wahren Werte der Person(en) streuen.

Standardschätzfehler

Natürlich sind auch die Messwerte, die in die Regressionsgleichung eingehen, fehlerbehaftet. Deshalb liegt die Frage nahe, wie genau solche Vorhersagen sind. Die Kriteriumswerte streuen mehr oder weniger stark um die Regressionsgerade. Diese Streuung der wahren Kriteriumswerte um die vorhergesagten wird im Standardschätzfehler (nicht zu verwechseln mit dem Standardmessfehler) ausgedrückt.

Standardwerte

Siehe Normwerte

Stanine-Werte

Siehe Normwerte

Statusdiagnostik

Diagnostik, die sich auf die Beschreibung von momentanen Zuständen (auch Eigenschaften und Verhalten) bezieht.

Störungswissen

Zu den wichtigsten Aufgaben der Klinischen Psychologie gehört zum einen die Forschung über die Entstehung von psychischen Störungen, zum anderen die Überprüfung von Modellen darüber, wie psychische Störungen aufrechterhalten werden, wie sie »funktionieren«. Dieses »Störungswissen« stellt die Voraussetzung für angemessene klinisch-psychologische Interventionen (meist als psychologische Beratung oder Psychotherapie) dar.

Strategiematrix

In ihr sind die Regeln festgehalten, nach denen auf der Basis von diagnostischen Informationen Entscheidungen getroffen werden sollen. Die Werte einer solchen Matrix geben die Wahrscheinlichkeit an, mit der ein Proband, von dem die Information xr vorliegt, der Behandlung t zugeführt wird: p(t|xr).

Strenge-Fehler

Ein Strengefehler ist an einer Tendenz zu unterdurchschnittlichen Urteilen im Vergleich zu anderen Beobachtern erkennbar.

Strukturdiagnostik

Die Strukturdiagnostik befasst sich mit der Diagnose der Strukturen einer Organisation; sie nimmt im Vergleich zu anderen Ansätzen eine dominierende Stellung ein. Im Vordergrund stehen die »Ziele von Organisationen und ihre Umsetzung in Regeln und Ordnungen zur Ausrichtung der Organisationsmitglieder auf diese Ziele hin« (Büssing, 2007, S. 566). Psychologische Fragestellungen ergeben sich erst, wenn die Auswirkung von Strukturen auf das Verhalten und Erleben von Mitarbeitern erfasst werden soll.

Strukturelle Analyse Sozialer Beziehungen SASB

Mit der SASB können drei unterschiedliche Aspekte des interpersonellen Verhaltens und Erlebens erfasst werden: Der Fokus auf andere, der Fokus auf das Selbst und das Umgehen mit sich selbst (Introjekt). Das sehr komplexe System kann als Beobachtungsverfahren nur nach einem ausführlichen Training mit ausreichender Zuverlässigkeit eingesetzt werden.

Strukturiertes Klinisches Interview für DSM-IV (SKID)

Das SKID-I und SKID-II dienen der Diagnostik psychischer Störungen auf der »Achse 1« bzw. von Persönlichkeitsstörungen im Rahmen des psychiatrischen Diagnosesystems DSM-IV. Die Fragen sind im Wortlaut vorgegeben. Beim einzelnen Patienten müssen nicht alle Fragen gestellt werden, da Verzweigungsregeln existieren. Die Antworten werden nach einem vorgegebenen Schema beurteilt.

Subjektive Arbeitsanalyse (SAA)

Bei der SAA (Udris & Alioth, 1980) handelt es sich um einen Fragebogen, der die subjektive Wahrnehmung der Arbeitssituation durch den Mitarbeiter erfassen soll. Das Verfahren kann universell eingesetzt werden.

Suggestivfrage

Frage, die so formuliert wird, dass sie dem Befragten eine bestimmte Antwort nahelegt

Suppression

Suppression liegt vor, wenn aufgrund der hohen Korrelation einer oder mehrerer zusätzlicher Variablen mit den übrigen Prädiktoren deren kriteriumsirrelevante Varianzanteile gebunden oder unterdrückt werden; dadurch wird die Validität der Prädiktorenkombination erhöht.

SVF: Stressverarbeitungsfragebogen

Der Stressverarbeitungsfragen (Erdmann & Janke, 2008) dient dazu, die Art und Weise, wie Menschen mit Stress umgehen und wie sie ihn bewältigen, genau zu erfassen. Dabei wird zwischen verschiedenen positiven, stressreduzierenden und negativen, stressvermehrenden Strategien unterschieden.

systematische Verhaltensbeobachtung

Bei einer systematischen Verhaltensbeobachtung wird dem Beobachter genau vorgegeben, worauf er zu achten und wie er das Beobachtete zu protokollieren hat. Man muss also bereits Hypothesen darüber haben, was in der Beobachtungssituation wichtig ist. Die systematische Verhaltensbeobachtung erfordert einen erheblichen Aufwand bei der Vorbereitung: Meist erstellt man eine Liste mit relevanten Verhaltensweisen (»Indexsystem«; s.u.), und in der Beobachtungsphase wird beispielsweise beim Auftreten einer dieser Verhaltensweisen ein Strich in der Liste gemacht. Das Ergebnis liegt beispielsweise in Form einer Strichliste vor. Bei einer systematischen Verhaltensbeobachtung wird keine vollständige Beschreibung des Verhaltens angestrebt, sondern es soll immer nur ein bestimmter Teilaspekt des Verhaltens erfasst und quantifiziert werden.

systemische Ansätze

Bei den systemischen Ansätzen liegt der Fokus der Diagnostik und Behandlung nicht in erster Linie auf der »gestörten« Person, die professionelle Hilfe sucht; vielmehr werden psychische Probleme in funktionalem Zusammenhang mit den aktuellen Lebensumständen gesehen. Dabei spielen nahe Bezugspersonen und die Familie eine zentrale Rolle.

TAT: Thematischer Apperzeptionstest

Der TAT (Murray, 1991) wurde erstmals 1943 publiziert. Er soll es dem geübten Diagnostiker ermöglichen, vorherrschende Triebe, Gefühle, Gesinnungen, Komplexe und Konflikte des Probanden zu erkennen. Der TAT besteht aus 31 Bildtafeln, die grundlegende menschliche Problemsituationen ansprechen; eine Tafel ist völlig weiß, also ohne jedes Bild. Der Proband wird aufgefordert, zu jedem Bild eine möglichst dramatische Geschichte zu erzählen. Die Antworten werden nach einer nicht hinreichend standardisierten Prozedur inhaltsanalytisch ausgewertet.

Tätigkeitsbewertungssystem (TBS)

Ein dem handlungsregulations- bzw. tätigkeitstheoretischen Ansatz verpflichtetes Verfahren ist das Tätigkeitsbewertungssystem TBS (Hacker et al., 1995). Es wird vor allem zur Arbeitsgestaltung eingesetzt und ist für verschiedene Bereiche wie Produktion oder Büro und Verwaltung geeignet.

Tau-Äquivalenz

die True Scores zweier (oder mehrerer) Tests sind identisch

Teamdiagnostik

Zur Beschreibung der Arbeit und des Klimas in Teams bzw. Organisationen wurden spezielle Fragebögen konstruiert.

Teilleistungsstörungen

Unter Teilleistungsstörungen versteht man Leistungsdefizite, die anders als eine Lernstörung oder Lernbehinderung auf einen bestimmten Bereich schulischer Fertigkeiten beschränkt sind. Es können die Fertigkeiten zum Lesen, Schreiben und Rechnen betroffen sein.

teilnehmende Verhaltensbeobachtung

Der Beobachter ist in der Beobachtungssituation anwesend und nimmt selbst am Geschehen teil.

Tendenz zu Extremurteilen

Bei einer Tendenz zu Extremurteilen werden bevorzugt hohe und niedrige Ausprägungen angekreuzt. Daraus ergibt sich eine erhöhte Varianz der Urteile.

terminale oder investigatorische Entscheidungen

Wird auf der Basis der diagnostischen Information ein Proband einer Behandlung zugeführt, in der er mehr oder weniger lange verbleibt (z. B. Übertragung einer neuen Verantwortung, Aufnahme in ein Ausbildungsprogramm), handelt es sich um eine terminale Entscheidung. Mit der Zuweisung ist die diagnostische Aufgabe abgeschlossen. Eine investigatorische Entscheidung stellt den ersten Schritt in einem mehrstufigen Entscheidungsverfahren dar. Ihr folgt direkt oder nach einer Behandlung eine weitere diagnostische Untersuchung, die dann entweder zu einer weiteren investigatorischen oder zu einer terminalen Entscheidung führt.

Test d2-R (Test d2 – Revision): Aufmerksamkeits- und Konzentrationstest

Beim Test d2-R (Brickenkamp et al., 2010) handelt es sich um die revidierte Form eines bewährten Aufmerksamkeits- und Konzentrationstests, der schon seit 1962 auf dem Markt ist. Aufgabe ist es, unter Zeitdruck Zielobjekte (den Buchstaben d mit 2 Strichen) unter visuell sehr ähnlichen Objekten (d mit weniger oder mehr als 2 Strichen oder p mit Strichen) zu finden und durchzustreichen. Die Zeichen sind in 14 Zeilen angeordnet, und für jede Zeile stehen 20 Sekunden Zeit zur Verfügung.

Testauswerteprogramm

Die Auswertungsobjektivität kann durch Verwendung eines Testauswerteprogramms erhöht werden. Die Antworten der Testperson (in der Regel die Nummer der angekreuzten Antwortalternative) werden in den Computer eingegeben, woraufhin das Programm die Rohwerte für jede Skala bzw. den Gesamttest sowie die dazugehörigen Normwerte ermittelt.

Testen

Unter einem Test versteht man Datenerhebung unter Anwendung einer bestimmten Methode, nämlich Tests. Psychologische Diagnostik kann weitere Methoden wie z.B. das Interview oder Verhaltensbeobachtung einsetzen und zu einem Ergebnis integrieren.

Testing on Demand

Bei der Verwendung von Computertests verursacht die Anschaffung der Test-Software meist relativ hohe Kosten, während jede einzelne Anwendung nur wenig Geld kostet. Die Anschaffungskosten entfallen, wenn man sich für »Testing on Demand« entscheidet; die einzelne Anwendung ist dafür teurer als beim Computertest. Testverlage bieten an, dass manche Tests über das Internet durchgeführt werden können; die Ergebnisse stehen direkt nach der Durchführung zur Verfügung.

Testleistung

Testleistung ist das Ergebnis aus einem Leistungstest. Die Testleistung kann als Indikator für eine Fähigkeit (z. B. fluide Intelligenz), für eine Fertigkeit (z. B. das Beherrschen der Grundrechenarten) oder für Wissen verstanden werden.

Testreihe zur Prüfung der Konzentrationsfähigkeit (TPK)

Die Testreihe zur Prüfung der Konzentrationsfähigkeit (TPK) nach Kurth und Büttner (1999; s. auch Kurth & Büttner, 2004) wurde für Schulkinder der zweiten bis sechsten Klasse konzipiert und enthält drei Aufgabenarten, die typische Anforderungen im Schulunterricht aufgreifen: Lesen, Rechnen und Reproduzieren.

Time sampling

Will man die Dauer von Verhaltensweisen erfassen, bieten sich Time-sampling oder Event-sampling an. Beim Time-sampling werden Zeitabschnitte von beispielsweise zehn Sekunden festgelegt. Wird das Verhalten direkt beobachtet, ist es erforderlich, dass der Beobachter über einen Kopfhörer ein akustisches Signal erhält, wenn ein Zeitabschnitt zu Ende ist. Er macht einen Strich, wenn das Verhalten in dem zurückliegenden Zeitabschnitt aufgetreten ist.

TIPI: Trierer Integriertes Persönlichkeitsinventar

Beim TIPI handele es sich um das »erste nach dem eindimensionalen ordinalen Rasch-Modell konstruierte Inventar (…), das eine facettenreiche Erfassung von Eigenschaften und Dimensionen sowohl der ‚normalen‘ als auch der ‚gestörten‘ Persönlichkeit« gewährleiste (Becker, 2003, S. 3).

TKI: Teamklima-Inventar

Das TKI enthält 44 Items, die sich auf das Klima für Innovation und Leistung in Arbeitsgruppen beziehen. Dem Fragebogen liegt eine 4-Faktoren-Theorie mit den Dimensionen »Vision«, »Aufgabenorientierung«, »Partizipative Sicherheit« und »Unterstützung für Innovation« zugrunde. Den vier Faktoren sind insgesamt 13 Skalen untergeordnet.

Transparenz

Gutachten und Untersuchungsberichte müssen für die Adressaten inhaltlich nachvollziehbar sein.

Trennschärfe

Die Trennschärfe einer Aufgabe ist definiert als die Korrelation des Items mit dem Test oder der Skala des Tests, zu der das Item gehört. Der Test- bzw. Skalenwert wird dabei über alle Items mit Ausnahme des analysierten bestimmt (s. Part-whole-Korrektur). Sie ist ein Kennwert dafür, in welchem Ausmaß die durch das Item erfolgte Differenzierung der Probanden in Löser und Nichtlöser mit derjenigen durch die Skala als Ganzes übereinstimmt.

trimodaler Ansatz

Schuler und Höft (2007) haben mit dem sog. trimodalen Ansatz vorgeschlagen, drei Kategorien von Anforderungen zu unterscheiden, die ein Stellenbewerber erfüllen soll: Aufgaben und Ergebnisse, Verhalten sowie Eigenschaften. Um festzustellen, ob oder wie gut eine Person diese Anforderungen erfüllt, stehen drei Gruppen von Verfahren zur Verfügung, die als biografie-, simulations- und eigenschaftsorientiert bezeichnet werden.

True Score

Siehe wahrer Wert

T-Werte

Siehe Normwerte

Underachiever und Achiever

Die strikte Unterscheidung zwischen Fähigkeit (Potenzial) und Performanz führt dazu, dass – bei einer kategorialen Betrachtung – zwei Typen von Hochbegabten resultieren: Underachiever (die Leistungen sind niedriger als nach dem Potenzial zu erwarten wäre) und Achiever (Hochbegabte, deren Leistungen ihren Fähigkeiten entsprechen).

Und-Strategie

Auswahlstrategie, die Mindestwerte bei mehreren Variablen (Prädiktoren) verlangt. Probanden, die zuvor festgelegte Mindestwerte in den Prädiktoren nicht erreichen, werden »abgeschnitten«; deshalb wird auch von einem »multiple cutoff«-Modell gesprochen.

univariate oder multivariate Informationen

Die diagnostische Information kann sich auf eine Dimension beschränken (z. B. die Abiturnote), also univariat vorliegen, oder aus mehreren Dimensionen stammen und somit multivariat beschaffen sein (z. B. die Abiturnote und Allgemeine Intelligenz). Meist werden zur Erhöhung der Validität und damit auch der Entscheidungssicherheit mehrere Prädiktoren herangezogen, weil damit verschiedene Facetten des Kriteriums abgedeckt werden können.

Unverfälschbarkeit

Gibt an, ob ein Test schwer zu verfälschen ist. Testpersonen können sowohl ein Interesse an hohen wie auch an niedrigen Testwerten haben. Ein Test ist umso schwerer zu verfälschen, je undurchsichtiger die Bedeutung der Items ist.

Validität

Unter Validität wird die Übereinstimmung von Testergebnissen mit dem, was der Test messen soll, verstanden. Es handelt sich um ein Urteil darüber, wie angemessen bestimmte Schlussfolgerungen vom Testwert auf das Verhalten außerhalb des Tests oder auf ein Merkmal der Person sind.

Validitätsmatrix

Die Verknüpfung zwischen den vorgenommenen Behandlungen und deren Ergebnis (gleichsam der Erfolg im Kriterium) wird festgehalten in der sog. Validitätsmatrix. Deren Einträge geben die Wahrscheinlichkeit dafür an, dass ein Proband mit xr und der Behandlung t den Kriteriumswert cr erlangt: p(c|x<(sub>r,t). Die Kriteriumswerte können im einfachsten Fall dichotome Kategorien (erfolgreich/nicht erfolgreich; gesund/krank) bilden; möglich sind auch kontinuierliche Abstufungen.

Variabilitätsnormen

Variabilitäts- oder Abweichungsnormen setzen voraus, dass die Messwerte im Sinne der Gaußschen Glockenkurve normalverteilt sind. Der Normwert gibt an, wie weit eine Person mit ihrer Testleistung unter oder über dem Mittelwert einer Vergleichsgruppe liegt. Als Vergleichsgruppe können Personen gleichen Alters (Altersnormen), gleichen Geschlechts (Geschlechtsnormen) oder etwa gleicher Bildung (schul- oder bildungsspezifische Normen) dienen.

Veränderungsfragebogen des Erlebens und Verhaltens VEV

Fragebogen, der im Kontext der Gesprächspsychotherapie entwickelt wurde. Die Klienten sollen nach Abschluss der Behandlung 42 Aussagen der Art »Ich habe mehr Selbstvertrauen« im Vergleich zum Beginn der Therapie beurteilen.

Veränderungsindex

"Mehrere Autoren schlagen die Berechnung eines Veränderungsindex (""reliable change index"", RC) vor, um der Frage nachzugehen, ob sich einzelne (oder in einer Gruppenstudie: wie viele) Patienten nach einer Intervention in dem relevanten Merkmal tatsächlich verbessert haben und - wenn ja - wie groß diese Veränderung ausfällt. In den Index gehen die Differenz der Werte vor und nach der Behandlung und der Standardmessfehler der Differenzen der Referenzstichprobe (dysfunktionale Population) ein."

Veränderungswissen

Ziel einer Intervention ist , die vorhandene Störung entweder zu beseitigen oder zumindest zu lindern und die mit der Problematik verbundenen Einschränkungen zu reduzieren. Um dieses Ziel erreichen zu können, ist es notwendig, Kenntnisse darüber zu haben, wie eine Behandlung durchgeführt werden sollte, damit sich mit hoher Wahrscheinlichkeit der gewünschte Erfolg einstellt (»Veränderungswissen«).

verdeckte Verhaltensbeobachtung

Bei einer verdeckten Verhaltensbeobachtung ist der Beobachter nicht sichtbar. Sie soll aus ethischen Gründen nur mit Zustimmung der beteiligten Personen durchgeführt werden. Verdeckt beobachten kann man auch mit einer Kamera, die fest installiert ist und nur zu bestimmten Zeiten aufzeichnet.

Verhaltensbeobachtung

Die Verhaltensbeobachtung dient der Beschreibung des Verhaltens eines oder mehrerer Personen. Sie wird in der diagnostischen Praxis sehr oft eingesetzt – und sei es nur, um das Verhalten einer Person bei der Durchführung eines Tests oder während eines diagnostischen Interviews zu beschreiben.

Verhaltensbeobachtung im Feld

Eine Verhaltensbeobachtung im Feld, beispielsweise die Beobachtung eines Kindes beim Spiel mit der Mutter, hat den Vorteil, dass auch die Kontextbedingungen mit erfasst werden, die für das interessierende Verhalten mit verantwortlich sind.

Verhaltensbeurteilung

Die Verhaltensbeurteilung ist von der Verhaltensbeobachtung zu unterscheiden. Letztere liefert Daten über die Häufigkeit oder Dauer von konkreten Verhaltensweisen, die vom Diagnostiker (der nicht selbst Beobachter gewesen sein muss) interpretiert werden können. Bei der Verhaltensbeurteilung nimmt der Beobachter diese Interpretation direkt vor: Er sieht bestimmte Verhaltensweisen und schließt daraus direkt auf die Eigenschaft. Die lästige Registrierung während des Beobachtungsvorganges entfällt; der Beurteiler braucht sein Urteil in der Regel nicht einmal zu begründen.

Verhaltensgleichung

Kern des funktionalen Bedingungsmodells ist die sog. Verhaltensgleichung, in der das Verhalten selbst (R = Reaktion) sowie die auslösenden Bedingungen (S = Situation) und die nachfolgenden, meist verstärkenden Bedingungen (C = Konsequenz) in ihren funktionalen Zusammenhängen beschrieben werden. Die Verhaltensgleichung nach dem respondenten Modell enthält nur zwei Aspekte (S-R), die nach dem operanten Modell in der ursprünglichen Form drei Komponenten (S-R-C).

Verhaltenstheorie

Die Verhaltenstheorie erklärt Verhalten als eine Funktion der Situation. Sie befasst sich ausschließlich mit dem beobachtbaren Verhalten und den ebenfalls beobachtbaren situativen Bedingungen des Verhaltens (Auslöser und Konsequenzen). Geistige Prozesse und Gefühle sind somit von dieser Forschungsrichtung ausgeschlossen.

Verlaufsdiagnostik

Siehe Prozessdiagnostik

Vertrauensintervall

Siehe Konfidenzintervall

Verwechslungsfehler

Ein Verwechslungsfehler liegt vor, wenn auf einen Distraktor so reagiert wird, als wäre es ein Zielreiz.

Vollständige sequentielle Strategie

Diese Strategie stellt eine Kombination der beiden Vorgehensweisen Vorauswahl und Vorentscheidung dar. Nach Maßgabe der Punktwerte in einem Test erfolgt eine Aufteilung aller Probanden in drei Gruppen: eine, die (terminal) akzeptiert, eine andere, die definitiv abgewiesen, und eine dritte, die mit einem Folgetest untersucht wird. Die Entscheidung über Annahme vs. Ablehnung wird aus der Kombination zwischen Erst- und Folgetests getroffen.

Vorauswahl-(Pre-reject-) Strategie

Nach einem ersten Test werden alle Probanden, die einen bestimmten Wert nicht erreichen, von weiteren Untersuchungen ausgeschlossen und zurückgewiesen. Die verbleibenden Probanden absolvieren weitere Verfahren. Die Entscheidung über Annahme vs. Ablehnung wird aus der Kombination zwischen Erst- und Folgetests getroffen.

Vorauswahlverfahren

Internetbasierte Tests, die vom Probanden zu Hause bearbeitet werden. Die Ergebnisse liegen dem Diagnostiker vor, der daraufhin entscheidet, ob der Bewerber zu einer weiteren Untersuchung eingeladen wird oder nicht. Eine Ergebnisrückmeldung an den Probanden ist möglich, aber nicht zwingend.

Vorentscheidungs-(Pre-accept-)Strategie

Nach einem ersten Test werden alle Probanden, die einen bestimmten Trennwert überschreiten, bereits (terminal) akzeptiert. Mit den verbleibenden Probanden wird analog zur Vorauswahlstrategie verfahren.

wahrer Wert

Der messfehlerbereinigte Testwert einer Person; entspricht der tatsächlichen Ausprägung eines Merkmals, wie sie mit dem Test gemessen wird. Der wahre Wert einer Person in einem Test ist unveränderlich und – zumindest über einen bestimmten Zeitraum - konstant. Er könnte theoretisch ermittelt werden, indem man den Test extrem (genau genommen unendlich) oft durchführt und dabei sicherstellt, dass keine Erinnerungs- und Übungseffekte auftreten. Der Mittelwert oder Erwartungswert aller Messergebnisse (also aller beobachteter Werte) wäre dann der wahre Wert.

WET: Wiener Entwicklungstest

Der WET (Kastner-Koller & Deimann, 2002) soll bei Vorschulkindern im Alter von 3;0–5;11 Jahren den Entwicklungsstand in sechs Funktionsbereichen (Motorik, visuelle Wahrnehmung/Visumotorik, Lernen und Gedächtnis, kognitive Entwicklung, Sprache sowie sozial-emotionale Entwicklung) überprüfen.

Wilde-Intelligenztest (WIT-2)

Der WIT-2 (Kersting et al., 2008) wurde auf der Grundlage von umfassenden Analysen des bisherigen WIT neu konstruiert; dabei wurden neue Aufgabengruppen eingeführt. Der Test dient vorrangig der berufsbezogenen Diagnostik; deshalb sind die Testaufgaben teilweise in eine Semantik aus dem Berufs- und Arbeitsleben eingekleidet. Der WIT-2 repräsentiert fünf der sieben Primärfähigkeiten Thurstones (Verbal Comprehension, Number, Space, Reasoning, Memory). Das schlussfolgernde Denken wird im WIT-2 (anders als bei Thurstone) als eine dem verbalen, rechnerischen und räumlichen Denken übergeordnete Skala konzipiert. Darüber hinaus werden die Dimensionen Arbeitseffizienz und Wissen (Wirtschaft sowie Informationstechnologie) erfasst.

Zentrale Tendenz

Eine zentrale Tendenz, d. h. eine Bevorzugung mittlerer Skalenpositionen, lässt sich statistisch durch eine gegenüber Vergleichsbeurteilern eingeschränkte Varianz der Urteile eines Beobachters nachweisen.

Zentrales Beziehungskonfliktthema ZBKT

Eine formalisierte psychodynamische Diagnostik, die in Form eines standardisierten Interviews subjektiv bedeutsame Beziehungsepisoden erhebt. Ausgewertet werden die Interaktionsmuster der Probanden anhand der eigenen Wünsche, der Reaktionen anderer und der darauf folgenden Reaktionen des Interviewten.

Zufallskorrektur

Hauptsächlich bei Mehrfachwahlaufgaben (und nicht so sehr bei Ergänzungsaufgaben) können richtige Lösungen durch Zufall erreicht werden. Um den zufallskorrigierten Testwert einer einzelnen Testperson zu erhalten, ist vom ursprünglichen Testwert X die Anzahl der richtigen Antworten abzuziehen, die durch Raten erzielt werden können.

Zuordnungsfehler

Bei der Zuordnung von Probanden zu Bedingungen sind zwei Arten von Fehlern zu unterscheiden: Fehler erster Art: FP = falsche Positive, d. h. Personen werden als krank bezeichnet, obwohl sie gesund sind. Fehler zweiter Art: FN = falsche Negative, d. h. Personen werden als gesund diagnostiziert, obwohl sie der Krankengruppe angehören.

Zustände

"Als Zustände (""states"") werden bestimmte Verhaltensweisen klassifiziert, die zeitlich wenig stabil und stark situationsabhängig sind. Dies können Emotionen, mentale Zustände oder Erregungszustände sein."

Z-Werte

Siehe Normwerte

Zurück zur Übersicht