Glossar: Psychologische Diagnostik

Bitte wählen Sie ein Glossar

A-Z Navigation

Alle A B C D E F G H I K L M N O P Q R S T U V W Z

Begriff	Erklärung
»faking good«-Bedingung (faking (fake) good condition)	Testpersonen werden in einer experimentellen Untersuchung aufgefordert, ein diagnostisches Verfahren so zu bearbeiten, dass sie mit ihrem Ergebnis einen möglichst guten Eindruck machen. Durch Vergleich mit einer neutralen Kontrollbedingung kann festgestellt werden, wie stark das Verfahren in die positive Richtung verfälscht werden kann.
»faking bad«-Bedingung (faking (fake) bad condition)	Testpersonen werden in einer experimentellen Untersuchung aufgefordert, ein diagnostisches Verfahren so zu bearbeiten, dass sie mit ihrem Ergebnis einen möglichst schlechten Eindruck machen. Durch Vergleich mit einer neutralen Kontrollbedingung kann festgestellt werden, wie stark das Verfahren in die negative Richtung verfälscht werden kann - also inwiefern Simulation möglich ist.
Abweichungsnormen (deviation norms (standardized norms))	siehe Variabilitätsnormen
Adaptives Intelligenz Diagnostikum 3 (AID 3) (Adaptive Intelligence Diagnosticum 3 – Third Edition)	Das Adaptive Intelligenz Diagnostikum 3 (AID 3) von Kubinger und Holocher-Ertl (2014) ist mit seinen Untertests inhaltlich stark an die Wechsler-Intelligenztests angelehnt. Das Verfahren zeichnet sich durch vier Besonderheiten aus: es ist adaptiv, die Items sind Rasch-Modell-konform, es existieren eine Kurzform und vor allem liegt dem Test ein eigenes Intelligenzmodell zugrunde, dass sich stark vom dem der Wechsler-Tests unterscheidet.
Adaptives Testen (adaptive testing)	Bei einer adaptiven Testdurchführung wird kontinuierlich anhand der schon bearbeiteten Testitems die Fähigkeit der Testpersonen geschätzt. Das nächste Items wird danach ausgewählt, dass es aufgrund seiner Schwierigkeit optimal zu der aktuell geschätzten Fähigkeit der Testperson passt und damit die meiste Information über deren Fähigkeitsniveau liefert. Beim adaptiven Testen sind in der Regel weniger Items zu bearbeiten als beim herkömmlichen Testen, bei dem alle Testpersonen sämtliche Items bearbeiten müssen.
Aggregation (aggregation)	Erhebung von Information zu einem Merkmal durch mehrere Messungen und Zusammenführung zu einem Urteil. Beispielsweise wird in einem Assessment Center ein Merkmal in mehreren Übungen beobachtet und dann zu einem Gesamtwert aggregiert.
AHA Arbeitshaltungen – Kurze Testbatterie: Anspruchsniveau, Frustrationstoleranz, Leistungsmotivation, Impulsivität/Reflexivität (Attitude Towards Work)	Bei dem Test AHA von Kubinger & Ebenhöh (1996) handelt es sich um einen am Computer durchzuführenden Objektiven Persönlichkeitstest. Die Bearbeitung der drei Untertests (z. B. »Figuren vergleichen«) liefert zahlreiche Kennwerte wie »Entschlussfreudigkeit« oder »Frustrationstoleranz«.
Alertness (alertness)	Das Konzept »Alertness« spielt v. a. in der Neuropsychologie eine Rolle. Darunter wird eine basale Wachheit oder Ansprechbarkeit auf Reize jeder Art verstanden. Eine extreme Verminderung der Alertness ist bei komatösen Patientinnen bzw. Patienten zu beobachten. Alertness kann als eine generelle Voraussetzung für Aufmerksamkeitsleistungen verstanden werden. In Alertness-Tests wird die Reaktionszeit auf einfache Reize gemessen.
Allgemeine Leistungstests (general performance tests)	siehe Aufmerksamkeits- und Konzentrationstests
Anamnese (anamnesis)	Unter einer Anamnese wird in Anlehnung an den Sprachgebrauch der Medizin die Erkundung der Vorgeschichte einer Erkrankung oder Störung, meist mittels Gespräch bzw. diagnostischem Interview, verstanden.
änderungssensitive Verfahren (modification-sensitive techniques)	Um tatsächliche Merkmalsänderungen erfassen zu können, benötigt man änderungssensitive Verfahren. Für Verfahren, die aktuelle Zustände (z. B. Gefühle, Stimmungen) messen sollen, ist Änderungssensitivität als Validitätsbeleg zu fordern. Beispielsweise verändert sich die Wachheit bei langdauernden monotonen Tätigkeiten. Ein Verfahrung zur Messung von Wachheit sollte solche Veränderungen im Zeitverlauf auch abbilden.
Anforderungsanalyse (requirement analysis (job analysis))	Um eine Ausbildung, ein Studium, einen Beruf oder auch eine bestimmte Tätigkeit erfolgreich und zufrieden bewältigen zu können, muss man bestimme Voraussetzungen erfüllen. Eine Anforderungsanalyse liefert Informationen darüber, welche Fähigkeiten, Kompetenzen, Fertigkeiten und Persönlichkeitseigenschaften und in welcher Ausprägung dazu erforderlich sind. Dazu haben sich verschiedene Vorgehensweisen bewährt, beispielsweise eine mehr oder weniger systematische Befragung von Stelleninhaberinnen und -inhabern.
Anforderungsprofil (requirement profile)	Bei eignungsdiagnostischen Fragestellungen werden die beispielsweise für eine Stelle nötigen Anforderungen in einem »Anforderungsprofil« grafisch dargestellt. Die erforderlichen Merkmale stehen untereinander. Daneben werden auf grafischen Skalen die gewünschten Ausprägung und meist auch ein noch akzeptierter Bereich eingetragen. In dieses Profil können später auch die für eine Person ermittelten Merkmalsausprägungen eingetragen werden. So sieht man, wie gut die Person die Anforderungen erfüllt.
Annahmequoten (acceptance rates)	Bei diagnostischen Entscheidungen geht es oft darum, ob jemand z. B. eine Stelle oder einen Therapieplatz bekommt. Stehen 100 Studienplätze zur Verfügung und es liegen 500 Bewerbungen vor, wird die Annahmequote (hier 20%) vorab festgelegt. Bei variablen Annahmequoten hingegen kommt es bei jeder diagnostischen Entscheidung nur darauf an, ob jemand die nötigen Anforderungen oder Voraussetzungen erfüllt. Beispielsweise erhalten alle Personen eine Therapie, die als therapiebedürftig beurteilt worden sind.
Äquivalentnormen (equivalent norms)	Standardisierte diagnostische Verfahren liefern als Ergebnis Rohwertpunkte (z. B. 40 Aufgaben gelöst). Rohwerte allein sagen wenig aus; sie bedürfen einer Einordnung. Bei Äquivalentnormen wird eine Person anhand ihres Rohwertes der Referenzgruppe zugeordnet, zu der sie mit ihrem Rohwert am besten passt. Beispielsweise passt die Person mit 40 gelösten Aufgaben am besten zu der Altersgruppe 9 Jahre, weil diese im Durchschnitt 39,3 Aufgaben löst. Handelt es sich um einen Intelligenztest, kann man sagen, dass diese Intelligenztestleistung etwa der eines 9jährigen Kindes entspricht.
Arbeitsanalyse (job analysis)	»Bei der psychologischen Arbeitsanalyse geht es um die Analyse und Bewertung der Arbeitsaufgabe(n) und der Arbeitsbedingungen« (Dunckel & Resch, 2010, S. 1111). Die Arbeitsanalyse bezieht sich auf die Arbeit bzw. Tätigkeiten; die Anforderungsanalyse leitet aus der Kenntnis der Tätigkeiten ab, welche Merkmale Menschen aufweisen sollten, um diese Tätigkeiten erfolgreich erledigen zu können.
Assessment Center (assessment center)	»Ein Assessment-Center (AC) ist ein eignungsdiagnostisches Verfahren zur Potenzial-und Eignungsbeurteilung im Rahmen von Personalauswahl- oder Entwicklungsfragestellungen, bei dem mehrere Methoden kombiniert und die Teilnehmer von mehreren Assessoren beobachtet sowie bewertet werden« (Arbeitskreis Assessment Center 2016, S. 3). Dabei wird der Arbeitsplatz, auf den sich Teilnehmerinnen und Teilnehmer beworben haben, durch Rollenspiele, Fallstudien, Präsentationsaufgaben und Gruppendiskussionen simuliert.
Aufmerksamkeit (attention)	Aufmerksamkeit kann definiert werden als Fähigkeit, ganz bestimmte Reize/Ereignisse unter vielen willentlich oder nicht willentlich wirksam zu beachten. Aufmerksamkeitstests erfassen, wie schnell und genau bestimmte im Test dargebotene Reize (instruktionsbedingt) willentlich erkannt werden. Im Alltag beachten wir aber auch viele Ereignisse, die von sich aus Aufmerksamkeit auf sich ziehen (eigener Name zu hören, Warnsignale etc.).
Aufmerksamkeits- und Konzentrationstests (attention and concentration tests)	Für die Konstrukte »Aufmerksamkeit« und »Konzentration« haben sich noch keine konsensfähigen Definitionen durchgesetzt. Viele Autorinnen und Autoren vermeiden deshalb eine begriffliche Festlegung und verwenden die Begriffe wie Synonyme. In einem einflussreichen Beitrag hatte Bartenwerfer (1964) vorgeschlagen, diese Tests einfach als »Allgemeine Leistungstests« zu bezeichnen. Es gibt aber auch Bemühungen, beide Konstrukte samt ihrer Operationalisierungen durch Tests zu unterscheiden.
Aufmerksamkeitstests (attention tests)	Tests zu verschiedenen Formen der Aufmerksamkeit haben ein gemeinsames Merkmal: Sie erfassen, wie schnell und genau Testpersonen kritische Reize entdecken. Die Tests unterscheiden sich vor allem darin, welche kritischen Reize verwendet und unter welchen Bedingungen diese dargeboten werden. Die Bedingungen sind ausschlaggebend dafür, welche »Form« der Aufmerksamkeit gemessen werden soll (z. B. geteilte Aufmerksamkeit bei zwei Gruppen von Reizen).
Aufwärmphase (warm-up phase)	In vielen Leistungstests werden die Testpersonen zunächst durch Übungsaufgaben, deren Ergebnis nicht gewertet wird, mit dem Test vertraut gemacht.
Augenscheinvalidität (face validity)	Wenn man einem diagnostischen Verfahren ansieht, was es misst, spricht man von Augenscheinvalidität. Das kann erwünscht sein, um die Akzeptanz des Verfahrens zu erhöhen. Augenscheinvalidität kann auch unerwünscht sein, weil sie sie unehrlichen Antworten erleichtert.
Auslassungsfehler (error of omission)	Von einem Auslassungsfehler in einem Aufmerksamkeits- oder Konzentrationstest spricht man, wenn ein kritischer Reiz vorliegt und die Testperson nicht darauf reagiert.
Auswertungsobjektivität (objectivity of scoring)	Sie ist ein Aspekt des Testgütekriteriums »Objektivität« und gibt das Ausmaß an, in dem Antworten der Testperson unabhängig von der Person, die den Test auswertet, zu den gleichen Ergebnissen führen. Für die Auswertungsobjektivität ist entscheidend, dass das Vorgehen im Manual mit klaren und unmissverständlichen Anweisungen beschrieben wird. Dazu gehören auch Anweisungen, wie mit Auslassungen, Korrekturen und Doppelankreuzungen (»richtig« und »falsch« angekreuzt) zu verfahren ist.
Behandlung (treatment)	Unter Behandlung werden sehr unterschiedliche Interventionen subsumiert. Es mag sich dabei um eine eng umschriebene Maßnahme handeln (wie z. B. die Therapie einer Klientin bzw. eines Klienten) oder um eine Kombination vieler einzelner »treatments« (wie z. B. den Einbezug der Familie oder der Arbeitskolleginnen und -kollegen in den Behandlungsplan).
Beobachterdrift (observer drift)	Von Beobachterdrift spricht man, wenn die Genauigkeit der Beobachtung über die Beobachtungsphase hinweg entweder nachlässt (z. B. wegen Ermüdung) oder zunimmt (z. B. wegen zunehmender Geübtheit).
beobachteter Wert (observed score)	Der Testwert, der aus der einmaligen Testung einer Person resultiert. Gemäß der Klassischen Testtheorie setzt er sich zusammen aus dem wahren Wert der Person, der aber durch Messfehler »verfälscht« wird.
Berliner Intelligenzstruktur-Test (BIS) (Berlin Intelligence Structure Test (BIS))	Dem Berliner Intelligenzstruktur-Test (Form 4; BIS-4) von Jäger et al. (1997) liegt mit dem »Berliner Intelligenzstrukturmodell« ein Strukturmodell zugrunde, das sich deutlich von dem anderer Tests unterscheidet. Dieses Modell erweist sich auch als nützlich, um andere Intelligenztests oder Aufgabengruppen konzeptuell einzuordnen. Die Autoren unterscheiden vier Arten von »Operationen« (z. B. Merken), die jeweils mit drei unterschiedlichen »Inhalten« (z. B. numerische Aufgaben) kombinierbar sind. Zur Hochbegabungsdiagnostik steht mit dem BIS-HB (Jäger et al., 2006) eine Testversion zur Verfügung, die nicht nur an durchschnittlich begabten, sondern auch an über 500 hochbegabten Schülerinnen und Schülern normiert wurde.
Berufseignungsdiagnostik (vocational aptitude testing)	»Berufseignungsdiagnostik bezeichnet die Methodologie der Entwicklung, Prüfung und Anwendung psychologischer Verfahren zum Zwecke eignungsbezogener Erfolgsprognosen und Entscheidungshilfen im beruflichen Kontext« (Schuler & Höft, 2007, S. 102).
Big Five (Big Five)	Nach heutigem Stand kann man die Begriffe zur Beschreibung von Persönlichkeit fünf globalen Dimensionen zuordnen: Neurotizismus, Extraversion, Verträglichkeit, Offenheit für Erfahrung und Gewissenhaftigkeit. Das Fünf-Faktoren-Modell liegt mehreren Persönlichkeitsfragebögen zugrunde.
BIP: Bochumer Inventar zur berufsbezogenen Persönlichkeitsbeschreibung (The Bochum Inventory of Job-Related Personality Description (BIP))	Das BIP (Hossiep & Paschen, 2003, 2019) ist ein mehrdimensionaler Persönlichkeitsfragebogen speziell für die berufliche Eignungsdiagnostik. Es liegt in einer Selbst- und einer Fremdbeurteilungsform vor und soll 14 berufsrelevante Dimensionen der Persönlichkeit erfassen. Daraus wurde mit dem BIP-6 F (Hossiep & Krüger, 2012) eine Kurzform zur Erfassung von 6 Dimensionen abgeleitet.
Bochumer Matrizentest (BOMAT) (Bochum Advanced Matrix)	Die Bochumer Matrizentests verwenden Aufgaben, die immer aus einer 5 × 3-Matrix mit einem leeren Feld bestehen, das durch eines von sechs zur Auswahl stehenden Mustern zu ergänzen ist. Ähnliche Items finden sich auch in anderen Tests zur Erfassung der fluiden Intelligenz, auch Intelligenzpotential genannt. Der BOMAT - Standard (Hossiep & Hasella, 2010) dient der Auswahl und Beratung von Auszubildenden und zur Schullaufbahnberatung. Er wurde an 3439 Schülerinnen und Schülern zwischen 14 und 20 Jahren normiert. Der BOMAT - advanced (Hossiep, Turck & Hasella, 1999) wurde für den oberen Intelligenzbereich konstruiert und an 303 Studierenden und Absolventen von Universitäten und Fachhochschulen normiert. Eine Kurzversion trägt den Namen BOMAT - advanced - short version (Hossiep, Turck & Hasella, 2001). Sie wurde an 668 Absolventinnen und Absolventen von (Fach-) Hochschulen normiert.
Centil-Werte (C-Werte) (decile scores)	siehe Normwerte
CFT 20-R mit WS/ZF-R: Grundintelligenztest Skala 2 – Revision; mit Wortschatztest und Zahlenfolgentest (Culture Fair Intelligence Test (CFIT))	Beim CFT 20-R (von »Culture Fair Test«) von Weiß (2019) handelt es sich um ein Mitglied einer ganzen »Testfamilie« zur sprachfreien Messung der fluiden Intelligenz mit langer Tradition. Der CFT 20-R umfasst vier Aufgabengruppen: Figurenreihen fortsetzen, Figuren klassifizieren, Figurenmatrizen vervollständigen und topologische Schlussfolgerungen ziehen. Wortschatz- und Zahlenfolgentest stellen fakultative Zusatztests zur Messung der kristallinen Intelligenz dar.
Computer-Test (computer-based test)	Test, der am Computer durchgeführt wird. Viele als Papier-und-Bleistift Test entwickelte Tests liegen inzwischen auch als Computerversion vor. Es gibt aber auch Tests, die von Anfang an für die Durchführung am Computer konzipiert wurden.
Daueraufmerksamkeit (sustained attention)	Einige Testautorinnen und -autoren sprechen von Daueraufmerksamkeit, wenn die Aufmerksamkeit bei der Testdurchführung über einen längeren Zeitraum aufrechterhalten werden muss und damit auch Konzentration verlangen.
Deduktive Methode/Rationale Konstruktion (rational / deductive / theory-guided method of test construction)	Bei der Konstruktion von Testitems wird meist ein deduktives Vorgehen gewählt: Man beginnt mit einer Theorie, die eine gute Beschreibung des zu messenden Merkmals liefert. Daraus werden typische Verhaltensweisen abgeleitet, die als Indikatoren für das interessierende Merkmal gelten. Dazu werden dann Items formuliert.
Diagnostischer Prozess (diagnostic process)	Als diagnostischer Prozess wird die Abfolge von Maßnahmen zur Gewinnung diagnostisch relevanter Informationen und deren Integration zur Beantwortung einer Fragestellung bezeichnet. Er umfasst fünf Schritte: 1) Formulierung der globalen Fragestellung, 2) Differenzierung der globalen Fragestellung in dafür infrage kommende Teilfragen, 3) Auswahl der zur Beantwortung der Teilfragen bestmöglichen diagnostischen Instrumente, 4) Durchführung und Auswertung der diagnostischen Instrumente, 5) Integration der Ergebnisse zur Beantwortung der Teilfragen und der globalen Fragestellung.
Diagnostisches Interview (diagnostic interview)	Diagnostisches Interview ist der Überbegriff für Methoden zur Erhebung von diagnostisch relevanten Informationen mittels Gespräch. Mit Begriffen wie Anamnese, Exploration, Einstellungsgespräch oder Auswahlgespräch kann der Verwendungszweck oder die Zielsetzung eines diagnostischen Interviews näher bestimmt werden. Diagnostische Interviews unterscheiden sich durch den Grad ihrer Standardisierung.
Diagnostisches Interview bei psychischen Störungen (DIPS) (Diagnostic Interview for Mental Disorders (DIPD))	Beim DIPS open access (Margraf et al. 2017) handelt es sich um ein strukturiertes und standardisiertes Interviews zur klassifikatorischen Diagnostik psychischer Störungen. Weitere Versionen sind das Mini-DIPS Open Access: Diagnostisches Kurzinterview bei psychischen Störungen (Margraf und Cwik 2017) und Kinder-DIPS Open Access: Diagnostisches Interview bei psychischen Störungen im Kindes- und Jugendalter (Schneider et al. 2017).
Diagnostische Urteilsbildung (diagnostic judgment)	Die diagnostische Urteilsbildung stellt im diagnostischen Prozess den letzten Schritt dar. Hier werden die vorliegenden Untersuchungsergebnisse zur Beantwortung der psychologischen Fragen und der globalen Fragestellung integriert. Das Ergebnis nennt man diagnostisches Urteil.
dichotome Items (dichotomous items)	Items mit dichotomem Antwortformat (z.B. Ja-Nein, Richtig - Falsch)
DIN 33430 (DIN 33430)	Deutsche Norm zu Anforderungen an Verfahren und deren Einsatz bei berufsbezogenen Eignungsbeurteilungen (aktualisiert: DIN, 2016). Die Norm gibt Qualitätsstandards für den gesamten eignungsdiagnostischen Prozess vor sowie für die Personen, die als Eignungsdiagnostikerinnen bzw. -diagnostiker oder Beobachtende mitwirken, sowie für die eingesetzten Verfahren fest.
direkte Veränderungsmessung (direct measurement of change)	Eine direkte Veränderungsmessung erfolgt in Form einer Einmalerhebung, z. B. mit dem Veränderungsfragebogen des Erlebens und Verhaltens (VEV). Mit der Zielerreichungsbeurteilung (»goal attainment scaling«) kann eingestuft werden, inwieweit die zu Beginn oder im Verlauf der Therapie gesetzten Ziele tatsächlich realisiert werden konnten.
direkte Verhaltensbeobachtung (direct observation of behavior)	Die direkte Verhaltensbeobachtung bietet gegenüber der Verwendung einer Kamera den Vorteil, dass man seinen Blick dahin richten kann, wo das Geschehen interessant ist. Dabei kann man seinen Standpunkt verändern, um das Geschehen besser beobachten zu können. Ein Nachteil besteht darin, dass es nicht möglich ist, gleichzeitig zu beobachten und zu registrieren.
diskriminante Validität (discriminant validity)	Als diskriminante (divergente) Validität bezeichnet man den Zusammenhang mit Indikatoren anderer Konstrukte.
DSM-V (DSM-V)	Das Diagnostische und Statistische Manual Psychischer Störungen in der fünften Revision das Diagnostische und Statistische Manual Psychischer Störungen in der 5. Revision (DSM-5; American Psychiatric Association 2015, 2018) ist ein Klassifikationssystem für psychische Störungen, das von der Amerikanischen Psychiatrischen Vereinigung entwickelt wurde. (American Psychiatric Association).
Durchführungsobjektivität (objectivity of administration)	Die Durchführungsobjektivität ist gegeben, wenn ein Verfahren immer auf die gleiche Weise durchgeführt wird. Zur Standardisierung der Durchführung gehört, dass das Testmaterial (Testhefte, Antwortbögen etc.), die Instruktionen und die Randbedingungen der Untersuchung festgelegt sind.
Durchstreichtests	Aufmerksamkeits- und Konzentrationstests mit Suchaufgaben, bei denen Zielobjekte durchzustreichen sind, werden auch als »Durchstreichtests« bezeichnet. Der Begriff leitet sich vom Antwortmodus (bestimmte Zeichen durchstreichen) her.
Dyskalkulie (dyscalculia (math disability))	Umschriebene Entwicklungsstörung schulischer Fertigkeiten, welche die Rechenfertigkeit betrifft und in den einschlägigen internationalen Klassifikationssystemen (ICD, DSM) definiert ist. Sie ist »nicht allein durch eine allgemeine Intelligenzminderung oder eine unangemessene Beschulung erklärbar ... Das Defizit betrifft vor allem die Beherrschung grundlegender Rechenfertigkeiten, wie Addition, Subtraktion, Multiplikation und Division« (AWMF 2018, S. 5).
Effektstärke d (effect size d; Cohen's d (effect size))	Die Effektstärke d gibt an, wie stark sich die Mittelwerte zweier Messwerte-Verteilungen voneinander unterscheiden. Die Differenz wird in Streuungseinheiten (gemittelten Standardabweichungen beider Verteilungen) ausgedrückt. Bei Standardwerten beträgt die Standardabweichung 10; d = .56 entspricht 0,56 Streuungseinheiten und somit 5,6 Standardwertpunkten.
eigenschaftstheoretische Konzeption der Persönlichkeit (trait model)	Nach dieser Konzeption lässt sich das Verhalten und Erleben von Menschen in Form von Eigenschaften (traits) beschreiben, welche relativ breite und zeitlich stabile Dispositionen zu bestimmten Verhaltensweisen darstellen, die konsistent in verschiedenen Situationen auftreten können. Eigenschaften sind hypothetische, gedankliche, konstruierte Gebilde (Konstrukte), die nicht direkt beobachtbar sind und somit aus direkt beobachteten Verhaltensweisen nur erschlossen werden können.
Eingangsdiagnostik (initial examination)	Statusdiagnostik, die vor einer Intervention durchgeführt wird, um zu überprüfen, ob bestimmte Maßnahmen erforderlich sind.
Einsichtnahme (inspection)	Einer begutachteten Person soll - soweit das vertretbar ist - Einsicht in das Gutachten und in Untersuchungsberichte gewährt werden. Die wird in berufsethischen Richtlinien gefordert.
einstufiges oder sequentielles Testen (one-step testing or sequential testing)	Im Fall von einstufigem Testen erfolgt die Zuordnung einer Testperson zu einer Behandlung auf der Basis einer punktuell-einmaligen Diagnose, bei sequentiellem Testen hingegen als Resultat eines gestuften Vorgehens in mehreren Schritten.
Einzeluntersuchung (individual testing)	Ein Test wird nur mit einer einzelnen Person durchgeführt. Die Alternative ist eine Gruppenuntersuchung mit mehreren Testpersonen.
Elterliche Sorge (parental custody)	Die elterliche Sorge gilt von der Geburt bis zur Volljährigkeit des Kindes und umfasst die Personen- und die Vermögensfürsorge. Zur Personenfürsorge gehören die Fürsorge für das körperliche Wohl des Kindes, die Erziehung, Aufenthaltsbestimmung, Aufsichtspflicht und die Umgangsbestimmung. Die Vermögensfürsorge betrifft die Vertretung des Kindes in finanziellen Angelegenheiten.
Entwicklungstests (developmental test)	Mit Entwicklungstests soll festgestellt werden, ob sich ein Kind allgemein oder in einem speziellen Bereich altersgemäß entwickelt hat. Solche Tests sollten deshalb Items aufweisen, die vor allem mit dem Lebensalter hoch korrelieren, also beispielsweise zwischen benachbarten Altersstufen differenzieren. Durch Vergleich der individuellen Ergebnisse mit den Leistungen Gleichaltriger lassen sich Hinweise auf eventuell behandlungsbedürftige Entwicklungsverzögerungen finden.
erfahrungsgeleitet-intuitive Methode (experiential-intuitive judgement of job demands)	Unter der erfahrungsgeleitet-intuitiven Methode versteht man die freie, nicht formalisierte Beurteilung der Anforderungen an einen Beruf oder eine Stelle. Sie verlangt gründliche Kenntnisse der Stelle und ihrer organisatorischen Einbettung.
Erfolgskontrolle (measurement of success)	Zur Sicherung der Ergebnisqualität einer psychologischen Intervention (z. B. Therapie, Personalentwicklungsmaßnahme) ist es notwendig, deren Erfolg zu evaluieren. Veränderungen können indirekt gemessen werden, indem zu Beginn und am Ende der Intervention die gleichen Verfahren vorgegeben werden. Bei einer direkten Messung werden die Veränderungen einmalig am Ende der Intervention z. B. durch Befragung erfasst. Soll eine Interventionsmethode evaluiert werden, ist eine unbehandelte Kontrollgruppe erforderlich.
Error Score (error score)	siehe Fehlerwert
Erwartungsbereich (expectancy range)	siehe Konfidenzintervall
Erwartungswert (expected value)	Nach der Klassischen Testtheorie ist der wahre Messwert für die Merkmalsausprägung einer Person als Erwartungswert unendlich häufiger Messungen unter identischen Bedingungen definiert.
Evaluation (evaluation)	»Evaluation ist die systematische Untersuchung des Nutzens oder Wertes eines Gegenstandes. Solche Evaluationsgegenstände können z. B. Programme, Projekte, Produkte, Maßnahmen, Leistungen, Organisationen, Politik, Technologie oder Forschung sein« (Gesellschaft für Evaluation 2008, S. 15). Auch psychologische Diagnostik kann Gegenstand einer Evaluation sein. Man kann den Prozess des diagnostischen Vorgehens evaluieren (z. B. werden Vorgaben oder Standards eingehalten?), die Ergebnisse von Diagnostik (z. B. wie gut treffen die Prognosen über die Berufseignung zu?) oder den Nutzen von Diagnostik (z. B. wie groß ist der finanzielle Nutzen einer Auswahl von Studierenden mit einem Studierfähigkeitstest?).
Event sampling (event sampling)	Mit event sampling wird ein methodisches Vorgehen bei der systematischen Verhaltensbeobachtung bezeichnet. In der Regel ist dazu eine Videoaufnahme nötig, in die die Zeit eingeblendet ist. Für die interessierenden Verhaltensweisen werden exakt Beginn und Ende bestimmt um daraus deren Dauer im Beobachtungszeitraum zu ermitteln.
EWL: Die Eigenschaftswörterliste (The Adjective Word List)	Bei der EWL (Janke & Debus, 1978) handelt es sich um ein mehrdimensionales Verfahren zur quantitativen Beschreibung des aktuellen Befindens mit Hilfe von Adjektiven (z. B. »energisch«, »traurig«). Die »Normalversion« umfasst 15 Skalen mit insgesamt 161 Items; die Kurzversion erfasst die gleichen Merkmale mit nur 123 Items. Speziell für Kinder steht ein 40-Item-Version mit 10 Skalen zur Verfügung (Janke und Janke 2005).
Exploration (exploration)	Unter »Exploration« versteht man eine Variante des diagnostischen Interviews. Der Begriff stammt ursprünglich aus der Psychiatrie und bezeichnet die Erkundung des subjektiven Lebensraums einer Person.
Externale Konstruktion (method of empirical keying / criterion-keyed construction)	Ansatzpunkt der externalen Skalenentwicklung ist das Vorliegen verschiedener Gruppen von Personen als Teil der sozialen Realität. Das können z. B. Menschen mit einer bestimmten diagnostizierten psychischen Störung und (zum Vergleich) eine Gruppe von psychiatrisch unauffälligen Personen sein. Den Mitgliedern beider Gruppen wird eine möglichst große und inhaltlich breit gefächerte Zahl von Items vorgelegt, in der Hoffnung, dass sich darunter einige befinden werden, die zwischen den Gruppen empirisch diskriminieren. Diese Items werden für die vorläufige Testversion ausgewählt und neuen Stichprobe beider Gruppen zur Kreuzvalidierung vorgelegt. Mit den Items, die auch in dieser Erhebung noch zwischen den Gruppen diskriminieren, bildet man die endgültige Skala.
fachspezifischer Studierfähigkeitstest (Subject-specific test for scholastic aptitude)	Diese Tests dienen dazu, die Eignung für einen bestimmten Studiengang, eventuell sogar einen bestimmten Studiengang an einer bestimmten Hochschule festzustellen. Im deutschsprachigen Raum werden u. a. Tests zur Auswahl von Studierenden für medizinische Studiengänge eingesetzt.
Fahreignungsdiagnostik (medical-psychological assessment (MPA))	Die Fahreignungsdiagnostik befasst sich mit unterschiedlichen Aspekten der Fahreignung. Je nach Begutachtungsanlass und Fragestellung liegt der Schwerpunkt etwa auf Verhaltensgewohnheiten im Umgang mit Alkohol, der Persönlichkeit (z. B. bei Aggressionsdelikten) oder auf bestimmten Merkmalen der Leistungsfähigkeit. Im Fall der Fahrerlaubnis zur Fahrgastbeförderung oder bei Zweifeln an der psychischen Leistungsfähigkeit stehen eindeutig kognitive Leistungsmerkmale im Vordergrund.
Fahrerlaubnisverordnung (driver's licence regulation)	Die »Verordnung über die Zulassung von Personen zum Straßenverkehr« (kurz: Fahrerlaubnis-Verordnung, FeV) stellt die rechtliche Grundlage für eine Begutachtung der Fahreignung für den Straßenverkehr dar. Sie wurde im Dezember 2010 eingeführt und seitdem mehrfach aktualisiert.
Fairness (fairness)	Ein Test gilt als fair, wenn er Personengruppen nicht systematisch benachteiligt. Ein Test ist nicht an sich fair oder unfair: Eine Unfairness ergibt sich erst, wenn der Test in einer Population eingesetzt wird, die zum Teil aus benachteiligten Personen besteht, z. B. weil sie die deutsche Sprache nicht gut genug beherrschen und der Test gute Sprachkenntnisse voraussetzt. Verschiedene Modelle befassen sich mit der Frage, wie man mangelnde Fairness am besten feststellt. Unterschiede in der Testleistung zweier Gruppen reichen nicht aus.
Familie in Tieren (Family as Animals)	Für diesen projektiven Test (Brehm-Gräser, 2001) aus der Gruppe der zeichnerischen- und Gestaltungsverfahren benötigt man ein Blatt Papier und Stifte. Das Kind wird aufgefordert, sich seine Familie als Tiere vorzustellen und sie zu malen. Die Zeichnung wird inhaltlich und formal gedeutet; das Manual bietet dazu jedoch keine wissenschaftlich fundierten Auswertungs- und Interpretationsregeln.
Fehlerwert (error score)	Die Abweichung eines beobachteten Testwerts vom wahren Wert einer Person. Diese kommt durch Messfehler zustande, welche von Messung zu Messung variieren - der Erwartungswert (Mittelwert der Messfehler bei unendlich vielen Messungen) beträgt 0. Inhaltlich umfasst das Konzept des Messfehlers die Gesamtheit aller unsystematischen Einflussgrößen, die auf das Messergebnis einwirken können.
fluide Intelligenz (fluid intelligence)	Darunter versteht man die von Bildungseinflüssen relativ unabhängige geistige Leistungsfähigkeit. Sie kommt in verschiedenen Intelligenzmodellen als Intelligenzfaktor vor. In Tests zur Messung der fluiden Intelligenz finden oft sprachfreie Aufgaben zum schlussfolgernden Denken (z. B. Matrizenaufgaben) Verwendung.
FPI-R: Freiburger Persönlichkeitsinventar – Revidierte Fassung (Freiburg Personality Inventory - Revised)	Das FPI-R (Fahrenberg et al., 2020) ist ein in der Praxis vielverwendeter Persönlichkeitsfragebogen mit langer Tradition; die erste Auflage des FPI erschien bereits 1970. Es handelt sich um eine eigenständige Entwicklung, die sich nicht dem Big-Five-Ansatz verpflichtet sieht. Das FPI-R umfasst zehn Standardskalen (z. B. Lebenszufriedenheit, Gehemmtheit) und zwei globale Zusatzskalen (Emotionalität und Extraversion). Die Skala »Offenheit« dient auch als Kontrollskala.
Fragebogen zur Partnerschaftsdiagnostik (FPD) (questionnaire for relationship assessment)	Der FPD (Hahlweg, 2016) dient mit den Skalen »Streitverhalten«, »Zärtlichkeit« und »Gemeinsamkeit/Kommunikation« zur Bestimmung der partnerschaftlichen oder Ehequalität.
Fragebogenmethode (survey method)	Die Fragebogenmethode zeichnet sich dadurch aus, dass vorformulierte Fragen oder Feststellungen in schriftlicher Form vorgelegt werden. Das Antwortformat ist festgelegt. Die Items sind Skalen zugeordnet; die Auswertung erfolgt meist mit Hilfe von Schablonen.
Frankfurter Adaptiver Konzentrationsleistungs-Test (FAKT-II) (Frankfurt Adaptive Concentration-Performance Test)	Beim FAKT-II (Moosbrugger & Goldhammer, 2007) handelt es sich um eine Computerversion des FAIR (siehe https://www.testzentrale.de/shop/frankfurter-aufmerksamkeits-inventar-2…). Die Konzentrationsfähigkeit kann wahlweise auch adaptiv gemessen, indem das Schwierigkeitsniveau der Items »maßgeschneidert« an das individuelle Konzentrationsvermögen der Testperson angepasst wird: Je höher die Konzentrationsleistung liegt, desto rascher werden die Items vorgegeben. Die Testdauer kann auf bis zu 30 Minuten verlängert werden.
Frankfurter Aufmerksamkeits-Inventar (FAIR) (Frankfurt Attention Inventory)	Das Frankfurter Aufmerksamkeits-Inventar (FAIR) von Moosbrugger und Oehlschlägel (2011) verwendet als Testitems vier Zeichen, von denen zwei als Zielitems fungieren (in Testform A »Kreis mit 3 Punkten« sowie »Quadrat mit 2 Punkten«; in Testform B sind Ziel- und Nicht-Zielitems vertauscht). Im Sinne des »vollständigen Markierungsprinzips« haben Testpersonen die Aufgabe, auf dem Testbogen unter jeder Zeile eine Linie zu ziehen und diese bei Zielitems zackenförmig hochzuziehen.
freie Verhaltensbeobachtung (unstructured observation of behavior)	Von einer freien Verhaltensbeobachtung spricht man, wenn die Beobachterin oder der Beobachter selbst entscheidet, welche Verhaltensweisen sie oder er beobachtet. Für die Beobachtung gibt es in der Regel einen Anlass, und sie kann auch der Überprüfung konkreter Hypothesen bzw. der Beantwortung von Fragen dienen. Das Ergebnis ist ein mehr oder weniger detaillierter schriftlicher Bericht.
Gefälligkeitsgutachten (Courtesy expertise)	Unter Gefälligkeitsgutachten versteht man Gutachten, bei dem das Ergebnisinteresse der auftraggebenden oder der begutachteten Person über fachlichen Gesichtspunkten steht. Sie sind aus berufsethischen Gründen nicht zulässig.
gemeinsame Methodenvarianz (common-method variance)	Häufig wird ein diagnostisches Verfahren an einem anderen Verfahren validiert, das den gleichen Methodentypus verwendet (z.B. wird ein Leistungstest an einem anderen Leistungstest validiert). Dann spricht man von gemeinsamer Methodenvarianz. Durch die Verwendung der gleichen Methode kann die Korrelation beider Verfahren künstlich erhöht sein, z. B. durch sozial erwünschtes Antworten.
Genogramm (genogram)	In einem Genogramm werden die Beziehungen zwischen den Mitgliedern einer Familie grafisch dargestellt. Dabei können auch bereits verstorbene oder auch Personen, die nicht der Familie angehören, mit aufgenommen werden. Merkmale der Personen (z. B. Geschlecht) können durch grafische Symbole dargestellt werden.
GES: Griffiths Entwicklungsskalen zur Beurteilung der Entwicklung in den ersten beiden Lebensjahren (The Griffiths Mental Development Scales : birth to 2 years)	Die GES (deutsche Version von Brandt & Sticker, 2001) dient der Erfassung des Entwicklungsstandes in den Bereichen Motorik, sozialer Kontakt, Hören und Sprechen, Auge-Hand-Koordination und kognitive Entwicklung. Die Kinder werden dazu in bestimmten Situationen, teils unter Verwendung von Testmaterialien, beobachtet. Beispielsweise wird geprüft, ob das Kind den Ring, den man ihm reicht, nimmt.
Geschwindigkeitstests (speed tests)	Geschwindigkeitstests (Speed-Tests) sind Leistungstests, die aus sehr leichten Aufgaben bestehen, die in einer sehr knapp bemessenen Zeit zu bearbeiten sind.
Goldberg-Index (Goldberg index)	Ein bekanntes Urteilsmodell zur »mechanischen Urteilsbildung« anhand von MMPI-Testergebnissen. Damit wird festgestellt, ob eine Patientin bzw. ein Patient psychotisch ist oder nicht. Die individuellen Testwerte aus fünf Skalen werden nach einer einfachen Formel verrechnet.
Gruppenuntersuchung (group test(ing) null)	Testung, die mit mehreren Personen gleichzeitig durchgeführt wird
GT: Gießen-Test (Giessen Test)	Der Gießen-Test (GT-II, Beckmann et al., 2012) ist ein vor einem psychoanalytischen Hintergrund entwickelter psychometrischer Fragebogen mit sechs Standardskalen (z. B. Dominanz). Er wird vor allem für die Paardiagnostik verwendet. In verschiedenen Varianten kann damit eine realistische oder eine ideale Beschreibung der eigenen Person oder des Partners bzw. der Partnerin erhoben werden.
Guttman-Modell (Guttman model)	siehe Skalogramm-Modell
Halo-Effekt (halo effect)	Die wohl bedeutsamste Fehlerquelle bei der Verhaltensbeobachtung/-beurteilung ist der Halo-Effekt. Er äußert sich in unangemessen hohen Korrelationen der Urteile über verschiedene Merkmale einer Person. Er soll dadurch zustande kommen, dass das Urteil über ein herausragendes Merkmal die Beurteilungen anderer Merkmale einer Person »überstrahlt«. Beispielsweise wirkt eine Person sehr freundlich; andere Merkmale werden daraufhin positiver beurteilt.
HAWIK: Hamburg-Wechsler-Intelligenztest für Kinder (Hamburg-Wechsler Intelligence Intelligence Scale for Children)	Beim HAWIK (zuletzt HAWIK-IV; Petermann & Petermann, 2007) handelt es sich um die deutsche Version der amerikanischen Wechsler Intelligence Scale for Children. Der Test dient der Messung der Allgemeinen Intelligenz und liefert zusätzlich Informationen über vier kognitive Fähigkeiten, die als Teilaspekte der Intelligenz aufzufassen sind: Sprachverständnis, Wahrnehmungsgebundenes Logisches Denken, Arbeitsgedächtnis und Verarbeitungsgeschwindigkeit. Die deutschsprachigen Wechsler-Tests werden unter der Bezeichnung Wechsler Intelligence Scale for Children (WISC) weitergeführt (zuletzt WISC-V von Wechsler, 2017).
HCR-20 (HCR-20)	Die Checkliste HCR-20 (Historical, Clinical, and Risk Management-20 von Webster et al., 1997) liegt auch in einer deutschen Fassung vor (Müller-Isberner et al., 1998). Sie soll zukünftiges gewalttätiges Verhalten vorhersagen. Die beurteilende Person stuft 20 Risikofaktoren (= Items) aus der Vorgeschichte, zu gegenwärtigen klinischen Symptomen und zum künftigen Risiko-Management auf einer dreistufigen Skala (0 = Item trifft definitiv nicht zu bis 3 = trifft sicher zu) ein. Sie soll dabei auf alle verfügbaren Informationsquellen wie Berichte von Polizei und Staatsanwaltschaft oder Stellungnahmen von Psychologen bzw. Psychologinnen oder auch Krankenpflegepersonal zurückgreifen; auch ein Interview ist möglich. Unter dem Kürzel HCR-20 V3 liegt die 3. Version des Verfahrens mit teilweise veränderten Items vor (Douglas et al., 2014; deutsch Müller-Isberner et al., 2014).
Hochbegabung (intellectual giftedness)	Unter Hochbegabung wird meist eine herausragend hohe allgemeine Intelligenz mit einem IQ von mindestens 130 verstanden.
Hofeffekt (halo effect)	siehe Halo-Effekt
Homogenität (homogeneity)	Der Begriff bezieht sich sowohl auch Merkmale bzw. Konstrukte als auch auf Items zu deren Messung. Homogenität bedeutet Einheitlichkeit (im Gegensatz zu Komplexität und Vielschichtigkeit). Die Fertigkeit des Addierens von einstelligen Zahlen ist ein homogeneres Merkmal als die Beherrschung aller Grundrechenarten. Dementsprechend sollten die Items im ersten Fall homogener sein als im zweiten. Items zur Messung eines sehr homogenen Merkmals weisen in der Regel hohe Trennschärfen auf.
ICD-10 (ICD-10)	Die Internationale Klassifikation psychischer Störungen (»International Classification of Diseases«) in ihrer zehnten Revision (ICD-10; Kapitel V), die von der Weltgesundheitsorganisation (WHO) herausgegeben wird, ist ein aktuell gültiges und in Wissenschaft und klinischer Praxis eingesetztes Klassifikationssystem für psychische Störungen.
Ideografische Prognose (ideographic prognosis)	Der Begriff bezeichnet eine Vorgehensweise bei der Erstellung von Krimimalprognosen. Ziel dieses Ansatzes ist es, ein individuelles Erklärungsmodel für die untersuchte Person auszuarbeiten, um damit zu einer Prognose zu gelangen. Die Alternative wäre ein nomothetischer Ansatz, der auf allgemeinen Gesetzmäßigkeiten bzw. damit verbundenen statistisch gesicherten Zusammenhängen basiert.
impression management (impression management)	Selbstbeschreibungen in Richtung eines sozial erwünschten Bildes. Dabei ist der Wunsch entscheidend, vor anderen einen guten Eindruck machen zu wollen.
indirekte Veränderungsmessung (indirect measurement of change)	Bei der indirekten Veränderungsmessung werden die relevanten (meist symptomorientierten) Verfahren, die zu Beginn der Therapie eingesetzt wurden, am Ende der Behandlung erneut vorgegeben.
Induktive Konstruktion (inductive (factor-analytical) construction)	Bei der induktiven Konstruktion von Skalen werden meist Items aus vorhanden Verfahren mit gleichem oder ähnlichem Messanspruch zusammengestellt. Die Itemsammlung wird von vielen Personen bearbeitet. Die Annahme ist, dass miteinander korrelierende Items das gleiche Merkmal erfassen. Durch Anwendung einer explorative Faktorenanalyse findet man eine oder auch mehrere Gruppen (Faktoren) korrelierender Items. Eventuell nimmt man dann an, dass das Merkmal mehrdimensional ist und mehrere Skalen zu seiner Messung nötig sind.
informierte Einwilligung (informed consent)	Die Teilnahme an einer diagnostischen Untersuchung ist grundsätzlich freiwillig. Die Teilnehmerinnen und Teilnehmer sollen aus ethischen Gründen vor Beginn der Untersuchung über wichtige Details informiert werden. Sie können dann entscheiden, ob sie sich der Untersuchung unterziehen oder nicht bzw. ob sie die Teilnahme an einem bestimmten Verfahren verweigern.
Inhaltsvalidität (content validity)	Unter Inhaltsvalidität versteht man, wie repräsentativ die Items eines Tests für das zu messende Merkmal sind. Sie ist in bestimmten Anwendungsbereichen sehr wichtig, etwa bei klinischen Skalen, die sich an anerkannten Klassifikationen und Beschreibungen klinischer Störungen orientieren oder Schulleistungstests, die den Lernstand in einem Schulfach messen sollen.
Inkrementelle Validität (incremental validity)	Bei Anwendung mehrerer diagnostischer Verfahren zu einer umfassenden Messung eines Merkmals, ist es entscheidend, welcher Zuwachs an Validität mit einem weiteren Verfahren erzielt wird. Diesen Zuwachs nennt man inkrementelle Validität. Das zusätzliche Verfahren erfasst in diesem Fall einen bisher noch nicht berücksichtigten Aspekt des Kriteriums.
Integritätstests (integrity tests)	Eine spezielle Variante von Persönlichkeitstests findet in Deutschland kaum Verwendung: die Integritätstests. Diese Verfahren wurden entwickelt, um kontraproduktives Verhalten im Unternehmen (Diebstahl, Alkohol- oder Drogenkonsum, Beschädigung oder Zerstörung von Sachen etc.) vorherzusagen.
Intelligenztests (Systematik) (intelligence tests (systematics / classification))	Intelligenztests haben in der Psychologie eine lange Tradition und sollen verschiedene (mehr oder weniger globale) Komponenten der kognitiven Leistungsfähigkeit erfassen. Intelligenztests unterscheiden sich in vielerlei Hinsicht. Inhaltliche Einordnung in Intelligenzmodelle (z.B. Berliner Intelligenzmodell, Carroll-Modell) möglich. Messintention: Tests soll die allgemeine Intelligenz oder eine Intelligenzkomponente messen, ein Globalmaß der Intelligenz und/oder Informationen zur Intelligenzstruktur bzw. über einzelne Intelligenzkomponenten liefern, die Intelligenz sprachfrei/kulturfair oder bildungsabhängig messen. Durchführungsbedingungen: Einige können nur als Einzeltest durchführt werden, viele aber auch als Gruppentest, sie betonen unterschiedlich stark speed und power und sind als Papier-und-Bleistift-Test und/oder als Computertest verfügbar. Zielgruppe: Ein Tests kann für einen bestimmten Alters- oder einen bestimmten Intelligenzbereich vorgesehen sein, sich aber auch für die Gesamtbevölkerung oder für spezielle Personengruppen eignen.
Interaktionismus (interactionism)	Persönlichkeitsmerkmale werden als situationsübergreifend wirksam verstanden. Es ist unstrittig, dass konkretes Verhalten auch auf die jeweilige Situation zurückzuführen ist. Der Interaktionismus betont das Zusammenwirken von Situationen und Persönlichkeitseigenschaften bei der Erklärung von Verhalten, ignoriert dabei aber die Haupteffekte. Es gibt nur wenige Verfahren, die den interaktionistischen Ansatz berücksichtigen.
Interaktionsprozessanalyse (interaction process analysis)	Zur Erforschung von Interaktionen in Kleingruppen hat Bales bereits 1950 die sog. Interaktionsprozessanalyse (s. Bales, 1975) entwickelt. Die Systematik ist theoretisch fundiert und führt zu insgesamt zwölf Kategorien des Verhaltens. Beobachtende, die mit einem solchen Kategoriensystem arbeiten, müssen jede Verhaltensweise einer dieser Kategorien zuordnen – eine Restkategorie gibt es nicht.
Interne Konsistenz (internal consistency)	Die interne Konsistenz bezeichnet nach Bentler (2009) den Anteil der gemeinsamen Varianz an der Gesamtvarianz der jeweils relevanten Items einer Skala. Die Bestimmung der internen Konsistenz ist eine Variante der Reliabilitätsschätzung. Cronbachs Alpha ist die bekannteste Formel zur Schätzung der internen Konsistenz.
Interpretationsobjektivität (objectivity of interpretation)	Interpretationsobjektivität ist dann gegeben, wenn im Testmanual genaue Anweisungen vorliegen, wie ein bestimmter Rohwert zu interpretieren ist. Dazu sind erstens klare Aussagen nötig, welches Merkmal mit dem Test gemessen wird bzw. wie es zu benennen ist. Zweitens muss erklärt werden, wie man die Ausprägung des Merkmals bei der Testperson mit Hilfe von Normtabellen ermittelt und benennt.
Interview (interview)	Interviews dienen generell der Erhebung von Informationen mittels Gespräch. Interviews werden beispielsweise von Journalistinnen und Journalisten eingesetzt, um politische Standpunkte in Erfahrung zu bringen. In anderen Kontexten nennt man Interviews beispielsweise Verhör oder Zeugenbefragung. »Diagnostisches« Interview ist der Überbegriff für Methoden zur Erhebung von diagnostisch relevanten Informationen mittels Gespräch. Mit Begriffen wie Anamnese, Exploration, Einstellungsgespräch oder Auswahlgespräch kann der Verwendungszweck oder die Zielsetzung eines diagnostischen Interviews näher bestimmt werden.
Inventar komplexer Aufmerksamkeit (INKA) (Inventory for Complex Attention)	Das Inventar komplexer Aufmerksamkeit (INKA) von Heyde (1995) zählt zu den Konzentrationstests. Es kombiniert zwei Aufgabentypen: Suchen (von bestimmten Konsonanten in einer Zeile) und Transformation (in andere Konsonanten (z. B. wird B zu Z). Die Aufgabe ist sehr komplex.
In-vivo-Beobachtungen (in vivo observations)	Beobachtungen in natürlichen Umgebungen. Anwendungsbeispiele sind die Beobachtung aggressiven Verhaltens von Kindern im Kindergarten oder - bei Erziehungsproblemen - die Beobachtung der Interaktionen von Eltern und Kindern in ihrer Wohnung.
IST-2000-R: Intelligenz-Struktur-Test 2000 – Revision (Intelligence Structure Test IST-R)	Der I-S-T 2000-R (erw.) (Liepmann et al., 2007) ist ein breit angelegter Intelligenztest, der mehrere Kennwerte zur Intelligenz liefert. Er besteht aus zwei separat einsetzbaren Teilen: Das »Grundmodul« dient der Messung des schlussfolgernden Denkens, der fluiden Intelligenz sowie bei Bedarf, mit zwei separaten Subtests, auch der Merkfähigkeit. Das »Erweiterungsmodul« erfasst allgemeines Wissen; daraus kann die kristallisierte Intelligenz geschätzt werden. Der Test liefert darüber hinaus auch Kennwerte für die verbale, numerische und figurale Intelligenz.
Itemformat (test item format)	Die Items eines Leistungs- oder Persönlichkeitstests können auf unterschiedliche Weise zu beantworten sein. Eine wichtige Unterscheidung ist die zwischen freien und gebundenen Antworten. Ein Test, der freie Antworten verlangt, ist der Rorschach-Test. Der Testperson wird ein Tintenklecks mit der Frage vorgelegt »Was könnte das sein?«. Die Antwort, z. B. »eine Fledermaus«, wird protokolliert. Bei eingeschränkten freien Antworten werden z. B. Ergänzungen durch ein fehlendes Wort verlangt. Zu den gebundene Antwortformaten zählen Zuordnungsaufgaben, Sortieraufgaben, Multiple-Choice-Aufgaben, Beurteilungsaufgaben (mit Antwortskalen) und dichotome Antworten (z. B. ja-nein, richtig-falsch).
Item-Response-Theorie (IRT) (item response theory (IRT))	Item-Response-Theorien werden auch als »Probabilistische Testtheorien« bezeichnet. Sie beschäftigen sich mit Antworten auf Items und beschreiben das auf ein oder mehrere Items bezogene Antwortverhalten von Personen (item response) als Wahrscheinlichkeitsfunktion, d. h. als probabilistische Funktion. Die IRT unterscheiden sich darin, für welches Antwortformat (dichotom, ordinal, nominal) sie gelten und ob sie Personen nach ihrer Merkmalsausprägung quantifizieren oder sie Klassen zuordnen.
Itemschwierigkeit (item difficulty)	In der Klassischen Testtheorie gibt die Itemschwierigkeit an, wie groß der Anteil der Personen ist, die das Item im Sinne des Merkmals beantwortet haben. Je höher der Anteil der Personen ist, die ein Item im Sinne des Merkmals beantworten, desto leichter ist das Item. Im einparametrischen dichotomen Rasch-Modell, ist die Itemschwierigkeit anders definiert; nämlich als der Punkt auf dem Fähigkeitsspektrum, an dem die Lösungswahrscheinlichkeit .50 beträgt.
Itemvalidität (item validity)	Die Itemvalidität ist definiert als der Zusammenhang eines Items mit einem Außenkriterium an. Bei external konstruierten Tests ist dieser Kennwert besonders wichtig. Die Itemvalidität kann sowohl als Korrelation mit einem Kriteriumswert berechnet werden als auch durch einen Mittelwertsvergleich.
Kaufman Assessment Battery for Children – Second Edition (KABC-II) (Kaufman-Assessment Battery for Children (KABC-II))	Bei der KABC-II handelt es sich um einen Intelligenztest für den Altersbereich 3;6 bis 18;6 Jahren (deutsche Version von Kaufman und Kaufman, 2015). Sie basiert auf dem Carroll-Horn-Cattell-Modell (CHC-Modell) der Intelligenz (McGrew, 2005) und liefert sowohl einen Gesamt-IQ als auch weitere Kennwerte. Zusätzlich können die Ergebnisse auch nach Lurias Theorie zu neupsychologischen Verarbeitungsprozessen (Luria 1970) interpretiert werden.
Kieler Änderungssensitive Symptomliste KASSL (Kiel Change-Sensitive List of Symptoms)	Die Kieler Änderungssensitive Symptomliste KASSL ((Zielke, 1979) ist ein Beispiel für einen Fragebogen, der im Kontext der Gesprächspsychotherapie entwickelt wurde. Die 50 Fragebogenitems erfassen eine Reihe von Beschwerden. Das Verfahren liefert einen Gesamtwert der Symptombelastung sowie mehrere auf faktorenanalytischer Basis ermittelte Skalenwerte (z. B. sozialer Kontakt).
Klassifikation (classification)	Spezialfall der Beschreibung, bei dem Menschen zu vordefinierten Klassen zugeordnet werden
Klassische Testtheorie (classical test theory)	Die zentrale Annahme der Klassischen Testtheorie ist, dass Messungen fehlerbehaftet sind. Sie nimmt an, dass eine einzelne Messung aufgrund von unsystematischen Einflussfaktoren ein höheres oder niedrigeres Ergebnis liefert als aufgrund der tatsächlichen Merkmalsausprägung zu erwarten wäre.
KLT-R: Konzentrations-Leistungs-Test – Revidierte Fassung (Concentration Performance Test-Revised)	Der KLT-R von Düker et al. (2001) ist ein Konzentrationstest für die 4. bis 6. (KLT 4-6) bzw. die 6. bis 13. Klasse (KLT 6-13). Jedes Item besteht aus zwei Rechenaufgaben wie 8 + 9 − 2 = ? und 4 − 2 + 7 = ? , deren Ergebnisse zu vergleichen sind. Im KLT 4-6 ist das kleinere Ergebnis vom größeren zu subtrahieren, im KLT 6-13 nur dann, denn das erste Ergebnis größer ist als das zweite (andernfalls sind beide Ergebnisse zu addieren). Nach Düker ist die Koordination mehrerer Einzeltätigkeiten ein wesentliches Merkmal der Konzentration.
kompensatorisches Entscheidungsmodell (Compensatory decision making model)	In einem kompensatorischen Urteilsmodell werden die erhobenen Prädiktoren so verrechnet, dass sie sich gegenseitig ausgleichen (kompensieren) können. Dazu werden die Prädiktoren (gleich gewichtet oder auch unterschiedlich gewichtet) addiert.
Konfidenzintervall (confidence interval)	Um die Unreliabilität psychologischer Messung angemessen abzubilden, wird ein Konfidenzintervall um das Ergebnis der Messung gelegt. Es reflektiert die zu erwartende Schwankung bei wiederholten Messung.
Konstruktvalidität (construct validity)	Unter Konstruktvalidität versteht man empirische Belege dafür, dass ein Test das Konstrukt erfasst, welches er erfassen soll – und nicht ein anderes.
Kontrollskalen (validity scales)	Um eine Verfälschung bei der Bearbeitung von Fragebögen zu entdecken, wurden verschiedene Kontrollskalen entwickelt, die z. B. »impression management« oder Lügen erfassen sollen.
konvergente Validität (convergent validity)	Den Zusammenhang mit anderen Indikatoren des Konstrukts, das man erfassen will, nennt man konvergente Validität.
Konzentration (concentration)	Unter Konzentration kann man die Fähigkeit verstehen, sich über mehr oder weniger lange Zeit einer Tätigkeit effizient zuwenden zu können. Die Effizienz zeigt sich an der Quantität (bewältigte Aufgabenmenge oder benötigte Zeit) und der Qualität (Güte bzw. niedrige Fehlerquote) der dabei erbrachten Leistung. Die Leistung ist dabei in Bezug auf die spezifischen (für die Tätigkeit benötigten) Fähigkeiten, Fertigkeiten und/oder Kompetenzen zu relativieren.
Konzentrationstest für 3. und 4. Klassen – Revision (KT 3-4 R) (concentration test for 3rd and 4th classes)	Die Items des Konzentrationstests für 3. und 4. Klassen – Revision (KT 3-4 R) von Nell et al. (2004) beinhalten Würfel, die zeichnerisch so dargestellt sind, dass man immer drei Flächen mit jeweils 1 bis 6 Punkten sehen kann. Jedes Item ist mit den vier Musterwürfeln zu vergleichen.
Konzentrationstests (concentration tests)	Konzentrationstests lassen sich – anders als etwa Intelligenztests – nicht nach theoretischen Modellen klassifizieren, da solche Modelle nicht vorliegen. Für die Auswahl eines Tests ist vor allem relevant, welche Art von Aufgaben verwendet wird und für welche Zielgruppe ein Test vorgesehen ist. Die Art der Testaufgaben ist wichtig, da häufig nicht »die« Konzentrationsfähigkeit (als allgemeine und breite Fähigkeit) gefragt ist, sondern die Fähigkeit, sich unter näher bestimmbaren Bedingungen zu konzentrieren.
Konzentrierte Aufmerksamkeit (concentrated attention)	Damit ist die Fähigkeit gemeint, die Aufmerksamkeit längere Zeit aufrecht zu erhalten, also eine Kombination von Aufmerksamkeit und Konzentration.
kristalline Intelligenz (crystallized intelligence)	Nach dem Carroll-Horn-Cattell-Modell (CHC-Modell) versteht man darunter erworbenes deklaratives und prozedurales Wissen und dessen Anwendung.
kriteriumsbezogene Skalenentwicklung (construction method of empirical keying / criterion-keyed construction)	siehe externale Konstruktion
kriteriumsorientierte Tests (criterion-referenced test)	Kriteriumsorientierte Tests sind inhaltsvalide Testverfahren, die nicht die Position einer Person in Relation zu einer Vergleichsnorm, sondern das Erreichen oder Verfehlen eines konkreten Kriteriums ermitteln wollen.
Kriteriumsvalidität (criterion validity)	Unter Kriteriumsvalidität versteht man den Zusammenhang zwischen Testergebnis und konkreten Leistungen oder Verhaltensweisen außerhalb der Testsituation. Das Kriterium muss für den vorgesehenen Einsatzbereich des Tests relevant sein.
Kritische Differenz (critical difference)	In der Praxis werden manchmal zwei Testwerte einer Testperson verglichen. Mithilfe der Berechnung einer »Kritischen Differenz« kann man herausfinden, wie groß die Differenz zwischen zwei Testwerten sein muss, um nicht mehr alleine als messfehlerbedingt erachtet werden zu können.
Künstliche Intelligenz (artificial intelligence)	Unter künstlicher Intelligenz versteht man einen Forschungsansatz, bei dem mit Hilfe von Algorithmen komplexe Zusammenhänge zwischen verfügbaren Daten über eine Person als Prädiktoren für beispielsweise ein Persönlichkeitsmerkmal verwendet werden. Bei den Daten kann es sich z. B. um digitale Spuren, die Menschen im Internet hinterlassen haben, beobachtbare Verhaltensweisen oder biografische Merkmale handeln. Das System lernt in vielen Durchgängen an sehr vielen Datensätzen zu zuverlässigen Vorhersagen zu kommen, weshalb man auch von »machine learning« spricht.
latente Variablen (latent variable)	Bei den latenten Variablen handelt es sich im Kontext der IRT um die Merkmalsausprägung in nicht beobachtbaren, dahinterliegenden Dispositionen (Einstellungen, Persönlichkeitsmerkmalen, Fähigkeiten). Sie determinieren die Antworten auf Testitems, also manifestes Verhalten.
Leistungsbeurteilung (performance evaluation)	Leistungsbeurteilung findet im Rahmen der Personalentwicklung statt. Sie soll quantifizieren, in welchem Ausmaß eine Mitarbeiterin bzw. ein Mitarbeiter zum Erfolg des Unternehmens beigetragen hat. Sie hat verschiedene Funktionen wie Feedback für Mitarbeitende geben oder Bedarf an Personalentwicklungsmaßnahmen feststellen (z. B. Teilnahme an Trainingsprogrammen) .
Leistungsprüfsystem (LPS) (Performance Testing System)	Das LPS liegt in zwei Versionen vor. Das LPS-2 (Kreuzpointner et al., 2013) liefert mit seinen 11 Untertests Informationen über die allgemeine Intelligenz sowie die Komponenten »kristalline Intelligenz«, »fluide Intelligenz«, »visuelle Wahrnehmungsfähigkeit« und »kognitive Schnelligkeit« im Sinne des Intelligenzmodells von Carroll. Das LPS 50+ (Sturm et al., 2015) stellt eine Adaptation des LPS von 1993 speziell für den Altersbereich zwischen 50 und 90 Jahren dar.
Leistungstest (performance test)	In Leistungstests sollen die Testpersonen Aufgaben bearbeiten und dabei ihr Bestes geben (z. B. rechnen, geometrische Figuren vergleichen, Fehler in Texten suchen oder Probleme lösen). Die geleistete Arbeit wird quantifiziert durch die Anzahl (richtig) bearbeiteter Aufgaben oder die Bearbeitungszeit. Leistungstests dienen der Messung der Intelligenz, der Konzentrationsfähigkeit, von Wissen, Fertigkeiten und Kompetenzen (z. B. Rechnen, Lesen).
Leistungsmotivationsinventar (LMI) (Achievement Motivation Inventory (AMI))	Das LMI (Schuler & Prochaska, 2001) ist ein Fragbogen zur »breiten« Messung der berufsbezogenen Leistungsmotivation. Mit 170 liefert es neben einem Gesamtwert auch differenzierte Informationen zu 17 mehr oder weniger eng mit der Leistungsmotivation verbundenen Merkmalen wie Beharrlichkeit, Wettbewerbsorientierung oder auch Furchtlosigkeit. Der Gesamtwert kann auch mit Hilfe einer aus 30 ausgewählten Items bestehenden Kurzform bestimmt werden.
logischer Fehler (logical error)	Der logische Fehler bezeichnet einen Beurteilungsfehler im Rahmen von Verhaltensbeobachtungen. Er beschreibt die implizite Annahme, dass Zusammenhänge zwischen zwei oder mehr Merkmalen oder Verhaltensweisen bestehen. Die Beurteilung eines Merkmals (z. B. Intelligenz) wird durch Information über andere vermeintlich verbundene Merkmale (z. B. Brillenträger) beeinflusst und damit verfälscht.
Marburger Modell (Marburg conventions to evaluate indivdual test scores)	Das Modell dient zur Verbalisierung von normbasierten Testergebnissen. Die Ausprägung eines Merkmals wird einheitlich benannt. Die zugehörigen Bereich in der Normalverteilung sind: »durchschnittlich« = Mittelwert +/– je eine halbe (!) Standardabweichung (bei Standardwerten SW also 95 - 105), »hoch« = 1 Standardabweichung darüber (SW 106 - 115), »sehr hoch« = eine weitere Standardabweichung darüber, nach oben aber offen (SW > 115), »niedrig« und »sehr niedrig« analog nach unten (SW= 94 - 85 bzw. SW < 85). Bei der Verbalisierung wird immer Bezug auf die herangezogene Referenzgruppe genommen. Für Konfidenzintervalle werden die gleichen Begriffen verwendet.
Medizinische Diagnostik (medical assessment)	Medizinische Diagnostik befasst sich wie die psychologische Diagnostik mit Menschen als Merkmalsträger, fokussiert jedoch überwiegend auf körperliche Merkmale und nur selten auf Verhalten und Erleben.
Mehrfachwahl-Wortschatz-Test (MWT) (Multiple choice vocabulary test of intelligence (MWT))	Der MWT soll über den Wortschatz (Itembeispiel: »Oher – Ohr – Ehr – Ereh – Hor«; das einzige richtige Wort markieren) die kristallisierte Intelligenz messen (verbreitete Form MMT-B von Lehrl, 1977).
Methode des zirkulären Fragens (circular questioning)	Mit der Methode des zirkulären Fragens werden Familienmitglieder (bzw. Mitglieder des untersuchten »Systems«) nacheinander über persönliche Sichtweisen und Mutmaßungen über die jeweils anderen Beteiligten befragt. Dadurch erhalten alle Beteiligten gleichzeitig Informationen zu den unterschiedlichen Sichtweisen der Einzelnen auf die jeweiligen Beziehungen und zu den interaktionellen Motiven.
Milde-Fehler (leniency bias)	Eine Antworttendenz; ein Mildefehler wird darin sichtbar, dass eine beobachtende Person insgesamt positivere Urteile abgibt als andere.
Minderungskorrektur (correction for attenuation)	Wenn Messwerte fehlerbehaftet sind, wirkt sich dies mindernd auf die Höhe der Korrelation mit einer anderen Variablen aus. Die doppelte Minderungskorrektur liefert eine Schätzung für die Korrelation der wahren Werte zweier Variablen, wenn deren Reliabilitätskoeffizienten bekannt sind. Damit wird gleichsam die »Minderung« korrigiert, welcher Korrelationskoeffizienten unterliegen, wenn die miteinander korrelierten Messwerte fehlerbehaftet sind. Die einfache Minderungskorrektur liefert eine Schätzung für die Korrelation eines Tests mit einem Kriterium unter der Annahme, dass das Kriterium messfehlerfrei erfasst wird. Damit wird gleichsam die »Minderung« korrigiert, die durch die fehlerbehaftete Messung des Kriteriums entsteht.
MMPI-2: Minnesota-Multiphasic-Personality-Inventory-2 (MMPI-2: Minnesota-Multiphasic-Personality-Inventory-2)	Beim MMPI-2 (Hathaway et al., 2000) handelt es sich um einen mehrdimensionalen Persönlichkeitsfragebogen für den klinischen Bereich. Es dient hauptsächlich dazu, Probandinnen und Probanden hinsichtlich verschiedener psychiatrischer Kategorien zu beurteilen oder ggf. auch festzustellen, dass sie zur unauffälligen »Normalpopulation« gehören.
Moderatorvariable (moderator variable)	Wenn die Korrelation einer Variablen (z.B. Berufserfolg) mit einer zweiten Variablen (z.B. Abiturnote) von einer dritten Variablen (z.B. dem sozioökonomischen Status der Testpersonen) abhängt, nennt man die dritte »Moderatorvariable«. Bei Tests kommt es vor, dass die Höhe dessen Validität von einer Drittvariablen abhängt.
Multimethodales Vorgehen (multi-method approach)	Multimethodales Vorgehen bedeutet, dass ein Merkmal mit verschiedenen Arten von Verfahren (z. B. Leistungstest, diagnostisches Interview) erfasst wird.
Multimodales Einstellungsinterview (Multimodal job interview)	Beim Multimodalen Einstellungsinterview (Schuler, (1992) handelt es ich um ein Konzept zur Gestaltung von Einstellungsgesprächen. Das Attribut »multimodal« weist darauf hin, dass in dem Interview unterschiedliche Methoden benutzt werden (z. B. situative und biografiebezogene Fragen) um ein bestimmtes Merkmal zu messen.
multiple cutoff (multiple cutoff)	siehe Und-Strategie
Multiple-Choice-Aufgaben (multiple-choice items)	Für eine Frage stehen mehrere Antwortmöglichkeiten zur Verfügung. Die Testperson soll die richtige(n) Antworten auswählen und anzukreuzen. Dieser Aufgabentyp findet bei Leistungstests sehr oft Verwendung.
Multitrait-Multimethod-Analyse (multitrait-multimethod analysis)	Jede Eigenschaft (z. B. Depressivität, Ängstlichkeit, Neurotizismus) wird mit unterschiedlichen Methoden (z. B. Fragebogen, Fremdbeurteilung, Verhaltensbeobachtung) erfasst. Die resultierende Korrelationsmatrix ist die Multitrait-Multimethod-Matrix. Die Korrelationen geben Aufschluss über die diskriminante und die konvergente Validität. So kann man etwa feststellen, inwieweit ein Validitätskoeffizient auf einen Methodeneffekt (Verwendung der gleichen Art von Verfahren) zurückzuführen ist.
Negativer Prädiktionswert (negative predictive value)	Der negative Prädiktionswert bezeichnet die Wahrscheinlichkeit, mit der eine negative Diagnose zutreffend ist. Sie beschreibt den Anteil der korrekten Zurückweisungen an allen laut Test negativ diagnostizierten Personen.
Neglect (hemispatial neglect)	Patienten mit dieser neurologischen Störung erkennen Reize, die auf einer Seite des Wahrnehmungsfeldes dargeboten werden, nicht. Sie reagieren nicht auf entsprechende Reize und stoßen beispielsweise mit der Schulter der »vernachlässigten« Seite am Türrahmen an.
NEO-PI-R: NEO-Persönlichkeitsinventar nach Costa und McCrae – Revidierte Fassung (The Revised NEO Personality Inventory)	Das NEO-PI-R (Ostendorf & Angleiter, 2004) ist ein Persönlichkeitstest, der dem Big-Five-Modell verpflichtet ist. Zu jeder der großen Dimensionen Neurotizismus, Extraversion, Offenheit für Erfahrung, Verträglichkeit und Gewissenhaftigkeit liegen zusätzlich sechs Subskalen (Facetten) vor.
Neuropsychologische Diagnostik (neuropsychological assessment)	Die neuropsychologische Diagnostik befasst sich mit Störungen, die auf (angeborene oder erworbene) Defekte im Zentralnervensystem zurückzuführen sind. »Ziel der neuropsychologischen Diagnostik ist die Erfassung und Objektivierung von kognitiven und affektiven Funktionsstörungen nach einer Hirnfunktionsstörung oder Hirnschädigung und ggf. der emotionalen Reaktionen des Patienten auf diese Störungen« (Gesellschaft für Neuropsychologie et al., 2005, S. 185).
nichtteilnehmende Verhaltensbeobachtung (non-participant behavioral observation)	Die Beobachterin oder der Beobachter ist in der Beobachtungssituation anwesend, verhält sich jedoch passiv, beteiligt sich nicht am Geschehen.
Powertests (power tests)	Powertests sind Leistungstests, die (weitgehend) ohne Zeitdruck zu bearbeiten sind. Die Items sind in der Regel nach ihrer Schwierigkeit gereiht; die Aufgaben werden gegen Ende immer schwerer lösbar. Selbst bei unbegrenzter Zeitvorgabe würde keine Testperson alle Aufgaben lösen.
nomologisches Netzwerk (nomological network)	Cronbach und Meehl (1955) haben argumentiert, dass Konstrukte (z. B. Gewissenhaftigkeit, Narzissmus, Intelligenz) in ein nomologisches Netzwerk eingeordnet werden sollen. Unter einem nomologischen Netzwerk werden Aussagen oder Gesetze verstanden, die die Beziehung zwischen Konstrukten, aber auch zwischen Konstrukten und Beobachtbarem beschreiben. Wird ein neuer Test entwickelt, muss festgelegt werden, welches Konstrukt er erfassen soll und welches nicht und mit welchen es Überlappungen geben kann.
Nomothetische Prognose (nomothetic approach)	Bei der Begutachtung können statistische Erkenntnisse über viele vergleichbare Fällen, »Gesetzmäßigkeiten«, genutzt werden. Beispielsweise kann eine Rückfallprognose damit begründet werden, dass Straftäter mit ähnlicher Vorgeschichte, gleichem Geschlecht und etwa gleichem Alter häufig rückfällig werden.
Normierung (standardization)	Die Normierung eines Tests liefert ein Bezugssystem, um die individuellen Testwerte einordnen zu können. Dazu wird der Test von einer großen und idealerweise repräsentativen Stichprobe von Testpersonen unter standardisierten Durchführungsbedingungen bearbeitet. Anhand der Ergebnisse werden Normtabellen erstellt, die alters- und geschlechtsspezifisch sein können.
Normwerte (norm-referenced scores)	Die Rohwerte in einem Test (z. B. die Summe richtiger Antworten) werden mit Hilfe von Normtabellen zur Interpretation in Normwerte transformiert. Diese geben bei normalerteilten Rohwerten an, wie viele Standardabweichungen eine Testperson unter oder über dem Mittelwert der Vergleichsgruppe liegt. Es gibt verschiedene Normwerte, die sich darin unterscheiden, welcher Zahlenwert für eine durchschnittliche Ausprägung (Mittelwert der Vergleichsgruppe) steht (bei IQ-Werten 100) und welcher für eine Standardabweichung (bei IQ-Werten 15). Gebräuchliche Normwerte sind Z-Werte (Standardwerte), IQ-, T-, Centil- und Stanine-Werte. Prozentrangwerte (siehe dort) stellen eine besondere Art von Normen dar, denen keine Normalverteilung zugrunde liegen muss.
Objektive Persönlichkeitstests (objective personality tests)	Objektive Persönlichkeitstests sind Tests, die Persönlichkeitsmerkmale aus dem Verhalten von Testpersonen erschließen. Verhalten wird unter standardisierten Testbedingungen »provoziert« und als Testantwort erfasst. Sie werden heute in der Regel computergestützt durchgeführt. Der Test wirkt meist wie ein Leistungstest: Die Testpersonen sollen auf bestimmte Aufgaben reagieren und haben dabei nur einen kleinen Verhaltensspielraum, können also nur zwischen wenigen Optionen wählen. Dadurch werden die Durchführung und die Auswertung standardisiert.
Objektivität (objectivity)	Objektivität bedeutet, dass die Ergebnisse eines diagnostischen Verfahrens unabhängig davon zustande kommen, wer die Untersuchung, die Auswertung und die Interpretation durchführt. Dementsprechend wird auch zwischen Durchführungs- Auswertungs- und Interpretationsobjektivät unterschieden.
Oder-Strategie (Or-strategy)	Bei einer »Oder-Strategie« genügen entsprechend hohe Punktwerte in einem von mehreren Prädiktoren. Eine solche Auswahlstrategie liegt dann nahe, wenn die durch das Kriterium geforderte Leistung entweder auf die eine oder auf die andere Weise erbracht werden kann.
Offenbarungspflicht (duty to warn)	Gesetzliche Regelung (§ 138 StGB), die die Pflicht zur Anzeige bestimmter Straftaten betrifft, die noch nicht ausgeführt wurden.
OLMT: Objektiver Leistungsmotivations Test (Objective Achievement Motivation Test)	Der Objektive Leistungsmotivations Test OLMT (Schmidt-Atzert, 2007) soll die Leistungsmotivation über eine kognitiv wenig anspruchsvolle Aufgabe messen: Durch Drücken von zwei Tasten ist auf dem Bildschirm wiederholt eine »Straße« möglichst schnell abzufahren. Der Test liefert mit vier Hauptkennwerten (z. B. »Anspruchsniveau«, »Motivation durch Konkurrenz«) Informationen zur individuellen Leistungsmotivation.
Operationalisierte Psychodynamische Diagnostik OPD (Operationalized Psychodynamic Diagnostics)	Ziel dieses Ansatzes ist, diagnostische Konzepte der psychodynamischen Theorie und Psychotherapie möglichst reliabel zu erfassen. Über nichtformalisierte oder standardisierte diagnostische Gespräche werden theoretisch relevante Bereiche auf fünf Achsen (z. B. zeitlich überdauernde Konflikte) abgebildet.
Organigramm (organigram)	Mit dem Organigramm können Organisationen und Verbände in ihrer hierarchischen Struktur und den wechselseitigen formellen und informellen Abhängigkeiten von Stellen bzw. Personen grafisch dargestellt werden.
Organisationsdiagnostik (organizational assessment)	Die psychologisch ausgerichtete Organisationsdiagnostik befasst sich mit dem Verhalten und Erleben der Mitglieder in Organisationen. Dazu werden verschiedene genutzt, etwa die Analyse von Dokumenten (z. B. Organigramme), Organisations- und betriebswirtschaftliche Statistiken (z. B. Fluktuation), Befragung von Mitarbeitenden, Beobachtungen am Arbeitsplatz.
Overachiever (overachiever)	Das Konzept beruht auf der Unterscheidung von Begabung (insbes. Intelligenz) und Leistung in der Schule oder auch im Beruf. In der Schule sind Overachiever Schülerinnen und Schüler, die herausragende Leistungen zeigen, die aber in dieser Höhe nicht durch ihre Intelligenz erklärbar sind.
PAI 30: Test zur Praktischen Alltagsintelligenz (PAI 30: Test for the Assessment of Practical Intelligence in Everyday Settings)	Praktische Alltagsintelligenz zeigt sich »in der Auffindung von praktischen Problemlösungen bezogen auf materielle Gegebenheiten im Alltag« (Mariacher & Neubauer, 2005, S. 11). Sie werde in der Regel nicht durch eine bestimmte Ausbildung, sondern durch die Auseinandersetzung mit der eigenen Lebensumwelt erworben. Der PAI-30 umfasst 30 Aufgaben, in denen jeweils ein alltagspraktisches Problem beschrieben und durch eine Skizze oder Foto veranschaulicht wird; die Lösung ist frei zu beschreiben oder durch Ankreuzen einer Antwortalternativen einzutragen.
Papier-und-Bleistift-Test (paper-and-pencil test)	Test, für dessen Bearbeitung man lediglich Papier (z.B. Fragebogen) und ein Schreibutensil (z.B. Bleistift) benötigt
Paralleltest-Reliabilität (parallel-forms reliability)	Methode zur Schätzung der Reliabilität eines Tests, bei der zwei parallele Versionen eines Tests von ein und derselben Gruppe von Personen bearbeitet werden. Wie bei der Retest-Methode wird an zwei Zeitpunkten gemessen und die Reliabilität des Tests ergibt sich aus der Korrelation der beiden Tests. Der zweite Test ist jedoch nicht mit dem ersten identisch, sondern nur inhaltlich äquivalent.
Fragebogen zur Partnerschaftsdiagnostik (FPD) (Partnership Questionnaire)	Der FPD (Hahlweg, 2016) ist ein Fragebogen zur Erfassung von »Streitverhalten«, »Zärtlichkeit« und »Gemeinsamkeit/Kommunikation« in Partnerschaften.
Part-whole-Korrektur (part-whole-correction)	Wenn bei der Berechnung der Trennschärfe (Korrelation Item - Testwert) das Item im Testwert enthalten ist, kommt es partiell zu einer Korrelation des Items mit sich selbst. Die Korrelation des Items mit dem Test wird dadurch künstlich erhöht. Bei der manuellen oder EDV-gestützten Berechnung der Trennschärfe wird der Wert für das Item immer vom Gesamtwert subtrahiert, bevor die Korrelation berechnet wird.
Personenlizenzen (personal licenses)	Im Rahmen der berufsbezogenen Eignungsbeurteilung nach DIN 33430 wurden Personenlizenzen eingeführt, zu deren Erwerb man erfolgreich an einer Prüfung teilnehmen muss. Neben einer umfassenden Lizenz ist es möglich, eine Lizenz »Mitwirkende an Eignungsinterviews« und eine Lizenz »Mitwirkende an Verhaltensbeobachtungen« zu erwerben. Die Lizenzen dienen als Qualifikationsnachweis.
Platzierung (placement)	Platzierung ist eine Variante von diagnostischen Entscheidungen. Alle untersuchten Personen verbleiben dabei im System. Sie werden einer von mehreren zur Auswahl stehenden Bedingungen zugeordnet. Dies kann eine Personalentwicklungsmaßnahme, eine passende Schulklasse oder etwa (in der klinischen Psychologie) eine bestimmte Therapie sein.
Positiver Prädiktionswert (positive predictive value)	Der positive Prädiktionswert bezeichnet die Wahrscheinlichkeit, mit der eine positive Diagnose zutreffend ist. Sie beschreibt den Anteil der Treffer an allen laut Test positiv diagnostizierten Personen.
Power-Tests (power tests)	siehe Niveautests
Primacy- und Recency-Effekt (primacy and recency effect)	Unter Primacy- und Recency-Effekt versteht man, dass sich Beurteilerinnen und Beurteiler übermäßig stark von den Beobachtungen beeinflussen lassen, die sie am Anfang bzw. am Ende der Beobachtungsphase gemacht haben.
Probabilistische Testtheorie (latent trait theory)	siehe Item-Response-Theorie
Problemanalyse (problem analysis)	Die Problemanalyse ist ein Ansatz in der kognitiv-verhaltenstherapeutischen Diagnostik. Dabei sucht man nach funktionalen Zusammenhängen zwischen dem sog. »problematischen Verhalten« einerseits sowie antezedenten und konsequenten Bedingungen und Ereignissen andererseits. Ziel dieser Form der Diagnostik ist in erster Linie, diejenigen Bedingungen festzustellen, die die Aufrechterhaltung der Probleme erklären können.
Projektion (psychological projection)	Der Begriff der Projektion geht auf Freud zurück und meint ursprünglich die Verlegung einer Eigenschaft, die das Ich bedroht und an der eigenen Person nicht wahrgenommen wird, auf eine Person der Außenwelt. In Abwandlung des klassischen Projektionsbegriffs wird für projektive Tests angenommen, dass die Reaktionen auf das Testmaterial durch Projektion eigener Eigenschaften in das mehr oder weniger diffuse Testmaterial zustande kommen.
Prototypenansatz (prototype approach)	Dieser Ansatz dient dazu Items zu finden, die einander ähnlich sind - und zwar ohne statistische Zusammenhangsanalyse. Stattdessen beurteilen Menschen Verhaltensweisen oder Adjektive danach, wie typisch oder charakteristisch sie für ein zu messendes Merkmal sind oder sie benennen für ein Merkmal prototypische Verhaltensweisen bzw. Adjektive.
Prozentränge (percentile rank)	Prozentränge geben den prozentualen Anteil von Personen in der Vergleichsgruppe an, die einen schlechteren oder gleich guten Wert wie eine Testperson erzielt haben. Sie variieren zwischen 0 und 100. Dabei sind keinerlei Annahmen über die Verteilung der Testwerte nötig.
Prozessdiagnostik (process assessment)	Diagnostik mit kontinuierlicher Erfassung des zu verändernden Merkmals während einer Intervention. Sie erlaubt die Anpassung der Intervention an die Veränderungen. Kausale Schlüsse sind allerdings ohne eine kontrollierte experimentelle Untersuchung nicht statthaft. Veränderungen können auch auf Faktoren zurückzuführen sein, die nichts mit der Intervention zu tun haben.
Pseudoparalleltest (pseudo-parallel test)	Damit wird ein Test bezeichnet, der einem anderen bis auf die Reihenfolge der Item exakt gleicht. Damit kann n Gruppentestungen Abschreiben verhindert werden.
Psychische Störungen (mental disorders)	Von einer psychischen Störung spricht man, wenn eine Person bestimmte Symptome wie z. B. Antriebslosigkeit oder Konzentrationsstörungen aufweist. Jede psychische Störung wird durch mehrere Symptome definiert, wobei eine Mindestanzahl erfüllt sein muss. Art und Anzahl der Symptome beruhen auf Konventionen, die z. B. in der »Internationalen Klassifikation psychischer Störungen« (10. Revision ICD -10; Dilling et al. 2010), die auch in Deutschland ab 2022 von der 11. Revision (ICD-11; WHO 2018) abgelöst werden soll. Eine weitere bekannte Klassifikation ist das »Diagnostische und Statistische Manual Psychischer Störungen« (DSM-5, American Psychiatric Association, 2018).
Psychischer und Sozial-Kommunikativer Befund PSKB (Psychological Disorders and Social Coping Report)	Mit dem PSKB (Rudolf, 1993) stufen Therapeutinnen und Therapeuten auf der Basis des anamnestischen Gesprächs einerseits psychische Störungen hinsichtlich ihrer Symptomatik (psychischer Befund) ein, andererseits das Ich-Erleben, die soziale Bewältigung sowie Reaktionen auf belastende Lebensereignisse. Das Verfahren kann auch als Fragebogen eingesetzt werden.
Psychologisches Gutachten (Psychological assessment report)	Ein für diagnostische Zwecke verfasstes psychologisches Gutachten beantwortet eine vorgegebene Fragestellung. Im Gutachten wird der Prozess zur Beantwortung der Fragestellung sowie die eingesetzten Methoden nachvollziehbar dargestellt.
Psychologische Diagnostik (psychological assessment)	Psychologische Diagnostik ist eine Teildisziplin der Psychologie. Sie dient der Beantwortung von Fragestellungen, die sich auf die Beschreibung, Klassifikation, Erklärung oder Vorhersage menschlichen Verhaltens und Erlebens beziehen. Sie schließt die gezielte Erhebung von Informationen über das Verhalten und Erleben eines oder mehrerer Menschen sowie deren relevanter Bedingungen ein. Die erhobenen Informationen werden für die Beantwortung der Fragestellung interpretiert. Das diagnostische Handeln wird von psychologischem Wissen geleitet. Zur Erhebung von Informationen werden Methoden verwendet, die wissenschaftlichen Standards genügen.
Psychologische Fragen (psychological hypotheses)	»Psychologische Fragen« sind ein anderes Wort für Hypothesen in einem Gutachten. Sie werden aus der Fragestellung des Auftraggebers abgeleitet. Sie werden so formuliert, dass sie grundsätzlich durch geeignete diagnostische Verfahren beantwortet werden können.
Psychologischer Test (psychological test)	Ein psychologischer Test ist eine Messmethode, mit der ein psychologisches Merkmal (oder auch mehrere Merkmale) erfasst werden soll(en). Es handelt sich um ein standardisiertes Verfahren, bei der Personen auf standardisierte Reizvorlagen (Aufgaben, Fragen etc.) reagieren. Die Reaktionen (Testantworten) erlauben einen wissenschaftlich begründbaren Rückschluss auf die individuelle Ausprägung eines psychologischen Merkmals (oder auch mehrere Merkmale). Auch wissenschaftlich fundierte Fragebögen erfüllen die Anforderungen an einen Test.
Q-Sort-Technik (Q-sort technique)	Hierbei sortiert der Proband oder die Probandin auf Karten vorgegebene Aussagen danach, wie gut sie auf ihn oder sie zutreffen. Auf die gleiche Weise kann auch das ideale Selbstbild beurteilt werden.
Rasch-Modell (Rasch model)	Als Rasch-Modelle bezeichnet man eine Gruppe von probabilistischen Testmodellen. Diese nehmen an, dass das Antwortverhalten aufgrund einer (latenten) Fähigkeit oder Eigenschaft sowie der Itemschwierigkeit zustande kommt.
Ratekorrektur (correction for guessing)	siehe Zufallskorrektur
Ravens Progressive Matrizen (Raven's Progressive Matrices)	Unter dem Überbegriff »Ravens Progressive Matrizen« lassen sich verschiedene sprachfreie figurale Matrizentests zur Messung der Intelligenz zusammenführen, die sich in ihrer Schwierigkeit und dem vorgesehenen Altersbereich unterscheiden. Ihre Entwicklung geht bis auf das Jahr 1938 zurück. Varianten sind die Standard Progressive Matrices (SPM), die Advanced Progressive Matrices (APM), die Coloured Progressive Matrices (CPM). Raven‘s 2 Progressive Matrices, Clinical Edition (Raven’s 2) für den Altersbereich von 4;0 bis 69;11 Jahren (Pearson Clinical Assessment Deutschland 2019) sind eine Neuentwicklung auf Basis der APM, CPM und SPM.
Reaktivität (reactivity)	Reaktivität ist ein Fehler, der insbesondere bei der Verhaltensbeobachtung eine Rolle spielt. Der Messvorgang selbst wirkt sich auf das Messergebnis aus. Die Tatsache, dass sich die Person beobachtet fühlt, kann dazu führen, dass sich ihr Verhalten ändert.
Realkennzeichen (indicators of testimony credibility)	Darunter versteht man konkrete Anzeichen dafür, dass eine Zeugin oder ein Zeuge ein Ereignis selbst erlebt hat und keine „Erfindungen“ präsentiert. Beispiele sind die Schilderung ausgefallener Einzelheiten und das Eingeständnis von Erinnerungslücken. Die Aussage wird dazu inhaltsanalytisch untersucht. Das Vorliegen vieler Realkennzeichnen in einer Aussage spricht dafür, dass die Person das Ereignis tatsächlich selbst erlebt hat.
Rechtspsychologische Diagnostik (forensic psychological assessment)	Hierbei handelt es sich um einen weiten Anwendungsbereich der Psychologischen Diagnostik. Klassische Aufgaben sind die Erstellung von Gerichtsgutachten zu Fragen der Schuldfähigkeit von Straftäterinnen und Straftätern, der Glaubhaftigkeit von Zeuginnen- bzw. Zeugenaussagen oder etwa des Sorgerechts in Scheidungsverfahren sowie die Untersuchung von Straftätern bzw. Straftäterinnen in Haftanstalten zur Fundierung von Behandlungsmaßnahmen oder zur Erstellung einer Rückfallprognose vor einer möglichen Entlassung.
Regression zur Mitte (regression toward the mean)	Unter der Regression zur Mitte versteht man das Phänomen, dass sich extreme Messwerte bei einer Testwiederholung oder der Messung mit einem ähnlichen Test in Richtung des Durchschnittswertes verschieben. Der Effekt ist umso größer, je extremer der Messwert bei der ersten Messung ist und je niedriger die Retest-Reliabilität bzw. die Korrelation der beiden Tests ist. Eine Erklärung ist, dass sich die Messfehler bei extremen beobachteten Werten asymmetrisch um den wahren Wert verteilen.
Reliabilität (reliability)	Die Reliabilität ist ein wichtiges Gütekriterium von diagnostischen Verfahren. Sie beschreibt die Genauigkeit, mit der ein Test ein Merkmal erfasst, und zwar unabhängig davon, ob hierbei das intendierte Merkmal gemessen wird (das ist eine Frage der Validität). Die wichtigsten Schätzmethoden für die Reliabilität sind die Messwiederholung und die Bestimmung der internen Konsistenz.
Retest-Reliabilität ((test-)retest reliability)	Eine Methode zur Schätzung der Reliabilität ist die Testwiederholung (Retest). Dabei wird ein und derselbe Test ein und derselben Stichprobe von Testpersonen erneut dargeboten. Die Korrelation zwischen zwei Vorgaben gibt das Ausmaß der Retest- oder Testwiederholungsreliabilität an.
ROC-Kurve (ROC curve)	Bei diagnostischen Entscheidungen wie der Selektion von Bewerberinnen und Bewerbern, die für einen Beruf geeignet sind, besteht ein Dilemma: Setzt man den erforderlichen Testwert (Cut-off-Wert) niedrig an, erzielt man viele Treffer, versäumt es aber auch, ungeeignete Personen zurückweisen. Es ergibt sich also ein Trade-off zwischen Sensitivität (hohe Trefferrate) und Spezifität (hohe Rate an korrekten Zurückweisungen) . Ein Hilfsmittel, den optimalen Cut-off-Wert zu finden, ist die sog. ROC-Kurve (von Receiver-Operating Characteristic aus der Signal-Entdeckungs-Theorie). In einer Grafik mit den Achsen Sensitivität und 1- Spezifität werden mögliche Cut-off-Werte abgetragen und zu einer Kurve verbunden. Man findet so den Punkt, an dem beide Kennwerte gleich groß sind. Die Kosten einer Fehlentscheidung bleiben aber unberücksichtigt.
Rorschach-Test (Rorschach (inkblot) test)	Der Rorschach-Test (Rorschach, 1921) ist ein Formdeuteverfahren, bei dem der Testperson nacheinander zehn Klecksbilder vorgelegt werden. Die Frage dazu lautet immer »Was könnte das sein?«. Die Antworten werden protokolliert und anschließend nach verschiedenen Kriterien beurteilt (»signiert«). Daraus können verschiedene Kennwerte berechnet werden. Die Auswertung und Interpretation verlangt eine sehr große durch Training erworbene Expertise.
Schuleingangstests (school readiness test)	Sie sind auch als Schulreifetests bekannt und haben die Aufgabe, zu prüfen, ob ein schulpflichtiges Kind den Anforderungen der Schule gewachsen ist. Sie können schulisch relevante Entwicklungsdefizite aufzeigen, die ggf. vor der Einschulung durch geeignete Trainingsmaßnahmen kompensiert werden.
Schulleistungstest (scholastic performance test)	Schulleistungstests dienen dazu, den Lernstand eines Kindes in einem bestimmten Bereich (insbesondere Rechtschreibung oder Mathematik) durch einen Vergleich mit Kindern der gleichen Klassenstufe festzustellen. Die Testinhalte orientieren sich an den Lehrplänen der Klassen und sind bundesweit normiert.
Schulreifetests (school readiness assessments)	siehe Schuleingangstests
Schultests (scholastic tests)	Schultests sollen Fähigkeiten und Fertigkeiten erfassen, die eine Voraussetzung für das Erbringen schulischer Leistungen darstellen (Schuleingangstests), oder sie erfassen direkt den schulischen Leistungsstand (Schulleistungstest).
Schweigepflicht (professional confidentiality)	Gesetzliche Regelung (§ 203 StGB), die den Schutz von Privatgeheimnissen regelt. Angehörige bestimmter Berufe, dazu zählen auch Berufspsychologen mit staatlich anerkannter wissenschaftlicher Abschlussprüfung, können mit einer Freiheitsstrafe bis zu einem Jahr oder mit Geldstrafe bestraft werden, wenn sie bei Ausübung ihres Berufes ihre Schweigepflicht verletzten.
Screening des Entwicklungsstandes bei Einschulungsuntersuchungen (S-ENS) (Developmental Status Screening during school readiness assessments)	Das S-ENS von Döpfner et al. (2005) soll Hinweise auf mögliche Entwicklungsdefizite in folgenden Bereichen liefern: Körperkoordination, Visuomotorik, Visuelle Wahrnehmung und Informationsverarbeitung, Sprachkompetenz und auditive Informationsverarbeitung und Artikulation.
Selbstbeobachtung (self-monitoring)	Die Beobachtung des eigenen Verhaltens und Erlebens im Alltag (auch »ambulantes« oder »ambulatorisches Assessment« genannt) stellt eine wichtige Ergänzung und teilweise auch Alternative zur Fremdbeobachtung dar. Es gibt auch ausgearbeitete standardisierte Verfahren wie die »Experience Sampling Method (ESM)« oder die »Day Reconstruction Method (DRM)«.
Selektion (selection)	Prozess, der der Auswahl von Personen oder von Bedingungen dient, so dass eine optimale Passung zwischen beiden Elementen entsteht.
Selektionskennwert (selection index)	Der Selektionskennwert korrigiert die Trennschärfen für die Itemstreuung (die sich aus der Itemschwierigkeit herleitet). Er kann zur Auswahl von Items verwendet werden.
Selektive und geteilte Aufmerksamkeit (divided attention)	Die Abgrenzung der geteilten von der selektiven Aufmerksamkeit basiert auf bestimmten Eigenschaften der kritischen Reize: Stammen sie aus zwei unterschiedlichen Reizklassen (z. B. akustische und visuelle Reize), spricht man von geteilter Aufmerksamkeit, ansonsten von selektiver Aufmerksamkeit. Empirisch ist die Unterscheidung zwischen selektiver und geteilter Aufmerksamkeit schwer zu begründen: Meist korrelieren die entsprechenden Tests hoch und laden auf einem Faktor.
Self-Assessment (self-assessment)	Self-Assessment bedeutet, dass sich Menschen selbst testen, etwa um etwas über ihre Eignung für einen Studiengang oder eine Stelle zu erfahren. Dazu werden z. B. Persönlichkeitsfragebögen und Leistungstests von zu Hause aus am Computer bearbeitet. Die Testperson kann dabei anonym bleiben und nur sie erhält eine Rückmeldung über ihre Ergebnisse. Universitäten und Unternehmen wollen damit potenzielle Bewerberinnen und Bewerber bei ihrer Studien- oder Berufswahl unterstützen. Sie hoffen aber auch, dass sich geeignete Personen für eine Bewerbung entscheiden und ungeeignete davon absehen. Das nennt man Selbstselektion (Siehe auch Stichwort »Vorselektion«).
Self-deception (self-deception)	Verzerrung bei Selbstbeschreibungen in Richtung eines sozial erwünschten Bildes. Paulhus (1984) hat dieses »Vor-sich-selbst-gut-dastehen-Wollen« Selbsttäuschung (»self-deception«) genannt. Es ist von dem Motiv, auf andere einen guten Eindruck machen zu wollen (impression management) zu unterscheiden.
Sensitivität (sensitivity)	Wahrscheinlichkeit, mit der ein vorliegender »positiver Zustand« (z. B. geeignet, krank) als solcher erkannt wird. Sie errechnet sich aus der Anzahl der Treffer bezogen auf alle Personen, die wirklich »positiv« (z. B. wirklich geeignet) sind
Simulation (malingering)	Simulation (hier verstanden als Selbstdarstellungstendenz) beschreibt das absichtliche Vortäuschen einer Störung oder Beeinträchtigung. Sie ist von der Dissimulation, dem Verbergen einer Störung oder Beeinträchtigung zu unterscheiden.
Sonderpädagogischer Förderbedarf (special educational needs)	»Sonderpädagogischer Förderbedarf ist bei Kindern und Jugendlichen anzunehmen, die in ihren Bildungs-, Entwicklungs- und Lernmöglichkeiten so beeinträchtigt sind, dass sie im Unterricht der allgemeinen Schule ohne sonderpädagogische Unterstützung nicht hinreichend gefördert werden können« (Kultusministerkonferenz der Länder in der Bundesrepublik Deutschland, 1994, S. 5).
Spearman-Brown-Formel (Spearman-Brown prophecy formula)	Die Reliabilität eines diagnostischen Verfahrens hängt von der Anzahl der Items ab. Mit der Spearman-Brown-Formel lässt sich die Höhe der Reliabilität bei Verlängerung oder Verkürzung des Tests um k Testteile schätzen. Umgekehrt lässt sich auch die erforderliche Testlänge (Itemanzahl) ermitteln, mit der man eine gewünschte Höhe der Reliabilität erreichen wird.
Speed-Tests (speed tests)	siehe Geschwindigkeitstests
Spezifität (specificity)	Wahrscheinlichkeit, mit der ein vorliegender »negativer Zustand« (z. B. nicht geeignet, nicht krank) als solcher erkannt wird. Sie errechnet sich aus der Anzahl der korrekten Zurückweisungen bezogen auf alle Personen, die wirklich »negativ« (z. B. wirklich nicht geeignet) sind.
Split-Half-Reliabilität (split-half reliability)	Methode zur Schätzung der Reliabilität eines Tests. Der Test wird nach der Durchführung in zwei möglichst äquivalente Hälften aufgeteilt, z. B. indem Items mit gerader Nummer eine Hälfte bilden und die mit ungerader Nummer die andere. So erhält man für jede untersuchte Person zwei Testwerte. Beide Testhälften werden korreliert und die Korrelation wird nach der Spearman-Brown-Formel auf die ursprüngliche Testlänge hochgerechnet.
STAI: State-Trait-Angst-Inventar (State-Trait Anxiety Inventory)	Das STAI ist ein international bekannter Fragebogen mit einer Skala zur Messung von Angst als Zustand und einer für Angst als Eigenschaft (Ängstlichkeit). Eine deutsche Version stammt von Laux et al. (1981).
Standardmessfehler (standard error of measurement)	Der Standardmessfehler sE gibt an, wie stark die Fehlerwerte um die »wahren« Werte der Person(en) streuen. Der beobachtete Wert wird dabei als Schätzung des wahren Wertes verwendet. Die Standardabweichung der Messwerte in der Population (bei Standardwerten beträgt sie 10) wird mit der Wurzel aus der Unreliabilität (1 - Reliabilität) multipliziert. Beispiel: Reliabilität = .70, Standardwerte mit s = 10, sE = 10 x Wurzel (1 - .70) = 5.48. Der Standardmessfehler wird zur Schätzung des Konfidenzintervalls verwendet.
Standardschätzfehler (standard error of estimation)	Auch der Standardschätzfehler sET gibt an, sie stark die Fehlerwerte um die »wahren« Werte der Person(en) streuen. Der wahre Wert wird regressionsanalytisch aus den beobachteten Werten geschätzt. Die Standardabweichung der Messwert in der Population (bei Standardwerten beträgt sie 10) wird mit der Wurzel aus der Unreliablität (1 - Reliabilität) x der Reliabilität multipliziert. Beispiel: Reliabilität = .70, Standardwerte mit s = 10, sET = 10 x Wurzel ((1 - .70) x .70) = 4.58.Der Standardmessfehler fällt rechnerisch stets kleiner aus als der Standardschätzfehler. Auch er wird zur Schätzung des Konfidenzintervalls verwendet.
Standardwerte (standard scores)	siehe Normwerte
Stanine-Werte (stanine scores)	siehe Normwerte
Statusdiagnostik (status assessment)	Diagnostik, die sich auf die Beschreibung von momentanen Zuständen (auch Eigenschaften und Verhalten) bezieht.
Störungswissen (knowledge of psychopathology)	Zu den wichtigsten Aufgaben der Klinischen Psychologie gehört zum einen die Forschung über die Entstehung von psychischen Störungen, zum anderen die Überprüfung von Modellen darüber, wie psychische Störungen aufrechterhalten werden, wie sie »funktionieren«. Dieses »Störungswissen« stellt die Voraussetzung für angemessene klinisch-psychologische Interventionen (meist als psychologische Beratung oder Psychotherapie) dar.
Strengefehler (severity bias)	Beim Strengefehler handelt es sich um einen Beurteilungsfehler. Er ist daran zu erkennen, dass eine beurteilende Person im Vergleich zu anderen eine Tendenz zu negativen Urteilen hat.
Strukturelle Analyse Sozialer Beziehungen SASB (Structural Analysis of Social Behavior)	Beim SASB handelt es sich um ein Beobachtungsverfahren für die interpersonale Diagnostik. Damit können drei unterschiedliche Aspekte des interpersonellen Verhaltens und Erlebens erfasst werden: Der Fokus auf andere, der Fokus auf das Selbst und das Umgehen mit sich selbst (Introjekt).
Strukturiertes Klinisches Interview für DSM-5-Störungen - klinische Version (SKID-5-CV) (Structured Clinical Interview for DSM-V)	Das SKID-5-CV (Beesdo-Baum et al., 2019) dient der Diagnostik psychischer Störungen nach dem Klassifikationssystem DSM-5.
Suggestivfrage (leading question)	Frage, die so formuliert wird, dass sie der befragten Person eine bestimmte Antwort nahelegt.
SVF: Stressverarbeitungsfragebogen (Stress Coping Inventory)	Der SVF (Erdmann & Janke, 2008) soll erfassen, wie Menschen in Stresssituationen reagieren und wie sie Stress bewältigen. Dabei wird zwischen verschiedenen positiven, stressreduzierenden und negativen, stressvermehrenden Strategien unterschieden.
systematische Verhaltensbeobachtung (systematic behavioral observation)	Bei einer systematischen Verhaltensbeobachtung wird der beobachtenden Person genau vorgegeben, worauf sie zu achten und wie sie das Beobachtete zu protokollieren hat. Es wird keine vollständige Beschreibung des Verhaltens einer Person angestrebt, sondern es soll immer nur ein bestimmter Teilaspekt des Verhaltens beobachtet werden, beispielsweise Dominanzverhalten. Dazu sind Vorarbeiten erforderlich: Meist erstellt man eine Liste mit relevanten Verhaltensweisen, und in der Beobachtungsphase wird beispielsweise beim Auftreten einer dieser Verhaltensweisen ein Strich in der Liste gemacht. Das zu erfassende Verhalten kann so quantifiziert werden.
TAT: Thematischer Apperzeptionstest (Thematic Apperception Test)	Der TAT (Murray, 1991) wurde erstmals 1943 publiziert und basiert auf der Persönlichkeitstheorie Murrays. Er dient dazu, vorherrschende Triebe, Gefühle, Gesinnungen, Komplexe und Konflikte der untersuchten Person zu erkennen. Der TAT besteht aus 31 Bildtafeln, die grundlegende menschliche Problemsituationen ansprechen; eine Tafel ist völlig weiß. Die Testperson wird aufgefordert, zu jedem Bild eine möglichst dramatische Geschichte zu erzählen. Die Antworten werden nach einer nicht hinreichend standardisierten Prozedur inhaltsanalytisch ausgewertet.
Tätigkeitsbewertungssystem (TBS) (Activity Evaluation System)	Das TBS (Hacker et al., 1995) wird vor allem zur Arbeitsgestaltung eingesetzt. Es erfasst fünf Merkmalsbereiche (z. B. erforderliche geistige, kognitive, Leistungen). Es und ist für verschiedene Bereiche wie Produktion oder Büro und Verwaltung geeignet.
Tau-Äquivalenz (tau equivalence)	Items einer Skala sowie parallele Tests sollen das gleiche latente Merkmal messen. Dabei werden fünf Formen der Äquivalenz von Messungen unterschieden, die unterschiedlich »strenge« Annahmen machen. Tau-Äquivalenz meint: Die wahren Werte der Messungen sind exakt gleich, der Einfluss der Messfehler auf die Messungen ist nicht gleich.
Teamklima-Inventar (TKI) (team climate)	Zur Beschreibung des Klimas in Teams bzw. Organisationen wurden spezielle Fragebögen konstruiert. Ein Beispiel ist Teamklima-Inventar (TKI) in der deutschen Version von Brodbeck et al., 2000), das das Klima für Innovation und Leistung in Arbeitsgruppen erfassen soll. Das TKI enthält 44 Items, die sich auf das Klima für Innovation und Leistung in Arbeitsgruppen beziehen. Dem Fragebogen liegt eine 4-Faktoren-Theorie mit den Dimensionen »Vision«, »Aufgabenorientierung«, »Partizipative Sicherheit« und »Unterstützung für Innovation« zugrunde. Den vier Faktoren sind insgesamt 13 Skalen untergeordnet.
Teilleistungsstörungen (specific developmental disorders of scholastic skills)	Unter Teilleistungsstörungen versteht man Leistungsdefizite, die anders als eine Lernstörung oder Lernbehinderung auf einen bestimmten Bereich schulischer Fertigkeiten beschränkt sind. Es können die Fertigkeiten zum Lesen, Schreiben und Rechnen betroffen sein. Nach ICD-10-GM werden Teilleistungsstörungen als »umschriebene Entwicklungsstörungen schulischer Fertigkeiten« eingeordnet.
teilnehmende Verhaltensbeobachtung (participant behavioral observation)	Bei dieser Variante der Verhaltensbeobachtung ist die Beobachterin oder der Beobachter nicht nur in der Beobachtungssituation anwesend, sondern nimmt auch selbst am Geschehen teil. Beispielsweise beobachtet eine Lehrkraft einen Schüler während sie die Klasse unterrichtet.
Tendenz zu Extremurteilen (tendency to make extreme judgments)	Bei einer Tendenz zu Extremurteilen werden bevorzugt hohe und niedrige Ausprägungen angekreuzt. Daraus ergibt sich eine erhöhte Varianz der Urteile.
Terminale versus investigatorische Entscheidungen (terminal and investigative decisions)	Eine investigatorische Entscheidung stellt nur den ersten Schritt in einem mehrstufigen Entscheidungsverfahren dar. Ihr folgt z. B. eine Behandlung und danach eine weitere diagnostische Untersuchung. Bei einer terminalen (endgültigen) Entscheidung wird auf Basis der vorliegenden diagnostischen Informationen eine Maßnahme eingeleitet, ohne dass eine weitere Diagnostik vorgesehen ist und ohne dass die Entscheidung für oder gegen eine Maßnahme revidiert wird.
Test d2-R (Test d2 – Revision): Aufmerksamkeits- und Konzentrationstest (d2 Test of Attention(revision))	Beim Test d2-R (Brickenkamp et al., 2010) handelt es sich um die revidierte Form eines bewährten Aufmerksamkeits- und Konzentrationstests, der schon seit 1962 auf dem Markt ist. Auf dem Testbogen befinden sich 14 Zeilen mit den Buchstaben d und p, die oben und/oder unter mit Strichen versehen sind. Die Testpersonen sollen unter Zeitdruck (20 Sekunden pro Zeile) möglichst jedes d, das 2 Striche hat, (daher der Testname) durchstreichen und dabei möglichst fehlerfrei arbeiten.
Testauswerteprogramm (Scoring software)	Die Auswertungsobjektivität von Papier-und-Bleistift Tests kann durch Verwendung eines Testauswerteprogramms erhöht werden. Die Antworten der Testperson (in der Regel die Nummer der angekreuzten Antwortalternative) werden manuell in den Computer eingegeben. Eventuell kann der Testbogen auch eingescannt werden. Die Software ermittelt die Rohwerte für jede Skala bzw. den Gesamttest sowie die dazugehörigen Normwerte.
Testen (testing)	Unter Testen versteht man Datenerhebung unter Anwendung einer bestimmten Methode, nämlich Tests. In der psychologischen Diagnostik werden in der Regel weitere Methoden wie z.B. das Interview oder Verhaltensbeobachtung einsetzt. Die Ergebnisse werden dann gemeinsam interpretiert. Testen allein ist also noch keine Diagnostik.
Testing on Demand (testing on demand)	Testing on Demand ist eine spezielle Variante von comuterbasierter Diagnostik. Testverlage bieten an, dass manche Tests über das Internet durchgeführt werden können; die Ergebnisse stehen direkt nach der Durchführung zur Verfügung. Die Testsoftware muss also nicht angeschafft werden.
Testleistung (test performance)	In Leistungstests sind meist viele Aufgaben in einer feststehenden Bearbeitungszeit lösen. Das Ergebnis nennen wir Testleistung. Diese kann als Indikator für eine Fähigkeit (z. B. fluide Intelligenz), für eine Fertigkeit (z. B. das Beherrschen der Grundrechenarten) oder für Wissen verstanden werden.
Time sampling (time sampling)	Time sampling ist eine Methode, mit der bei der Verhaltensbeobachtung die Häufigkeit von bestimmten Verhaltensweisen registriert wird. Dazu werden Zeitabschnitte von beispielsweise zehn Sekunden festgelegt. Bei einer vollständigen direkten Registrierung macht die Beobachterin oder der der Beobachter am Ende eines Zeitabschnitts auf ein Signal hin im Protokollbogen einen Strich bei allen aufgelisteten Verhaltensweisen, die in dem Zeitabschnitt aufgetreten sind. Alternativ können auch Registrierphasen zwischen den Beobachtungsphasen eingeschoben werden.
TIPI: Trierer Integriertes Persönlichkeitsinventar (The Trier Integrated Personality Inventory)	Beim TIPI (Becker, 2003) handelt es sich um einen mehrdimensionalen Persönlichkeitsfragebogen mit 34 Primärskalen und 4 daraus abgeleiteten Globalskalen. Es soll sowohl die »normale« als auch die »gestörte« Persönlichkeit beschreiben können.
Transparenz (transparency)	Die Forderung nach Transparenz findet sich u. a. explizit bei psychologischen Gutachten und dem Assessment-Center (AC). Im Gutachten soll der gesamte diagnostische Prozess von der Formulierung von psychologischen Fragen bis zur Beantwortung der Fragestellung transparent und nachvollziehbar dargestellt werden. Im AC sollen die Teilnehmenden vorab über die Übungen und die dabei bewerteten Anforderungsdimensionen informiert werden.
Trennschärfe ((corrected) item-total-correlation)	Die Trennschärfe eines Items ist definiert als die Korrelation des Items mit dem Test oder Testteil, zu dem dieses Item gehört. Sie zeigt an, in welchem Ausmaß das Item das Gleiche misst wie der Test bzw. der Testteil (die Skala). Man kann auch sagen: Die Trennschärfe zeigt an, wie gut das Item zwischen Personen mit hohem vs. niedrigem Testwert »trennt«.
Trimodaler Ansatz (trimodal concept of personnel assessment)	Schuler und Höft (2007) haben mit dem sog. »trimodalen Ansatz« vorgeschlagen, diagnostische Verfahren zur Personalauswahl in biografiebezoge, simulations- und konstruktorientierte Ansätze zu unterteilen. Auf die Biografie bezieht sich etwa die Analyse von Bewerbungsunterlagen, bei der man u. a. früher erworbene berufsrelevante Qualifikationen sucht. Das Verhalten in simulierten beruflichen Situationen kann im Assessment Center oder durch situative Fragen im Interview erhoben werden. Konstruktorientiert geht man vor, wenn man stabile Eigenschaften wie Intelligenz oder bestimmte Persönlichkeitsmerkmale misst, die für die Stelle relevant sind.
True Score (true score)	siehe wahrer Wert
T-Werte (T-values)	siehe Normwerte
Underachiever und Achiever (underachiever and achiever)	Beide Konzept beruhen auf der Unterscheidung von Begabung (insbes. Intelligenz) und Leistung in der Schule oder auch im Beruf. In der Schule sind Underachiever Schülerinnen und Schüler, deren schulische Leistungen hinter den Möglichkeiten zurückbleiben, die sie aufgrund ihrer Intelligenz hätten. Achiever sind Menschen, bei denen die gezeigten Leistungen zu ihren Fähigkeiten passen.
Und-Strategie (multiple-cutoff strategy)	Auswahlstrategie, die Mindestwerte bei mehreren Variablen (Prädiktoren) verlangt. Testpersonen, die zuvor festgelegte Mindestwerte in den Prädiktoren nicht erreichen, werden »abgeschnitten«; deshalb wird auch von einem »Multiple-Cut-off«-Modell gesprochen.
univariate versus multivariate Informationen (single / multiple measures of assessment)	Diagnostische Entscheidungen können auf einem Merkmal (z. B. der Abiturnote) beruhen oder auf mehreren (z. B. Abiturnote und Intelligenz). Man sagt dann, dass die Informationen univariat oder multivariat sind. Oft werden zur Erhöhung der Validität und damit auch der Entscheidungssicherheit mehrere Prädiktoren herangezogen, weil damit verschiedene Facetten des Kriteriums abgedeckt werden können.
Unverfälschbarkeit (test integrity)	Unverfälschbarkeit ist ein Nebengütekriterium von Tests. Sie besagt, wie schwer ein Test zu verfälschen ist. Testpersonen können sowohl ein Interesse an hohen wie auch an niedrigen Testwerten haben. Durch Faking-Studien, in denen eine Gruppe von Testpersonen gebeten wird, sich ehrlich und zwei weitere, sich besonders gut oder besonders schlecht darzustellen, kann man herausfinden, wie anfällig das Instrument für eine absichtliche Verfälschung ist.
Validität (validity)	»Validität bezeichnet das Ausmaß, in dem Evidenz und Theorie die Interpretation von Testwerten rechtfertigen« (AERA et al., 2014). Es kommt also darauf an, wie gut die Testergebnissen mit dem, was der Test messen soll, übereinstimmen. Dabei gibt es viele Möglichkeiten, solche Belege zu erbringen.
Variabilitätsnormen (standardized norms)	Variabilitäts- oder Abweichungsnormen setzen voraus, dass die Messwerte normalverteilt sind und mindestens Intervallskala-Niveau haben. Der Normwert gibt an, wie weit eine Person mit ihrem Testwert unter oder über dem Mittelwert einer Vergleichsgruppe liegt.
Veränderungsfragebogen des Erlebens und Verhaltens VEV (Questionnaire of Changes in Experience and Behavior)	Fragebogen, der im Kontext der Gesprächspsychotherapie entwickelt wurde. Die Klientinnen und Klienten sollen nach Abschluss der Behandlung 42 Aussagen der Art »Ich habe mehr Selbstvertrauen« im Vergleich zum Beginn der Therapie beurteilen.
Veränderungsindex (reliable change index)	Mehrere Autorinnen und Autoren schlagen die Berechnung eines Veränderungsindex (»reliable change index«, RCI) vor, um der Frage nachzugehen, ob sich einzelne (oder in einer Gruppenstudie: wie viele) Patienten nach einer Intervention in dem relevanten Merkmal tatsächlich verbessert haben und - wenn ja - wie groß diese Veränderung ausfällt. In den Index gehen die Differenz der Werte vor und nach der Behandlung und der Standardmessfehler der Differenzen der Referenzstichprobe (dysfunktionale Population) ein.
Veränderungswissen (modification knowledge)	Ziel einer Intervention ist , die vorhandene Störung entweder zu beseitigen oder zumindest zu lindern und die mit der Problematik verbundenen Einschränkungen zu reduzieren. Um dieses Ziel erreichen zu können, ist es notwendig, Kenntnisse darüber zu haben, wie eine Behandlung durchgeführt werden sollte, damit sich mit hoher Wahrscheinlichkeit der gewünschte Erfolg einstellt (»Veränderungswissen«).
verdeckte Verhaltensbeobachtung (covert behavioral observation)	Bei einer verdeckten Verhaltensbeobachtung ist der die Beobachterin oder der Beobachter nicht sichtbar. Verdeckt beobachten kann man auch mit einer Kamera, die fest installiert ist und nur zu bestimmten Zeiten aufzeichnet. Eine verdeckte Beobachtung soll aus ethischen Gründen nur mit Zustimmung der beteiligten Personen durchgeführt werden.
Verhaltensbeobachtung (behavioral observation)	Die Verhaltensbeobachtung dient der Beschreibung oder der Quantifizierung des Verhaltens einer oder mehrerer Personen. Sie wird in der diagnostischen Praxis sehr oft eingesetzt – und sei es nur, um das Verhalten einer Person bei der Durchführung eines Tests oder während eines diagnostischen Interviews zu beschreiben. Sie kann explorativ oder zur Überprüfung von Hypothesen eingesetzt werden.
Verhaltensbeobachtung im Feld (field observation of behavior)	Eine Verhaltensbeobachtung im Feld, beispielsweise die Beobachtung eines Kindes beim Spiel mit der Mutter, hat den Vorteil, dass auch die Kontextbedingungen mit erfasst werden, die für das interessierende Verhalten mit verantwortlich sind.
Verhaltensbeurteilung (behavioral judgment)	Bei der Verhaltensbeurteilung werden anders als bei der Verhaltensbeobachtung keine konkreten Verhaltensweisen registriert. Die beobachtende Person beobachtet Verhalten und schließt daraus direkt auf eine oder mehrere Eigenschaften der Person. Sie beurteilt deren Ausprägung während des Beobachtungszeitraums mit Hilfe von Ratingskalen. Die beurteilende Person braucht ihr Urteil in der Regel nicht einmal zu begründen.
Verhaltensgleichung (behavioral equation)	In einer Verhaltensgleichung (Westhoff und Kluck, 2008) wird Verhalten auf bestimmte Bedingungen zurückgeführt. Die Formel V = f (U, O, K, E, M, S) besagt, dass Verhalten eine Funktion ist von Umgebungsvariablen (U) wie etwa der Wohnsituation, Organismusvariablen (O) wie z. B. Krankheiten, kognitiven Variablen (K), z. B. Intelligenz, emotionalen Variablen (E), z. B. Ängste, motivationalen Variablen (M), z. B. Bedürfnis nach Zuwendung und sozialen Variablen (S), z. B. soziale Normen, sowie deren Wechselwirkungen ist. Die Gleichung hilft besonders bei einer Begutachtung, geeignete Hypothesen zur Beantwortung einer Fragestellung zu finden.
Verlaufsdiagnostik (process assessment)	siehe Prozessdiagnostik
Vertrauensintervall (confidence interval)	siehe Konfidenzintervall
Verwechslungsfehler (error of commission)	Bei Aufmerksamkeits- und Konzentrationstests spricht man von einem Verwechslungsfehler, wenn ein Distraktor (Item, auf das nicht reagiert werden soll) markiert wird.
Vorauswahl-(Pre-reject-) Strategie (multiple hurdle strategy)	Es handelt sich um eine sequentielle Strategie bei der Selektion von Personen. Wer eine bestimmte oder auch eine von mehreren Mindestanforderungen nicht erfüllt, wird ausgeschlossen und nicht weiter diagnostisch untersucht. Dazu werden relevante und leicht zu erhebende Merkmale (etwa eine geforderte Berufsausbildung) zuerst erhoben. Auch wenig aufwändige Vorauswahlverfahren wie telefonisches Interview oder internetbasierte Tests sind möglich.
Vorentscheidungs-(Pre-accept-) Strategie (pre-accept strategy)	Dabei handelt es sich um eine sequenzielle disjunktive (Oder-)Auswahlstrategie. Im ersten Schritt wird geprüft, ob die Person eine bestimmte Mindestanforderung erfüllt. Beispielsweise werden Bewerberinnen und Bewerber, die im Abitur eine Mindestnote erreichen, in das weitere Auswahlverfahren aufgenommen. Wer dieses Kriterium nicht erfüllt, nimmt an einem Leistungstest teil und verbleibt bei einem guten Ergebnis ebenfalls weiter im Auswahlverfahren.
Wahrer Wert (true score)	Der wahre Wert ist in der Klassischen Testtheorie definiert als der Erwartungswert unendlich häufiger Messungen unter identischen Bedingungen.
WET: Wiener Entwicklungstest (Viennese Development Test (WET))	Der WET (3. Aufl. von Kastner-Koller & Deimann, 2012) soll bei Vorschulkindern im Alter von 3;0–5;11 Jahren den Entwicklungsstand in sechs Funktionsbereichen (Motorik, visuelle Wahrnehmung/Visumotorik, Lernen und Gedächtnis, kognitive Entwicklung, Sprache sowie sozial-emotionale Entwicklung) überprüfen. Die 13 Subtests (z. B. Nachzeichnen, Puppenspiel) verwenden standardisiertes Testmaterial. Zusätzlich wird mit einem Elternfragebogen die Selbstständigkeitsentwicklung des Kindes beurteilt.
Wilde-Intelligenz-Test 2 (WIT-2) (Wilde Intelligence Test 2)	Der WIT-2 (Kersting et al., 2008) dient vorrangig der berufsbezogenen Diagnostik; deshalb sind die Testaufgaben teilweise in eine Semantik aus dem Berufs- und Arbeitsleben eingekleidet. Der WIT-2 repräsentiert fünf der sieben Primärfähigkeiten Thurstones (Verbal Comprehension, Number, Space, Reasoning, Memory). Das schlussfolgernde Denken wird im WIT-2 (anders als bei Thurstone) als eine dem verbalen, rechnerischen und räumlichen Denken übergeordnete Skala konzipiert. Darüber hinaus werden die Dimensionen Arbeitseffizienz und Wissen (Wirtschaft sowie Informationstechnologie) erfasst.
Zentrale Tendenz (central tendency)	Eine zentrale Tendenz in der Verhaltensbeurteilung liegt vor, wenn die Beurteilerinnen und Beurteiler bevorzugt mittlerer Skalenwerte ankreuzen. Daraus resultiert eine eingeschränkte Varianz ihrer Urteile im Vergleich zu anderen Beurteilenden.
Zentrales Beziehungskonfliktthema ZBKT (The Core Conflictual Relationship Theme (CCRT))	Eine formalisierte psychodynamische Diagnostik, die in Form eines standardisierten Interviews subjektiv bedeutsame Beziehungsepisoden erhebt. Ausgewertet werden die Interaktionsmuster der Testpersonen anhand der eigenen Wünsche, der Reaktionen anderer und der darauf folgenden Reaktionen der interviewten Personen(en).
Zustände (states)	Als Zustände (»states«) werden bestimmte Merkmale klassifiziert, die zeitlich wenig stabil und stark situationsabhängig sind. Dies können Emotionen, mentale Zustände oder Erregungszustände sein. Sie werden Eigenschaften unterschieden, die zeitlich relativ stabil sind (»traits«).
Z-Werte (Z-values)	siehe Normwerte

Zurück zur Übersicht

Tags