Diese Website befindet sich gerade im Aufbau!

 

Hier finden Sie die Antworten auf die Übungsfragen aus der 6. Auflage des Buchs Psychologische Diagnostik inklusive pdfs zum Download.

Es liegen noch nicht alle Musterlösungen vor, sodass wir Sie noch um etwas Geduld bitten in Bezug auf die Kapitel 2, 5, 6 und 8.

Zusätzlich werden die Fragen und Antworten zu einem späteren Zeitpunkt wie üblich unter dem Reiter Verständnisfragen auf der Hauptseite des Buchs zur Verfügung gestellt.

 

Inhaltsübersicht

 

Kapitel 1 - Einleitung

Abschnitt 1.1 Definition

Abschnitt 1.2 Anwendungsgebiete und Fragestellungen

Abschnitt 1.3 Verhältnis zu anderen Disziplinen der Psychologie

Abschnitt 1.4 Ziele der Psychologischen Diagnostik

Abschnitt 1.5 Der diagnostische Prozess

Abschnitt 1.6 Meilensteine in der Geschichte der Psychologischen Diagnostik

Abschnitt 1.7 Gesetzliche Rahmenbedingungen und ethische Richtlinien

 

Kapitel 2 - Grundlagen diagnostischer Verfahren

Abschnitt 2.1 Allgemeines zu psychologischen Tests

Abschnitt 2.2 Die Klassische Testtheorie

Abschnitt 2.3 Item-Response-Theorien

Abschnitt 2.4 Konstruktionsprinzipien psychologischer Tests

Abschnitt 2.5 Grundzüge von Itemanalysen

Abschnitt 2.6 Testgütekriterien

 

Kapitel 3 - Diagnostische Verfahren

Abschnitt 3.1 Einleitung

Abschnitt 3.2 Leistungstests

Abschnitt 3.3 Persönlichkeitsfragebögen

Abschnitt 3.4 Objektive Persönlichkeitstests

Abschnitt 3.5 Projektive Verfahren

Abschnitt 3.6 Verhaltensbeobachtung und -beurteilung

Abschnitt 3.7 Diagnostisches Interview

 

Kapitel 4 - Durchführung einer diagnostischen Untersuchung und Gutachtenerstellung

Abschnitt 4.1 Persönliche Voraussetzungen und ethisch verantwortliches Vorgehen bis Abschnitt 4.5 Durchführung und Auswertung diagnostischer Verfahren

Abschnitt 4.6 Das psychologische Gutachten

 

Kapitel 5 - Diagnostische Strategien und Evaluation des Vorgehens

Abschnitt 5.1 Diagnostische Strategien

Abschnitt 5.2 Evaluation des Vorgehens

 

Kapitel 6 - Diagnostik in der Arbeits-, Organisations- und Wirtschaftspsychologie

Abschnitt 6.1 Organisationsdiagnostik

Abschnitt 6.2 Diagnostik von Personenmerkmalen

Abschnitt 6.3 Evaluation der Psychologischen Diagnostik in der Arbeits-, Organisations- und Wirtschaftspsychologie

Abschnitt 6.4 Ein Qualitätsstandard für berufsbezogene Eignungsbeurteilungen die DIN 33430

 

Kapitel 7 - Diagnostik in der Pädagogischen Psychologie

Abschnitt 7.1 Diagnostik zur Schullaufbahnberatung

Abschnitt 7.2 Diagnostik bei Schulschwierigkeiten

Abschnitt 7.3 Hochbegabungsdiagnostik

Abschnitt 7.4 Tests im Bildungsbereich

 

Kapitel 8 - Diagnostik in der Klinischen Psychologie und Pschotherapie

Die Antworten zu Kapitel 8 werden noch zur Verfügung gestellt.

Abschnitt 8.1 Aufgaben der klinisch-psychologischen Diagnostik bis Abschnitt 8.6 Erfolgskontrolle als Teil der Qualitätssicherung

 

Kapitel 9 - Diagnostik in weiteren Anwendungsfeldern

Abschnitt 9.1 Neuropsychologische Diagnostik

Abschnitt 9.2 Rechtspsychologische Diagnostik

Abschnitt 9.3 Verkehrspsychologische Diagnostik

 

 

Kapitel 1 - Einleitung

 

Abschnitt 1.1 Definition

 

Was sind zentrale Elemente der Definition von Psychologischer Diagnostik?

  • Psychologische Diagnostik ist eine Teildisziplin der Psychologie.
  • Sie dient der Beantwortung von Fragestellungen.
    • Diese beziehen sich auf die Beschreibung, Klassifikation, Erklärung oder Vorhersage menschlichen Verhaltens und Erlebens.
  • Sie schließt die gezielte Erhebung von Informationen über
    • das Verhalten und Erleben eines oder mehrerer Menschen
    • sowie deren relevanter Bedingungen ein.
  • Die erhobenen Informationen werden für die Beantwortung der Fragestellung interpretiert.
  • Das diagnostische Handeln wird von psychologischem Wissen geleitet.
  • Zur Erhebung von Informationen werden Methoden verwendet, die wissenschaftlichen Standards genügen.

 

Wie ist Psychologische Diagnostik von Testen, medizinischer Diagnostik und Evaluation abzugrenzen?

  • Der Begriff „Test“ bezieht sich nur auf eine von mehreren möglichen Methoden der Datenerhebung. Im Rahmen von Psychologischer Diagnostik werden auch andere Methoden wie etwa Interviews oder Verhaltensbeobachtungen eingesetzt.

Selbst bei reiner Anwendung von Tests reichen die Aufgaben der Psychologischen Diagnostik weit über das Testen hinaus:

  • Interpretation der im Rahmen des Testens entstandenen Informationen
  • Integration verschiedener Ergebnisse zu einem diagnostischen Urteil.
  • Bei der Medizinischen Diagnostik stehen körperliche Merkmale im Fokus und nicht (oder zumindest seltener) Verhalten und Erleben. Bei z. B. der Diagnostik psychischer Störungen oder des Krankheitsverhaltens (z. B. der Medikamenten-Compliance) wirken psychologische und medizinische Diagnostik zusammen.
  • Evaluation ist die systematische Untersuchung des Nutzens oder Wertes eines Gegenstandes (z. B. Programme, Projekte, Produkte, Maßnahmen, Leistungen, Organisationen, Politik, Technologie oder Forschung). Dabei benötigt man unter Umständen keine psychologisch-diagnostischen Verfahren. Dienen die zu evaluierenden Maßnahmen dazu, psychische Merkmale von Menschen (Beispiel: Depressivität) oder deren Verhalten (Beispiel: Zwangsverhalten) zu verändern, kann Psychologische Diagnostik ein Mittel zum Zweck der Evaluation sein.

 

Abschnitt 1.2 Anwendungsgebiete und Fragestellungen

 

Warum bedarf es vor psychologischen Interventionen einer Psychologischen Diagnostik?

Eine wirksame Behandlung kann nur dann erfolgen, wenn die Art der Erkrankung bekannt ist. In der Medizin gilt das geflügelte Wort: „Vor die Behandlung hat der liebe Gott die Diagnose gestellt“. Das gilt auch für andere Formen der Intervention (z.B. Hochbegabtenförderung).

 

Nennen Sie typische diagnostische Fragestellungen in psychologischen Anwendungsfeldern!

  • Klinische Psychologie: Liegt eine psychische Störung vor und wenn ja, welche?
  • Gesundheitspsychologie: Das gesundheitsbezogene Verhalten (z. B. Ess-, Bewegungs- oder Erholungsverhalten, berufsbezogenes Stresserleben) beurteilen.
  • Pädagogische Psychologie:  Wie sind der Leistungsstand und die Leistungsfähigkeit?
  • Arbeits- und Organisationspsychologie:  Bei der Personalauswahl Eignungsmerkmale prüfen, bei der Personalentwicklung und Laufbahnberatung Potenziale und Defizite erkennen.
  • Forensische Psychologie: Glaubwürdigkeit von Zeugen bzw. deren Aussagen beurteilen, Kriminalprognose vor einer vorzeitigen Entlassung von Strafgefangenen erstellen.
  • Verkehrspsychologie: Beurteilung der Fahreignung.

 

Abschnitt 1.3 Verhältnis zu anderen Disziplinen der Psychologie

 

Wie profitiert Psychologische Diagnostik von Grundlagendisziplinen der Psychologie? Wie profitieren Grundlagendisziplinen der Psychologie von Psychologischer Diagnostik?

Bei der Entwicklung von diagnostischen Verfahren (z. B. Tests) wird die Grundlagenforschung aus anderen Disziplinen genutzt. Beispiele sind Strukturmodellen zur Persönlichkeit und zur Intelligenz aus der Differentiellen Psychologie. Umgekehrt profitieren andere Disziplinen vom Methodeninventar der Psychologischen Diagnostik (z. B. Verwendung von Intelligenztests in der Pädagogischen, Klinischen oder Arbeits- und Organisationspsychologie.)

 

Abschnitt 1.4 Ziele der Psychologischen Diagnostik

 

Welche allgemeinen Ziele verfolgt die Psychologische Diagnostik?

Generell geht es um die Beantwortung konkreter Fragestellungen in der Psychologischen Diagnostik und anderen Teildisziplinen der Psychologie. Dabei wird eine Beschreibung, Klassifikation, Erklärung und/oder Vorhersage von Verhalten angestrebt.

 

Wovon gehen interaktionistische Ansätze zur Erklärung (und Prognose) von Verhalten aus?

Interaktionistischen Ansätze zur Erklärung und Prognose von Verhalten gehen davon aus, dass neben Merkmalen der Person (also vor allem Eigenschaften) und der Situation zusätzlich auch die Interaktion zwischen beidem – also Person und Situation – relevant sind.

 

Abschnitt 1.5 Der diagnostische Prozess

 

Was versteht man unter einem diagnostischen Prozess?

Die Abfolge von Maßnahmen zur Gewinnung diagnostisch relevanter Informationen und deren Integration zur Beantwortung einer Fragestellung. Damit ist der gesamte Entscheidungsprozess von der Formulierung einer Fragestellung bis zu deren Beantwortung gemeint.

 

Welche wesentlichen Teilschritte beinhaltet ein diagnostischer Prozess?

  1. Formulierung der „globalen Fragestellung“
  2. Differenzierung der globalen Fragestellung in dafür infrage kommende Teilfragen (sog. „psychologische Fragen“)
  3. Auswahl der zur Beantwortung der Teilfragen bestmöglichen diagnostischen Instrumente
  4. Durchführung und Auswertung der diagnostischen Instrumente
  5. Integration der Ergebnisse zur Beantwortung der Teilfragen und der globalen Fragestellung

 

Bei welchen Gründen sollte die Beantwortung einer Fragestellung abgelehnt werden?

  • Der Diagnostikerin oder dem Diagnostiker fehlt die nötige Sachkunde, z. B. weil der Auftrag fällt nicht in ihren/seinen Kompetenzbereich fällt.
  • Der Auftrag ist mit dem eigenen Gewissen oder mit gesetzlichen Vorschriften nicht vereinbar (Beispiel: kein Gefälligkeitsgutachten).
  • Die Diagnostikerin oder der Diagnostiker ist nicht neutral und kann den Auftrag daher vermutlich nicht hinreichend ergebnisoffen bearbeiten.
  • Der Erkenntnisgewinn für die auftraggebende Person ist gemessen an der Belastung der Probandin bzw. des Probanden oder den anfallenden Kosten voraussichtlich gering.

 

Abschnitt 1.6 Meilensteine in der Geschichte der Psychologischen Diagnostik

 

Welche Relevanz haben soziale Medien für die Psychologische Diagnostik?

Die in sozialen Medien hinterlassenen „Spuren“ (z. B. „Likes“ auf Facebook) können zusammen mit anderen Daten (z. B. Persönlichkeitsfragebogen) dazu genutzt werden, Algorithmen zu trainieren. Mit den Algorithmen gelingt dann anhand der „Spuren“ meist eine erstaunliche gute Vorhersage persönlicher Merkmale (z. B. von Persönlichkeitseigenschaften, aber auch von sexuellen Präferenzen).

 

Abschnitt 1.7 Gesetzliche Rahmenbedingungen und ethische Richtlinien

 

Welche im Grundgesetz verankerten Werte sind für die Psychologische Diagnostik unmittelbar relevant?

Menschenwürde. Artikel 1 (1): „Die Würde des Menschen ist unantastbar. Sie zu achten und zu schützen ist Verpflichtung aller staatlichen Gewalt.“

Freie Entfaltung der Persönlichkeit. Artikel 2: „(1) Jeder hat das Recht auf die freie Entfaltung seiner Persönlichkeit, soweit er nicht die Rechte anderer verletzt und nicht gegen die verfassungsmäßige Ordnung oder das Sittengesetz verstößt. (2) Jeder hat das Recht auf Leben und körperliche Unversehrtheit. Die Freiheit der Person ist unverletzlich. In diese Rechte darf nur auf Grund eines Gesetzes eingegriffen werden.“

 

Wie ist die Schweigepflicht gesetzlich verankert und welche Details sind im Umgang damit zu beachten?

Strafgesetzbuch, § 203 (Verletzung von Privatgeheimnissen): „(1) Wer unbefugt ein fremdes Geheimnis, namentlich ein zum persönlichen Lebensbereich gehörendes Geheimnis oder ein Betriebs- oder Geschäftsgeheimnis, offenbart, das ihm als Berufspsychologen mit staatlich anerkannter wissenschaftlicher Abschlussprüfung anvertraut worden oder sonst bekannt geworden ist, wird mit Freiheitsstrafe bis zu einem Jahr oder mit Geldstrafe bestraft.“

  • Nicht geschützt sind Geheimnisse, die einem Berufspsychologen im privaten Bereich anvertraut werden. Die Schweigepflicht bezieht sich auf die Ausübung der Berufstätigkeit.
  • „Offenbaren“ bedeutet, dass eine Identifizierung der betroffenen Person möglich ist. Wer also Daten in anonymisierter Form weitergibt, offenbart kein Geheimnis.
  • Die Schweigepflicht gilt auch gegenüber Personen, die selbst der Schweigepflicht unterliegen (Kollegen, Ärzte, Anwälte, etc.).
  • Zulässig ist die Weitergabe persönlicher Informationen, wenn der Betroffene dem zustimmt.
  • Auch Kinder werden durch die Schweigepflicht geschützt. Da diese auch ein Informationsrecht haben, sind im Einzelfall Schweigepflicht und Informationsrecht gegeneinander abzuwägen.
  • Vor Gericht besteht in zivilrechtlichen Prozessen ein Zeugnisverweigerungsrecht. Berufspsychologen haben das Recht, Aussagen über ihnen anvertraute Geheimnisse zu verweigern. In Strafprozessen besteht dieses Schweigerecht nur für Psychologische Psychotherapeuten und Kinder- und Jugendlichenpsychotherapeuten und bei ihnen auch nur bezüglich Informationen, die sie im Rahmen einer Untersuchung oder Heilbehandlung erfahren haben.

 

Was sind zentrale, für die Psychologische Diagnostik relevante Forderungen der Datenschutzgrundverordnung?

Personenbezogenen Daten

  • dürfen nur in einem Maß erhoben werden, wie es der Zweck der Erhebung erfordert.
  • müssen vor unrechtmäßiger Verarbeitung oder Nutzung geschützt werden.
  • dürfen nur mit Einwilligung der betreffenden Person erhoben und gespeichert werden, es sei denn andere wichtige Gründe erfordern die Datenerhebung und -speicherung (z. B. zum Schutz lebenswichtiger Interessen Dritter).
  • dürfen nur nach ausführlicher Information der betreffenden Personen erhoben und gespeichert werden.

Betroffene Personen haben ein

  • Auskunftsrecht (z. B. über Verarbeitungszweck und Dauer der Speicherung),
  • Recht auf Berichtigung, Löschung, Einschränkung der Verarbeitung und ein Widerspruchsrecht.

 

Was versteht man unter der Offenbarungspflicht?

Wer von bestimmten schweren Straftaten (z. B. Hocherrat, Mord, Raub) erfährt, die geplant sind oder gerade ausgeführt werden, kann mit bis zu fünf Jahren Haft bestraft werden, falls er diese nicht rechtzeitig meldet. Dieses Gesetz betrifft übrigens nicht nur Berufspsychologen, sondern ist generell gültig.

Entscheidend bei der Offenbarungspflicht ist, dass die Straftat, von der man erfährt, noch abgewendet werden kann.

 

Nennen Sie aus den Ethischen Richtlinien der Deutschen Gesellschaft für Psychologie e. V. (DGPs) einzelne Forderungen zur Erstellung von Gutachten!

Sorgfaltspflicht: Sachliche und wissenschaftliche Fundiertheit sowie Sorgfalt und Gewissenhaftigkeit.

Transparenz: Für die Adressatin bzw. den Adressaten sind das Gutachten oder der Bericht inhaltlich nachvollziehbar.

Einsichtnahme gewähren: Einsichtnahme durch die Klientin bzw. den Klienten ermöglichen bzw. darauf hinwirken. Wenn keine Einsichtnahme möglich sein sollte, vorab darüber informieren.

Keine Gefälligkeitsgutachten

Keine Gutachten, die ohne eigene Mitwirkung zustande gekommen sind.

 

 

zurück zur Inhaltsübersicht

 

Kapitel 2 - Grundlagen diagnostischer Verfahren

 

Abschnitt 2.1 Allgemeines zu psychologischen Tests

 

Was sind zentrale Elemente der Definition von Psychologischen Tests?

Für einen psychologischen Test gilt: a) Es handelt sich um eine Messmethode, bei der Personen auf standardisierte Reizvorlagen (Aufgaben, Fragen etc.) reagieren. b) Reaktionen werden durch die spezifischen, im Test realisierten Bedingungen hervorgerufen. c) Die Reaktionen erlauben einen wissenschaftlich begründbaren Rückschluss auf die individuelle Ausprägung eines psychologischen Merkmals (oder auch mehrere Merkmale). d) Das Vorgehen ist standardisiert. e) Ziel ist eine quantitative (Ausprägung des Merkmals) und/oder eine qualitative Aussage (Vorhandensein oder Art des Merkmals) über das psychologische Merkmal. (a bis c zitiert nach Heidenreich 1993, S. 389)

 

Was versteht man unter einer Testtheorie?

Testtheorien machen grundlegende Annahmen darüber, wie aufgrund von beobachtetem Verhalten in einem Test auf ein latentes Merkmal geschlossen werden kann. Sie dienen als Grundlage für die Konstruktion und Evaluation von psychologischen Tests.

 

Was versteht man unter reflexiven Messungen?

Bei reflexiven Messungen geht man davon aus, dass Antworten auf Testitems die Ausprägung der Testpersonen in dem zu messenden latenten Merkmal reflektieren. Im Gegensatz dazu gehen formative Messungen davon aus, dass nicht die zugrunde liegende latente Variable auf die Itemantworten „einwirkt“, sondern die Itemantworten bilden die latente Variable.

 

Abschnitt 2.2 Die Klassische Testtheorie

 

Was sind zentrale Annahmen der Klassischen Testtheorie?

Eine zentrale Annahme der Klassischen Testtheorie ist, dass Messungen fehlerbehaftet sind. Sie nimmt an, dass eine einzelne Messung aufgrund von unsystematischen Einflussfaktoren ein höheres oder niedrigeres Ergebnis liefert als aufgrund der tatsächlichen Merkmalsausprägung zu erwarten wäre. Basierend darauf nimmt die Klassische Testtheorie an: Es gibt einen wahren Wert der Merkmalsausprägung einer Person v, definiert als der Erwartungswert unendlich häufiger Messungen unter identischen Bedingungen (Existenzaxiom). Sowie: Der beobachtete Wert einer Person v in einem Testitem i setzt sich zusammen aus dem wahren Wert der Person v und einem zufälligen Messfehler (Verknüpfungsaxiom). Es folgt weiterhin aus der Annahme zufälliger Messfehler, dass diese mit wahren Werten, beobachteten Werten oder Messfehlern aus anderen Messungen unkorreliert sind – sonst wären sie nicht unsystematisch bzw. zufällig.

 

Was versteht man in der Klassischen Testtheorie unter dem „wahren Wert“?

Die Klassische Testtheorie versteht unter dem „wahren Wert“ den Erwartungswert aller Messergebnisse (in einem Test oder von Testwiederholungen).

 

Wie lässt sich (zur Reliabilitätsschätzung) bemessen, wie hoch der Anteil der Varianz der wahren Werte und wie hoch der Anteil der messfehlerbedingten Varianz ist?

Im Kern nutzt man dazu die Korrelation des Tests mit einer (essenziell) parallelen Version des Tests oder die Korrelation zwischen (essenziell) parallelen Testteilen bzw. Testwiederholungen.

 

Was wird an der Klassischen Testtheorie kritisiert?

Es wird kritisiert, dass sich Messfehler nicht, wie in der Klassischen Testtheorie postuliert, immer zufällig um den wahren Wert verteilen. Zudem wird kritisiert, dass die Parameter der Klassischen Testtheorie populations- und stichprobenabhängig sind. Zudem geht man in der Klassischen Testtheorie davon aus, dass sich bei häufiger Wiederholung von Messungen, etwa durch mehrere parallele Items, Messfehler „herausmitteln“. Damit geht man auch davon aus, dass Ergebnisse von einzelnen Messungen aggregiert werden können – etwa zu einem Summen- oder Mittelwert. Dies setzt jedoch mindestens ein Intervallskalenniveau und die Prüfung, ob Summen- und Mittelwerte angemessene Berechnungen des Testwertes sind, voraus. Eine explizite Prüfung dessen bleibt jedoch in der Praxis häufig aus.

 

Abschnitt 2.3 Item-Response-Theorien

 

Nennen Sie verschiedene Item-Response-Modelle und die Antwortformate, für die diese verwendet werden können!

Für dichotome Daten und das Ziel, Merkmale zu quantifizieren, bieten sich dichotome Raschmodelle an. Für dichotome Daten und das Ziel, eine Klassifikation von Personen vorzunehmen, bieten sich latente Klassenanalysen an. Mixed-Rasch-Modelle erlauben eine Kombination aus Quantifikation und Klassifikation. Für ordinale Daten kann das ordinale Rasch-Modell herangezogen werden, um Merkmale zu quantifizieren. Eine Klassifikation auf Basis ordinaler Daten gelingt mit einer Klassenanalyse für ordinale Daten. Nominale Daten können mit Rasch-Modellen bzw. Klassenanalysen für nominale Daten ausgewertet werden.

 

Was versteht man unter einer itemcharakteristischen Kurve?

Unter einer itemcharakteristischen Kurve versteht man den Verlauf der Lösungswahrscheinlichkeit eines Items in Abhängigkeit von der Fähigkeit der Testpersonen.

 

Wie ist die Itemschwierigkeit im einparametrischen dichotomen Rasch-Modell definiert?

Die Itemschwierigkeit ist definiert als der Punkt auf dem Merkmalskontinuum, an dem die Lösungswahrscheinlichkeit p(Xvi = 1) = .50 beträgt.

 

Was versteht man unter spezifischer Objektivität?

Spezifische Objektivität der Vergleiche ist eine Eigenschaft des dichotomen einparametrischen Rasch-Modells. Sie meint, dass zur Ermittlung des Fähigkeitsunterschieds zwischen Personen es egal ist, welche Items herangezogen werden. Spezifische Objektivität der Vergleiche meint auch, dass Vergleiche von Items nicht davon abhängen, welche Personen man dazu heranzieht.

 

Was versteht man unter lokaler stochastischer Unabhängigkeit?

Lokale stochastische Unabhängigkeit beschreibt die Annahme, dass bei konstanter zu messender Eigenschaft bzw. Fähigkeit die Lösungswahrscheinlichkeit eines Items unabhängig von dem Ergebnis bei einem anderen Item sein sollte.

 

Erläutern Sie die Logik des grafischen Modelltests!

Eine einfache Möglichkeit, zu prüfen, ob für einen vorliegenden Test tatsächlich von spezifischer Objektivität der Vergleiche ausgegangen werden kann, bietet der grafische Modelltest. Bei diesem teilt man die Stichprobe in 2 Substichproben (z. B. ältere und jüngere Personen), berechnet die Itemschwierigkeiten getrennt für beide Stichproben und inspiziert dann anhand eines Streudiagramms, ob die getrennt geschätzten Schwierigkeitsparameter der Items konvergieren. Dies sieht man im Streudiagramm daran, dass sich die Schwierigkeiten größtenteils entlang einer Winkelhalbierenden anordnen.

 

Welche Erweiterungen des einparametrischen dichotomen Rasch-Modells gibt es und wodurch unterscheiden diese sich von selbigem?

Im 2PL-Modell wird neben einem Personenfähigkeits- und einem Itemschwierigkeitsparameter auch ein Diskriminationsparameter angenommen. Dadurch verlaufen Item-charakteristische Kurven nicht mehr notwendigerweise parallel, sondern können unterschiedlich steil sein. Die vorteilhaften Eigenschaften des 1PL-Modells der spezifischen Objektivität der Vergleiche sowie des Summenwerts als erschöpfende Statistik treffen auf das 2PL-Modell nicht zu. Das 3PL-Modell enthält zusätzlich einen Rateparameter.

 

Was beschreiben Item- und Testinformationsfunktion?

Die Iteminformationsfunktion beschreibt die Bereiche auf dem Merkmalskontinuum, für die ein bestimmtes Item besonders „informativ“ ist. Aggregiert man die Iteminformationsfunktionen aller Items eines Tests, so erhält man die Testinformationsfunktion. Sie gibt an, für welche Bereich auf dem Merkmalskontinuum ein Test (mit seinen Items) besonders informativ ist.

 

Welche Schwellenabstände impliziert das Ratingskalenmodell?

Das Ratingskalenmodell geht davon aus, dass die Schwellenabstände innerhalb der Items unterschiedlich, aber über die Items hinweg gleich sind.

 

Wozu dient eine Latent-Class-Analyse?

In manchen Fällen besteht das Ziel einer Testung nicht darin, die Merkmalsausprägung von Personen zu quantifizieren, sondern darin, Personen verschiedenen Klassen zuzuordnen. Hierzu kann die Latent-Class-Analyse genutzt werden. Damit können Gruppen identifiziert werden, die sich bezüglich der Antworten auf die applizierten Items unterscheiden. Eine zentrale Annahme ist, dass sich zwischen den Gruppen die Lösungswahrscheinlichkeiten der Items unterscheiden. Innerhalb einer Gruppe erhält jedes Item eine Lösungswahrscheinlichkeit, die für alle Personen der Gruppe gleich ist.

 

Abschnitt 2.4 Konstruktionsprinzipien psychologischer Tests

 

Nennen Sie wichtige Schritte des Testentwicklungsprozesses!

Wichtige Schritte des Testentwicklungsprozesses sind: Festlegung des Ziels eines Messinstruments; Definition des Messgegenstands; Itemgenerierung; Itemanalyse und Analyse des Testentwurfs; Revision des Itempools; erneute Itemanalyse und Analyse des Testentwurfs; Validierung. Ggf. können weitere Schritte (im Anschluss oder zwischendurch) notwendig sein.

 

Nennen und beschreiben Sie grundlegende Methoden der Itemgenerierung!

Geht es um die Messung eines Merkmals, stellt die deduktive Methode (häufig auch als rationale Methode bezeichnet) für viele Testentwicklerinnen und -entwickler die ideale Lösung dar. Man beruft sich auf eine Theorie, die eine gute Beschreibung des Merkmals liefert, und formuliert Items entsprechend der theoretischen Vorgaben. Bei der induktiven Methode der Testentwicklung stützen sich die Personen, die einen Test konstruieren, nicht primär auf eine bestimmte Theorie. Die Strategie besteht vielmehr darin, diejenigen Items zu einem Testentwurf zusammenzufassen, die hoch miteinander korrelieren und damit (sehr wahrscheinlich) gemeinsam ein latentes Merkmal abbilden. Die kriteriumsorientierte Methode kommt zum Einsatz, wenn statt der Position einer Person in Relation zu einer Vergleichsnorm das Erreichen oder Verfehlen eines konkreten Kriteriums ermittelt werden soll. Items werden so formuliert und ausgewählt, dass sie für das Kriterium repräsentativ sind. Ansatzpunkt der externalen Methode der Testentwicklung ist das Vorliegen verschiedener Gegebenheiten in der Realität. Dies können Gruppen von Personen als Teil der sozialen Realität sein. Dazu werden Items ausgewählt, die zwischen Mitgliedern und Nicht-Mitgliedern dieser Gruppen differenzieren oder mit relevanten externen Gegebenheiten korrelieren.

 

Welche Randbedingungen sind bei der Itemformulierung zu beachten?

Als Randbedingungen bei der Itemformulierung sind zu beachten: Zielgruppe (wer soll den Test später bearbeiten?); Anwendungsbereich (welche Verwendungszwecke sind angedacht?); Einsatzbedingungen (unter welchen Randbedingungen wird ein Test eingesetzt? Und von wem?).

 

Was sind die Vor- und Nachteile gängiger Antwortformate?

Völlig freie Antworten sind geeignet, wenn komplexes Denken, originelle Lösungen oder Praxistransfer erfasst werden sollen, ohne dass die Lösung durch vorgegebene Antwortalternativen eingegrenzt oder vorgebahnt wird. Nachteile bestehen in der aufwendigen Auswertung, der meist eingeschränkten Auswertungsobjektivität sowie dem Umstand, dass Antworten ggf. abhängig von mündlicher bzw. schriftlicher Ausdrucksfähigkeit sind. Eingeschränkt freie Antworten sind geeignet, wenn verfügbares Wissen und nicht bloßes Wiedererkennen erfasst werden soll, ebenso für originelle Lösungen. Nachteilig sind die eher aufwendige Auswertung und eine eventuell eingeschränkte Auswertungsobjektivität. Zuordnungsaufgaben (und Sortieraufgaben) sind zur Erfassung von Wissen und Kenntnissen geeignet und dabei objektiv und ökonomisch (mit Schablone, Auswertungsprogramm) auszuwerten. Es wird jedoch nur das Wiedererkennen und nicht der freie Abruf von Gedächtnisinhalten erfasst. Multiple-Choice-Aufgaben (und Forced-Choice-Aufgaben) sind ebenfalls objektiv und ökonomisch auszuwerten. Dabei sind die Nachteile, dass gute Distraktoren oft schwer zu finden sind, dass bei Leistungstests nur das Wiedererkennen und nicht der freie Abruf von Gedächtnisinhalten erfasst wird sowie dass die richtige Lösung in Leistungstests auch durch Raten erreicht werden kann. Beurteilungsaufgaben sind ebenfalls objektiv und ökonomisch auszuwerten und liefern differenziere Informationen als eine dichotome Antwortskala. Dichotome Antwortformate haben den weiteren Nachteil, dass eine Entscheidung (zwischen zwei Antwortalternativen) erzwungen wird.

 

Was versteht man unter einer negativen Itempolung?

Von einer negativen Itempolung spricht man, wenn der negative Pol einer Antwortskala für eine hohe Merkmalsausprägung spricht und umgekehrt. Bspw. würde eine hohe Zustimmung (positiver Pol der Antwortskala) bei Items zur Depressivität wie „Ich bin meist fröhlich“ oder „Ich bin selten gedrückter Stimmung“ für eine geringe Depressivität sprechen.

 

Abschnitt 2.5 Grundzüge von Itemanalysen

 

Wie ist Itemschwierigkeit in der Klassischen Testtheorie definiert?

Die Itemschwierigkeit nach der Klassischen Testtheorie gibt an, wie groß der Anteil der Personen ist, die das Item im Sinne des Merkmals beantwortet haben. Je höher der Anteil der Personen ist, die ein Item im Sinne des Merkmals beantworten, desto leichter ist das Item.

 

Was versteht man unter einer part-whole-korrigierten Trennschärfe?

Die Trennschärfe eines Items ist definiert als die Korrelation des Items mit dem Test oder Testteil, zu dem dieses Item gehört. Von einer part-whole-Korrektur spricht man, wenn bei der Berechnung des Testwertes als Summe aller Antworten das jeweilige Item, für das die Trennschärfe bestimmt werden soll, unberücksichtigt bleibt.

 

Von welchen Faktoren hängt die Trennschärfe ab?

Die Höhe der Trennschärfe hängt von der inhaltlichen Passung des Items, der Verteilungsform von Itemantworten und Testwerten sowie von der Streuung des Items und der Testwerte ab.

 

Was sind Eigenwerte im Rahmen einer Faktorenanalyse und wie kann man an deren Verlauf die Zahl der zu extrahierenden Faktoren ermitteln?

Der Eigenwert eines Faktors beschreibt den Anteil der Varianz aller in die Analyse einbezogener Items, der durch diesen Faktor erklärt wird. Eine Möglichkeit, die Zahl der zu extrahierenden Faktoren zu bestimmen, besteht in der Inspektion des Verlaufs der Eigenwerte über alle denkbaren Faktoren (von nur einem Faktor bis zu so vielen Faktoren, wie Items vorhanden sind). Weist der Verlauf der Eigenwertlinie einen Abfall von einem zum nächsten Faktor auf, bleibt man besser bei der Zahl der Faktoren, die vor dem Abfall der Eigenwerte gegeben war. Optisch stellt sich ein solcher Abfall als Knick im Eigenwerteverlauf dar.

 

Was beschreibt der Q-Index?

Für Itemanalysen nach Probabilistischen Testtheorien stehen verschiedene Itemfitmaße zur Verfügung. Eines dieser Fitmaße, der Q-Index, folgt der Logik, dass Items dann gut zum angenommenen Modell passen, wenn sie von den „richtigen“ Personen gelöst wurden (Rost 2004). Das heißt, schwierige Items sollten vornehmlich von Personen mit hoher Fähigkeitsausprägung gelöst worden sein. Items mittlerer Schwierigkeit sollten vornehmlich von Personen mit mittlerer und hoher Fähigkeitsausprägung gelöst worden sein, seltener von Personen mit niedriger Fähigkeitsausprägung. Der Q-Index prüft daher, wie wahrscheinlich das vorliegende Muster der Antworten (aller Personen bei diesem Item) ist, gegeben die Randsumme des Items.

 

Abschnitt 2.6 Testgütekriterien

 

Nennen Sie die 3 Hauptgütekriterien und wesentliche Nebengütekriterien!

Unter den 3 Hauptgütekriterien versteht man Objektivität, Reliabilität und Validität. Wesentliche Nebengütekriterien sind: Normierung, Skalierung, Ökonomie, Nützlichkeit, Unverfälschbarkeit, Zumutbarkeit/Akzeptanz, Fairness.

 

Welche Formen der Objektivität unterscheidet man?

Man unterscheidet Durchführungs-, Auswertungs- und Interpretationsobjektivität. Durchführungsobjektivität ist dann gegeben, wenn ein Verfahren immer auf die gleiche Weise durchgeführt wird. Auswertungsobjektivität gibt das Ausmaß an, in dem Antworten der Testperson unabhängig von der Person, die den Test auswertet, zu den gleichen Ergebnissen führen. Interpretationsobjektivität ist dann gegeben, wenn klare Aussagen über zulässige Interpretationen sowie Hilfsmittel für die Einordnung von Ergebnissen (z. B. in Form von Normtabellen) vorliegen.

 

Was sind Methoden der Reliabilitätsschätzung und was ist bei deren Anwendung jeweils zu beachten?

Bei der Schätzung über die Retest-Methode wird der gleiche Test derselben Stichprobe 2× dargeboten. Die Korrelation zwischen den Ergebnissen der beiden Messungen wird als Reliabilitätsschätzung interpretiert. Die Retest-Methode setzt voraus, dass man die gleichen Personen zu einem späteren Zeitpunkt erneut untersuchen kann und die dann durchgeführte Messung als mindestens essenziell parallel zur 1. Messung gelten kann. Eine damit verbundene Schwierigkeit der Retest-Methode besteht darin, das Intervall zwischen den beiden Testungen sinnvoll zu wählen. Bei der Schätzung über die Paralleltest-Methode werden (mindestens essenziell) parallele Versionen eines Tests von ein und derselben Gruppe von Personen bearbeitet. Die Reliabilitätsschätzung ergibt sich aus der Korrelation der beiden parallelen Tests. Der wesentliche Nachteil der Paralleltest-Methode besteht darin, dass für die allermeisten Tests keine parallele Version vorliegt. Bei der Schätzung über die Split-Half- bzw. Testhalbierungsmethode wird das Testergebnis auf Basis von 2 äquivalenten (d. h. mindestens essenziell parallelen) Testhälften berechnet. So erhält man für jede Probandin und jeden Probanden 2 Testwerte. Der ganze Test wird von den Testpersonen zunächst normal bearbeitet; die Aufteilung in Hälften erfolgt erst nach Vorliegen der Ergebnisse. Die Korrelation der Werte aus beiden Testhälften wird – nach einer Korrektur – als Schätzung der Reliabilität verwendet. Mithilfe der Spearman-Brown-Formel kann man für diese künstliche Testhalbierung korrigieren und schätzen, wie hoch die Reliabilität des Tests mit der gesamten Itemzahl wäre. Voraussetzung für die Anwendung der Spearman-Brown-Formel ist jedoch, dass es sich bei den Testhälften um mindestens essenziell parallele Versionen handelt. Bei der Schätzung über die interne Konsistenz wird der Anteil der gemeinsamen Varianz an der Gesamtvarianz der jeweils relevanten Items berechnet. Es stehen hierzu verschiedene Formeln zur Verfügung. Häufig wird das sog. Cronbachs Alpha berechnet. Es muss jedoch beachtet werden, dass Alpha nur dann eine angemessene Schätzung der Reliabilität gewährleistet, wenn die Testitems mindestens tau-äquivalente Messungen darstellen (Eid und Schmidt 2014).

 

Welche Formen der Äquivalenz von Messungen gibt es und wodurch unterscheiden sich diese?

Es werden 5 Formen der Äquivalenz von Messungen unterschieden, die unterschiedlich „strenge“ Annahmen machen: Parallele Messungen, essenziell parallele Messungen, tau-äquivalente Messungen, essenziell tau-äquivalente Messungen und tau-kongenerische Messungen.  Die fünf unterschiedlich strengen Annahmen zur Äquivalenz von Messungen setzen allesamt voraus: Die Messungen müssen eindimensional sein, also nur ein Merkmal messen – die Messfehler der beider Messungen sind unkorreliert. Sofern von parallelen Messungen im strengen Sinne ausgegangen werden soll, müssen die wahren Werte identisch und die Messungen gleich reliabel sein (gleicher Messfehlereinfluss; in nachfolgender Tabelle ist zusammengefasst, welche Annahmen von den 5 Formen der Äquivalenz von Messungen gemacht werden). Sind beide Messungen gleich reliabel, aber die wahren Werte von Personen in einer der beiden Messungen lediglich um eine Konstante verschoben, so spricht man von essenziell parallelen Messungen. Die verbleibenden 3 Formen der Äquivalenz verlangen nicht, dass Messungen gleich reliabel sein sollen. Werden dennoch identische wahre Werte gemessen, spricht man von tau-äquivalenten Messungen. Sind die Messungen nicht gleich reliabel, aber die wahren Werte bis auf eine Verschiebung um eine Konstante identisch, spricht man von essenziell tau-äquivalenten Messungen. Sind die wahren Werte nicht identisch, aber durch eine lineare Transformation ineinander überführbar, spricht man von tau-kongenerischen Messungen (vgl. Bühner 2021; Eid und Schmidt 2014).

 

Inwiefern ist McDonalds Omega dem Koeffizient Alpha vorzuziehen?

Es muss beachtet werden, dass Cronbachs Alpha nur dann eine angemessene Schätzung der Reliabilität gewährleistet, wenn die Testitems mindestens tau-äquivalente Messungen darstellen (Eid und Schmidt 2014). Sind Messungen durch Testitems nur tau-kongenerisch, ermöglicht Cronbachs Alpha keine angemessene Schätzung der Reliabilität. Da tau-Äquivalenz der Items selten angenommen werden kann, raten mittlerweile viele Forscherinnen und Forscher von der Nutzung von Cronbachs Alpha ab. In diesen Fällen empfiehlt sich eine Schätzung der Reliabilität anhand von McDonalds Omega (McDonald 1999).

 

Wie kann die Reliabilität einer Messung in der Einzelfalldiagnostik genutzt werden?

Ein wesentlicher Nutzen der Reliabilität einer Messung für die Einzelfalldiagnostik besteht in der Feststellung der Genauigkeit, mit der ein Individualergebnis ermittelt wurde. Man berichtet dazu Konfidenzintervall.

 

Wodurch wird die Breite eines Konfidenzintervalls, das man um einen Testwert legt, beeinflusst?

Die Breite eines Konfidenzintervalls, das man um einen Testwert legt, wird beeinflusst durch: die Reliabilität der Messung, die angenommene Sicherheitswahrscheinlichkeit, die Standardabweichung der Messwerte, die Wahl eines ein- vs. zweiseitigen Konfidenzintervalls sowie die Methode der Berechnung (Äquivalenz vs. Regressionsmethode).

 

Welche Rolle spielt die Reliabilität der Messung beim Vergleich von 2 Testwerten einer Person (etwa vor und nach einer Behandlung)?

Aufgrund des Messfehlers könnten sich die zwei gemessene Werte einer Person zufällig voneinander unterscheiden auch wenn keine tatsächliche Veränderung des Merkmals eingetreten ist. Daher muss man ermitteln, wie groß eine Differenz zwischen 2 Werten (des gleichen Tests, gemessen bei der gleichen Person) sein muss, sodass sie wahrscheinlich nicht alleine durch den Messfehler erklärt werden kann. Dies bezeichnet man als kritische Differenz.

 

Wofür korrigiert eine doppelte Minderungskorrektur?

Die doppelte Minderungskorrektur korrigiert die Korrelation zwischen zwei Messungen um den Messfehleranteil der beiden Messungen. Eine einfache Minderungskorrektur korrigiert diese Korrelation nur um den Messfehleranteil in einer der beiden Messungen.

 

Wie ist Validität definiert?

Validität bezeichnet das Ausmaß, in dem Evidenz und Theorie die Interpretation von Testwerten rechtfertigen (AERA et al. 2014).

 

Anhand welcher Testeigenschaften lassen sich Belege für die Validität von Testwertinterpretationen generieren?

Belege für die Validität von Testwertinterpretationen können generiert werden anhand des Testinhalts, von Antwortprozessen, der Struktur des Tests sowie des Zusammenhangs zu anderen Variablen.

 

Was versteht man unter einem nomologischen Netz?

Unter einem nomologischen Netz versteht man Annahmen über die Beziehung des Zielkonstrukts zu anderen Konstrukten. Sofern die entsprechenden Messungen die angenommenen Konstrukte adäquat abbilden, sollten die beobachteten Testwerte in einem ähnlichen Zusammenhang stehen, wie er für die Konstrukte angenommen wurde. Lassen sich für einen neu entwickelten Test die so abgeleiteten Zusammenhänge nicht zeigen, misst der Test entweder das Konstrukt nicht (oder nur teilweise) oder die angenommenen Zusammenhänge waren theoretisch nicht gut abgeleitet.

 

Wie kann eine Multitrait-Multimethod-Analyse im Rahmen der Testvalidierung genutzt werden?

Eine einfache Möglichkeit, Methodeneffekte im Rahmen der Testvalidierung zu berücksichtigen, bietet der sog. „Multitrait-Multimethod-Ansatz“ (MTMM-Ansatz; Campbell und Fiske 1959). Er sieht vor, dass alle in einer Validierungsstudie berücksichtigten Konstrukte möglichst mit mehreren Methoden erfasst werden. Die daraus resultierenden Korrelationen werden dann nach einer einfachen Systematik sortiert und bewertet: Statt nur nach „konvergent“ und „diskriminant“ zu unterscheiden, werden Korrelationen zusätzlich nach „gleiche Methoden“ und „ungleiche Methoden“ sortiert. Im Rahmen einer Korrelationsmatrix können dann bspw. die entsprechenden Korrelationen systematisch verglichen werden.

 

Was versteht man unter retrograden, konkurrenten und prädiktiven Validitätsbelegen?

Damit wird der Zeitpunkt, zu dem die Validitätsbelege erhoben wurden, bezeichnet. Retrograd bezeichnet den Umstand, dass Validitätsbelege bereits vor der Erhebung des Zielkonstrukts erfasst wurden (bspw. Schulnoten, die bereits lange vor der eigentlichen Testung vorlagen). Konkurrent meint, dass Validitätsbelege parallel zur Messung des Zielkonstrukts erfasst wurden. Prädiktiv meint, dass solche Validitätsbelege zeitlich nach der Messung des Zielkonstrukts erfasst wurden.

 

Wie beeinflusst die Symmetrie/Asymmetrie von 2 Messungen deren Korrelation?

Symmetrie bzw. Asymmetrie beschreibt, dass Prädiktor (z. B. ein neu entwickelter und zu validierender Test) und Kriterium in Bezug auf den Inhalt und das Generalitätsniveau merh oder weniger gut korrespondieren können. In Fällen deutlicher Asymmetrie ist die zu erwartende Korrelation gemindert.

 

Was versteht man unter Variabilitäts- bzw. Abweichungsnormen?

Variabilitäts- oder Abweichungsnormen geben an, wie weit eine Person mit ihrer Testleistung unter oder über dem Mittelwert einer Vergleichsgruppe liegt. Die Abweichung jedes einzelnen Messwertes vom Mittelwert der Normgruppe wird dabei in Einheiten der Streuung der Normgruppe ausgedrückt. Als Vergleichsgruppe kann bspw. eine bevölkerungsrepräsentative Stichprobe dienen.

 

Nennen Sie gängige Normwertskalen sowie deren Mittelwert und Standardabweichung!

Gängige Normwertskalen sind die z-Skala (MW = 0, SD = 1), die IQ-Skala (MW = 100, SD = 15), die Standardwertskala (MW = 100, SD = 10), die T-Wertskala (MW = 50, SD = 10) sowie die Stanine-Skala (MW = 5, SD ≈ 2).

 

Wann kann ein Test als unfair gegenüber einer oder mehreren Personengruppen bewertet werden?

Es existieren verschiedene Auffassungen darüber, wann ein Test als fair oder unfair angesehen werden sollte. Grundsätzlich gilt, dass Personengruppen aufgrund ihrer ethnischen, soziokulturellen oder geschlechtsspezifischen Gruppenzugehörigkeit nicht systematisch benachteiligt werden dürfen. Die amerikanischen Uniform Guidelines for Employee Selection Procedures sprechen von diskriminierenden bzw. unfairen Auswahlverfahren, wenn die Selektionsrate (also der Anteil aller Ausgewählten an allen Bewerberinnen und Bewerbern) in einer Subgruppe unterhalb von 80 % der Gruppe mit der höchsten Selektionsrate liegt.

 

 

zurück zur Inhaltsübersicht

 

 

Kapitel 3 - Diagnostische Verfahren

 

Abschnitt 3.1 Einleitung

 

Welche beiden diagnostische Leistungstests werden einer Befragung von Roth und Herzberg (2008) zufolge in der Praxis am häufigsten eingesetzt?

  • Diagnostisches Interview
  • Verhaltensbeobachtung

 

Nennen Sie Informationsquellen zu standardisierten diagnostischen Verfahren!

Testkompendien, Lehrbücher, Online-Testverzeichnis in der Datenbank PSYNDEXplus Tests, Testmanuale, Testrezensionen, Kataloge und Online-Verzeichnis der Testverlage

 

Abschnitt 3.2 Leistungstests

 

Für was sind die Leistungen in Leistungstests ein Indikator?

Sie sind ein Indikator für eine Fähigkeit (z. B. fluide Intelligenz), für eine Fertigkeit (z. B. das Beherrschen der Grundrechenarten) oder für Wissen.

 

Wie wirken sich Übung und Vorbereitung auf die Testleistung aus?

Übung durch wiederholte Testdurchführung und gezielte Testvorbereitung (Coaching) führen zu erheblichen Leistungsverbesserungen im Test.

 

Was haben Aufmerksamkeit und Konzentrationsfähigkeit gemeinsam, und wie lassen sie sich voneinander abgrenzen?

Aufmerksamkeit und Konzentration können als eine allgemeine Leistungsfähigkeit verstanden werden, die über die Quantität (bewältigte Aufgabenmenge oder benötigte Zeit) und Qualität (Güte bzw. niedrige Fehlerquote) der erbrachten Leistung bestimmt werden.

Aufmerksamkeit ist die Fähigkeit, bestimmte Reize/Ereignisse unter vielen willentlich oder nicht willentlich wirksam zu beachten. Sie bezieht sich damit auf die Wahrnehmung.  Konzentration ist die Fähigkeit, sich über mehr oder weniger lange Zeit einer Tätigkeit effizient zuwenden zu können. Die Leistung ist dabei in Bezug auf die spezifischen (für die Tätigkeit benötigten) Fähigkeiten, Fertigkeiten und/oder Kompetenzen zu relativieren.

 

Welche Aufmerksamkeitsfunktionen werden unterschieden, und was versteht man jeweils darunter?

  • Alertness (einfache Reize schnell beantworten können)
  • Fokussierte oder selektive Aufmerksamkeit (Beachten bestimmter Reize innerhalb einer Reizklasse)
  • Geteilte Aufmerksamkeit (Beachten bestimmter Reize aus zwei verschiedenen Reizklassen)
  • Daueraufmerksamkeit (Fokussierte oder geteilte Aufmerksamkeit über längere Zeit)
  • Alertness (Beachten selten auftretender Reize über längere Zeit)

 

Welche Aufgabentypen kommen bei Konzentrationstests vor? Nennen Sie jeweils ein Testbeispiel!

  • Suchen definierter (Aufmerksamkeits- und Konzentrationstest d2-R) oder wechselnder Zeichen (Zahlen-Verbindungs-Test ZVT)
  • Vergleichen (Differentieller Konzentrationstest für Kinder DKT-K)
  • Rechnen (Konzentrations-Leistungs-Test KLT-R)
  • Sortieren (Konzentrations-Verlaufs-Test KVT)
  • Merken (Konzentrations-Leistungs-Test KLT-R)
  • Transformieren (Zahlen-Symbol-Test)

 

Wie viele Konzentrationsfaktoren wurden bei einer Faktorisierung verschiedener Tests gefunden?

Einer – trotz ganz unterschiedlicher Testaufgaben.

 

Welches Merkmal misst der d2-R?

Aufmerksamkeit und Konzentration („konzentrierte Aufmerksamkeit“)

 

Beschreiben Sie die Aufgabe der Testpersonen bei der Bearbeitung des d2-R! Was sind die Durchführungsbedingungen?

Alle ds durchstreichen, die zwei Striche haben. Der Test wird zeilenweise bearbeitet; für jede der 14 Zeilen stehen 20 Sekunden zur Verfügung.

 

Welche Kennwerte werden beim d2-R bestimmt (dazu liegen auch Normen vor), und wie sind sie definiert?

  • Konzentrationsleistungswert (Anzahl der entdeckten Zielobjekte minus Verwechslungsfehler)
  • Bearbeitete Zielobjekte (Anzahl markierter und übersehener Zielobjekte)
  • Fehlerprozent (Auslassungs- und Verwechslungsfehler, dividiert durch Anzahl bearbeiteter Zielobjekte)

 

Welche beiden Leistungen muss man bei der Bearbeitung des KLT-R (Konzentrations-Leistungs-Test – revidierte Fassung) erbringen?

  • Rechnen
  • Zwischenergebnisse merken

 

Mit welchen 2 Merkmalen (oder Tests) korreliert der KLT-R relativ hoch?

  • Rechenfertigkeit (standardisierter Rechentest)
  • Intelligenz

 

Nach welchen 3 Merkmalen kann man Intelligenztests einteilen?

  • Messintention (z. B. allgemeine Intelligenz messen)
  • Durchführungsbedingungen (z. B. Einzel- oder Gruppentestung)
  • Zielgruppe (z. B. bestimmter Altersbereich)

 

Welche Merkmale (Formen der Intelligenz) erfassen verschiedene Intelligenztests?

  • Allgemeine Intelligenz oder eine Intelligenzkomponente wie etwa Schlussfolgerndes Denken
  • Intelligenzstruktur bzw. mehrere Komponenten
  • sprachfrei/kulturfair (fluide Intelligenz) oder bildungsabhängig (kristallisierte Intelligenz) gemessene Intelligenz

 

Welche Kennwerte liefert die deutsche Version der WISC-V (Wechsler Intelligence Scale for Children) auf den beiden höchsten Ebenen?

  • Gesamt-IQ
  • 5 primäre Indexwerte: AGD = Arbeitsgedächtnis, FS = Fluides Schlussfolgern, SV = Sprachverständnis, VG = Verarbeitungsgeschwindigkeit, VRV = Visuell-Räumliche Verarbeitung

 

Für welchen Alters- und welchen Intelligenzbereich wurde die WISC-V entwickelt?

  • Für Kinder und Jugendliche im Alter von 6 bis 16 Jahren
  • Sehr breiter Intelligenzbereich von IQ 40 bis 160

 

Welche Kritik am Strukturmodell der WISC-V haben Canivez et al. (2018) vorgebracht?

Die Indexwerte (Faktoren) passen in allen Altersgruppen schlecht zu den Daten. Ein Modell mit 4 Faktoren (Sprachverständnis, Arbeitsgedächtnis, Verarbeitungsgeschwindigkeit und wahrnehmungsgebundenes logisches Denken) passt besser zu den Normdaten. Für die sekundären Indexwerte konnten sie keine Belege finden.

 

Welche 2 gut vergleichbare Alternativen zur Intelligenzdiagnostik bei Kindern gibt es zur WISC-V?

  • Kaufman Assessment Battery for Children (K-ABC-II)
  • Adaptives Intelligenz Diagnosticum 2 (AID 3)

 

Aus welchen 2 Modulen besteht der Intelligenz-Struktur-Test 2000-R, und welche Intelligenzkomponenten werden damit gemessen?

  • Grundmodul: Verbale, numerische und figurale Intelligenz, Merkfähigkeit, Reasoning (schlussfolgerndes Denken)
  • Erweiterungsmodul: Wissen

Zusätzlich können durch Auspartialisierung des Wissens bzw. von Reasoning die fluide und die kristallisierte Intelligenz geschätzt werden.

 

Nennen Sie 3 weitere „breite“ Intelligenztests als Alternativen zum I-S-T 2000-R!

  • Leistungsprüfsystem 2 (LPS-2) und Leistungsprüfsystem 50+ (LPS 50+)
  • Wilde-Intelligenz-Test 2 (WIT-2)
  • Berliner Intelligenzstruktur-Test Form 4 (BIS-4) bzw. BIS-HB für Hochbegabung

 

Wie ist der CFT 20-R aufgebaut, und was soll der Test messen?

  • Vier Subtests: Figurenreihen fortsetzen, Figuren klassifizieren, Figurenmatrizen vervollständigen und topologische Schlussfolgerungen.
  • Der Test dient der sprachfreien Messung der fluiden Intelligenz („Grundintelligenz“). Wortschatztest und Zahlenfolgentest sollen zusätzlich die kristallisierte Intelligenz messen.

 

Nach welchen 2 Modellen der kognitiven Fähigkeiten lassen sich sowohl konventionelle Intelligenz- als auch spezielle Fähigkeitstests einordnen?

Nach dem Modell von Carroll und dem Modell nach Cattell, Horn und Carroll (CHC-Modell)

 

Welche Art von Aufgaben verwendet der Test zur Praktischen Alltagsintelligenz (PAI 30), und wie werden die Antworten dort ausgewertet?

Jede Aufgabe besteht aus einem Alltagsproblem (meist technischer Art), das in den meisten Fällen durch ein Foto oder eine Skizze veranschaulicht wird und zu dem der Proband eine Lösung finden soll. Die Antwort wird im Antwortheft entweder durch Ankreuzen einer Antwortalternative oder durch freie, stichwortartige Beschreibung der Lösung eingetragen. Zu den freien Antworten werden im Manual richtige Antworten genannt (manchmal sind mehrere Lösungen richtig) und erklärt. Der Auswerter bewertet die Antwort des Probanden.

 

Beschreiben Sie den Aufbau und die Aufgaben der Griffiths-Entwicklungsskalen (GES) zur Beurteilung der Entwicklung in den ersten beiden Lebensjahren!

Die GES besteht aus 208 Aufgaben zu den Bereichen Motorik, sozialer Kontakt, Hören und Sprechen, Auge-Hand-Koordination und kognitive Entwicklung (jeweils eine Skala). Für die Aufgaben wird zum Teil standardisiertes Testmaterial (z. B. Schachtel mit zwölf Spielsachen) verwendet. Der Testleiter beobachtet, ob das Kind eine bestimmte Leistung erbringt (z. B. reagiert, wenn es gerufen wird).

 

Für welchen Altersbereich ist der Wiener Entwicklungstest (WET) vorgesehen, und welche Merkmale erfasst er?

Für Vorschulkinder (von 3;0 bis 5;11 Jahren). Der Test soll den Entwicklungsstand in sechs Funktionsbereichen (Motorik, visuelle Wahrnehmung/Visumotorik, Lernen und Gedächtnis, kognitive Entwicklung, Sprache, sozial-emotionale Entwicklung) überprüfen.

 

Welche Merkmale sollen die Intelligence and Development Scales – 2 (IDS-2) erfassen?

  • Allgemeine Intelligenz und mit den Intelligenz-Faktoren „Verarbeitung Visuell“ „Langzeitgedächtnis“, „Verarbeitungsgeschwindigkeit“, „Kurzzeitgedächtnis Auditiv“, „Kurzzeitgedächtnis Räumlich-Visuell“, „Denken Abstrakt“, „Denken Verbal“.
  • „Exekutive Funktionen“
  • Allgemeine Entwicklungsfunktionen: „Psychomotorik“, „Sozial-emotionale Kompetenz“, „Schulische Kompetenzen“ und „Arbeitshaltung“

 

Abschnitt 3.3 Persönlichkeitsfragebögen

 

Welche Vor- und Nachteile haben Persönlichkeitsfragebögen?

Vorteile:

  • Durchführung und Auswertung sind leicht zu standardisieren
  • Zugang zu Informationen möglich, die der Beobachtung nicht zugänglich sind
  • Vergleich mit anderen Menschen durch Normen möglich
  • Ökonomisch
  • Robuste Methode, die Fehler verzeiht

Nachteile:

  • Selbsteinsicht nötig
  • Erinnern ist fehleranfällig
  • Retrospektive Aussagen sind nur mentale Repräsentationen von subjektivem Erleben und Verhalten
  • Begriffe wie „häufig“ und „nie“ variieren in ihrer Bedeutung
  • Items verlangen oft komplexe Urteilsprozesse
  • Anfällig für Selbsttäuschung
  • Verfälschbar

 

Wie kann man Täuschung in Persönlichkeitsfragebögen eventuell verhindern und wie kontrollieren (erkennen)?

Verhinderung:

  • In der Instruktion darauf hinweisen, dass man ehrlich antworten soll
  • Forced-choice-Antwortformat
  • (Eine Verkürzung der Antwortzeit ist nicht effektiv)

Erkennen durch Kontrollskalen zu Selbsttäuschung und „impression management“

 

Wie wurden die Items des Minnesota Multiphasic Personality Inventory-2 (MMPI-2) ausgewählt?

Externale Konstruktion: Gruppen von klinisch auffälligen Personen, die von Psychiatern als Schizophrene, Hysteriker, Hypochonder usw. diagnostiziert worden waren, bearbeiteten die Items ebenso wie „unauffällig-normale“ Kontrollpersonen. Items, die eine klinische Gruppe von den Gesunden trennten, wurden zu einer Skala zusammengefasst.

 

Woher stammen die Items des MMPI-2-RF?

Aus dem „alten“ MMPI-2

 

Wie viele Skalen hat das MMPI-2-RF und in welche Kategorien lassen sie sich einteilen (möglichst jeweils auch ein Beispiel nennen)?

51 Skalen:

  • 9 Validitätsskalen (z. B.  Seltenheitsskala)
  • 3 Skalen höherer Ordnung (z.B. Denkstörungen)
  • 9 rekonstruierte klinische Skalen (z. B. Entmutigung)
  • Spezialproblemskalen
  • 5 Somatisch-kognitive Skalen, z. B. Unwohlsein)
  • 9 Internalisierungsskalen (z. B. Suizidgedanken)
  • 4 Externaliserungsskalen (z. B. Jugendliche Verhaltensprobleme)
  • 5 Interpersonale Skalen (z. B. Familiäre Probleme)
  • 2 Interessenskalen (z. B. Ästhetisch-literarisches Interesse)
  • 5 Personality-Psychopathology-Five-Skalen (z. B. Aggressivität)

 

Welche Funktion hat die Skala „Entmutigung“ für die Konstruktion der Skalen des MMPI-2-RF?

Entmutigung ist ein störungsunspezifisches Merkmal, umfasst also Eigenschaften, die bei vielen psychischen Störungen vorkommen. Sie wurde aus den übrigen rekonstruierten klinischen Skalen herausgenommen.

 

Nennen Sie einige Validitätsskalen im MMPI-2-RF!

Einseitige Antwortinkonsistenz (TRIN-r), Seltenheitsskala (F-r), Psychopathologische Seltenheitsskala (Fp-r), Somatische Seltenheitsskala (Fa), Beschwerdenvalidität (FBS-r), Antworttendenzskala (RBS), Ungewöhnliche Tugenden (L-r), Ausgeglichenheitsvalidität (K-r)

 

Nach welchem Prinzip wurden die Skalen des Freiburger Persönlichkeitsinventars (FPI-R) zusammengestellt?

Ausschlaggebend waren Interessen der Autoren an bestimmten Dimensionen des Verhaltens. Dabei spielten theoretische Grundlagen (insbesondere Extraversion und Neurotizismus/Emotionalität), Implikationen für das soziale Zusammenleben (z. B. Aggressivität) und das subjektive Wohlbefinden oder Zurechtkommen mit Anforderungen (z. B. Lebenszufriedenheit, Beanspruchung) eine Rolle.

 

Welche Erkenntnisse ergeben sich aus einer Simultanfaktorisierung mehrerer Testsysteme (neben dem FPI-R u. a. das NEO-Fünf-Faktoren-Inventar, NEO-FFI) für die Skalen des FPI-R?

Die Ergebnisse sprechen für eine große Bandbreite des FPI-R. Vier der fünf Big-Five-Faktoren werden abgedeckt, und zwar Neurotizismus (Lebenszufriedenheit, Erregbarkeit, Beanspruchung und körperliche Beschwerden), Extraversion (niedrige Gehemmtheit), Verträglichkeit (soziale Orientierung und niedrige Aggressivität), Gewissenhaftigkeit (Leistungsorientierung). Offenheit für Erfahrung wird mit dem FPI-R nicht erfasst.

 

Wie ist das NEO-PI-R strukturell aufgebaut?

Das NEO-PI-R besteht aus 5 Hauptskalen zu den 5 globalen Persönlichkeitsdimensionen, die mit je 6 Subskalen (Facetten) abgedeckt werden.

 

Für welche Anwendungen wurde das Bochumer Inventar zur berufsbezogenen Persönlichkeitsbeschreibung (BIP) entwickelt, und welche Art von Merkmalen soll es erfassen?

Das BIP wurde für die berufliche Eignungsdiagnostik (Personalauswahl, Platzierungsentscheidungen, Training, Coaching und Beratung) entwickelt. Es kann in einer Selbst- und einer Fremdbeurteilungsversion eingesetzt werden und soll 14 berufsrelevante Dimensionen der Persönlichkeit erfassen. Die 14 Skalen betreffen die berufliche Orientierung, das Arbeitsverhalten, soziale Kompetenzen und die psychische Konstitution.

 

Welche Gemeinsamkeiten haben Fragebögen zur Zustandsmessung (Befinden) mit denen zur Persönlichkeit, und worin unterscheiden sie sich?

Das Messprinzip (Items zur Selbst- und auch Fremdbeurteilung, wobei eine Skala meist aus mehreren Items besteht) ist das Gleiche. Persönlichkeitsmerkmale gelten als zeitlich stabil und situationsübergreifend wirksame Eigenschaften. Das Befinden wird als Zustand verstanden, der über die Zeit wenig stabil und viel stärker situationsabhängig ist.

 

Wie ist das State-Trait-Angstinventar (STAI) aufgebaut, und was soll es messen?

Das STAI besteht aus zwei Skalen. Die separaten Skalen sollen Angst als Zustand und als Eigenschaft messen.

 

Wie ist die Eigenschaftswörterliste (EWL) aufgebaut, und was soll damit gemessen werden? Nennen Sie auch Skalenbeispiele!

Die EWL ist ein mehrdimensionales Verfahren zur quantitativen Beschreibung des aktuellen Befindens. Sie soll 6 Befindlichkeitsbereiche (z. B. leistungsbezogene Aktivität) mit insgesamt 15 Skalen erfassen. Skalenbeispiele: Aktiviertheit, Konzentriertheit, Müdigkeit, gehobene Stimmung, Ärger, Ängstlichkeit.

 

Für welche Zwecke wurde der EXPLORIX entwickelt, und welche Theorie liegt dem Verfahren zugrunde?

Der EXPLORIX wurde zur Unterstützung bei der Berufswahl und der Laufbahnplanung entwickelt. Theoretischer Hintergrund ist die Berufswahltheorie von John Holland, der zufolge sich sechs berufsbezogene Interessen- bzw. Persönlichkeitstypen (z. B. Realistic, Investigative) unterscheiden lassen.

 

Welche Theorie bzw. welches Modell liegt dem Leistungsmotivationsinventar (LMI) zugrunde? Beschreiben Sie den Aufbau des LMI!

Leistungsmotivation wird als ein breites Konzept verstanden, dessen Merkmale mehr oder weniger zentral versus peripher sind („Zwiebelmodell“). Kernbereich (z. B. Beharrlichkeit, Erfolgshoffnung), „Randfacetten“ (z. B. Selbstständigkeit, Statusorientierung). Peripherie (Merkmale, die mit der Leistungsmotivation zumindest theoretisch verbunden sind). Äußerer Randbereich („Hintergrundmerkmale“, die nur einen Einfluss auf die Leistungsmotivation ausüben).

Das LMI hat 17 Skalen (Beispiele s.o.). Eine Kurzskala liefert nur einen Kennwert der Leistungsmotivation.

 

Abschnitt 3.4 Objektive Persönlichkeitstests

 

Was versteht man unter objektiven Persönlichkeitstests?

Objektive Tests zur Messung der Persönlichkeit und Motivation sind Verfahren, die mit Test-Daten unmittelbar das Verhalten eines Individuums in einer standardisierten Situation erfassen, ohne dass dieses in der Regel selbst beurteilen werden muss.

 

Nennen Sie 3 Beispiele für objektive Persönlichkeitstests!

  • Objektive Testbatterie OA-TB75
  • Arbeitshaltungen
  • Objektiver Leistungsmotivations Test OLMT

 

Warum sind implizite Assoziationstests für die Einzelfalldiagnostik nicht brauchbar?

Es fehlen überzeugende Validitätsbelege und die Verfahren sind bislang nicht normiert.

 

Nennen Sie ein standardisiertes diagnostisches Verfahren, das durch Anwendung von künstlicher Intelligenz Persönlichkeitsmerkmale messen soll und beschreiben Sie dessen Durchführung!

Jobfit von PRECIRE. Die Testpersonen nehmen an einem standardisierten Telefoninterview teil und mithilfe einer speziell dafür entwickelten Software werden daraus anhand sehr vieler Sprachmerkmale (Features) verschiedene Persönlichkeitsmerkmale diagnostiziert.

 

Warum ist bei dem Test, der künstliche Intelligenz zur Diagnostik von Persönlichkeitsmerkmalen verwendet, der Nachweis von inkrementeller Validität gegenüber Fragebögen wichtig?

Bei Jobfit von PRECIRE wurde die Software daran trainiert, die Ergebnisse in Persönlichkeitstests vorherzusagen. Es ist der Nachweis erforderlich, dass die mit Jobfit von PRECIRE aufwendig gemessenen Persönlichkeitsmerkmale z. B. Berufserfolg besser vorhersagen als mit einfach durchzuführenden, ökonomischen Fragebögen. Nur dann ist der höhere Aufwand gerechtfertigt.

 

Abschnitt 3.5 Projektive Verfahren

 

Welche 3 Gemeinsamkeiten weisen projektive Tests mit objektiven Persönlichkeitstests auf?

  • Kein Selbstbericht
  • Verhalten wird in standardisierter Testsituation erfasst
  • Test ist weitgehend undurchschaubar

 

Nennen Sie die 3 Merkmale des klassischen Projektionsbegriffs!

  • Projektion besteht darin, dass man anderen Menschen Eigenschaften, Gefühle, Wünsche unterstellt, die man selbst hat, aber sich nicht eingesteht, weil sie gewöhnlich negativ bewertet werden
  • Projektion ist ein unbewusster Vorgang.
  • Es handelt sich um einen Abwehrmechanismus.

 

Was versteht man in einer verallgemeinerten Version unter Projektion, und welche Konsequenzen ergeben sich daraus für das Testmaterial?

Eigene Interessen, Gewohnheiten, Zustände, Wünsche, etc. wirken sich auf die Wahrnehmung bzw. Interpretation von mehrdeutigem Material (z. B. von Tintenklecksen) aus. Die Annahme, dass es sich um einen unbewussten Vorgang handelt, der zudem der Abwehr dient, ist nicht mehr zwingend erforderlich. Als Testmaterial sind mehrdeutige Reize mit einem spezifischen Aufforderungscharakter geeignet.

 

Nennen Sie Kategorien, in die man projektive Tests unterteilen kann! Nennen Sie jeweils ein Verfahren als Beispiel!

  • Formdeuteverfahren (z. B. Rorschach-Test)
  • Zeichnerische und Gestaltungsverfahren (z. B. Familie in Tieren)
  • Verbal-thematische Verfahren (z. B. TAT)

Alternative Klassifikation (auch richtig):

  • Konstruktion (z. B. TAT)
  • Ergänzen (z. B. Rosenzweig Picture Frustration Test)
  • Anordnung/Selektion (z. B. Szondi-Test)
  • Ausdruck (z. B. Analyse der Handschrift)

 

Wodurch unterscheiden sich semiprojektive von projektiven Tests?

Anstatt Geschichten frei erzählen zu lassen, gibt es eine Auswahl von vorgegeben Antwortmöglichkeiten. Die Auswertung wird dadurch wesentlich vereinfacht, weil feststeht, welche Antwort für welches Motiv steht.

 

Als was wurde der Rorschach-Test ursprünglich entwickelt?

Als wahrnehmungsdiagnostisches Experiment (Verfahren) zur Diagnostik der damals neu definierten Störung „Schizophrenie“

 

Nach welchen 4 Aspekten wird der Rorschach-Test in der klassischen Variante ausgewertet?

  • Erfassungsmodus (Ganz- oder Detaildeutung)
  • Determinanten (Form, Farbe, Bewegung)
  • Inhalt (z. B. Tier, Mensch, Anatomie)
  • Grad der Originalität (z. B. „Vulgärantwort“)

 

Wie gut ist der Rorschach-Test geeignet, psychiatrische Störungen zu erkennen?

Eher schlecht; das MMPI ist einer Metaanalyse zufolge diesbezüglich besser.

 

Wie wird der TAT durchgeführt (Testmaterial, Instruktion)?

Eine Auswahl von schwarz-weißen Bildtafeln, die grundlegende menschliche Problemsituationen ansprechen, wird verwendet. Die Testperson soll zu jedem Bild eine möglichst dramatische Geschichte erzählen. Darin soll enthalten sein, was zu der gezeigten Situation führte, was gerade geschieht, was die Personen fühlen und denken und wie die Geschichte ausgeht.

 

Was soll mit dem TAT gemessen werden?

Motive („needs“) und Zwänge/Einflüsse der Umwelt („presses“)

 

Welche Ergebnisse brachte eine Metaanalyse zur Validität des TAT im Kontext von Leistungsmotivation (Spangler 1992)? Warum sind die Ergebnisse kritisch zu hinterfragen?

  • Sehr niedrige Korrelation mit Fragebögen (r = .09).
  • Höhere Korrelation mit harten Erfolgskriterien als Fragebögen (r = .22 vs. .13).
  • Problematisch: TAT-Kennwert ist der Länge der Geschichten und mit Intelligenz konfundiert. Beide Merkmale wurden in der Metaanalyse nicht kontrolliert.

 

Beschreiben Sie das Multi-Motiv-Gitter (MMG) und beurteilen Sie Befunde zu dessen Validität!

Das MMG soll die Motive Leistung, Affiliation und Macht erfassen. Den Testpersonen werden Bilder (Strichzeichnungen) gezeigt, und sie sollen jeweils ankreuzen, welche der vorgegebenen Aussagen am besten zu dem Bild passen. Die Aussagen passen zum Teil zu einem oder mehreren Motiven, die mit dem Bild angeregt werden sollen. Die zu jedem der Motive passenden Antworten werden gezählt.

Validität: Die Ergebnisse sind weitgehend die gleichen, wenn der Test ohne die Bilder durchgeführt wird (die Anregung eines Motivs ist offenbar nicht nötig). Die MMG-Skalen korrelierten sehr niedrig mit den Skalen von anderen projektiven Tests (PSE, OMT), die ebenfalls das Leistungs-Affiliations- und das Machtmotivmotiv messen sollen.

 

In der Studie von Schüler et al. (2015) bearbeiteten die Testpersonen ein projektives (PSE), 2 semiprojektive (OMT, MMG) Tests und einen Fragebogen (PRF). Welche Ergebnisse fanden Schüler et al. zum Leistungsmotiv und wie interpretieren sie diese?

Die Leistungsmotiv-Kennwerte der (semi-)projektiven Tests mit dem Fragebogen waren sehr niedrig, ebenso die Interkorrelationen der Skalen der (semi-)projektiven Tests. Die Leistungsmotivation korrelierte relativ hoch mit anderen Motiven. Die Ergebnisse wecken starke Zweifel an der Konstruktvalidität der untersuchten (semi-) projektiven Tests.

 

Wie wird der Test „Familie in Tieren“ durchgeführt, und wie ist dessen psychometrische Qualität zu bewerten?

Das Kind soll seine Familie als Tiere malen. Die psychometrische Qualität ist völlig unzulänglich.

 

Abschnitt 3.6 Verhaltensbeobachtung und -beurteilung

 

Worin unterscheiden sich freie und systematische Verhaltensbeobachtung?

  • Freie VB: Beobachtende entscheiden, was ihnen wichtig ist zu beobachten; keine Vorgaben.
  • Systematische VB: Beobachtende erhalten Vorgaben, worauf sie zu achten haben und wie das Beobachtete zu protokollieren ist.

 

Nach welchen 6 Aspekten kann Verhaltensbeobachtung näher charakterisiert werden?

  • Frei oder systematisch (gebunden)
  • Direkt oder indirekt (anhand von Aufzeichnungen)
  • In natürlicher Umgebung („im Feld“) oder in einer Situation, die vom Beobachter geschaffen wurde
  • Verdeckt oder offen
  • Wenn offen, dann teilnehmend oder nicht teilnehmend
  • Selbst- oder Fremdbeobachtung

 

Welche Möglichkeiten der Selbstbeobachtung und der Registrierung von Verhalten und Ereignissen im Alltag kennen Sie? Beschreiben Sie diese Ansätze kurz!

  • Experience (auch Event) Sampling Method (ESM): Auf ein Signal hin protokolliert die Person mittels Protokollheft oder elektronisch (Smartphone), was sie gerade macht oder erlebt. Welche Fragen zu beantworten sind, richtet sich nach dem Untersuchungsziel.
  • Day Reconstruction Method (DRM): Die Person rekonstruiert am Abend den Tagesablauf anhand von Leitfragen. So bekommt sie ein klares und vollständiges Bild des Tagesablaufs. Dann beantwortet sie vorgegebene Fragen zum Tag.
  • Event Reconstruction Method (ERM): Wie DRM, aber nicht auf den ganzen Tag, sondern nur auf bestimmte Ereignisse bezogen.

 

Was ist beim Einsatz einer verdeckten Beobachtung zu beachten?

  • Die Zustimmung der beteiligten Personen(en) soll aus ethischen Gründen vorliegen.
  • Die Verwendung einer Kamera ist nützlich. Die Person gewöhnt sich mit der Zeit an Kamera und verhält sich dann weitgehend natürlich.
  • Die Reaktivität soll damit eingeschränkt werden; sie ist geringer als wenn Beobachtende anwesend sind.

 

Welche Vorteile bieten elektronische Aufzeichnungen (z. B. mittels Smartphone oder Tablet) gegenüber der Verwendung von Verhaltensprotokollen in Papierform?

  • Es wird sichergestellt, dass die Aufzeichnung zum vorgesehenen Zeitpunkt stattfindet.
  • Unzugänglichkeit der vorausgegangenen Antworten
  • Keine nachträglichen Änderungen der Eingaben möglich

 

Was bedeuten Selektion, Segmentierung und Quantifizierung?

  • Selektion: Vieles ist nicht wichtig und wird daher nicht beachtet. Beachtet wird nur ein kleiner Teil im Verhaltensstrom, der relevant erscheint.
  • Segmentierung: Was als relevant entdeckt wird, grenzen wir voneinander ab und benennen es meist nach seiner vermuteten Bedeutung. Beispiele sind Lachen, Weinen, Schimpfen.
  • Quantifizierung: Es werden Aussagen über die Intensität, Dauer oder Häufigkeit von Verhaltensweisen gemacht.

 

Was bedeuten time und event sampling?

  • Time-sampling: Zeitabschnitte von beispielsweise zehn Sekunden werden festgelegt; tritt eine Verhaltensweise in dem Zeitfenster auf, wird dies durch einen Strich in der Liste registriert. Das Verhalten wird durch die Anzahl der Zeitfenster operationalisiert, in denen das Verhalten vorkam. Beobachten und Protokollieren können zeitlich getrennt werden. Es können auch mehrere Verhaltensweisen registriert werden.
  • Event-sampling: Die Dauer des Verhaltens wird exakt gemessen (in der Regel anhand einer Videoaufnahme).

 

Wodurch zeichnet sich ein Kategoriensystem aus?

Verhalten soll vollständig (anstatt über ausgewählte Verhaltensweisen) erfasst werden. Das Verhalten wird dazu in mehrere klar definierte und voneinander abgrenzbare Kategorien unterteilt. Alle relevanten Verhaltensweisen werden dann einer Kategorie zugeordnet.

 

Nennen Sie ein Beispiel für ein Kategoriensystem, und geben Sie an, was damit erfasst werden soll!

Interaktionsprozessanalyse (Bales, 1975), die das Interaktionsverhalten in Kleingruppen mit 12 Kategorien erfassen soll.

 

Worin unterscheidet sich die Verhaltensbeurteilung von der Verhaltensbeobachtung?

Bei der Verhaltensbeurteilung nimmt die beobachtende Person selbst Schlussfolgerungen über die Ausprägung eines Merkmals vor, d. h. sie stuft sie direkt ein. Bei der Verhaltensbeobachtung ist die Beobachtung auf die neutrale Registrierung/Beschreibung von Verhaltensweisen beschränkt. Die Ausprägung der Merkmale wird später (eventuell von anderen) anhand der Beobachtungsprotokolle ermittelt.

 

Beschreiben Sie mithilfe des Brunswik’schen Linsenmodells die Entstehung einer Verhaltensbeurteilung!

Die beobachtete Person („Sender“) sendet willentlich und unwillentlich Hinweisreize aus. Diese nimmt die beobachtende Person wahr. Die objektiv vorhandenen Verhaltensweisen werden dabei subjektiv kodiert und zu einem Urteil über den „Sender“ verarbeitet: Dem „Sender“ werden Eigenschaften oder Zustände zugeschrieben.

 

Mit welchen statistischen Verfahren wird die Übereinstimmung zwischen Beobachtenden und Beurteilenden berechnet?

Anmerkung: im Lehrbuchtext gibt es dazu keine Aussagen. Dafür wird beschrieben, wie der Zusammenhang zwischen menschlichen Urteilen und der Realität („achievement“) formal beschrieben und mit der „Linsengleichung“ berechnet werden kann.

 

Nennen Sie wichtige Fehler, die bei der Verhaltensbeobachtung und -beurteilung auftreten können!

  • Haloeffekt
  • Logischer Fehler
  • Primacy- und Recency-Effekt
  • Beobachterdrift
  • Reaktivität
  • Antworttendenzen (wie z. B. Mildefehler)

 

Abschnitt 3.7 Diagnostisches Interview

 

Was versteht man unter Anamnese und unter Exploration?

  • Anamnese: gesprächsweise Erkundung der Vorgeschichte einer Erkrankung oder Störung
  • Exploration: Erkundung des subjektiven Lebensraums eines Probanden

 

Was bedeutet eine standardisierte Auswertung bei einem diagnostischen Interview?

Die Antworten werden nach festen Regeln verwertet. Meist muss der Interviewer entscheiden, in welche der vorgegebenen Kategorien die Antwort passt. Auch wie die Antworten verrechnet werden, wird vorab festgelegt.

 

Wann bietet sich der Einsatz standardisierter Interviews besonders an?

Wenn sich eine Fragestellung oft wiederholt und wenn die Ergebnisse mit denen anderer Probanden verglichen werden sollen.

 

Was bedeutet Standardisierung konkret beim Strukturierten Klinischen Interview für DSM-5-Störungen – Klinische Version (SKID-5-CV)?

  • Die Fragen sind vorgegeben und werden stets im gleichen Wortlaut vorgetragen.
  • Die Kategorien zur Bewertung einer Antwort sind vorgegeben; davon ist stets nur eine anzukreuzen.
  • Die Verrechnung der Bewertungen ist genau geregelt.

 

Warum ist es problematisch, Kappa-Koeffizienten über .70 für die Übereinstimmung zweier Interviewer/-innen als gute Übereinstimmung zu interpretieren?

Die beiden Interviewer stimmen in einem erheblichen Teil der Fälle nicht überein; ob ein Klient als gesund oder gestört diagnostiziert wird, hängt damit erheblich vom Interviewer ab.

 

Was sind die wesentlichen Merkmale des sog. „multimodalen Einstellungsinterviews“?

Acht Gesprächsabschnitte: Gesprächsbeginn, Selbstvorstellung des Bewerbers, Berufsinteressen und Berufswahl, freies Gespräch, biografiebezogene Fragen, realistische Tätigkeitsinformation, situative Fragen, Gesprächsabschluss.

 

Welches sind die wichtigsten Ergebnisse aus Metaanalysen zur Kriteriumsvalidität von Eignungsinterviews?

  • Standardisierte/strukturierte Interviews haben eine relativ hohe Validität bei der Vorhersage von Ausbildungs- und Berufserfolg.
  • Interviews sind wenig valide zur Vorhersage von Studienerfolg.
  • Interviews mit biografischen Fragen sind valider als solche mit situativen Fragen.

 

Von welchen Faktoren hängt die Beurteilung im Eignungsinterview ab? Welche Rolle spielt die Art des Interviews dabei?

Interviews sind anfällig für Urteilsfehler, die insbesondere durch das Erscheinungsbild und Impression Management hervorgerufen werden. Je unstrukturierter ein Interview ist, desto anfälliger ist es für Urteilsfehler.

 

Welche 3 Phasen unterscheiden Westhoff und Kluck (2008) bei der Grobstruktur eines Interviews?

  • Einleitung
  • Informationserhebung
  • Abschluss

 

Welche Vorteile hat man, wenn man einen Leitfaden ausformuliert?

  • Standardisierung des Interviews
  • Entlastung für Interviewer während des Gesprächs
  • Hilfestellung für die Auswertung

 

Nennen Sie Maßnahmen, um die interviewte Person zum Reden zu motivieren!

  • Sie vorab über Ziele und Fragestellung informieren
  • Angemessene Fragen stellen
  • Aktives Zuhören
  • Gegebenenfalls Antwortalternativen vorgeben
  • Um die interviewte Person dazu zu bewegen, über ihre Gefühle zu sprechen, gegebenenfalls eigene Vermutungen über deren emotionales Befinden äußern

 

Woran kann man erkennen, dass der Klient/die Klientin bei einem Thema oder dem ganzen Interview Widerstand leistet?

  • Verspätetes Erscheinen zum Interview
  • Nonverbale Anzeichen dafür, dass das Thema unangenehm ist (z. B. Gähnen, Erröten, auf die Uhr schauen, Meiden von Blickkontakt, Schweigen
  • Verbales Vermeidungsverhalten wie „Sich nicht erinnern können“, Themenwechsel, unpräzise Angaben, Auslassungen

 

Nennen Sie Strategien zum adäquaten Umgang mit Widerstand!

  • Ursachen erkennen und abstellen
  • Verständnis zeigen
  • Abwarten
  • Fragen umformulieren
  • Gefühle ansprechen
  • Fragen begründen
  • Konfrontation

 

Wie kann man intervenieren, wenn der Klient/die Klientin vom Thema abschweift?

  • Auf die Ausgangsfrage zurückkommen
  • Äußerungen für Überleitung auf die eigentliche Frage nutzen
  • Vermehrt Stellen geschlossener Fragen stellen
  • Paraphrasieren, dabei das Wichtige aufgreifen
  • Nonverbal signalisieren, dass die Äußerungen nicht wichtig sind
  • Mit dem Anfertigen von Notizen aufhören
  • Verstärker (Nicken, „hm“ etc.) aussetzen
  • Nonverbale Verstärker bei angemessenen Antworten

 

 

zurück zur Inhaltsübersicht

 

Kapitel 4 - Durchführung einer diagnostischen Untersuchung und Gutachtenerstellung

 

Abschnitt 4.1 Persönliche Voraussetzungen und ethisch verantwortliches Vorgehen bis Abschnitt 4.5 Durchführung und Auswertung diagnostischer Verfahren

 

 

Nennen Sie die 5 zentralen Schritte des diagnostischen Prozesses!

  • Auftragsannahme und Formulierung der globalen Fragestellung
  • Differenzierung der globalen Fragestellung in dafür infrage kommende Teilfragen (sog. „psychologische Fragen“)
  • Auswahl der zur Beantwortung der Teilfragen bestmöglichen diagnostischen Instrumente
  • Durchführung und Auswertung der diagnostischen Instrumente
  • Integration der Ergebnisse zur Beantwortung der Teilfragen und der globalen Fragestellung

[s. Vorbemerkungen]

 

Nennen Sie 2 zentrale Anforderungen der International Test Commission (ITC) bezüglich der Darstellung und Interpretation der Ergebnisse!

  • Klare und exakte Angabe der Testergebnisse
  • Angemessene Interpretation der Testergebnisse

[Die Antwort findet sich in Kapitel 4.5!]

 

Die berufsethischen Richtlinien der deutschen Psychologenverbände verlangen „fachliche Kompetenz“ für Dienstleistungen, wozu auch diagnostische Untersuchungen und Begutachtungen gehören. Was wird konkret von den Psychologinnen und Psychologen erwartet?

  • Sie kennen die Grenzen ihrer spezifischen Kompetenzen und ihrer Fachkenntnis.
  • Sie sind durch eine wissenschaftlich fundierte Ausbildung, fachliche Fortbildung und berufliches Handeln qualifiziert. 
  • Sie bieten nur solche Dienstleistungen an und verwenden nur die Methoden, für die sie durch Ausbildung, Fortbildung oder Erfahrung qualifiziert sind.

 

Nennen Sie je ein Beispiel für einen informellen und einen formellen Auftrag für eine diagnostische Untersuchung!

  • Informell: Im Rahmen einer schulpsychologischen Beratung bitten die Eltern um Abklärung der Gründe für die „Schulprobleme“ ihres Kindes. 
  • Formell: Ein Familiengericht bittet schriftlich um die Klärung der Frage, ob im konkreten Fall das Kindeswohl gefährdet ist.

 

Was kann man tun, um zu verhindern, dass die Testperson die Untersuchungsergebnisse verfälscht, und wie kann man eine Verfälschung eventuell erkennen?

  • Bei Leistungstests in Gruppenuntersuchungen das Abschreiben vom Nachbarn verhindern (Abstand halten, Paralleltests bzw. Pseudoparalleltests verwenden)
  • Bei Persönlichkeitsfragebögen Verfahren einsetzten, die schwer verfälschbar sind oder Kontrollskalen haben, die sozial erwünschtes
    Antwortverhalten anzeigen.
  • Fragebögen mit Forced-Choice-Format einsetzen
  • Spezielle Verfahren einsetzen, die eine Simulation erkennen

 

Bei der Auswahl eines diagnostischen Verfahrens ist zu prüfen, ob es auch für die zu untersuchende Person angemessen ist. Welche Aspekte sind dabei zu beachten?

  • Der Messanspruch des Verfahrens muss passen und die Validität muss empirisch belegt sein.
  • Ist das Verfahren für Personen dieses Alters, dieses Geschlechts, dieser Bildung geeignet?
  • Wird es bei dem Verfahren bei dieser Person Akzeptanzprobleme geben?
  • Liegen körperliche (z. B. eine Sehbehinderung) oder kognitive Einschränkungen vor?
  • Sind Übungseffekte zu erwarten, weil die Person das Verfahren schon einmal durchgeführt hat?

 

Wo findet man Richtlinien zur computer- und internetbasierten Testung?

Die International Test Commission (ITC) hat Richtlinien zur computer- und internetbasierten Testung veröffentlicht.

 

Welche Effekte kann eine für die Testperson zu lange Testdauer haben?

Compliance und Motivation können abnehmen und sich negative auf die Testleistung auswirken. Eine zu lange Testung kann belastend sein und ist daher auch ethisch nicht zu vertreten.

 

Nennen Sie Vor- und Nachteile von Gruppenuntersuchungen (in Abgrenzung zu Einzeluntersuchungen)!

Vorteil:
      - Geringerer Zeitaufwand für Testleiter

Nachteile:
      - Verhaltensbeobachtung schwerer möglich
      - Gefahr des Abschreibens
      - Bei Power-Tests unterschiedlich lange Bearbeitungszeit der Probanden

 

Warum sollte man die zu untersuchenden Personen vor Beginn über wichtige Aspekte der Untersuchung aufklären?

  • Aus ethischen Gründen (Prinzip der informierten Einwilligung)
  • Wenn persönliche Informationen erhoben werden, kann evtl. erklärt werden, dass die Angaben vertraulich behandelt werden.
  • Eine Untersuchung wird eher als fair wahrgenommen, wenn die Teilnehmenden über wesentliche Aspekte informiert werden.
  • Die Testangst der Teilnehmenden kann damit reduziert werden.
  • Bei Gruppenuntersuchungen lassen sich so störende Zwischenfragen während der Untersuchung verhindern.

 

Welche Möglichkeiten der Testauswertung gibt es?

  • Manuelle Auswertung (meist mit Schablonen)
  • Verwendung eines Testauswertungsprogramms (Eingabe der Daten nötig)
  • Computergestützte Testdurchführung und -auswertung

 

Welche 4 Kernelemente sollte die Mitteilung eines Testergebnisses an Laien enthalten?

  • Das Merkmal benennen
  • Die Ausprägung des beobachteten Wertes verbal einordnen (z. B. "durchschnittlich")
  • Die Referenzgruppe nennen
  • Das Konfidenzintervall mitteilen („unter Berücksichtigung der Messgenauigkeit könnte das Ergebnis auch …“)

 

Abschnitt 4.6 Das psychologische Gutachten

 

Aus welchen Gründen sollte eine Diagnostikerin/ein Diagnostiker einen Begutachtungsauftrag ablehnen?

  • Der Auftrag ist mit dem eigenen Gewissen oder mit gesetzlichen Vorschriften nicht vereinbar.
  • Fehlende eigene Sachkunde
  • Der Erkenntnisgewinn für den Auftraggeber/die Auftraggeberin ist voraussichtlich zu gering.

[Die Antwort findet sich in Kapitel 4.2!]

 

Wie könnte eine leicht verständliche tabellarische Ergebnisdarstellung in einem Gutachten aussehen? Beschränken Sie sich auf die Elemente, die für Laien relevant sind.

  • Benennung der Merkmale
  • Grafische Darstellung deren Ausprägung (z. B. Skala mit 5 Stufen)
  • Verbale Verankerung der Skalenstufen (z. B. sehr hoch …) und Referenzgruppe in den Anmerkungen zur Tabelle erläutern
  • Auch Konfidenzintervall auf der Skala zeigen (durch z. B. farbige Markierung der möglichen Ausprägungsstufen)

 

Welche Funktion hat der Befund im Gutachten? Wie kann man diesen Teil des Gutachtens auch nennen?

Der Befund dient der Beantwortung der einzelnen psychologischen Fragen - unter Beachtung von Übereinstimmungen und Widersprüchen. Man kann diesen Teil auch "Interpretation der Ergebnisse" nennen.

 

Welche formalen Angaben sollten sich in einem Gutachten finden?

  • Name, akademischer Titel und Adresse des Gutachters
  • Name und Adresse des Auftraggebers
  • Die Fragestellung des Auftraggebers
  • Name(n) und Geburtsdatum/Geburtsdaten der untersuchten Person(en)
  • Ggf. herangezogene zusätzliche Informationsquellen (z. B. Akten, Epikrisen)
  • Ggf. beauftragte Zusatzgutachten
  • Das jeweilige Datum der Untersuchung(en)
  • Das Datum der schriftlichen Abfassung des Gutachtens
  • Die rechtsverbindliche Unterschrift des Gutachters
  • Nachweis der im Gutachten verwendeten Fachliteratur inklusive Quellennachweise der eingesetzten Verfahren

 

Welche Funktion hat die Stellungnahme im Gutachten?

Klare und vollständige Beantwortung der Fragestellung des Auftraggebers

 

 

zurück zur Inhaltsübersicht

 

Kapitel 5 - Diagnostische Strategien und Evaluation des Vorgehens

 

Abschnitt 5.1 Diagnostische Strategien

 

Was versteht man unter diagnostischen Strategien?

Diagnostische Strategien lassen sich definieren als „auf diagnostischen Daten aufbauende Konzeptionen, mit deren Hilfe der Diagnostiker sein [bzw. die Diagnostikerin ihr] antizipiertes Ziel zu erreichen sucht“ (Jäger 1988, S. 117). Diagnostische Strategien beschreiben also unterscheidbare Prinzipien des Diagnostizierens. Die Wahl der Strategie richtet sich danach, wie das diagnostische Ziel unter den gegebenen Randbedingungen am besten zu erreichen ist.

 

Wie unterscheiden sich diagnostische Strategien zur Selektion bzw. zur Modifikation?

Die diagnostischen Strategien zur Selektion vs. Modifikation unterscheiden sich deutlich. Steht eine Selektion im Vordergrund, sind alle infrage kommenden Entitäten (alle sich bewerbenden Personen, alle verfügbaren Therapieformen, alle infrage kommenden Berufe, alle verfügbaren Schulformen etc.) zu betrachten und in eine Rangreihe hinsichtlich ihrer Passung zu bringen. Die unter Beachtung verschiedener relevanter Kriterien beste Option wird empfohlen. Ob die zur Beurteilung der Passung herangezogenen Kriterien veränderbar sind oder nicht, spielt keine oder nur eine untergeordnete Rolle. Steht die Modifikation im Vordergrund, werden die Merkmale einer zu „modifizierenden“ Person oder eines zu modifizierenden Kontextes betrachtet. Ein bewertender Vergleich mit anderen Personen oder Kontexten ist nicht zentral. Vielmehr sind auslösende und aufrechterhaltende Bedingungen für eine problematische Gegebenheit sowie die tatsächlich modifizierbaren Anteile des „Problems“ zu identifizieren.

 

Welche Erkenntnisse liefert der Vergleich mechanischer vs. klinischer Urteilsbildung?

Mittlerweile liegen 4 Metaanalysen zum Vergleich von klinischer und mechanischer Urteilsbildung vor. Die Ergebnisse zeigen, dass die mechanische (und hier besonders die statistische) Vorhersage der klinischen Urteilsbildung überlegen ist. Dennoch sollte mechanischen Modellen nicht blind vertraut werden. Insbesondere Wenn ein seltenes Ereignis vorliegt, das von dem Prognosemodell nicht berücksichtigt wurde, aber für das zu treffende Urteil sehr relevant ist, sollte dieses Wissen – abweichend von einem mechanischen Vorgehen – genutzt werden.

 

Unter welchen Randbedingungen sind die klinische und die mechanische Urteilsbildung etwa gleich gut?

Lediglich rational begründete Urteilsmodellen (mechanisch, aber nicht statistisch) sind kaum besser als klinische Urteile.

 

Was versteht man unter kompensatorischer, konjunktiver und disjunktiver Entscheidungsstrategie?

Ein kompensatorisches Entscheidungsmodell bedeutet, dass sich die Prädiktoren gegenseitig ausgleichen (kompensieren) können. Mit anderen Worten: Niedrige Leistungen in einem Prädiktor können durch hohe in dem anderen wettgemacht werden. Bei der disjunktiven Entscheidungsstrategie, auch „Oder-Strategie“ genannt, genügen entsprechend hohe Punktwerte in einem einzelnen der Prädiktoren (d. h., die Ergebnisse mehrerer diagnostischer Verfahren werden nicht zu einem Gesamtwert verrechnet). Bei der konjunktiven Entscheidungsstrategie, die auch als „Und-Strategie“ bezeichnet wird, müssen für ein positives Urteil mehrere Cut-off-Werte überwunden bzw. mehrere „Hürden“ übersprungen werden.

 

Was bezeichnet das Multiple-Hurdle-Problem?

Ziegler und Bühner (2012) legen dar, dass selbst bei geringen Hürden (z. B. nicht schlechter als 1 Standardabweichung unter dem Mittelwert der repräsentativen Vergleichsgruppe) die Wahrscheinlichkeit, alle Hürden zu bewältigen, gering sein kann. Dies ist insbesondere dann der Fall, wenn die Hürden aus unabhängigen, d. h. unkorrelierten Messungen bestehen. Die Basiswahrscheinlichkeit, einen Wert zu erreichen, der größer ist als der Mittelwert minus 1 Standardabweichung der repräsentativen Vergleichsgruppe, ist zwar hoch (= 0,84; da bei normalverteilten Messwerten 84 % der Normgruppe diesen Wert übertreffen), für 5 unabhängige Hürden würden diese Wahrscheinlichkeiten jedoch multipliziert. Damit liegt die Basiswahrscheinlichkeit, 5 Hürden zu „überspringen“ nur noch bei 0,84 × 0,84 × 0,84 × 0,84 × 0,84 ≈ 0,42 (Ziegler & Bühner 2012, S. 52).

 

Welche Fehlerarten sind beim Festlegen eines Cut-off-Wertes zu beachten?

Folgende Fehlerarten sind beim Festlegen eines Cut-off-Wertes zu beachten: a) Diagnostizierende denken, ein Zustand läge vor, was aber gar nicht so ist (Alpha-Fehler). b) Diagnostizierende denken, ein Zustand läge nicht vor, in der Realität liegt er aber vor (Beta-Fehler)?

 

Erläutern Sie, warum der positive und der negative Prädiktionswert anfällig für die Grundquote sind, Sensitivität und Spezifität jedoch nicht!

Sensitivität und Spezifität lassen sich unabhängig von den Grundraten oder der Prävalenz bestimmen, da sie jeweils Anteile miteinander verrechnen, die gleichsam von einer Erhöhung oder Verringerung der Grundquote betroffen sind. Bei positivem bzw. negativem Prädiktionswert ist dies anders, hier sind die verrechneten Anteile unterschiedlich von einer Erhöhung oder Verringerung der Grundquote betroffen.

 

Wie kann die Wahl des optimalen Cut-off-Wertes grafisch vollzogen werden?

Als grafische Entscheidungshilfe für den bestmöglichen Cut-off-Wert kann eine ROC-Kurve (von Receiver Operating Characteristic aus der Signalentdeckungstheorie; Schäfer 1989) erstellt werden. Dazu trägt man für jeden Cut-off-Wert die resultierende Sensitivität und Spezifität in ein Koordinatensystem ein. Aus Gründen der besseren Darstellung verwendet man statt der Spezifität jedoch den inversen Wert (also 1 – Spezifität). Der Cut-off-Wert mit dem besten Kompromiss aus Sensitivität und Spezifität ist jener, der am weitesten in der linken oberen Ecke des Quadrats liegt.

 

Welche Quoten sind in der Eignungsdiagnostik interessant und wie sollten diese ausgeprägt sein?

In der Eignungsdiagnostik sind insbesondere der Anteil an grundsätzlich Geeigneten an allen Bewerbenden (Grundrate) sowie der Anteil der Ausgewählten an allen Bewerbenden (Selektionsrate) interessant. Während die Grundrate idealerweise möglichst hoch ist, sollte die Selektionsrate möglichst gering sein.

 

Was versteht man unter der Pre-reject-Strategie?

Von einer Pre-reject-Strategie spricht man, wenn im Rahmen eines sequenziellen Vorgehens Personen vorzeitig von weiteren Messungen ausgeschlossen werden. Beispielsweise kann eine Analyse der Bewerbungsunterlagen ergeben, dass einige Bewerberinnen und Bewerber für eine Professur keine eingeworbenen Forschungsmittel vorweisen können. Es würde keinen Sinn ergeben, diese Personen dennoch zu einem Berufungsvortrag und einem Interview einzuladen und sie erst danach – eventuell trotz hervorragendem Berufungsvortrag – aufgrund der fehlenden Forschungsmittel abzulehnen.

 

Abschnitt 5.2 Evaluation des Vorgehens

 

Wie kann das diagnostische Vorgehen überprüft werden, wenn keine realen Kriterien vorliegen?

Auch wenn keine Kriteriumsdaten vorliegen, muss nicht vollständig auf eine Ergebnisevaluation verzichtet werden. Auch innerhalb einzelner diagnostischer Verfahren lassen sich relevante Kennwerte ermitteln. So kann im Rahmen von Verhaltensbeobachtungen oder diagnostischen Interviews die Übereinstimmung zwischen 2 oder mehr Beurteilenden geprüft und verglichen werden – mit für solche Verfahren typischen Übereinstimmungsmaßen. Ebenso kann geprüft werden, ob die Faktorenstruktur eines Fragebogens in der spezifischen Stichprobe stabil, d. h. unverändert zu dem im Fragebogenmanual berichteten Ergebnis bleibt.

 

Erläutern Sie die grundlegende Logik von Nutzenschätzungen!

Nutzenmodelle in der Eignungsdiagnostik gehen davon aus, dass einerseits durch diagnostische Instrumente eine Prognose realer Kriterien (z. B. beruflicher Leistung) annähernd gelingt und andererseits realen Kriterien ein monetärer Wert beigemessen werden kann.

 

Was versteht man unter einer „truncated normal distribution“?

Unter einer „truncated normal distribution“ versteht man eine (an einer bestimmten Stelle) abgeschnittene Normalverteilung.

 

 

zurück zur Inhaltsübersicht

 

Kapitel 6 - Diagnostik in der Arbeits-, Organisations- und Wirtschaftspsychologie

 

Abschnitt 6.1 Organisationsdiagnostik

 

Was sind die 3 grundsätzlichen Zugänge der Arbeits- und Anforderungsanalyse und wie unterscheiden sich diese voneinander?

Grundsätzliche Zugänge der Arbeits- und Anforderungsanalyse werden als erfahrungsgeleitet-intuitiv, personenbezogen-empirisch oder arbeitsplatzanalytisch-empirisch bezeichnet. Unter der erfahrungsgeleitet-intuitiven Methode versteht man die freie, nicht formalisierte Beurteilung der Tätigkeitsmerkmale oder Anforderungen an einen Beruf. Sie verlangt gründliche Kenntnisse der Stelle und ihrer organisatorischen Einbettung. Meist wird diese Methode in Form von wenig standardisierten Interviews oder Workshops mit (langjährigen) Stelleninhaberinnen bzw. Stelleninhabern oder deren Vorgesetzten umgesetzt. Bei der personenbezogen-empirischen Methode werden empirisch ermittelte Zusammenhänge zwischen Personenmerkmalen (wie beispielsweise Intelligenz) und Kriterien des Ausbildungs- oder des Berufserfolgs genutzt. Idealerweise stammen die ermittelten Zusammenhänge aus dem eigenen Unternehmen. Aber auch metaanalytisch aufbereitete Ergebnisse der (internationalen) Forschung oder Befunde aus Einzelstudien mit vergleichbaren Berufsgruppen können für eine personenbezogen-empirische Anforderungsanalyse genutzt werden. Als relevante Anforderungen gelten solche Personenmerkmale, für die ein möglichst hoher Zusammenhang mit den relevanten Erfolgsmaßen (Leistung, Zufriedenheit etc.) nachgewiesen wurde. Bei der arbeitsplatzanalytisch-empirischen Methode werden mithilfe von standardisierten Verfahren Informationen über die Stelle erhoben. Dazu stehen verschiedene Instrumente zur Verfügung, die sich u. a. hinsichtlich der theoretischen Grundlage und der Auswahl der zu beschreibenden Arbeitsmerkmale unterscheiden.

 

Was versteht man unter der Critical-Incident-Technik?

Die bereits 1954 entwickelte Methode verlangt von Führungskräften, dass sie Verhaltensweisen ihrer Mitarbeitenden beschreiben, die zu Erfolg oder Misserfolg geführt haben, beispielsweise zu einer Erhöhung oder einer Verringerung der Produktion.

 

Was versteht man unter einem Anforderungsprofil?

Listet man relevante Anforderungsmerkmale nacheinander auf, versieht sie mit einer Skala zur Ausprägung und kennzeichnet auf jeder Skala den optimalen Bereich, erhält man ein Anforderungsprofil. In dieses Anforderungsprofil können die festgestellten Merkmalsausprägungen einer Person eingetragen werden. Man erkennt dann meist leicht, wie gut diese Person zu den Anforderungen passt.

 

Abschnitt 6.2 Diagnostik von Personenmerkmalen

 

Nennen Sie biografieorientierte, simulationsorientierte und konstruktorientierte Verfahren der Personalauswahl!

Werden Informationen herangezogen, die in der Vergangenheit von Bewerberinnen und Bewerbern entstanden sind, spricht man vom biografieorientierten Ansatz. Beispiele für biografieorientierte Verfahren sind Interviews, Kenntnisprüfungen, Analyse der Bewerbungsunterlagen (Nachweis fachlicher Qualifikationen durch Zeugnisse, Bescheinigungen über bestandene Ausbildungen und Fortbildungen, Zertifikate, Arbeitszeugnisse etc.) und biografische Fragebögen. Beim konstruktorientieren Ansatz stehen psychologische Eigenschaften im Fokus – daher wird er häufig auch als eigenschaftsorientierter Ansatz bezeichnet. Die zentrale Annahme ist, dass Verhalten über verschiedene Situationen hinweg von stabilen Eigenschaften determiniert wird. Beispiele für konstruktorientierte Verfahren sind Intelligenztests, andere Leistungstests und Persönlichkeitsfragebögen. Wenn diagnostische Verfahren ein möglichst realistisches Abbild zukünftiger beruflicher Gegebenheiten präsentieren (simulieren) und anhand des Verhaltens von Bewerberinnen und Bewerbern in dieser Simulation erheben, wie geeignet sie sind, dann zählt man diese zum simulationsorientierten Ansatz. Beispiele für simulationsorientierte Verfahren sind Assessment-Center, Situational-Judgment-Tests, Computersimulationen und Arbeitsproben.

 

Wie beurteilen Sie die Validität von Bewerbungsunterlagen für die Personalauswahl?

Insgesamt dürfte die Analyse von Bewerbungsunterlagen nur eine geringe Prognosekraft für berufliche Leistungen haben. Bedauerlicherweise liegen unseres Wissens nach keine Studien vor, die genau dies prüfen, nämlich inwiefern Beurteilungen von Bewerbungsunterlagen mit späteren Leistungen in Beruf oder Ausbildung korrespondieren. Hierzu sind Studien erforderlich, die häufig nicht im Feld und unter Realbedingungen durchgeführt werden können.

 

Welche Vor- und Nachteile bringt die Assessment-Center-Methode mit sich?

Bei der Assessment-Center-Methode handelt es sich um eine breit einsetzbare Methode, in der „echtes“ Verhalten von Bewerbenden beobachtet wird. Die Methode erfreut sich hoher Beliebtheit und zeigt Zusammenhänge zu beruflichen Kriterien in erwartbarer Höhe. Nachteile der Methode bestehen in der oft unklaren Konstruktvalidität (bedingt durch die schlechte Abgrenzbarkeit der beobachteten Inhaltsdimensionen) sowie in der aufwendigen Durchführung.

 

Was weiß man über die Abgrenzbarkeit der Dimensionen in Assessment-Centern?

Insgesamt muss der Anspruch, mit Assessment-Centern einzelne Verhaltensdimensionen konsistent über Übungen hinweg messen zu können, hinterfragt werden. Vor dem Hintergrund der verfügbaren Evidenz muss von übungs- bzw. situationsspezifischen Verhaltensweisen ausgegangen werden, deren globale Beurteilung zur Prädiktion beruflicher Leistungen taugt (sofern die im Assessment-Center enthaltenen Übungen ein hinreichend gutes Abbild der beruflichen Realität darstellen).

 

Wie ist es um die Reliabilität von Situational-Judgment-Tests bestellt?

Mittlerweile liegen 3 Metaanalysen zur mittleren Reliabilität von Situational-Judgment-Tests vor (Campion et al. 2014; Catano et al. 2012; Kasten und Freund 2016). Diese bescheinigen Situational-Judgment-Tests nur geringe Reliabilitäten (zwischen .46 und .68), sofern diese in Form von internen Konsistenzmaßen (Cronbachs Alpha) geschätzt werden. Allerdings erfüllen Situational-Judgment-Tests eine wesentliche Voraussetzung für interne Konsistenzschätzungen, nämlich die Eindimensionalität, nicht. Vielmehr sind die Items zumeist sehr heterogen; sie bestehen nicht selten aus ganz unterschiedlichen, komplexen Situationen, zu deren effektivem Bewältigen mehrere Konstrukte beitragen. Somit sind Reliabilitätsschätzungen durch Testwiederholung (Retest-Reliabilität) oder parallele Testversionen angemessener. In der Tat fallen die so ermittelten Reliabilitätskoeffizienten deutlich höher aus (zwischen .66 und .82; vgl. Clause et al. 1998).

 

Welche Verfahren lassen den höchsten inkrementellen Beitrag – über allgemeine kognitive Leistungstests hinaus – bei der Prognose der beruflichen Leistung erwarten?

Integritätstests, Interviews (auch Telefoninterviews), Interessentests, Gewissenhaftigkeitsfragebögen, eingeholte Referenzen.

 

Was versteht man unter sozialer Validität?

Mit diesem Begriff wird betont, dass neben dem klassischen und in der Wissenschaft häufiger beachteten Gütekriterium der Validität auch die subjektiven Bewertungen von Bewerbenden beachtet und zur Evaluation von Auswahlverfahren herangezogen werden sollten. Möglichkeiten der Einflussnahme auf solche Bewertungen sehen Schuler und Stehle (1983) in 4 Bereichen: Information (z. B. über die Organisation und die ausgeschriebene Position), Partizipation (z. B. Einflussnahme auf die diagnostische Situation, „opportunity to perform“ nach Gilliland, 1993), Transparenz (z. B. hinsichtlich des Bewertungsprozesses) und Urteilskommunikation (z. B. respektvoll, offen).

 

Welche Rolle kommt der Psychologischen Diagnostik in der Personalentwicklung zu?

Die Psychologische Diagnostik dient im Rahmen der Personalentwicklung der zielgerichteten Identifikation von spezifischen Entwicklungsbedarfen von Personen.

 

Abschnitt 6.3 Evaluation der Psychologischen Diagnostik in der Arbeits-, Organisations- und Wirtschaftspsychologie

 

Welchen Fehlerquellen unterliegen Arbeits- und Anforderungsanalysen?

Es werden soziale (z. B. Konformitätsdruck) und kognitive (z. B. Informationsüberlastung) Fehlerquellen unterschieden. Soziale Fehlerquellen umfassen: Prozesse der sozialen Beeinflussung und Prozesse der Selbstdarstellung. Kognitive Fehlerquellen gliedern sich in: Einschränkungen in der Informationsverarbeitung sowie Verzerrungen in der Informationsverarbeitung.

 

Was sind zentrale Erkenntnisse aus der Metaanalyse von Schmidt und Hunter (1998)?

Es zeigt sich in der Metaanalyse von Schmidt und Hunter (1998) eine hohe Relevanz von kognitiven Leistungstests, Arbeitsproben, Integritätstests, strukturierten Interviews und Tests zur Erfassung von berufsrelevantem Wissen für die statistische Vorhersage von Berufserfolg. Kognitive Leistungstests erwiesen sich als besonders relevant zur statistischen Vorhersage des Ausbildungserfolgs. Arbeitsproben, Fragebögen zur Gewissenhaftigkeit und strukturierte Interviews können laut den Ergebnissen dieser Metaanalyse ergänzend zu kognitiven Leistungstests eingesetzt werden, sodass ein substanzieller Zuwachs der Prognosegüte erreicht wird.

 

Was weiß man über die Relevanz von beruflichen Interessen für die berufliche Leistung?

Hinsichtlich dieses Zusammenhangs liegt eine einschlägige Metaanalyse von Van Iddekinge et al. (2011b) vor. In dieser Metaanalyse wurden insgesamt 74 Studien zusammengefasst und der Zusammenhang von Interessentests zu beruflicher Leistung, Ausbildungserfolg, Berufswechselabsichten und tatsächlichem Berufswechsel ermittelt. Es finden sich substanzielle Zusammenhänge von berufsbezogenen Interessenskalen zu beruflicher Leistung (ρ = .23).

 

Warum ist bei Verfahren zur Feststellung des Entwicklungsbedarfs die Frage besonders zentral, ob die verwendeten Verfahren ihrem Messanspruch gerecht werden?

Für Verfahren, die im Rahmen der Personalentwicklung eingesetzt werden, reicht es nicht aus, dass sie in einem engen Zusammenhang mit beruflicher Leistung stehen. Vielmehr muss belegt sein, dass sie tatsächlich das intendierte Konstrukt messen. Andernfalls ist eine Entscheidung darüber, welche Fertigkeiten oder Kompetenzen trainiert werden sollen, nicht möglich. Die Begründung für diese Aussage ist einfach: Man stelle sich vor, viele Mitarbeiterinnen und Mitarbeiter haben ein Verfahren zur Messung der Teamfähigkeit (beispielsweise einen Situational-Judgment-Test) absolviert. Personen mit niedrigen Werten in diesem Verfahren werden dann verpflichtet, ein Training zur Optimierung der Teamfähigkeit zu absolvieren. Wenn es aber nun so wäre, dass das Verfahren fälschlicherweise Intelligenz statt, wie beabsichtigt, Teamfähigkeit messen würde, so wäre der mit den Trainings verbundene Aufwand nutzlos. Es ist daher für diagnostische Verfahren zur Feststellung des Personalentwicklungsbedarfs stets abzusichern, dass diese ihrem Messanspruch gerecht werden.

 

Erläutern Sie, warum bivariate Analysen im Kontext der Diagnostik in der Arbeits- und Organisationspsychologie häufig nicht ausreichen!

Bei einer rein bivariaten Betrachtung des Zusammenhangs zwischen Auswahlverfahren und Kriterium wird davon ausgegangen, dass eine zuvor erfolgte Anforderungsanalyse valide Ergebnisse erbracht hat und dass die Anforderungen über die inkludierte Stichprobe ohnehin nicht variieren, weil beispielsweise nur eine Gruppe Auszubildender (z. B. Gebäudereinigende) betrachtet wird. Sobald Merkmale der Organisation und der Person innerhalb einer Studie bzw. einer Stichprobe Varianz aufweisen, ist eigentlich eine gemeinsame Betrachtung aller Variablen (Organisation, Person und abhängige Variable) erforderlich.

 

Was sind Probleme von Differenzwerten?

Probleme von Differenzwerten (nach Edwards 2002) sind: (i) Differenzwerte weisen zumeist eine geringere Reliabilität als die Einzelwerte auf. (ii) Wenn ein Wert eine größere Varianz als der andere hat, so wird die Varianz des Differenzwertes stärker von ersterem beeinflusst. Damit wird weniger klar, was der Differenzwert konzeptuell repräsentiert. (iii) Das Ausmaß, in dem die Einzelwerte den Effekt des Differenzwertes auf eine abhängige Variable beeinflussen, ist nicht empirisch zu bestimmen. (iv) Ein dreidimensionaler Zusammenhang (also zwischen 2 unabhängigen und abhängigen Variablen) wird zu einem zweidimensionalen (zwischen dem Differenzwert und der abhängigen Variablen) reduziert.

 

Abschnitt 6.4 Ein Qualitätsstandard für berufsbezogene Eignungsbeurteilungen die DIN 33430

 

Welchen Nutzen hat die DIN 33430?

Anbietende entsprechender Dienstleistungen erhalten Qualitätsstandards zur Planung und Durchführung von Eignungsbeurteilungen. Personen und Institutionen, die Eignungsbeurteilungen durchführen lassen, gewinnen Orientierung bei der Bewertung von externen Angeboten. Personalverantwortliche können Qualitätssicherung und -optimierung von Personalentscheidungen betreiben. Personen, deren Eignung beurteilt wird, werden vor unsachgemäßer oder missbräuchlicher Anwendung von Verfahren geschützt.

 

Welche Formen der Lizenzierung nach DIN 33430 existieren?

Personen können eine Lizenz erwerben. Dazu ist das Bestehen einer Prüfung notwendig. Lizenzierte Personen dokumentieren dadurch, dass sie über die notwendigen eignungsdiagnostischen Kenntnisse verfügen. Die Prüfungen zur Personenlizenzierung werden von der Deutschen Psychologenakademie (DPA) durchgeführt, einer Bildungseinrichtung des BDP, die auch ein öffentlich zugängliches Register lizenzierter Personen führt. Unternehmen können einen bei sich etablierten Prozess der Eignungsbeurteilung und das damit verbundene Qualitätsmanagement zertifizieren lassen (s. Kersting 2008; Reimann 2009). Die Zertifizierung einer Organisation kann ein speziell dazu qualifiziertes Zertifizierungsinstitut vornehmen (s. Reimann 2009).

 

 

zurück zur Inhaltsübersicht

 

 

Kapitel 7 - Diagnostik in der Pädagogischen Psychologie

 

Abschnitt 7.1 Diagnostik zur Schullaufbahnberatung

 

Welche 3 im Vorschulalter messbaren Fähigkeiten sind für den späteren Schulerfolg besonders relevant?

  • Phonologische Bewusstheit
  • Mengen- und zahlenbezogenes Vorwissen
  • Bereichsübergreifende Fähigkeiten

 

Welches Problem besteht bei einem Screening zur Entdeckung mangelnder Schulreife, wenn der Test eine prognostische Validität von r = .51 hat und der Anteil nicht schulreifer Kinder mit 2 % angenommen wird?

Die Trefferquote speziell für die Diagnose "nicht schulreif" ist zu gering (sie beträgt wegen der niedrigen Basisrate nur 17,5%)

 

Was versteht man unter „Regression zur Mitte“ und welche Bedeutung hat sie für ein Screening von Menschen, die einer seltenen Gruppe (z. B. Hochbegabte, Minderbegabte) angehören?

Unter der Regression zur Mitte versteht man das Phänomen, dass sich extreme Messwerte bei einer Testwiederholung (oder Messung mit einem ähnlichen Test) in Richtung Skalenmitte (dem Durchschnittswert) verschieben. Der Effekt ist umso größer, je extremer der Messwert bei der ersten Messung ist.

 

Nennen Sie wenigstens 3 Sonderschularten in Deutschland!

Es gibt Schulen mit den Förderschwerpunkten Lernen, Sehen, Hören, Sprache, Körperliche u. motorische Entwicklung, Geistige Entwicklung, Emotionale u. soziale Entwicklung etc.

 

Auf welche allgemeinen Faktoren werden Lernschwierigkeiten in der Schule zurückgeführt? Nennen Sie auch Beispiele!

  • Kognitive Persönlichkeitsmerkmale (z. B. Intelligenz)
  • Nichtkognitive Persönlichkeitsmerkmale (z. B. Motivation, Leistungsängstlichkeit)
  • Organisch-biologische Voraussetzungen (z. B. Erkrankungen und Behinderungen)
  • Situative oder Umweltfaktoren (z. B. Schul- oder Klassenklima, Unterrichtsqualität, Art der Leistungsbeurteilung, Mobbing; fehlende Unterstützung beim Lernen, Konflikte zu Hause, Scheidung der Eltern)

 

Studieninteressierte können an einem Online-Self-Assessment teilnehmen. Was ist das und wozu soll es dienen?

Online-Self-Assessments sind diagnostische Verfahren (Assessments), die dazu dienen, einen passenden Studiengang zu finden. Sie werden von Studieninteressierten selbst („Self“) zu Hause durchgeführt, und zwar ausschließlich über das Internet („Online“). Sie unterscheiden sich von Auswahlverfahren der Hochschulen:

  • Die Teilnahme ist in der Regel freiwillig
  • Die Hochschule erfährt das Ergebnis nicht.
  • Es kann auch Module enthalten, die der Information über den Studiengang dienen.

 

Abschnitt 7.2 Diagnostik bei Schulschwierigkeiten

 

Nennen Sie 2 umschriebene Entwicklungsstörungen schulischer Fertigkeiten!

  • F81.0 Lese- und Rechtschreibstörung
  • F81.1 Isolierte Rechtschreibstörung
  • F81.2 Rechenstörung
  • F81.3 Kombinierte Störungen schulischer Fertigkeiten (als Restkategorie)
  • F81.8 Sonstige Entwicklungsstörungen schulischer Fertigkeiten (inkl.: Entwicklungsbedingte expressive Schreibstörung)
  • F81.9 Entwicklungsstörung schulischer Fertigkeiten, nicht näher bezeichnet (inkl.: Lernbehinderung, Lernstörung, Störung des Wissenserwerbs – jeweils ohne nähere Angaben)

 

Welches sind nach der Leitlinie (AWMF 2018) die Hauptkriterien für die Diagnose einer Rechenstörung?

  • Unterdurchschnittliche Leistungen im Bereich der Mathematik (mind. 1,5 SD unter dem Durchschnitt). Wenn die klinischen und qualitativen Kriterien den Verdacht einer Rechenstörung unterstützen soll, genügt 1 SD unter dem Durchschnitt.
  • Ein IQ unter 70 soll durch Einsatz eines figuralen („nonverbalen“) Intelligenztests ausgeschlossen werden.
  • Andere Ursachen für die Rechenprobleme (z. B. eine Hirnschädigung oder eine unzureichende Beschulung) sollen ausgeschlossen werden.

 

Abschnitt 7.3 Hochbegabungsdiagnostik

 

Wie wird Hochbegabung definiert, und warum ist eine Definition über mehrere Begabungsmerkmale problematisch?

IQ von mind. 130

Verlangt man, dass mehrere Kriterien sehr stark ausgeprägt sind (obere 2 % der Verteilung) und sind diese Kriterien nur niedrig korreliert, nimmt die Zahl der hochbegabten Personen mit jedem weiteren Kriterium stark ab. Bei drei Kriterien, die zu .30 korrelieren, wären nur noch 0,03 % aller Menschen hochbegabt.

 

Wie gut können Lehrer/-innen einer Studie von Wild zufolge die Begabung ihrer Schüler/-innen beurteilen und wie gut erkennen sie Hochbegabung?

Die Korrelation der Lehrerurteile mit dem IQ ist relativ hoch (r = .59 bzw. .47 bei Hochbegabten. Nur 35 % der als „exzellent“ beurteilten Schüler waren tatsächlich hochbegabt. Nur 16 % der laut IQ Hochbegabten wurden als solche erkannt.

 

Was versteht man im Rahmen von Hochbegabung unter Under- und Overachiever?

Underachiever: Die Schulleistungen sind niedriger als nach dem Potenzial (IQ) zu erwarten wäre.

Overachiever: Die Schulleistungen sind höher als nach dem Potenzial (IQ) zu erwarten wäre.

 

Abschnitt 7.4 Tests im Bildungsbereich

 

Für welche Fragestellungen kann man in Schulleistungstests verwenden?

  • Wie ist der Leistungsstand der Schulklasse in z. B. Deutsch im bundesweiten Vergleich?
  • Wie ist der Leistungsstand einer Schülerin in dem Schulfach – und zwar unabhängig von den (vielleicht zu strengen oder zu milden) Noten? Dies kann etwa bei einem geplanten Schulwechsel helfen, die passende Klassenstufe zu finden.
  • Wie hoch oder niedrig ist die Rechenfertigkeit eines Schülers im Vergleich zu seiner Intelligenz? Der Vergleich ist für die Diagnose einer Teilleistungsstörung (Legasthenie, hier: Dyskalkulie) erforderlich.
  • Wo genau hat die Schülerin Schwächen im Bereich der Rechtschreibung? Einige Tests helfen zu erkennen, welche Fehler besonders oft vorkommen. Dies kann für die Förderung hilfreich sein.

 

Was leisten die PISA-Tests?

PISA dient der Politikberatung und hilft, ein Schulsystem zu evaluieren. Gemessen werden die schulischen Kompetenzen in den Bereichen Lesekompetenz, mathematische Kompetenz und

naturwissenschaftliche Grundbildung. Die Ergebnisse liegen in einer Einheitlichen Metrik vor (M = 500 Punkte, SD = 100). Damit ist ein längsschnittlicher Vergleich sowie ein Vergleich mit den Schulsystemen anderer Länder möglich.

 

 

zurück zur Inhaltsübersicht

 

Kapitel 8 - Diagnostik in der Klinischen Psychologie und Pschotherapie

 

Die Antworten zu Kapitel 8 werden noch zur Verfügung gestellt.

 

Abschnitt 8.1 Aufgaben der klinisch-psychologischen Diagnostik bis Abschnitt 8.6 Erfolgskontrolle als Teil der Qualitätssicherung

 

Welches sind die 5 zentralen Aufgaben der klinisch-psychologischen Diagnostik?

Welche 3 Bereiche des individuellen Erlebens und Verhaltens stehen im Fokus der klinisch-psychologischen Diagnostik?

Welche 5 Gruppen diagnostischer Methoden werden in der klinisch-psychologischen Diagnostik unterschieden?

Nennen Sie einige Versorgungseinrichtungen, in denen klinisch-psychologische Diagnostik ein wichtiger Teil der professionellen Arbeit darstellt!

Welche 3 wesentlichen Kompetenzbereiche sind zur Ausübung einer klinisch-psychologischen bzw. psychotherapeutischen Tätigkeit notwendig?

Nennen Sie zentrale Themen der biografischen Anamnese!

Welches sind die zentralen Faktoren für die Definition einer psychischen Störung?

Was ist der Unterschied zwischen kategorialer und dimensionaler Diagnostik in der Klinischen Psychologie?

Wann ist der Einsatz von Verhaltensbeobachtungen angemessen?

Was bedeuten die Buchstaben S, R und C in der klassischen Verhaltensgleichung?

Welches sind die 5 Achsen der Operationalisierten Psychodynamischen Diagnostik (OPD)?

Was ist der Unterschied zwischen einer statistisch und einer klinisch bedeutsamen Veränderung der klinisch relevanten Symptomatik?

 

zurück zur Inhaltsübersicht

 

 

 

Kapitel 9 - Diagnostik in weiteren Anwendungsfeldern

 

Abschnitt 9.1 Neuropsychologische Diagnostik

 

Welche Funktionsbereiche können bei einer Hirnschädigung betroffen sein?

  • Basale und höhere Wahrnehmungsleistungen
  • Aufmerksamkeitsleistungen
  • Gedächtnisfunktionen
  • Planungs- und Kontrollfunktionen („exekutive     Funktionen“)
  • Sprache
  • Sensomotorische Leistungen und motorische Planung
  • Räumlich-perzeptive, räumlich-kognitive und räumlich-konstruktive Leistungen
  • Zahlenverarbeitung und Rechenleistungen
  • Intellektuelles Niveau und Leistungsprofil (aggregierte Kompetenz)
  • Berufsabhängige Fertigkeiten und domänenspezifisches Wissen
  • Affektivität und Persönlichkeit

 

Wozu dient die Quantifizierung von neuropsychologischen Funktionsbeeinträchtigungen?

  • Therapieindikation
  • Dokumentation des Krankheitsverlaufs (Evaluation von Therapiemaßnahmen, Notwendigkeit weiterer Therapiemaßnahmen erkennen, „natürlichen“ Krankheitsverlauf verfolgen)
  • Abschätzung der Auswirkung der Erkrankung auf die berufliche Wiedereingliederung und die private Lebensgestaltung
  • Klärung von Versicherungsfragen

 

Wie lässt sich Verfälschung bei einer neuropsychologischen Untersuchung erkennen?

  • Diskrepanzen zwischen Datenquellen (Selbst- und Fremdberichten, Dokumenten oder beobachtbarem Verhalten)
  • Beschwerden oder Testergebnisse, die nicht zum neurologischen Status passen.
  • Auffällige Werte in Kontrollskalen von Fragebögen oder Tests
  • Auffällige Werte in Symptom-Validitäts-Test

 

Was versteht man unter „Neglect“, und wie äußert sich diese Störung?

Patientinnen und Patienten mit dieser Störung vernachlässigen Reize, die sich auf einer Seite des Wahrnehmungsfelds befinden. Sie reagieren nicht auf entsprechende Reize. Die Störung kann neben dem visuellen Bereich auch andere Sinnesmodalitäten betreffen. Als Erklärung für dieses Defizit wird eine Störung der Aufmerksamkeit, der mentalen Repräsentation der Umwelt und des neuronalen Raumkoordinatensystems diskutiert.

 

Abschnitt 9.2 Rechtspsychologische Diagnostik

 

Wozu dienen Realkennzeichen? Nennen Sie 3 Beispiele für Realkennzeichen!

Realkennzeichen stellen Kriterien dar, anhand derer erfundene Aussagen erkannt werden sollen. Damit sollen erlebnisbasierte von erfundenen Aussagen unterscheidbar sein.

Beispiele sind:

  • Logische Konsistenz
  • Schilderungen von Komplikationen im Handlungsverlauf
  • Schilderung ausgefallener Einzelheiten
  • Schilderung eigener psychischer Vorgänge
  • Eingeständnis von Erinnerungslücken

 

Wie lauten nach § 20 StGB die Kriterien für Schuldunfähigkeit?

Ohne Schuld handelt, wer bei Begehung der Tat wegen …

  • krankhafter seelischer Störung,
  • tiefgreifender Bewusstseinsstörung,
  • Schwachsinn,
  • schwerer anderer seelischer Abartigkeit

… unfähig ist, das Unrecht der Tat einzusehen oder nach dieser Einsicht zu handeln.

 

Wann liegt verminderte Schuldfähigkeit vor?

Verminderte Schuldfähigkeit liegt nach § 21 StGB vor, wenn „die Fähigkeit des Täters, das Unrecht der Tat einzusehen oder nach dieser Einsicht zu handeln, aus einem der in § 20 bezeichneten Gründe bei Begehung der Tat erheblich vermindert“ ist.

 

Warum sind Prognosen über künftiges delinquentes Verhalten schwer zu stellen?

Mehrere ungünstige Bedingungen treffen zusammen:

  • Das vorherzusagende Verhalten tritt (zumindest bei zahlreichen Delikten) selten auf.
  • Viele Täterinnen und Täter bleiben Jahre oder gar Jahrzehnte lang unauffällig, um dann plötzlich wieder einschlägige Straftaten zu begehen.
  • Verhalten wird immer auch durch die Situation determiniert. In welche Situationen eine Straftäterin oder ein Straftäter einmal kommen wird, die sie oder ihn wieder in Versuchung bringen, ist ungewiss.
  • Der Geltungszeitraum der Prognose ist gerade bei jungen Straftäterinnen und Straftätern sehr lang.

 

Welche 2 Ansätze werden bei der Kriminalprognose verwendet, und was zeichnet diese Ansätze aus?

Nomothetische Prognose: Bei der Begutachtung werden statistische Erkenntnisse über Rückfallrisiken in vergleichbaren Fällen genutzt. Die statistische Vorhersage muss sich auf Merkmale der Tat und des Delinquenten konzentrieren, die allgemein verfügbar sind (z. B. Art der Straftat, Alter, Geschlecht). Sie können aber nicht erklären, warum ein Straftäter rückfällig wird. Die statistische Prognose vernachlässigt zwangsläufig die seltenen Faktoren.

Ideografische Prognose: Ziel dieses Ansatzes ist es, ein individuelles Erklärungsmodell für die Person auszuarbeiten, um damit zu einer Prognose zu gelangen. Fragen können u. a. sein:

  • Unter welchen Bedingungen wurde die Straftat begangen?
  • Wie kann die Entstehung der damaligen Straftat erklärt werden?
  • Wie haben sich Verhaltensmuster der Delinquentin oder des Delinquenten in der Haft verändert?

 

Nennen Sie 3 mögliche psychologische Fragestellungen in Sorgerechtsentscheidungen!

  • Ist die Erziehungsfähigkeit durch eine Erkrankung eingeschränkt?
  • Liegt sexueller Missbrauch vor?
  • Ist die Bereitschaft vorhanden, elterliche Verantwortung zu übernehmen?
  • Sind die Betreuungs- und Versorgungsmöglichkeiten ausreichend?
  • Wie stark ist die Bindung des Kindes an einen Elternteil?
  • Was ist der Kindeswille?
  • Wie groß ist die Förderkompetenz des Elternteils?
  • Liegt ein Mangel an erzieherischer Kompetenz vor?
  • Wendet ein Elternteil unzulässige Erziehungsmaßnahmen an?

 

Abschnitt 9.3 Verkehrspsychologische Diagnostik

 

Welche geistigen Anforderungen werden für eine Fahrerlaubnis zur Fahrgastbeförderung verlangt?

  • Belastbarkeit
  • Orientierungsleistung
  • Konzentrationsleistung
  • Aufmerksamkeitsleistung
  • Reaktionsfähigkeit

 

Anhand welcher Kriterien kann nach den Begutachtungsleitlinien zur Kraftfahrereignung beurteilt werden, dass ein Alkoholmissbrauch abgestellt wurde? Nennen Sie 3 Kriterien!

  • Das Alkoholtrinkverhalten wurde ausreichend geändert. Das kann Abstinenz bedeuten oder auch eine zuverlässige Trennung von Alkoholkonsum und Verkehrsteilnahme.
  • Die Änderung des Trinkverhaltens ist stabil und motivational gefestigt.
  • Die Lebensverhältnisse stehen einer Stabilisierung nicht entgegen.
  • Wenn eine „Persönlichkeitsproblematik“ vorlag, wurde diese erkannt und korrigiert.
  • Es liegen keine verkehrsrelevanten Leistungs- und Funktionsbeeinträchtigungen als Folge eines früheren Alkoholmissbrauchs mehr vor.

 

Warum ist in der verkehrspsychologischen Diagnostik oft mit Verfälschung zu rechnen, und wie kann man damit umgehen?

  • Die Klientinnen und Klienten sind bestrebt, einen „guten“ Eindruck zu hinterlassen, um den Führerschein (wieder) zu erlangen. Es kursieren viele Tipps zur Selbstdarstellung im Gespräch, und es gibt sogar Anbieter von Vorbereitungskursen.
  • Diskrepanzen zwischen verschiedenen Aussagen sowie zwischen verbalen Angaben und Verhalten oder Akteninformationen sprechen für Verfälschung.

 

Warum soll eine Aufzeichnung der Exploration im Rahmen einer medizinisch-psychologischen Untersuchung angefertigt werden, und welche Argumente sprechen für und gegen eine Tonaufnahme?

In der Fahrerlaubnisverordnung wird eine „Aufzeichnung“ über die Untersuchung vorgeschrieben. Über die Art der Aufzeichnung wird keine Aussage gemacht.

Für eine Ton- (oder Video-)Aufnahme sprechen:

  • Gutes Beweismittel bei einer Gerichtsverhandlung
  • Anwältin/Anwalt kann überprüfen, ob Klientin/Klient zu Recht behauptet, dass er in der Exploration etwas anderes gesagt hat, als im Gutachten steht
  • Wegen der begrenzten Objektivität von halbstandardisierten Interviews ist es wichtig, eine Überprüfungsmöglichkeit zu haben

Gegen eine Ton- (oder Video-)Aufnahme der Exploration wird u. a. aufgeführt:

  • Das Vertrauensverhältnis zwischen Untersucher und Klient kann gestört werden

 

 

zurück zur Inhaltsübersicht

Zurück zur Übersicht