Forschungsmethoden der Psychologie

Liebe Studierende, herzlich willkommen bei der Vorlesung zu den Forschungsmethoden der Psychologie. In dieser Vorlesung wird es um die psychologische Diagnostik gehen. Wir werden uns damit beschäftigen, in den Leitfragen, was psychologische Diagnostik ist und was dabei wichtig ist zu beachten. Wir werden uns vor allen Dingen mit den Gütekriterien beschäftigen und dann mit den unterschiedlichen Verhaltensmaßen und Beobachtungsformen und mit den sogenannten Selbstberichtsverfahren.

In der Vergangenheit gab es ja große Unstimmigkeiten darüber, ob das Innere bzw. die Erkenntnis oder das Erleben von Individuen überhaupt wissenschaftlich messbar sei. Ich habe Ihnen da ein paar Namen aufgeschrieben, die unterschiedlicher Meinung dazu waren. Zum Glück konnten aber von einigen dieser namhaften Vertretern der Psychologie gezeigt werden, dass dies dann doch möglich ist.

Trotzdem ist es natürlich mit einem großen Aufwand verbunden, gerade das Erleben von Individuen. Individuen in wissenschaftlichen Untersuchungen zu messen, da es ja meistens eben um das Innere geht, was nicht objektiv oder so leicht objektiv messbar ist. Darum kommt also der Diagnostik, die sich genau mit dieser Thematik beschäftigt, eine so große Rolle in der Wissenschaft zu. Hören wir einmal, was dazu der Leiter des Lehrgebiets zum Thema Diagnostik sagt. Jeder kann sich überlegen, wie er oder sie das Erleben und Verhalten von anderen Individuen messbar machen kann oder wie man es testen kann.

Allerdings können diese augenscheinlich ja eigentlich ganz guten Überlegungen sich mit den wissenschaftlichen Prinzipien nicht immer vergleichen oder nicht immer vergleichbar sein oder auch nicht gemessen werden. Deshalb müssen wissenschaftliche Tests bestimmte Kriterien erfüllen, um als brauchbar angesehen zu werden. Diese Kriterien werden auch als Gütekriterien bezeichnet, die ich Ihnen dann im Folgenden vorstellen möchte.

Es gibt als unterstes Gütekriterium sozusagen, wenn man sie sich hier hierarchisch vorstellt, die sogenannte Objektivität. Bei der Objektivität wird gefragt, ob der Test die Merkmalsausprägungen unabhängig vom Versuchsleiter misst. Es wird dann unterteilt in die sogenannte Durchführungsobjektivität, die Auswertungs-und die Interpretationsobjektivität.

Die Durchführungsobjektivität ist dann gegeben. wenn die Testdurchführung unabhängig vom Versuchsleiter ist. Das ist beispielsweise dann der Fall, wenn die Testinstruktionen verschriftlicht den Versuchspersonen vorgelegt werden.

Bei der Auswertungsobjektivität geht es darum, dass die Testauswertung möglichst objektiv ist, also unabhängig vom Versuchsleiter. Das ist dann zum Beispiel der Fall, wenn die Auswertung maschinell erfolgt. Und bei der Interpretationsobjektivität ist es so, dass diese dann möglichst oder dass die Interpretation...

Oder dass sie dann gegeben ist, wenn die Interpretation der Testergebnisse möglichst objektiv ist, also unabhängig vom Versuchsleiter. Das ist dann der Fall, wenn die Werte quantitativ sind, also wenn es Zahlenwerte gibt und wenn es für jeden Wert im Testmanual, also im Benutzerhandbuch von dem Test, eine Interpretation zu finden ist. So gibt es also meistens bei den Tests, die wissenschaftlich untersucht sind und beziehungsweise wissenschaftlich eingesetzt werden. sogenannte Therapiemanuale, an der man nachlesen kann, nicht nur wie dieser Test durchgeführt wird, sondern auch welche Gütekriterien und wie die Gütekriterien gemessen wurden.

Schauen wir uns das mal an bei den Aussagen zum Test zur habituellen subjektiven Wohlbefindensskala, kurz HWBS. Da geht es darum, dass gesagt wird, die HSWBS ist in ihrer Durchführung und Auswertung standardisiert und deshalb als objektiv einzuschätzen. Das heißt, es gibt sowohl bei der Durchführung als auch bei der Auswertung und Interpretation eine Standards und dementsprechend kann das als objektiv angesehen werden.

Das bedeutet, die haben also standardisierte Instruktionen, es wird standardisiert ausgewertet und auch interpretiert. Das bedeutet meistens, dass man sogenannte Cut-Offs-Werte hat. Also wenn man sagt, insgesamt kann man in diesem Test z.B.

einen Wert oder einen Summscore von 18 erreichen. Und bei einem Wert von über 11 liegt also ein sehr hohes subjektives Wohlbefinden vor. Und bei einem Wert von unter 6 liegt ein sehr schlechtes subjektives Wohlbefinden vor.

Sodass man genau sehen kann, wenn man jetzt einen Wert von 8 hat, dann würde man sagen, es liegt also ein normales subjektives Wohlbefinden vor. Wie sieht es aus beim nächsten Gütekriterium? Das Gütekriterium, das also etwas höher angesiedelt ist als die Objektivität, die darauf aufbaut, nämlich die sogenannte Reliabilität. Mit dem Begriff der Reliabilität ist die Messgenauigkeit gemeint. Also wenn wir uns morgens messen an mehreren Tagen hintereinander, sollten wir in der Reliabilität, Regel also die gleiche Zahl herausbekommen von unserer Körpergröße.

Wenn wir also keine Kinder sind, die dann gerade einen Wachstumsschub machen, sollte das also regelmäßig beim regelmäßigen Messen immer der gleiche Wert herauskommen. Das ist beim Messen von Körpergröße jetzt nicht ganz so erstaunlich, allerdings oder auch schwierig herauszubekommen. Wenn man einmal ein gutes Messgerät hat, dann sollte das also in der Regel sozusagen immer das gleiche anzeigen. Sie können sich das ein bisschen bei Wagen vorstellen, die immer wieder nachkalibriert werden müssen, dass ein Kilo auch wirklich ein Kilo ist.

Und genauso müssen Sie sich das bei psychologischen Tests eben auch vorstellen, dass da geguckt werden muss, wie zuverlässig misst der Test. Wenn ich ihn also einmal vorgebe, dann sollte also das Testergebnis ungefähr das gleiche sein, wie wenn ich ihn das nächste Mal nochmal vorgebe. Wie kann das jetzt gemessen werden?

Bei den meisten psychologischen Tests bestehen diese aus mehreren Fragen, mehreren Items nennt man das auch, und deren Antworten dann am Ende zu einem sogenannten Summenscore oder Gesamtwert aggregiert werden. Also meistens ist es so, dass dann die einzeln aufaddiert werden und durch die Anzahl der Items dividiert werden. Und da sollten dann eben immer die gleichen Werte rauskommen.

Die Reliabilität kann mit unterschiedlichen Modellen geschätzt werden. und beträgt in der Regel eine Zahl zwischen 0 und 1. Gute Intelligenztests erreichen Reliabilitäten von über Punkt 9 und gute Persönlichkeitstests Korrelationen oder Koeffizienten von über Punkt 8, sodass man also sehen kann, wenn bei diesen Testmanualen in der Beschreibung steht, der Wert ist über Punkt 8 bei Intelligenztests oder bei über Punkt 9 bei Intelligenztests und bei über Punkt 8 bei... Persönlichkeitstest, dann ist das eigentlich ein ganz guter Test, den man vorsetzen kann. Es gibt mehrere Methoden, wie gesagt, wie man diese Reliabilität messen kann, wie man schätzen kann.

Messen kann man es ja nicht so genau, schätzen kann man sie. Da gibt es aber die Split-Half-oder die Halbierungsmethode. Die wird so angewendet, dass also tatsächlich der Test oder die Fragen in zwei Teile geteilt werden.

Wenn man davon ausgeht, dass tatsächlich bei einem Test auch nur eine Sache abgefragt wird und wir zum Beispiel 20 Fragen haben. dann würden wir also entweder die Fragen 1 bis 10 versus Fragen 11 bis 20 nehmen, also die Scores, also die Summenwerte, gemittelten Summenwerte von den Items 1 bis 10 mit den Werten oder dem Summenscore, dem gemittelten Summenscore von den Items von 11 bis 20 miteinander vergleichen und die sollten ungefähr gleich sein. Man kann es aber auch so machen, dass man dann die Ungraden mit den Graden verbindet.

Das wird also auch häufig gemacht. Das Problem dabei ist, dass manchmal oder dass dann natürlich nur ein Test getestet wird, also der Test nochmal halbiert wird und dass der Test aber der gleiche bleibt. Besser ist es eigentlich, wenn man eine sogenannte, mithilfe einer Paralleltest-Reliabilität diese misst oder sie einschätzt. Bei einer Paralleltest-Reliabilität geht es darum, dass man tatsächlich zwei parallele Versionen von einem Test hat, das gibt es häufig, die man dann eben den gleichen Versuchspersonen vorliegt.

Und dann sollten also ungefähr die gleichen Werte rauskommen. Eine Verallgemeinerung dieser Halbierungsmethode oder der Paralleltestmethode ist die Messung der internen Konsistenz mit Kronbachs Alpha. Da werden dann sozusagen alle Items untereinander miteinander verglichen und es wird geguckt, inwieweit die Werte miteinander übereinstimmen. Bei der Retest-Reliabilität, da geht es vor allen Dingen bei Persönlichkeitstests darum, dass der gleiche Test häufig wiedergegeben wird.

Und dann muss natürlich aber genügend Zeit dazwischen sein, sodass sich die Versuchspersonen nicht mehr daran erinnern, was sie beim ersten Mal geantwortet haben, weil sonst ja auch der Effekt oder beziehungsweise dann Störfaktor mit reinkommt, dass sie also genauso antworten möchten, wie sie es beim ersten Mal getan haben, sodass also da dann keine richtige Schätzung für die Reliabilität mehr rumkommt. Schauen wir uns einmal an, wie das mit der Schätzung der Reliabilität bei der habituellen subjektiven Wohlbefindensskala ist. Hier steht für die HSWBS-Konten sehr gute Homogenitätskoeffizienten erzielt werden. Interne Konsistenz für die Skala Stimmungsniveau liegt bei Punkt 8.2 und für die Skala Allgemeine Lebenszufriedenheit liegt dies bei Punkt 8.8.

Und in der heterogenen Gesamtstichtprobe betrug die interne Konsistenz für die Skala Stimmungsniveau 0.83 und die Skala allgemeine Lebenszufriedenheit 0.87. Also, da es sich nicht um einen Intelligenztest handelt, sondern eher um einen Persönlichkeitstest, sind die Werte über 0.8. Dementsprechend handelt es sich um eine recht gute Reliabilitätsmesse.

Oder ist die Schätzung der Reliabilität für diesen Test ganz gut? Kommen wir zum dritten Hauptgüte-Kriterium, das sozusagen oben auf der Spitze sitzt. Das heißt, es ist sowohl abhängig von der Reliabilität als auch von der Objektivität.

Es ist die sogenannte Validation. Da würde ich ganz gerne einen kleinen Schlenker machen und zwar fragen, ob Sie den Begriff der Phrenologie kennen. Phrenologie ist die altertümliche Überzeugung von Franz Josef Gall um 1750, dass die Form des Schädels Auskunft und Aussagen über Persönlichkeitsmerkmale zulässt.

Also wenn ein Schädel besonders geformt ist, besonders ausgeprägt an einer bestimmten Stelle war, dann hatte also diese Person... Diese Persönlichkeitseigenschaft, die mit dieser Stelle verbunden war, besonders deutlich ausgeprägt. Da wird es so sein, dass die Objektivität ganz gut ist, weil wenn Sie mal im Internet sich umschauen, werden Sie da schöne Beschreibungen finden, wo genau welche Stelle ist.

Das heißt, Sie werden also objektiv eigentlich ganz gut sagen können, wenn eine Stelle gut ausgeprägt ist. Da wird es also unabhängig vom Versuchsleiter so sein, dass also... die Aussagen gleich sind, dass also wenn, jetzt sagen wir mal hier vorne ist, also die Persönlichkeit, also wenn ich eine ausgeprägte Stirn habe, habe ich eine große Persönlichkeit, dann würde das unabhängig vom Versuchsleiter so interpretiert werden können und auch diagnostiziert werden. Wenn ich jetzt mehr Gedanken mache über die Reliabilität von dieser Phrenologie, dann wäre das auch ganz gut, weil ja eigentlich meine Kopfform immer die gleiche bleibt. Das heißt also, wenn ich mehrmals hintereinander messen würde, in unabhängigen oder in unterschiedlichen Zeitspannen, auch dann würde ich immer das Gleiche rausbekommen.

Meine Stirn wird immer gleich ausgeprägt bleiben. Das heißt also, meine Persönlichkeit oder die Interpretation, dass meine Persönlichkeit tatsächlich sehr ausgeprägt ist, bleibt. Wie ist es aber jetzt mit der inhaltlichen Passung?

Es wurde also tatsächlich, erfreute sich zwar großer Beliebtheit in einer gewissen Zeit, diese Phrenologie, aber sie konnte nicht wissenschaftlich nachgewiesen werden. Und genau das ist eben dieses gute Kriterium der Validität, dass bei dem geguckt wird, misst der Test überhaupt das, was er messen soll. Bei der Phrenologie wäre das eben nicht der Fall. Aber Sie merken, wie so wichtig es ist, dass man sich damit beschäftigt und dass die Validität eigentlich das Wichtigste der Hauptgüte-Kriterien ist.

Wenn man das also auf die Phrenologie anwendet, misst diese Phrenologie wirklich die, oder misst die Schädelform wirklich die Persönlichkeit. Ich glaube, da können wir zusammenstimmend sagen, dass oder zusammensagen, dass das nicht so ist. Es werden unterschiedliche Formen der Validität voneinander unterschieben. Also dann gibt es zum einen die Inhaltsvalidität. Da geht es um das Ausmaß, in dem die Aufgaben des Tests das zu messende Konstrukt inhaltlich repräsentieren.

Das wird anhand von Aussagen von Experten eingeschätzt. Also wenn Experten sich lange Zeit mit einem Thema beschäftigen und sich dann einen Fragebogen, einen neu zu erstellenden Fragebogen oder einen neu erstellten Fragebogen anschauen, dann sollen die sagen, ob die Fragen tatsächlich dann dieses hypothetische oder theoretische Konstrukt gut repräsentieren, das abgefragt werden soll. Das ist natürlich recht schwierig, weil wann ist man ein Experte und bedenkt der Experte in dem Moment dann auch wirklich alles, was zu bedenken ist. Und auch wenn ein Experte meint, alles bedacht zu haben, kann es ja sein, dass in der Zukunft noch rauskommt, dass er etwas gar nicht beachtet hat, was damals noch gar nicht beachtenswert war. Dementsprechend ist das immer ein bisschen mit Vorsicht zu betrachten.

Außerdem muss bei der Inhaltsvalidität oder von der Inhaltsvalidität die Augenscheinvalidität unterschieden werden. Die Augenscheinvalidität ist die Akzeptanz eines Tests durch die Versuchsperson. Wenn ich Ihnen also jetzt einen Fragebogen vorlege und sage, das ist ein Fragebogen zum habituellen subjektiven Wohlbefinden, das sollte mittlerweile klar sein, dass es also dann ums Glücklichsein, theoretische Konstrukt des Glücklichseins geht, wenn ich Ihnen dann aber Fragen stelle wie, versuchen Sie möglichst viele... Zahlen nacheinander richtig wiederzugeben und je mehr Zahlen sie wiedergeben, desto besser ist ihr subjektives Wohlbefinden, dann werden sie in der Augenscheinvalidität sagen, das stimmt aber irgendwas nicht, das hat eigentlich eher was mit Intelligenz, denn mit subjektivem Wohlbefinden zu tun. Also die Augenscheinvalidität ist wichtig für die Versuchsperson, dass sie auch das Gefühl haben, dass wenn sie einen Test vor sich liegen hat, der etwas messen soll, dass auch er ihrer Meinung nach genau das misst.

ist was anderes als die Inhaltsvalidität. Bei der Kriteriumsvalidität handelt es sich um den Zusammenhang zwischen dem Testergebnis und einem Kriterium außerhalb der Testsituation. Zum Beispiel, inwieweit gibt es einen Zusammenhang zwischen dem subjektiven Wohlbefinden und dem Lachen.

Oder wenn man es etwas deutlicher macht, wie ist es mit dem Zusammenhang zwischen einem Intelligenztest und dem Schulzeugnis. Das wird häufig auch beachtet oder bewertet, gemessen. Was aber am meisten gemessen wird, ist eigentlich die Konstruktvalidität.

Bei der Konstruktvalidität. Geht es darum, inwieweit es einen Zusammenhang gibt zwischen alten und neuen Tests. Das heißt, es wird geguckt, wenn es bereits einen Test zum subjektiven Wohlbefinden geht, zum habituellen Wohlbefinden geht, und da eine Person sehr hohe Werte hat, dann sollte diese Person auch in dem neuen Test sehr hohe Werte haben. Das macht eigentlich Sinn. Oder wenn neue Depressionsfragebögen entwickelt werden, es gibt genügend Alte, die auch valide sind.

Und wenn die valide sind... und da eine Person ein niedriges Ergebnis hat, also sprich es geht ihr gut, dann sollte sie bei diesem neuen Test eben auch ein niedriges Ergebnis haben. Und dann könnte man davon ausgehen, dass der Test auch das misst, was er eigentlich messen soll, nämlich das subjektive Wohlbefinden, depressive Verstimmtheit oder was auch immer. Schauen wir uns einmal dazu dann die Aussagen an, bei der habituellen subjektiven Wohlbefindensskala. Da werden auch unterschiedliche Tests, die es bereits gibt, mit dieser neuen Skala verglichen oder mit dem neuen Test verglichen.

Einmal wird die Skala Lebenszufriedenheit des FPIR, eines Persönlichkeitstests, verglichen. Und da sieht man, dass es Korrelationen gibt von Punkt 7 bzw. Punkt 8. Mit einer anderen Skala bzw.

einem Fragebogen, General Health Questionnaire, gibt es auch Korrelationen von Punkt 5 und Punkt 6. Bei der allgemeinen Depressionsskala gibt es, also hoffentlich bzw. es gibt tatsächlich negative Korrelationen von Minus Punkt 5 und Minus Punkt 4. Natürlich sollte also, wenn man ein... Großes subjektives Wohlbefinden hat natürlich das Depressionsniveau sehr niedrig sein und umgekehrt.

Dementsprechend also eine negative Korrelation. Also das scheint ja auch der Fall zu sein, dass es also eine hohe oder eine gute Konstruktvalidität gibt. Das heißt also scheint dieser Test des habituellen subjektiven Wohlbefindens Gala sollte also eigentlich ganz gut anwendbar sein. Neben diesen sogenannten Hauptgütekriterien der Objektivität, der Reliabilität und der Validität gibt es auch sogenannte Nebengütekriterien, nämlich die Normierung und die Standardisierung. Bei der Normierung wird gefragt, ob es eine Vergleichsstichprobe gibt, an der das Ergebnis interpretiert werden kann.

Gibt es keine Normierung, das heißt keine Vergleichsstichprobe, kann also nicht hinreichend geklärt werden, wie die Werte der gemessenen Gruppe der Versuchspersonen interpretiert werden können. Nehmen Sie also einmal an, dass wir diese habituelle subjektive Wohlbefindensskala Personen mit einer diagnostizierten Depression vorgelegt haben. Wie können die dann mit einer Normgruppe, oder wie könnte es nicht sein, dass sich die Normwerte bei dieser Population verschieben und damit nicht vergleichbar sind?

Wenn also eine Normgruppe, die nicht nur oder die nicht aus psychisch Kranken besteht, dann ein Normwert hat. Das heißt also, Normwert wäre das, was sozusagen die Norm der gemessenen Gruppe als Mittelwert hat. Sagen wir mal, die hat einen Mittelwert von 8 und wir messen jetzt einen Mittelwert von 5 bei diesen diagnostizierten depressiven Personen.

Dann ist das nicht unbedingt miteinander vergleichbar. Deshalb ist es eigentlich wichtig, dass es eine Normierung gibt, um zu sehen, wie muss überhaupt dieser Wert interpretiert werden, wie darf dieser Wert nur interpretiert werden. Beim Nebengüte-Kriterium der Standardisierung handelt es sich um die Tatsache, dass der Test bei allen Personen in der gleichen Weise und unter den gleichen Bedingungen anzuwenden ist. Teilweise wird dies bereits durch die Durchführungsobjektivität angesprochen. Eine Standardisierung ist also eine Voraussetzung eigentlich für die Einhaltung der Objektivität bei dem Test.

Und wenn das so der Fall ist, also eine Objektivität und Standardisierung, dann können Sie sich vorstellen, warum es schwierig ist. Beziehungsweise nicht angeraten ist, dass man Tests an eigenen Familienmitgliedern durchführt. Klar, wenn es sich um sehr objektive Tests handelt, wo die Standardisierung sehr hoch ist, also wo ein Computer die Auswertung macht und die Interpretation anhand eines Therapiemanuals, anhand von quantifizierbaren oder quantifizierten Daten möglich ist, dann wird das noch am ehesten möglich sein. Also wenn Sie da sozusagen nicht mogeln können, aber wenn es sich um Interviews handelt, zum Beispiel, dann ist es schon sehr schwierig, dass man dann richtig interpretiert und dann nicht den sogenannten Rosenteileffekt dann doch zeigt. Bei der habituellen subjektiven Wohlbefindensskala liegen leider keine Normen vor, aber es wird gesagt, Was steht hier?

Das Stimmungsniveau und das allgemeine... Ne, wo sind wir? Das Stimmungsniveau und...

Ein bisschen größer und die allgemeine Lebenszufriedenheit mit der Gesamtschichtprobe korrelieren und nur geringfügig mit dem Alter korrelieren. Will jetzt gerade nicht. Es gibt Unterschiede zwischen Frauen und Männern, sodass man dann gucken kann, inwieweit ist da, also auf wen diese Stichprobe am besten, was die Normen angeht, anzutreten.

wenn ist, beziehungsweise was man dabei zu beachten hat bei der Anwendung und Interpretation der Daten. Kommen wir zu den Verhaltensmaßen und den Beobachtungsmaßen. Wir haben jetzt gerade über die Gütekriterien gesprochen, die gelten eben für für alle Tests, für alle Fragebögen, für alle Möglichkeiten, wie man Daten erwerben kann. Jetzt geht es darum, welche Möglichkeiten gibt es überhaupt, an diese theoretischen Konstrukte zu kommen.

Es gibt ja, die eigentlich ja nicht objektiv messbar sind oder beziehungsweise nur indirekt objektiv messbar sind, welche Möglichkeiten gibt es da der objektiven, indirekten, objektiven Datenerhebung und dann der direkten, subjektiven Datenerhebung. Es gibt einige Möglichkeiten, wie man die Daten möglichst objektiv versuchen kann zu erhalten. Da gibt es einmal die Möglichkeit der Verhaltensbeobachtung. Das ist also die tatsächliche Beobachtung des Verhaltens, zum Beispiel wie in unserem Beispiel des Tanzens und der Reaktion darauf, des Lächelns oder des Lachens.

Das heißt, Sie haben also... Es wird aufgenommen während des Tanzens. Das Tanzen wird aufgenommen und nachher wird es dann eingeteilt, oder wird sich nochmal angeguckt und dann eingeteilt in unterschiedliche Verhaltensmaße.

Das heißt, es wird also jedes Mal, wenn sie lächeln oder lachen, dann ein Strich gemacht bei der jeweiligen Kategorie, sodass sie nachher dann einen Summenwert haben von, wie oft hat derjenige gelächelt oder gelacht. Und das dann im Vergleich zu der Auswertung von Versuchspersonen, die zum Beispiel nur das Buch gelesen haben. Das ist die reine Verhaltensbeobachtung.

Die kann direkt oder indirekt sein. Direkt, indem man tatsächlich dann sagt, man sich daneben stellt und das beobachtet. Oder indirekt, wenn man das aufnimmt und nachher dann interpretiert. Unter natürlichen Bedingungen wäre dann, wenn man tatsächlich sich dann an die Tanzfläche stellt und dann zuguckt oder das aufnimmt und induziert wäre, wenn man die Leute dann ins Labor holt und sie dann tanzen lässt.

Dann gibt es die Verhaltensbeurteilung, da geht man dann einen Schritt als Versuchsleiter einen Schritt weiter und beurteilt das beobachtete Verhalten nach bestimmten eher abstrakteren Kriterien. So wird bei einer Verhaltensbeurteilung nicht mehr die Anzahl der einzelnen Lächler oder Lacher gemessen, sondern eventuell eine Einschätzung dazu abgegeben, wie gelöst oder glücklich eine Person aussieht. Und wie Sie sich vorstellen können, ist das schwer zu lernen und anzuwenden, sodass es möglichst objektiv ist, sodass also alle Versuchsleiter eigentlich zu einem gleichen Ergebnis kommen würden. Objektive Tests gibt es als objektive Datenerhebungen. Das sind Tests, die so gestellt werden, dass das Testergebnis nicht durch die Versuchsperson verfälscht werden kann.

So wird das unmittelbare Verhalten in einer Standardsituation erfasst, wie zum Beispiel in Intelligenztests, bei denen Aufgaben erledigt werden müssen, also zum Beispiel Zahlen in einer immer länger werdenden Reihenfolge aufgesagt werden müssen. Das kann man natürlich zum Schlechten hin manipulieren, aber nicht zum Besseren. Und auch wenn es zum Schlechten geht, dann würde man das als geschulter Versuchsleiter natürlich merken.

Auch die psychophysiologische Diagnostik kann Einblicke in das Erleben und Verhalten eines Individuums geben, da davon ausgegangen wird, dass bestimmte organismische Variablen damit ko-variieren. Also man geht zum Beispiel davon aus, dass mithilfe einer der Messungen der Hautleidfähigkeit man messen kann, inwieweit eine Person gestresst ist, da der Hautleidwiderstand abzielt. Wenn man gestresst wird, dann ist es ja meistens so, dass man anfängt zu schwitzen.

Beim Schwitzen der Hautleidwiderstand sinkt. Das heißt also, man geht davon aus, wenn man schwitzt, dass man gestresst ist. Und wenn man misst, dass der Hautleidwiderstand sinkt, dass also schneller ein Stimulus oder eine Reaktion gemessen wird, also dass schneller weitergeleitet wird über die Haut, dann kann man davon ausgehen, dass diese Person eben gestresster ist.

Das ist natürlich sehr objektiv, weil es nur unter ganz bestimmten Bedingungen veränderbar ist und eigentlich eher nicht verändert werden kann, diese psychophysiologischen Daten. Ich will jetzt nicht sagen, dass es gar nicht geht, es gibt Ausnahmen, aber es ist sehr, sehr schwierig und unter normalen Umständen eigentlich wird das nicht angewendet. Im Gegensatz zu diesen objektiven Verfahren, die ja meistens nur indirekt das Erleben und Verhalten oder gerade das Erleben messen können, das Verhalten natürlich schon eher.

geht es, wenn es um das Erleben geht, natürlich nur mit Hilfe von sogenannten subjektiven Verfahren, das heißt also Verfahren, die von innen heraus arbeiten. Die setzen dann im Gegensatz zu objektiven Verfahren, bei denen es dann um einen Versuchsleiter auch immer geht, bei den Versuchspersonen selber an und benötigen also nicht unbedingt ein Gegenüber. Das heißt, man kann also diese subjektiven Verfahren zum einen zwar mit einem Versuchsleiter anwenden, man kann sie aber auch ohne Versuchsleiter anwenden.

Bei gewissen Interviews muss das sogar mit Versuchsleiter sein, aber es gibt eben die meisten auch, die ohne Versuchsleiter durchgeführt werden können. Interviews sind die am häufigsten eingesetzten diagnostischen Instrumente in der psychologischen Berufspraxis. Es handelt sich hierbei um zielgerichtete Gespräche zwischen Versuchsleiter und Versuchsperson, die meistens im Rahmen eines halbstrukturierten Interviews gegeben werden.

Es werden Themen oder Fragen vorgegeben, die auf jeden Fall gestellt werden müssen, aber es gibt dann eben immer noch die Möglichkeit zu nachfragen. Das ist also einer der Gründe bei diesen halbstrukturierten Interviews, wo die Versuchsleiter auf jeden Fall anwesend sein müssen, um eben die Fragen zu stellen und gegebenenfalls Nachfragen zu stellen. Wenn es allerdings sich um Fragebögen handelt, das ist also die zweite Möglichkeit der subjektiven Verfahren, da...

Da gibt es gar keine Möglichkeit für Nachfragen, sondern es werden in der Regel Aussagen mit quantifizierbaren Werten versehen. So kennen das wahrscheinlich alle bei Evaluationen. Der Kurs hat mir gefallen, stimme sehr zu, stimme etwas zu, stimme nicht zu, stimme gar nicht zu.

Und das sind also die sogenannten Rating-Skalen. Da brauchen Sie eigentlich keinen Versuchsleiter, der dann hinter Ihnen steht und Ihnen erklärt, was Sie machen müssen, sondern das können Sie ja dann auch alleine machen, beziehungsweise bei Fragebögen ja, nein ankreuzen. Oder dann eventuell auch mal was dann dazu schreiben. Das können Sie auch alleine machen.

So, das sind also die Selbstberichtsverfahren. Schauen wir uns einmal an, wie das mit einem Beispiel in der Praxis aussieht. Wir haben gerade also an dem praktischen Beispiel gesehen, wie die theoretischen Inhalte der Vorlesungen angewendet werden können. Nochmal ganz kurz zum Rekapitulieren anhand der Leitfragen. Was ist psychologische Diagnostik und was ist dabei wichtig zu beachten?

Welche Gütekriterien gibt es? Es gibt die drei Hauptgütekriterien der Objektivität, der Reliabilität und der Validität, die aufeinander aufbauen. Dann gibt es die beiden Nebengütekriterien der Normierung und der Standardisierung.

Bei den Verhaltensmaßen und Beobachtungsformen konnten wir zwischen der Verhaltensbeobachtung, der Verhaltensbeurteilung, den objektiven Tests und den psychophysiologischen Diagnostiken unterscheiden. Und bei den Selbstberichtsverfahren. haben wir die Interviews und die Fragebögen kennengelernt.

Bis zum nächsten Mal. Auf Wiedersehen.

Transcript for:Forschungsmethoden der Psychologie

Transcript for:
Forschungsmethoden der Psychologie