300 Sozialwissenschaften
Refine
Document Type
- Doctoral Thesis (5) (remove)
Has Fulltext
- yes (5)
Is part of the Bibliography
- no (5)
Keywords
- Alignment (1)
- Bildungsarbeit (1)
- Cognitive Interviews (1)
- Cross-cultural Comparability (1)
- Einstellungen (1)
- Evaluation (1)
- Fragebogenentwicklung (1)
- Gerontologie (1)
- Measurement Invariance (1)
- Teaching Quality (1)
Institute
- Psychologie und Sportwissenschaften (5) (remove)
Measuring teaching cross-culturally - the issue of measurement invariance and sources of bias
(2021)
Im Kontext der Globalisierung nimmt das Interesse daran, Unterricht vergleichend zwischen Bildungssystemen der ganzen Welt zu untersuchen, kontinuierlich zu (Paine et al., 2016). Unterricht ist einer der stärksten Prädiktoren für Lernergebnisse von Schülerinnen und Schülern (Hattie, 2009). Folglich bieten internationale Vergleiche die einmalige Möglichkeit von besonders erfolgreichen Bildungssystemen zu lernen und geben Auskunft über die Generalisierbarkeit beziehungsweise über die kulturellen Variationen von Unterricht und dessen Wirksamkeit. Gleichzeitig sind sie richtungsweisend für bildungspolitische Entscheidungen (Klieme, 2020). Zur Erfassung von Unterrichtsmerkmalen aus der Perspektive der beteiligten Lehrkräfte und Schülerinnen und Schüler werden häufig Fragebögen in internationalen Schulleistungsstudien eingesetzt. Erste empirische Befunde weisen jedoch daraufhin, dass die Fragebogenskalen oftmals nicht messinvariant sind (z.B. Desa, 2014; He & Kubacka, 2015; Nilsen & Gustafsson, 2016). Das bedeutet, dass Unterschiede in den Messwerten zwischen Bildungssystemen nicht automatisch genuine Unterschiede im gemessenen Konstrukt, wie beispielsweise Unterschiede in der Klassenführung, reflektieren. Stattdessen entstehen diese teilweise durch nicht intendierte kulturelle Variationen im Antwortprozess (Bias), beispielsweise durch kulturelle Unterschiede in der Bedeutung der Items zur Messung von Klassenführung oder durch kulturspezifische Antworttendenzen (van de Vijver & Leung, 1997). Eine fehlende Messinvarianz hat folgenreiche Konsequenzen, da valide (Mittelwerts-)Vergleiche von Unterrichtsmerkmalen zwischen Bildungssystemen nicht möglich sind und somit die umfangreichen Datensätze internationaler Studien nicht ausgeschöpft werden können (Davidov et al., 2018a). Dennoch mangelt es in der international vergleichenden Bildungsforschung bisher an empirischen Studien, die mit fortgeschrittenen Analysemethoden die Messinvarianz von Unterrichtsmerkmalen prüfen, sowie an empirisch-fundierten Erkenntnissen zu den Ursachen der oftmals fehlenden Invarianz. Mit einer Kombination aus quantitativen und qualitativen Methoden widmet sich die vorliegende Dissertation in drei Beiträgen der Aufarbeitung dieser Forschungslücke. Sie konzentriert sich auf Fragebogenskalen zur Messung von zwei generischen Unterrichtsmerkmalen aus der Perspektive von Schülerinnen und Schülern, der Unterrichtsqualität mit den Dimensionen Klassenführung, konstruktive Unterstützung und kognitive Aktivierung und den Unterrichtsmethoden mit den Dimensionen lehrerzentrierte und schülerzentrierte Methoden und Methoden des Assessments.
Beitrag I prüft die Messinvarianz von PISA Skalen zur Erfassung der drei Basisdimensionen der Unterrichtsqualität zwischen 15 Bildungssystemen. Zusätzlich wird untersucht, ob die kulturelle Ähnlichkeit (operationalisiert als ähnliche oder identische Sprache) der Bildungssysteme einen Einfluss auf das Ausmaß der Messinvarianz besitzt. Da die Modellannahmen der häufig eingesetzten konfirmatorischen Faktorenanalyse zunehmend als zu strikt für Messinvarianzprüfungen im interkulturellen Kontext kritisiert werden (Rutkowski & Svetina, 2014), wird mit Alignment (Asparouhov & Muthén, 2014) eine flexiblere und angemessenere Methode verwendet. Dennoch erreichen die drei Basisdimensionen nur metrische (identische Faktorenladungen) und nicht skalare Invarianz (identische Intercepts) zwischen den 15 Bildungssystemen. Folglich sind valide Vergleiche von Mittelwertsunterschieden in der Unterrichtsqualität zwischen den 15 Bildungssystemen nicht möglich. Innerhalb der fünf Cluster, bestehend aus jeweils drei Bildungssystemen mit ähnlicher oder identischer Sprache, wird im Gegensatz dazu skalare Invarianz bestätigt. Die Ergebnisse aus Beitrag I legen nahe, dass die untersuchten Fragebogenskalen zur Messung von Unterrichtsqualität unterschiedlich zwischen Bildungssystemen funktionieren. Eine höhere Vergleichbarkeit scheint jedoch mit einer kulturellen und sprachlichen Ähnlichkeit der Befragten einherzugehen. Wird diese Ähnlichkeit bei der Analyse berücksichtigt, sind valide Vergleiche von Mittelwertsunterschieden für eine Teilmenge an Bildungssystemen mit invarianter Messung möglich.
Beitrag II knüpft an Ergebnisse aus Beitrag I an und untersucht potenzielle Ursachen der fehlenden Invarianz. Der Fokus liegt auf kulturellen Variationen im Antwortprozess, die zu einer eingeschränkten Datenvergleichbarkeit führen können (z.B. Schwarz et al., 2010). Beitrag II konzentriert sich auf die erste und zweite Stufe des Antwortprozesses, der Item-Interpretation und der Assoziation des Item-Inhaltes mit persönlichen Erfahrungen (Tourangeau, 1984). Mit Hilfe von kognitiven Interviews wird untersucht, wie Schülerinnen und Schüler aus China (Shanghai) und Deutschland PISA Items zur Messung konstruktiver Unterstützung interpretieren und welche Unterrichtserfahrungen sie mit den Items assoziieren. Die Ergebnisse der strukturierenden qualitativen Inhaltanalyse nach Kuckartz (2018) zeigen zwar, dass sowohl chinesische als auch deutsche Schülerinnen und Schüler die Items mehrheitlich mit Unterrichtsmethoden assoziieren, die zur Kompetenzunterstützung beitragen (beispielsweise Methoden zur Beseitigung von Verständnisproblemen). Es zeigen sich jedoch auch deutliche interpretative Variationen, sowohl für statistisch nicht messinvariante (nicht vergleichbare) Items als auch für messinvariante (vergleichbare) Items. Diese können zum einen auf Eigenschaften der Messung zurückgeführt werden. Hierzu zählt eine unterschiedliche Übersetzung des Terms Lernen (in Deutschland Lernfortschritt in China Lernstand). Zudem finden sich Hinweise, dass komplexe und uneindeutige Itemformulierungen mehr Spielraum für kulturspezifische Interpretationen zulassen. Die zweite Ursache der interpretativen Variationen ist ein unterschiedliches Verständnis von konstruktiver Unterstützung, das durch kulturelle Unterschiede in der Unterrichtsgestaltung und -zielsetzung erklärt werden kann (Leung, 2001). Neben der Kompetenzunterstützung assoziieren die deutschen Schülerinnen und Schüler die Items mehrheitlich mit Methoden zur Unterstützung ihrer Autonomie und ihres sozial-emotionalen Erlebens im Unterricht, wohingegen die chinesischen Schülerinnen und Schüler die Items mehrheitlich mit Methoden zur Unterstützung ihrer akademischen Produktivität (z.B. ihrer Aufmerksamkeit) assoziieren. Die Ergebnisse aus Beitrag II legen nahe, dass die Interpretation von Fragebogenitems variieren kann, je nach dem in welchem kulturellen Kontext die Frage gestellt wird. Sie betonen zudem, dass quantitative und qualitative Methoden miteinander kombiniert werden sollten, um verlässliche Information über die interkulturelle Vergleichbarkeit von Fragebogenitems zu erhalten ...
Die vorliegende Arbeit beschäftigt sich mit der außerhäuslichen Alltagsmobilität älterer Menschen, die eine zentrale Schlüsselfunktion in der Erhaltung von Lebensqualität und Gesundheit besonders im höheren Lebensalter einnimmt. Außerhäusliche Alltagsmobilität vollzieht sich stets in einem räumlichen Umweltausschnitt und kann aus ökogerontologischer Perspektive als Ergebnis eines gelungenen Person-Umwelt-Austauschs verstanden werden. Inwiefern psychologische Ressourcen im Sinne mobilitätsspezifischer Einstellungen zum Verständnis von zielgerichteter und habitualisierter Alltagsmobilität älterer Menschen beitragen können, ist Gegenstand der vorliegenden Arbeit. Altersspezifische, mobilitätsrelevante Einstellungen im außerhäuslichen Kontext werden sowohl in der sozialwissenschaftlichen Mobilitäts- und Alternsforschung als auch in der Praxis, etwa im Rahmen einer altersgerechten Stadtgestaltung, bislang noch zu wenig berücksichtigt. Die vorliegende Arbeit reagiert auf dieses Forschungsdesiderat, indem sie mobilitätsspezifische Einstellungen im höheren Lebensalter konzeptuell beschreibt, in den Kontext ökogerontologischer Theorien einbettet und ihre Bedeutung für den Erhalt eines aktiven und gelingenden Alterns untersucht. Im Rahmen der Dissertation wurde zunächst auf der Basis klassischer und neuer ökogerontologischer Modelle das Konstrukt der mobilitätsbezogenen Handlungsflexibilität und Routinen (MBFR) konzeptuell entwickelt. MBFR umfasst einerseits die individuelle Überzeugung, das eigene Mobilitätsverhalten an Herausforderungen außer Haus anpassen zu können (FLEX) und andererseits die Präferenz für mobilitätsbezogene Alltagsroutinen (ROU). Daraufhin wurde ein standardisiertes Messinstrument zur Erfassung des MBFR-Konzepts entwickelt, optimiert und hinsichtlich seiner psychometrischen Qualität untersucht. Die Formulierung der Testitems erfolgte in Anlehnung an bereits existierende Fragebögen zu verwandten Konstrukten. In der vorwiegend online durchgeführten Pilotstudie (Penger & Oswald, 2017) wurden die Items mittels explorativer Faktorenanalysen hinsichtlich ihrer dimensionalen Struktur untersucht. Die Stichprobe umfasste 265 Personen im Alter von 65 Jahren oder älter. Die Analysen des MBFR-Instruments ergaben nach Ausschluss von Items mit niedrigen und nicht eindeutigen Ladungen drei substanzielle Faktoren. Die Items der ersten Dimension bildeten die Überzeugung ab, flexibel mit personenbezogenen, altersassoziierten Herausforderungen (z. B. Schwierigkeiten im Gehen oder auf eine Gehhilfe angewiesen sein) umgehen zu können, um außerhäuslich mobil zu sein. Die Items der zweiten Dimension erfassten die Überzeugung, flexibel mit herausfordernden außerhäuslichen Umweltbedingungen (z. B. eine verlegte Haltestelle oder ein schlechter Zustand der Gehwege) umgehen zu können. Items, die auf den dritten Faktor luden, bildeten die Neigung zu Routinen im Mobilitätsalltag ab, z. B. bekannte Wege beizubehalten oder bei der Ausübung von außerhäuslichen Aktivitäten vertraute Orte aufzusuchen. Während die ersten beiden Faktoren mobilitätsbezogene Handlungsflexibilität (FLEX) messen, werden im dritten Faktor habitualisierte Verhaltensweisen (ROU) erfasst. Alle drei Faktoren wiesen eine akzeptable Reliabilität auf. Auf Basis von Rückmeldungen der Studienteilnehmer:innen wurde das MBFR-Instrument anschließend sprachlich angepasst und gekürzt. Der modifizierte Fragebogen wurde daraufhin in der empirischen Studie „MOBIL bleiben in Stuttgart“ (MBIS) eingesetzt. Dabei sollte die Frage beantwortet werden, ob das finale MBFR-Instrument die zugrundeliegenden Konstrukte valide und reliabel erfasst und die Testwerte somit ausreichende Gültigkeit hinsichtlich faktorieller, Konstrukt- und Kriteriumsvalidität bei älteren Menschen im urbanen Raum aufweisen (Penger & Conrad, eingereicht). Es wurden insgesamt 211 privatwohnende Stuttgarter:innen ab 65 Jahren in persönlichen Interviews und mithilfe eines 7-tägigen Wegetagebuchs zu verschiedenen Aspekten ihrer Mobilität im Wohnumfeld befragt. Statistische Analysen auf latenter Ebene erfolgten mittels Strukturgleichungsmodellen. Bivariate Zusammenhänge und Subgruppenanalysen wurden mittels Korrelations- und Regressionsanalysen berechnet. Die dreifaktorielle Struktur des MBFR-Fragebogens konnte im konfirmatorischen Modell empirisch bestätigt werden. Zudem fiel die interne Konsistenz aller drei Faktoren gut aus. Zusammenhänge zu konstruktverwandten Merkmalen – wie allgemeine und mobilitätsspezifische Einstellungen – deuten darauf hin, dass das MBFR-Instrument ausreichend konvergente Validität aufweist. Analysen auf latenter Ebene ergaben, dass Befragte durchschnittlich mehr außerhäusliche Wege zurückzulegten, wenn sie in stärkerem Maße überzeugt waren, flexibel auf mobilitätsbezogene Herausforderungen reagieren zu können (FLEX). Weiterhin ließen sich positive Zusammenhänge zwischen FLEX und der erlebten Selbstständigkeit sowie dem subjektiven Wohlbefinden aufzeigen. Die Befunde belegen somit hinreichende Übereinstimmungsvalidität der Testwerte. Differenzierte Analysen machten darüber hinaus deutlich, dass FLEX vor allem bei Befragten mit Mobilitätseinschränkungen bedeutsam zur Vorhersage des außerhäuslichen Mobilitätsverhaltens beitrug. ...
Kinder aus zugewanderten Familien und aus den unteren Sozialschichten haben es an deutschen Schulen schwer. Zu ihrer Unterstützung werden vielfältige Fördermaßnahmen angeboten. Welche Art der Förderung insbesondere Familien mit Migrationshintergrund benötigen, wird in der vorliegenden Schrift besprochen.
Zur Beantwortung dieser Frage wurde ein Familien-Bildungsprogramm - mittels qualitativer und quantitativer Erhebungsmethoden - evaluiert. In dem Programm werden Familien über die Dauer von zwei Jahren (im Übergang von der 4. in die 5. Klasse) eng begleitet. Das vielfältige Unterstützungsangebot ist dahingehend ausgerichtet, die teilnehmenden Kinder auf ihrem schulischen Weg zu unterstützen. Ebenso möchte das Programm zur Erhöhung der gesellschaftlichen Teilhabe der Familien beitragen.
Erhebliche Leistungsfortschritte erreichen fast alle Kinder im Kompetenzbereich Lesen. Besonders die leistungsschwächeren Kinder haben von der Förderung profitiert. Auch die Rechtschreibkompetenzen haben sich im Schnitt verbessert. Das schulbezogene Fähigkeitsselbstkonzept der Kinder sowie ihre Lern- und Leistungsmotivation bleibt von der Förderung relativ unbeeinflusst. Die Eltern profitieren insbesondere von dem Zugewinn einer konstanten Ansprechperson. Es gelingt den Mitarbeiterinnen ein Stützungs-Setting aufzubauen, welches den Eltern Sicherheit vermittelt und sie zuversichtlicher werden lässt. Daneben wurde eine Reihe differentieller Wirksamkeiten ermittelt (wie Entlastung, Aktivierung, Qualifizierung). Das Ausmaß der Wirksamkeit wird durch spezielle Bedingungen - auf Seite der Teilnehmer und auf Seite der Ausführenden - moderiert.
Die vorliegenden Ergebnisse werden mit Bezug auf Implikationen für die Praxis (in Schulen und Bildungsprogrammen) diskutiert.
Bindung bildet in der Erforschung langfristiger psychosozialer Entwicklung ein zentrales Konstrukt. In Bezug auf die Phase der mittleren Kindheit liegt dabei jedoch oft eine eingeschränkte Forschungsperspektive vor: dem Konzept der Monotropie folgend, wird trotz des wachsenden sozialen Umfelds allein Eltern eine besondere Aufmerksamkeit in ihrer Rolle als Bindungsfiguren zugeordnet. Zudem fehlen Studien jenseits westlich-europäischer Entwicklungsverläufe. Ziel der vorliegenden Arbeit ist die explorative Erforschung der transkulturellen Spannbreite und der kontextspezifischen Adaptivität in der Auswahl und Funktionalität von Bindungsfiguren der mittleren Kindheit. Dazu werden Daten in zwei ökokulturell gegensätzlichen Settings erhoben, um kontextspezifische und globale Trends betrachten zu können.
Zunächst erfolgt eine ethnologische Annäherung an die frühste Kindheit im kamerunischen Setting der Nseh entlang des Tragetuchs als zentralem Care-Objekt. Diese offenbart eine symbiotische Beziehungsgestaltung, aber auch strenge Regeln des Aufbaus und der Abgrenzung im geteilten Care-System.
Anschließend wird eine methodische Strategie zur Erforschung der mittleren Kindheit entwickelt, die eine Netzwerkperspektive beinhaltet und der kindlichen Wahrnehmung folgt. Dabei werden teilnehmende Beobachtungen mit Photo Elicitation Interviews verbunden, um das vollständige Kollektiv der Bindungsfiguren zu identifizieren und in ihren soziostrukturellen und funktionellen Eigenschaften zu charakterisieren. Indem das Setting zum inhärenten Teil der Datenerhebung wird, werden dabei adaptive Prozesse zugänglich.
In Umsetzungen dieser kontextualisierend explorativen Strategie bei den kamerunischen Nseh und im deutschen Bad Nauheim werden die Bindungsnetzwerke der mittleren Kindheit erfasst und in ihrer Adaptivität diskutiert. Der Kontrastvergleich offenbart, dass die Kinder der Nseh im Vergleich zu den Kindern aus Bad Nauheim in der Altersstruktur vielfältigere, räumlich enger begrenzte und zeitlich stabilere Netzwerke beschreiben. In beiden Settings identifizieren die Kinder eine Aufteilung der inhaltlich-funktionelle Verantwortlichkeiten, die bei den Nseh gemäß den Altersgruppen verläuft.
Insgesamt zeichnet sich für die mittlere Kindheit ein komplexes Bindungsumfeld ab. Dabei verbinden sich settingspezifische Kindheitsbedingungen mit globalen Entwicklungsthemen. Das mehrdimensionale kindliche Sicherheitsgefühl kann auf die Wirkung eines Kollektivs an Bindungsfiguren zurückgeführt werden, zu dem kontextunabhängig in einem bedeutsamen Ausmaß auch Peers gehören.
Das Ziel der vorliegenden publikationsbasierten Dissertation liegt darin, ein Erhebungskonzept zu entwickeln, das es erlaubt, ICT-Skills – das heißt Fertigkeiten für das Lösen von Aufgaben in einer Informations- und Kommunikationstechnologie-Umgebung – theoretisch fundiert zu erheben sowie die Validität der intendierten Testwerteinterpretation empirisch zu untersuchen. Die Testwerte sollen als ICT-spezifische Fertigkeiten höherer Ordnung interpretiert werden.
Für die Erfassung von ICT-Skills kann auf keine lange Forschungstradition zurückgegriffen werden. Daher ist es das Ziel der ersten Arbeit, eine Rahmenkonzeption zur Messung von ICT-Skills zu erstellen. Dabei werden drei Ziele verfolgt: Erstens soll für die Itementwicklung spezifiziert werden, auf welchen generischen und ICT spezifischen Fertigkeiten ICT-Skills basieren. Mithilfe etablierter psychologischer Theorien aus den relevanten Fertigkeitsbereichen werden kognitive Schwierigkeiten bei der Bewältigung von ICT-Aufgaben beschrieben, die als Grundlage für die Entwicklung der Items dienen. Zweitens werden für die Implementierung der Items Rationale für deren Erstellung in einer simulationsbasierten Umgebung formuliert, die es erlauben sollen, die intendierten kognitiven Prozesse realitätsnah in den Items abzubilden. Obgleich diese Arbeit einen konzeptionellen Fokus hat, besteht das dritte Ziel darin, die Rahmenkonzeption empirisch zu erproben, um zu beurteilen, ob die Rahmenkonzeption zur Itementwicklung und -implementierung geeignet war.
Aus der Rahmenkonzeption, die ein breites Spektrum relevanter ICT-Aufgaben für die Erfassung sowie eine simulationsbasierte Erhebung vorsieht, resultieren sehr heterogene Items. Deshalb unterscheiden sich ICT-Skills-Items von eher homogenen Itempools, wie sie typischerweise zur Erfassung von Konstrukten der psychologischen Leistungsdiagnostik, etwa zur Intelligenzdiagnostik, verwendet werden. Aus diesem Grund ist für die Konstruktvalidierung der Testwerteinterpretation, die das Ziel der zweiten und dritten Arbeit darstellt, zunächst konzeptionelle Forschungsarbeit nötig, um angemessene Validierungsstrategien für heterogene Items zu entwickeln. Diese in der zweiten und dritten Arbeit erforderlichen konzeptionellen Beiträge bedingen die Struktur dieses Rahmentextes, in dem zunächst die konzeptionellen Beiträge aller drei Arbeiten vorgestellt und anschließend alle empirischen Ergebnisse berichtet werden. Die konzeptionellen Entwicklungen für die Validierung der intendierten Interpretation der Testwerte orientieren sich an Vorgehensweisen der psychologischen Leistungsdiagnostik, der nomothetischen Spanne und der Konstruktrepräsentation (vgl. Embretson, 1983). Mit diesen wird untersucht, inwiefern sich die zentralen Annahmen der Rahmenkonzeption aus der ersten Arbeit, nämlich die bei der Aufgabenlösung involvierten Fertigkeiten und kognitiven Prozesse, in den Testwerten widerspiegeln.
Das Ziel der zweiten Arbeit besteht darin, die nomothetische Spanne von ICT-Skills zu untersuchen und den postulierten Zusammenhang mit generischen und ICT-spezifischen Fertigkeiten empirisch zu untersuchen. Neben dem klassischen Ansatz, der Zusammenhänge über alle Items hinweg betrachtet, wird das Zusammenspiel verschiedener Fertigkeiten auch auf Itemebene analysiert. Darüber hinaus sollen potentielle Variationen in den Zusammenhängen über die sehr heterogenen Items durch Merkmale erklärt werden, welche für diese Heterogenität bezeichnend sind. Die empirischen Ergebnisse dienen – basierend auf den in der Rahmenkonzeption definierten Fertigkeiten – als Evidenzen für die Validität der Testwerteinterpretation.
Das Ziel der dritten Arbeit ist es, die Konstruktrepräsentation zu untersuchen, indem Evidenzen für die intendierten kognitiven Prozesse in der Itembearbeitung gesammelt werden. Klassischerweise werden in homogenen Itempools Itemmerkmale zwischen Items verglichen und wenn möglich quantifiziert, um die Schwierigkeit in Items zu beschreiben. Da die Items sehr heterogen sind, wurden zwei experimentelle Ansätze entwickelt, die diese kognitiven Prozesse in Itemvarianten verändern oder eliminieren. Die Auswirkungen dieser Manipulationen werden in Bezug auf die Itemschwierigkeit und den Zusammenhang mit anderen Konstrukten untersucht. Verändert werden die in der Rahmenkonzeption abgeleiteten schwierigkeitsdeterminierenden Merkmale, um zu untermauern, dass die ICT Skills Items ICT-spezifische Fertigkeiten erfordern. Eliminiert werden alle Merkmale die Fertigkeiten höherer Ordnung erfordern sollten. Mit diesen experimentellen Strategien können die zentralen Punkte der intendierten Testwerteinterpretation untersucht werden.
Neben den empirischen Ergebnissen zur Untermauerung der intendierten Testwerteinterpretation für den entwickelten ICT-Skills-Test ist der Erkenntnisgewinn dieser Arbeit auch in den konzeptionellen Beiträgen zu sehen. Mit diesen wurde exemplarisch gezeigt, wie ein Konstrukt wie ICT-Skills erfasst werden kann, indem man sich an den Vorgehensweisen der psychologischen Leistungsdiagnostik orientiert und dabei auf Annahmen kognitiver Prozesse zurückgreift.