Neuromythen: Phänomen und Diskussionskontexte
Der Begriff Neuromythen kennzeichnet falsche bzw. durch Vereinfachung verfälschte Darstellungen neurowissenschaftlicher Forschungsergebnisse im wissenschaftlichen Diskurs, in der öffentlichen Wahrnehmung und in pädagogischen Praxisfeldern (Clark, 2015). Das Missverstehen oder Vernachlässigen grundlegender Prinzipien wissenschaftlichen Forschens sowie Unsicherheiten im Umgang mit (neuro-) wissenschaftlichen Erkenntnissen können begünstigen, dass diese verkürzt dargestellt, falsch interpretiert oder fehlerhaft aufgefasst und vermittelt werden. Das Phänomen zeigt nach Vidal und Müller (2018) drei Perspektiven: Zum einen sind Neuromythen kulturell verankerte, „weit verbreitete Annahmen und Vorurteile über das Gehirn und seine Arbeitsweise“ (S. 82), die aufklärerisch wirken wollen und sich „gegen gesellschaftliche und alltagsweltliche Vorurteile“ (S. 84) richten; zum zweiten sind mit diesem Begriff „Fehldeutungen, Überinterpretationen oder Simplifizierungen neurowissenschaftlicher Wissensbestände und Forschungsergebnisse“ (S. 83) bezeichnet, die eine Grenze „zwischen Wissenschaft und Nicht-Wissenschaft“ (S. 84) ziehen; und zum dritten werden Neuromythen mit „überzogenen Deutungsansprüchen der Neuro- und Kognitionswissenschaften assoziiert, die zur Mythenproduktion beitragen“ (S. 83), um „zwischen unterschiedlichen Wissenschaften und Wissenschaftsverständnissen“ (S. 84) zu differenzieren. Diese Begriffsfacetten finden sich in wissenschaftlichen, pädagogischen und journalistisch-publizistischen Kontexten wie auch im alltäglichen Sprachgebrauch und verdeutlichen die weite Verbreitung von Neuromythen sowie damit verknüpfte Anwendungsorientierungen. Zu den bekanntesten musikbezogenen Fehlvorstellungen neuro- und kognitionswissenschaftlicher Befunde zählt der weithin rezipierte und problematisierte Mozart-Effekt, der eine temporäre Leistungssteigerung in standardisierten Intelligenztests (räumliches Vorstellungsvermögen) durch Musikhören nahelegt (Rauscher et al., 1993). Zahlreiche Replikationen zeigen jedoch lediglich kleine Effekte und keinen Einfluss bestimmter Musikstücke oder -stile (Pietschnig et al., 2010).1
Gängige Bezeichnungen wie Neuropädagogik, Neurodidaktik, Neuroeducation oder Educational Neuroscience (Vidal & Müller, 2018) spiegeln das Interesse, aus den Neurowissenschaften fruchtbare Impulse für pädagogische Praxiskontexte zu gewinnen. Die Prävalenz von Neuromythen unter Lehrenden ist empirisch gut belegt; ob und wie diese auf Lernleistungen und Effektivität des Unterrichts einwirkt, ist noch nicht geklärt (Horvath et al., 2018; Krammer et al., 2019; Hennes et al., 2024). Die Entstehung von Neuromythen kann einerseits als Folge eines Mangels an wissenschaftlichem Wissen, sodann aufgrund einer Kommunikationslücke zwischen Forschung und Lehrpraxis oder durch Konsultation von Informationsquellen minderer Qualität seitens der Lehrenden verstanden werden, wie Torrijos-Muelas et al. (2021) mit einer systematischen Auswertung von 24 empirischen Studien der Jahre 2012 bis 2020 aus 20 verschiedenen Ländern (mit N = 13.767 Proband*innen) zeigen. Die Befunde von Dekker et al. (2012) legen zudem nahe, dass ein erhöhtes allgemeines Wissen über das Gehirn und seine Funktionen nicht zwingend vor Fehlkonzeptionen schützt: Lehrende, die angaben, viel über das Gehirn zu wissen, schätzten Neuromythen häufiger als wahre Aussagen ein. Derartige Hintergründe spielen eine Rolle für die Verbreitung musikbezogener Neuromythen u. a. in musikpädagogischen Kontexten. Es scheint daher wenig erstaunlich, dass entsprechende Fehlvorstellungen auch unter fachlich gut informierten und ausgebildeten Musiklehrenden und Musik-Lehramtsstudierenden auftreten, wie Düvel et al. (2017) erstmals feststellten.
Zusammenfassung der Referenzstudie (Düvel et al., 2017)
Düvel et al. (2017) untersuchten die Verbreitung musikbezogener Neuromythen unter Musiklehrkräften und Musik-Lehramtsstudierenden.2 In einem mehrstufigen Prozess wurden musikbezogene Neuromythen und Neurofakten recherchiert und in einem Expert*innenrating geprüft, sodass jeweils sieben wissenschaftlich nicht belegte (Neuromythen) und wissenschaftlich belegte Aussagen (Neurofakten) als einzuschätzende Thesen ausgewählt werden konnten. Diese wurden in zwei separaten Online-Erhebungen von Musiklehrenden (n = 91) und Musik-Lehramtsstudierenden (n = 125), dem Paradigma der Signalentdeckungstheorie folgend (siehe dazu unten), als „wissenschaftlich nicht belegt“ oder „wissenschaftlich belegt“ bewertet.3 Auch wurden Kontroll- und Prädiktorvariablen erhoben, wie die Einschätzung des Einflusses von Genetik gegenüber Umwelt auf erfolgreiches Lernen, der höchste erreichte Bildungsabschluss, das Interesse an Neurowissenschaften und dessen Bedeutung für den Lehrberuf, ob eine Aus- oder Weiterbildung in Neurowissenschaften absolviert wurde, ob neurowissenschaftliche Lehrmethoden bekannt sind und ob Bücher, Zeitschriften oder Webseiten zu neurowissenschaftlichen oder ähnlichen Themen gelesen wurden. Studierende wurden zusätzlich nach der Länge ihres bereits absolvierten Studiums und der voraussichtlichen Zeit bis zum Studienabschluss in Fachsemestern gefragt sowie ob sie beabsichtigen, den Lehrberuf zu ergreifen.
Die Ergebnisse zeigten, dass die Studierenden die gegebenen Thesen über Rate-Niveau den korrekten Kategorien zuordneten (d’ = 1.48, SD = 1.22). Tendenziell wurden die präsentierten Thesen eher als wissenschaftlich belegt bewertet (cStudierende = −0.41). Daraus folgt, dass die gegebenen Neurofakten häufiger korrekt zugeordnet wurden (77,7 %) als Neuromythen (59,3 %). Als signifikante Prädiktoren für eine hohe Diskriminationsleistung zeigten sich in der studentischen Stichprobe die Anzahl gelesener Medien (Bücher, Zeitschriften, Webseiten, βstandardisiert = 0.237) sowie die bisherige Studiendauer (βstandardisiert = 0.240).
Trotz dieser ersten Einblicke in die Verbreitung musikbezogener Neuromythen unter Musik-Lehramtsstudierenden kann auf der Basis dieser einen bislang vorliegenden Studie noch nicht als gesichert gelten, wie gut jene Zielgruppe zwischen falschen Annahmen (Neuromythen) und wissenschaftlich belegten Aussagen (Neurofakten) unterscheiden kann und wie sich dies in einem Vergleich verschiedener Studienfächer äußert. Daher ist das Ziel unserer Studie, die vorliegenden Befunde von Düvel et al. (2017) in einer Replikation zu überprüfen.
Motivation für eine Replikation
In der empirischen Forschung bieten Replikationsstudien ein wichtiges Mittel zur Sicherung des fachlichen Wissensbestandes, da sie die Anzahl an Beobachtungen erhöhen und so die Verlässlichkeit empirischer Befunde steigern sowie mit der Reflektion angewandter methodischer Verfahren in direkten oder konzeptuellen Replikationen einen Beitrag zur methodologischen Diskussion leisten (Frieler et al., 2013). Da empirische Befunde stets an Merkmale der jeweils untersuchten Stichproben gebunden sind, ist eine Überprüfung der daran erzielten Befunde sinnvoll, besonders im Hinblick auf individuelle Einstellungen und Fähigkeiten, die zudem auch zeit- und kulturbedingten Veränderungen unterworfen sein können. Insofern erscheint eine Replikation der Befunde von Düvel et al. (2017) nach etwa sechs Jahren durchaus einleuchtend, da dieser Zeitraum in etwa eine Studierendenkohorte umfasst. Die Daten der Referenzstudie (Düvel et al., 2017) wurden primär 2015 erhoben (10.06.–21.09.2015, n = 91 Lehrende; 13.11.2015–02.01.2016, n = 125 Studierende), die der Replikationsstudie im Jahr 2021 (07.12.–17.12.2021, N = 439 Studierende).
Forschungsfragen und Hypothesen
Das Ziel der Replikation war zu prüfen, ob die von Düvel et al. (2017) beobachteten Diskriminationsleistungen auch in einer anderen Studierendenkohorte auftreten – und ob und in welcher Weise fachspezifische Wissensstände damit zusammenhängen. Wir erwarteten zunächst, dass sich die Diskriminationsleistung der Musik-Lehramtsstudierenden zwischen den beiden Erhebungen nicht signifikant unterscheidet, da die inhaltlich-fachlichen Kompetenzen beider Kohorten ähnlich sein sollten (Lehramtsstudium mit dem Fach Musik):
H1: Die Diskriminationsleistung (Sensitivität d‘) und die Antworttendenz (Bias c) bei musikbezogenen Thesen unterscheidet sich bei Musik-Lehramtsstudierenden in dieser Erhebung nicht signifikant von den Ergebnissen der von Düvel et al. (2017) erhobenen Stichprobe an Musik-Lehramtsstudierenden.
Zusätzlich werden Studierende anderer Fächer befragt, um Personengruppen mit unterschiedlicher fachlicher Expertise vergleichen zu können. Da auch hier eine fachliche Kompetenz (Fach Musik) bzw. spezifische Qualifikationsmerkmale (Inhalte pädagogischer Psychologie wie Mechanismen des Lernens) in den Blick genommen sind, liegt folgende Vermutung nahe:
H2: Bezogen auf musikbezogene Thesen, zeigen die Musik-Lehramtsstudierenden eine höhere Diskriminationsleistung (Sensitivität d‘) als Lehramtsstudierende anderer Fächer. Diese wiederum zeigen eine höhere Diskriminationsleistung als Studierende in anderen Studiengängen ohne Lehramtsbezug.
Neben 14 musikbezogenen Thesen wurden jeweils drei weitere allgemeine Neuromythen und Neurofakten ausgewählt und abgefragt (siehe Tabelle 1). Da eine fachliche Expertisierung (Fach Musik) hinsichtlich der Einschätzung allgemeiner Thesen keinen Einfluss zeigen sollte, ergibt sich folgende Hypothese:
H3: Bezogen auf die allgemeinen Thesen zeigt sich kein Gruppenunterschied zwischen Lehramtsstudierenden mit dem Fach Musik und Lehramtsstudierenden mit anderen Fächern hinsichtlich ihrer Diskriminationsleistung (Sensitivität d‘).
Auch wird angenommen, dass Lehramtsstudierende aufgrund ihrer Studieninhalte größere Kompetenzen hinsichtlich der Einschätzung von Aussagen über allgemeine Funktionsweisen des Gehirns und Mechanismen des Lernens aufweisen sollten als Studierende anderer Studiengänge, sodass als Hypothese formuliert wird:
H4: Bezogen auf die allgemeinen Thesen zeigen die Lehramtsstudierenden (sowohl mit Fach Musik als auch ohne Fach Musik) eine höhere Diskriminationsleistung (Sensitivität d‘) als die Studierenden anderer Fächer.
Über die Erhebung von Kontroll- und Prädiktorvariablen sollen mögliche Einflussfaktoren auf eine gute Diskriminationsleistung erkundet und mit der Referenzstudie abgeglichen werden. Es liegt folgende Vermutung nahe:
H5: Wie bei Düvel et al. (2017) zeigen erneut Prädiktoren, die mit guter akademischer Bildung im Zusammenhang stehen, einen signifikanten Zusammenhang mit der Diskriminationsleistung (Sensitivität d‘).
Methode
Studiendesign, Ablauf der Befragung und erhobene Variablen
Die Datenerhebung wurde, wie schon die Referenzstudie von Düvel et al. (2017), als Online-Survey auf der Plattform SoSci Survey (https://www.soscisurvey.de/) umgesetzt. Nach einer einleitenden Beschreibung der Forschungsabsicht und dem Hinweis auf eine mögliche Teilnahmevergütung im Rahmen eines Gewinnspiels wurde das Einverständnis zur Datenerhebung eingeholt.
Auf der ersten Seite des Online-Fragebogens wurde nach Alter, Geschlechtsidentität und Zugehörigkeit zu u. a. einer der folgenden Gruppen gefragt: „Lehramtsstudent*in“, „Student*in (kein Lehramt)“. Weitere Gruppen (z. B. Referendare, Berufstätige) waren nur marginal vertreten und ihre Antworten wurden nicht ausgewertet (siehe Filterkriterien im Abschnitt Datenaufbereitung).
Die Lehramtsstudierenden wurden anschließend nach ihrer Fächerkombination und ihrem Studiensemester gefragt sowie, wie viele Semester sie noch bis zum Abschluss benötigen. Die Studierenden anderer Fächer wurden nach ihrem Studiengang, ihrem Studiensemester und der Anzahl der Semester bis zum Abschluss gefragt. Es folgten bei allen Studierenden Fragen zum Bereich der Neuro-Education, die insgesamt denen der Referenzstudie glichen.
Den Kern der Replikation bildete die Bewertung von Thesen (Neuromythen und Neurofakten) durch die Teilnehmenden gemäß des A-Not A-Paradigmas der Signalentdeckungstheorie (Düvel & Kopiez, 2022; Hautus et al., 2022, Kapitel 1 und 2)4.
Die Signalentdeckungstheorie (SDT) ist ein Überbegriff für verschiedene Paradigmen, die seit den 1950er Jahren in der Psychophysik entwickelt wurden (Green & Swets, 1966). In typischen Experimenten wurde den Proband*innen entweder ein akustisches Rauschen präsentiert (Noise) oder das gleiche Rauschen zusammen mit einem leisen Ton (Signal). Die Aufgabe bestand darin zu entscheiden, ob ein Ton im Gehörten vorhanden ist, oder nicht. Für die Auswertung ist ausschlaggebend, dass nicht nur die Anteile richtiger und falscher Antworten berechnet werden, sondern die richtigen und falschen Antworten je nach Stimulus-Typ (Noise oder Signal) getrennt betrachtet werden. Diese beiden Anteile werden zum Maß der Sensitivität d‘ (Diskriminationsleistung) verrechnet (siehe Abschnitt Auswertungsplan für Details). Zusätzlich wird angegeben, ob Proband*innen eher dazu tendieren ein Signal zu vermuten oder eher nur das Rauschen wahrzunehmen. Diese Tendenz wird durch das Maß der Antworttendenz c (Bias) abgebildet. Beim A-Not A-Design wird den Proband*innen stets nur ein Stimulus zur selben Zeit präsentiert, der einer der beiden Kategorien Signal („A“) oder Noise („Not A“) zugeordnet werden muss. Bei anderen Paradigmen innerhalb der SDT kann die konkrete Aufgabe anders ausfallen.
Im Fall der vorliegenden Studie entspricht ein Neurofakt dem Typ A (Signal), ein Neuromythos dem Typ Not A. Bei der Durchführung der Studie wurde den Proband*innen jede These einzeln präsentiert, und sie mussten diese als wissenschaftlich belegt oder als nicht wissenschaftlich belegt einordnen. Die insgesamt 20 Thesen wurden in einer zufällig wirkenden, aber gleichbleibenden Reihenfolge abgefragt und auf drei Fragebogenseiten verteilt. Am Ende der Befragung konnten sich die Teilnehmenden für eine Verlosung (10 Gutscheine eines Online-Händlers im Gesamtwert von 50 €) mit ihrer E-Mail-Adresse registrieren; diese wurde getrennt vom Datensatz gespeichert.
Auswahl der Thesen
Die musikbezogenen Thesen wurden aus der Referenzstudie übernommen und anhand aktueller Forschungsberichte überprüft. Aufgrund des mehrstufigen Auswahlprozederes (Düvel et al., 2017) war davon auszugehen, dass diese Thesen reliabel sind und sinnvoll verwendet werden können. Die daraus resultierenden je sieben musikbezogenen Neurofakten und Neuromythen wurden in der Replikation um jeweils drei allgemeine Neurofakten und Neuromythen ergänzt, die aus der Studie von Krammer et al. (2019) übernommen wurden. Damit standen insgesamt je zehn Neurofakten und Neuromythen zur Einschätzung bereit (Tabelle 1).
Tabelle 1
Liste der präsentierten Thesen mit Klassifikation als Mythos oder Fakt und je einem Kurztitel
| Bezeichnung | Typ | Kurztitel | These |
|---|---|---|---|
| Musikbezogene Thesen (Düvel et al., 2017) | |||
| Mythos 1 | Not A | Intelligenz | Hervorragende klassische Musiker*innen sind durchschnittlich intelligenter als Nichtmusiker*innen oder als die nicht-musikalische Bevölkerung mit Hochschulabschluss. |
| Mythos 2 | Not A | Rechenleistung | Durch Musikausbildung werden die Leistungen im Rechnen merkbar verbessert. |
| Mythos 3 | Not A | Leistungssteigerung durch klassische Musik | Das passive Hören von klassischer Musik führt während bestimmter Lernphasen zur Leistungssteigerung |
| Mythos 4 | Not A | Hörzugang | Bestimmte Genres/Stilistiken erzwingen einen bestimmten Hörzugang. Für klassische Musik kommt z. B. nur ein intellektueller Hörzugang in Frage. |
| Mythos 5 | Not A | Händigkeit | Bei Rechtshändern wird Sprache in der linken und Musik in der rechten Hirnhälfte verarbeitet. |
| Mythos 6 | Not A | Musikunterricht und kognitive Fähigkeiten | Musikunterricht ist ein Weg, die kognitiven Fähigkeiten (z. B. Intelligenz) eines Kindes effektiv zu fördern. |
| Mythos 7 | Not A | Improvisationsfähigkeit | Improvisationsfähigkeit am Klavier wird besonders durch die rechte Hirnhälfte gesteuert. Spezielle Übungen können die Leistungsfähigkeit dieser Hemisphäre steigern. |
| Fakt 1 | A | Kopplung Hören und Spielen | Musiker*innen besitzen eine starke neurophysiologische „Kopplung“ zwischen Hören und Spielbewegung. Diese haben sich die Musiker*innen durch intensives Lernen aufgebaut. |
| Fakt 2 | A | Passivhören | Der Einfluss von passivem Musikhören hängt z. B. von der Musikbildung, der emotionalen Wirkung und den Eigenschaften der Musik ab. |
| Fakt 3 | A | Amusie | Es gibt Personen, die Töne, Melodien und Rhythmen nicht verstehen können, obwohl ihre Hörleistung nicht beeinträchtigt ist. |
| Fakt 4 | A | Wahrnehmung | Musiker*innen können Musik besser (schneller, genauer, effizienter) wahrnehmen und verarbeiten als Nichtmusiker*innen. |
| Fakt 5 | A | Plastizität durch Musiküben | Durch intensives Üben eines Instruments verändert sich die anatomische Struktur des Gehirns. |
| Fakt 6 | A | Sprachförderung | Durch Musikunterricht können sprachliche Fähigkeiten gefördert werden. |
| Fakt 7 | A | Informationsverarbeitung | Durch Musik wird allgemein die Verarbeitung von auditorischen Informationen geschult. |
| Allgemeine Thesen (Krammer et al., 2019) | |||
| Mythos 8 | Not A | Lerntypen | Schüler*innen lernen besser, wenn ihnen Informationen entsprechend ihrem Lerntyp (z. B. visuell, auditiv, kinästhetisch) vermittelt werden. |
| Mythos 9 | Not A | Intelligenzen und ihre Lokalisation | Es gibt nicht nur eine, sondern mehrere, voneinander unabhängige Intelligenzen, die in unterschiedlichen Gehirnregionen lokalisiert sind. |
| Mythos 10 | Not A | Gehirnentwicklung | Die Gehirnentwicklung ist zwischen dem 11.–12. Lebensjahr abgeschlossen. |
| Fakt 8 | A | Lernen und Nervenzellen | Lernen erfolgt nicht durch die Bildung neuer Nervenzellen. |
| Fakt 9 | A | Schlaf-Wach-Rhythmus | Der zirkadiane Rhythmus („Schlaf-Wach-Rhythmus“) verändert sich während der Pubertät, was dazu führt, dass Schüler*innen während der ersten Stunden des Schultages müde sind. |
| Fakt 10 | A | Plastizität allgemein | Wiederholtes und langfristiges Training bestimmter geistiger Abläufe kann die Form und Struktur mancher Gehirnregionen verändern. |
Datenerhebung
Nach einem Pretest (N = 8) wurden im Dezember 2021 die Daten erhoben. Um gezielt Studierende anzusprechen, wurde die Einladung zur Teilnahme an einer Online-Befragung per E-Mail über Musikhochschulen und Universitäten sowie Social-Media-Kanäle und persönliche Kontakte zu Musikstudierenden verbreitet. Die Teilnahme erfolgte freiwillig und ohne Gegenleistung, als Anreiz war eine Verlosung von Gutscheinen eines Online-Händlers gegeben.5 Der Umfang der Stichprobe wurde an die Stichprobengröße der Referenzstudie angelehnt, die dort betrachtete Stichprobe von n = 125 Studierende sollten in dieser Erhebung übertroffen werden. Nach einigen Tagen der Datenerhebung lagen bereits 475 Datensätze vor, weshalb die Erhebung geschlossen wurde. Es war davon auszugehen, dass auch nach dem Ausschluss nicht-geeigneter Fälle (siehe folgender Abschnitt) eine Stichprobe von deutlich größerem Umfang als jene der Referenzstudie verfügbar wäre.
Datenaufbereitung
Das Sampling ergab 475 Fälle im Datensatz, der anhand mehrerer Kriterien gefiltert wurde, um eine möglichst gute Datenqualität zu erreichen (Abbildung 1). Diese Kriterien fokussieren die Zielpopulation der Untersuchung (Studierende) und betreffen den Status der Studienteilnehmer*innen (Schule, Ausbildung, Studium, Beruf), eine Mindest-Antwortquote im Fragebogen (vorletzte Seite) sowie zeitliche Grenzwerte in der Bearbeitung des Fragebogens. Eine maximale Bearbeitungsdauer von 20 Minuten wird als Indikator für eine unkonzentrierte oder unterbrochene Bearbeitung der Aufgaben verstanden; aufgrund der als Online-Befragung durchgeführten Datenerhebung sollte eine zeitliche Begrenzung zudem die Möglichkeit einschränken, dass Studienteilnehmer*innen die Beantwortung der Thesen mittels gezielter Online-Recherche unterstützen. Eine minimale Bearbeitungsdauer von mindestens 100 Sekunden wurde festgelegt als Durchschnittswert: Die so verfügbare Bearbeitungszeit von fünf Sekunden je These erscheint unrealistisch schnell und legt ein willkürliches bzw. nicht-reflektiertes Antwortverhalten nahe. Ebenfalls exkludiert wurde ein inkonsistenter Fall, bei dem sich eine Person als Lehramtsstudierende zuordnete, jedoch keine Fächerkombination angab und Freitexteingaben auf Englisch beantwortete, was eine Sprachbarriere nahelegt. Insgesamt resultierte dies in einem Datensatz mit N = 439 gültigen Fällen, der die Basis für alle folgenden Auswertungsschritte bildet.
Abbildung 1
Flowchart zur Filterung des Datensatzes
Die Primärdaten der Referenzstudie (Düvel et al., 2017) lagen vor, sodass die Replikation einen unmittelbaren Vergleich hinsichtlich der in den relevanten Stichproben gezeigten Diskriminationsleistungen statistisch gesichert auf Datenebene durchführen konnte.
Auswertungsplan
Für die Quantifizierung der Diskriminationsfähigkeit und der Antworttendenz gemäß der SDT ist die Kategorisierung der Antworten auf der Basis des in Tabelle 2 dargestellten Schemas zentral.
Tabelle 2
Schematische Darstellung der Klassifikation von Antworten als Treffer, Auslassung, Falscher Alarm oder Korrekte Zurückweisung gemäß der Signalentdeckungstheorie SDT
| Einschätzung der Befragten | |||
|---|---|---|---|
| Neurofakt (A) (wissenschaftlich belegt) | Neuromythos (Not A) (wissenschaftlich nicht belegt) | ||
| Eigenschaft der Thesen | Neurofakt (A) (wissenschaftlich belegt) | Treffer (engl.: Hit) korrekte Entscheidung: zutreffende Aussage wird als solche erkannt und angenommen | Auslassung (Fehler zweiter Art, falsch negativ, engl.: Miss) falsche Entscheidung: zutreffende Aussage wird als nicht zutreffend aufgefasst |
| Neuromythos (Not A) (wissenschaftlich nicht belegt) | Falscher Alarm (FA; Fehler erster Art, falsch positiv, engl.: False Alarm) falsche Entscheidung: nicht zutreffende Aussage wird als zutreffend aufgefasst | Zurückweisung (engl.: Correct Rejection) korrekte Entscheidung: nicht zutreffende Aussage wird als solche erkannt und abgelehnt | |
Die Berechnung der Sensitivität d‘ als Maß für die Diskriminationsleistung sowie die Antworttendenz c erfolgt aus dem Anteil an Hits bei der Zuordnung von Neurofakten sowie dem Anteil an FAs bei der Zuordnung von Neuromythen (zur Berechnung siehe Düvel & Kopiez, 2022, S. 2339–2340)6. Eine Sensitivität von d‘ = 0 entspricht dem Rate-Niveau, negative Werte spiegeln eine entgegengengesetzte Zuordnung wider, positive Werte eine korrekte Zuordnungsfähigkeit. Bei korrekter Bewertung aller Thesen (Fakten wie Mythen) würde die Person eine Sensitivität von d‘ ≈ 3 erzielen, analog d‘ ≈ −3 bei ausschließlich falschen Zuordnungen. Der neutrale Wert der Antworttendenz (Reaktionsschwelle) ist c = 0; davon abweichende Werte indizieren eine Reaktionsverzerrung: Ein negativer Wert zeigt eine progressive Entscheidungsstrategie an (Personen bewerten tendenziell eher positiv, d. h. die Thesen eher als „wissenschaftlich belegt“), ein positiver Wert eine konservative Entscheidungsstrategie an (Personen bewerten tendenziell eher negativ, d. h. die Thesen eher als „wissenschaftlich nicht belegt“).
Zur Prüfung der Hypothesen wurden folgende statistische Tests durchgeführt: Der Vergleich der Sensitivität bei Musik-Lehramtsstudierenden zwischen der Referenzstudie und der vorliegenden Replikation (H1) erfolgt mit einem Zweistichproben-t-Test für unabhängige Stichproben. Anschließend werden die mittleren Sensitivitäten (mit SD und 95 % CI) für die gesamte Stichprobe und alle Teilstichproben jeweils für alle 20 Thesen wie auch für die 14 musikbezogenen Thesen und für die sechs allgemeinen Thesen einzeln berechnet. Inferenzstatistische Tests erfolgen gemäß der formulierten Hypothesen: H2 erfordert eine between-subjects ANOVA mit den drei genannten Gruppen und der Sensitivität der Musik-Thesen als abhängige Variable. Falls die ANOVA signifikant ist, werden die in der Hypothese genannten Unterschiede durch post-hoc-Tests überprüft. H3 und H4 beziehen sich auf die allgemeinen Thesen und können gemeinsam durch eine between-subjects ANOVA mit ggf. post-hoc-Tests beantwortet werden. Zur Bestimmung von Prädiktoren für eine hohe Diskriminationsleistung (H5) wird eine multiple Regression berechnet (vgl. dazu Düvel et al., 2017).
Beschreibung der Stichprobe
Die alle Befragten umfassende Gesamtstichprobe wurde anhand der Angaben zu Studiengängen und -fächern in drei Teilstichproben gegliedert, um mögliche Unterschiede zwischen Studierenden unterschiedlicher Studienfächer zu untersuchen. Diese Gruppen sind hinsichtlich Geschlecht und Alter ähnlich, Frauen sind stets deutlich stärker vertreten als Männer. Das mittlere Alter lag in allen Teilstichproben bei etwa 23 Jahren (Tabelle 3).
Tabelle 3
Gruppengröße, Geschlecht und Alter der Stichprobe und der Teilstichproben aufgeteilt nach Studiengängen
| Stichprobe | Größe der Gruppe | Geschlecht (in Prozent) | Alter (in Jahren) | ||||
|---|---|---|---|---|---|---|---|
| weiblich | männlich | divers / keine Angabe | M | SD | [Min; Max] | ||
| Lehramtsstudierende mit Fach Musik | 44 | 81.8 | 15.9 | 2.3 | 23.41 | 4.40 | [18; 44] |
| Lehramtsstudierende ohne Fach Musik | 119 | 78.2 | 21.0 | 0.8 | 23.06 | 4.39 | [17; 42] |
| andere Studienfächer (kein Lehramt) | 276 | 74.6 | 22.5 | 2.9 | 22.59 | 4.69 | [18; 70] |
| gesamte Stichprobe | 439 | 76.3 | 21.4 | 2.3 | 22.80 | 4.58 | [17; 70] |
Die ohne Berücksichtigung der möglichen Fächerkombinationen einzelner Studiengänge am häufigsten genannten Fächer der Befragten sind Deutsch (n = 67), Mathematik (n = 63), Musik (n = 45), Biologie (n = 32) und Englisch (n = 31), gefolgt von Geschichte sowie zusammengefasst theologische Fächer und Philosophie/Ethik (jeweils n = 19) sowie Chemie (n = 16); im Mittelfeld der Verteilung mit Nennungen von n = 10 bis n = 2 finden sich Fächer wie u. a. Sachunterricht, Französisch, Geographie und Wirtschaftswissenschaften; jeweils nur einmal genannt wurden Chinesisch, Physik, Sonderpädagogik, Sozialkunde und Spanisch. Damit sind in der Gesamtstichprobe bis auf die Ingenieurwissenschaften alle nach DFG-Systematik klassifizierten Wissenschaftsbereiche vertreten (Natur-, Lebens-, Geistes- und Sozialwissenschaften). Auf eine Auswertung nach einzelnen Fächern wurde aufgrund komplexer Einflussfaktoren (Haupt-, und Nebenfachkombinationen wie auch individuelle Interessen), zu kleiner Teilstichproben und besonders mangelnder theoretischer Grundlage zur Bildung von Hypothesen verzichtet; mit Blick auf das Forschungsinteresse zielführender ist die hier vorgenommene Gruppierung musikbezogener und musikferner Fächer. Die Teilnehmenden wurden gefragt, in welchem Semester sie studieren und wie viele Semester sie noch bis zum Abschluss ihres Studiums benötigen (Tabelle 4). Durchschnittlich waren die Studierenden im 5. Bachelor-Semester (Median) und benötigten noch vier Semester bis zum Abschluss (ebenfalls Median). Die Teilstichproben zeigten große Ähnlichkeiten, die auf keine relevanten Unterschiede zwischen den Teilstichproben schließen lassen. In der Referenzstudie wurde das aktuelle Studiensemester geringfügig anders erhoben, was ermöglichte, aus dem Semester und den verbleibenden Semestern bis zum Abschluss die voraussichtliche Studiendauer zu berechnen. Da hier das Studiensemester ordinalskaliert erhoben wurde, war hier eine Berechnung der voraussichtlichen Studiendauer nicht möglich.
Tabelle 4
Beschreibung der Stichprobe und der Teilstichproben aufgeteilt nach Studiengängen hinsichtlich des aktuellen Studiensemesters und der Semester bis zum Abschluss
| Stichprobe | Studiensemesterb | Semester bis zum Abschluss | ||||||
|---|---|---|---|---|---|---|---|---|
| na | 1. Quartil | Mdn | 3. Quartil | n | 1. Quartil | Mdn | 3. Quartil | |
| Lehramtsstudierende mit Fach Musik | 42 | 3.5 | 5.5 | 7 | 44 | 2 | 4 | 6 |
| Lehramtsstudierende ohne Fach Musik | 117 | 1 | 5 | 7 | 119 | 2 | 4 | 7 |
| andere Studienfächer (kein Lehramt) | 262 | 1 | 5 | 7 | 276 | 2 | 4 | 5 |
| gesamte Stichprobe | 421 | 1 | 5 | 7 | 439 | 2 | 4 | 6 |
aAusgeschlossen wurden insg. n = 18 Fälle, deren Angabe ungültig war. bDas aktuelle Studiensemester wurde ordinalskaliert erhoben und wie folgt kodiert: 1 = Bachelor 1. Semester, 2 = Bachelor 2. Semester, 3 = Bachelor 3. Semester, 4 = Bachelor 4. Semester, 5 = Bachelor 5. Semester, 6 = Bachelor 6. Semester oder höher, 7 = Master 1. Semester, 8 = Master 2. Semester, 9 = Master 3. Semester, 10 = Master 4. Semester oder höher.
Ein Vergleich demografischer Eigenschaften der Musik-Lehramtsstudierenden aus der Replikation und Referenzstudie zeigt einen kleinen, nicht signifikanten Effekt bzgl. des Alters, Welchs t(54.2) = −1.38, p = .17, Cohens d = 0.30: Die Teilstichprobe der Replikation war etwas jünger als die der Referenzstudie. Den Einfluss von Genen gegenüber Umwelt auf das Lernen schätzen beide Teilstichproben gleich ein, ebenso glich sich das jeweilige Interesse an neurowissenschaftlichen Themen. Die Musik-Lehramtsstudierenden der Referenzstudie hatten jedoch mehr Medien zu neurowissenschaftlichen und neuropädagogischen Themen gelesen (Mdn = 1, Interquartilsabstand [IQR] = 2) als jene der Replikationsstudie (Mdn = 0, IQR = 1).
Ergebnisse
Die Aufbereitung des Datensatzes und die Berechnung der SDT-Variablen erfolgte in Microsoft Excel 365. Der finale Datensatz wurde als CSV-Datei exportiert, die weitere Auswertung erfolgte in RStudio (Version 2023.09.1) mittels R (Version 4.3.2) und der Pakete tidyverse (Wickham et al., 2019), effsize (Torchiano, 2016), ggpubr (Kassambara, 2023a), lsr (Navarro, 2015) und rstatix (Kassambara, 2023b). Das Auswertungsskript ist frei verfügbar (s. Ergänzende Materialien).
Diskriminationsleistung und Antworttendenz bei Musik-Lehramtsstudierenden und im Vergleich zur Referenzstudie von Düvel et al. (2017; Hypothese 1)
Die n = 125 Musik-Lehramtsstudierenden der Referenzstudie (Düvel et al., 2017) zeigten eine mittlere Sensitivität von d‘ = 1.48 (SD = 1.22, siehe auch Abbildung 2 für ein Fehlerbalkendiagramm) und eine Antworttendenz c = −0.41 (SD = 0.71). Um diese mit den n = 44 Musik-Lehramtsstudierenden aus der Replikation zu vergleichen, wurden zunächst die Sensitivität und die Antworttendenz für diese Teilstichprobe hinsichtlich der musikbezogenen Thesen ermittelt. Dies ergab Werte von d‘ = 1.05 (SD = 0.70, s. Abbildung 2) und c = −0.34 (SD = 0.40), d. h. sie tendierten ebenfalls leicht dazu, die Thesen als wissenschaftlich belegt einzuschätzen. Zweistichproben-t-Tests für unabhängige Stichproben ergaben einen signifikanten, kleinen Unterschied in der Sensitivität zwischen den beiden Gruppen, Welchs t(132.6) = 2.81, p = .006, Cohens d = 0.38 mit 95 % CI [0.04, 0.73]. Der geringe Unterschied zwischen den beiden Stichproben hinsichtlich der Antworttendenz erreichte jedoch keine statistische Signifikanz, Welchs t(133.3) = −0.85, p = .40, Cohens d = −0.12 mit 95 % CI [−0.46, 0.23]. Auf dieser Grundlage ist davon auszugehen, dass die Diskriminationsleistung der Musik-Lehramtsstudierenden in der Replikation etwas geringer ist als in der Referenzstudie. Hypothese 1 (es besteht kein Unterschied in der Diskriminationsleistung zwischen der vorliegenden Replikationsstudie und der Originalstudie) ist somit abzulehnen. Hinsichtlich der Antworttendenz liegt jedoch wahrscheinlich kein Unterschied zwischen den beiden Grundgesamtheiten vor, Hypothese 1 kann bzgl. der Antworttendenz angenommen werden.
Abbildung 2
Fehlerbalkendiagramm der Sensitivität für die verschiedenen Teilstichproben und im Vergleich zu Düvel et al. (2017)
Anmerkung. Teilstichprobengrößen an der x-Achse stammen aus der vorliegenden Replikationsstudie.
Unterschiede in der Diskriminationsleistung zwischen den Teilstichproben (Hypothesen 2, 3 und 4)
Die Sensitivität wurde für die beschriebenen Teilstichproben jeweils für alle insgesamt 20 Thesen sowie separat für die 14 musikbezogenen Thesen und die sechs allgemeinen Thesen berechnet und in Abbildung 2 als Fehlerbalkendiagramm dargestellt.
Hypothese 2 vermutet Unterschiede zwischen den Gruppen hinsichtlich ihrer Diskriminationsleistung bezüglich musikbezogener Thesen (Abbildung 2). Um die Mittelwertsunterschiede auf Signifikanz zu überprüfen, wurde eine one-way ANOVA mit dem Faktor Gruppe (between-Faktor, 3 Stufen: [1] Lehramt Musik, [2] Lehramt andere Fächer und [3] andere Studiengänge) berechnet: F(1, 437) = 0.806, p = .37, . Mit Blick auf die Testwerte ist Hypothese 2 abzulehnen: Zwar zeigt die Gruppe der Musik-Lehramtsstudierenden die höchsten Sensitivitätswerte, jedoch konnte kein Beleg für statistisch signifikant unterschiedliche Diskriminationsleistungen zwischen Studierenden unterschiedlicher Studiengänge bezüglich der musikbezogenen Thesen gefunden werden.
Hypothesen 3 und 4 formulieren Gruppenunterschiede hinsichtlich der Diskriminationsleistungen bezüglich allgemeiner Thesen (Abbildung 2). Analog zur Prüfung von Hypothese 2 wurde eine weitere ANOVA berechnet: F(1, 437) = 0.197, p = .658, . Diese zeigte ebenfalls keinen statistisch signifikanten Unterschied zwischen den Teilstichproben. Dieser Befund ist mit Hypothese 3 vereinbar, die formuliert, dass sich die Diskriminationsleistungen bezüglich allgemeiner Thesen zwischen Lehramtsstudierenden mit dem Fach Musik und Lehramtsstudierenden anderer Fächer nicht unterscheidet. Hingegen ist Hypothese 4 abzulehnen: Es wurde keine statistisch signifikant höhere Diskriminationsleistung in den Gruppen der Lehramtsstudierenden (mit und ohne das Fach Musik) als bei Studierenden anderer Studiengänge gefunden.
Prädiktoren für die Diskriminationsleistung (Hypothese 5)
Um mögliche Prädiktoren für eine gute Diskriminationsleistung zu bestimmen, wurde wie in der Referenzstudie eine multiple Regression berechnet. Im Vergleich zur Referenzstudie konnte die Variable Promotion nicht mit einbezogen werden, da diese in der Replikation nicht erhoben wurde. Folgende Variablen wurden als Prädiktoren mit einbezogen:
Alter,
Geschlecht (wobei die n = 10 Personen mit den Angaben „divers“ oder „keine Angabe“ für diese multiple Regression ausgeschlossen wurden),
Studiengang (als Dummy-Variable: Lehramt vs. kein Lehramt),
Einfluss von Genen und Umwelt auf das Lernen (ein Fall wurde wegen fehlendem Wert ausgeschlossen),
Interesse an Neurowissenschaften (als Dummy-Variable: sehr großes Interesse vs. kein bis etwas Interesse),
Lehrveranstaltungen zu Neurodidaktik (als Dummy-Variable: mind. eine vs. keine Lehrveranstaltung),
Anzahl gelesener Medien
Semester (ohne n = 18 Fälle mit fehlenden oder ungültigen Werten)
Semester bis zum Abschluss
Die multiple Regression wurde in R mittels der Funktion lm() mit den Standard-Parametern berechnet. Sie ergab für die n = 410 vollständigen Fälle p = .73 mit R2 = .015 und konnte demnach keinen relevanten Prädiktor für die Diskriminationsleistung anhand des vorliegenden Datensatzes ermitteln. Hypothese 5, die ähnliche Prädiktoren wie bei der Referenzstudie vermutete, kann daher nicht angenommen werden.
Explorative Analysen
Weitere Untersuchung der Antworttendenz
Weitere Hypothesen zu den Unterschieden zwischen den Teilstichproben oder zwischen musikbezogenen und allgemeinen Thesen konnten vorab nicht aufgestellt werden. Im Rahmen der Auswertungen wurden jedoch für alle Thesen die entsprechenden Werte der Antworttendenz berechnet (Abbildung 3). Es zeigt sich ein kleiner Effekt in der stärkeren Antworttendenz bei den allgemeinen Thesen, c = −0.45, als bei den musikbezogenen Thesen, c = −0.36; t(438) = 3.36, p < .001, d = 0.21 mit 95 % CI [0.09, 0.33]. Die allgemeinen Thesen scheinen demnach insgesamt noch etwas wissenschaftlicher eingeschätzt zu werden als die Thesen mit Musikbezug. Dieser Unterschied zeigte sich jedoch kaum bei Lehramtsstudierenden, stattdessen besonders bei den Studierenden anderer Studiengänge.
Abbildung 3
Fehlerbalkendiagramm der Antworttendenz für die verschiedenen Teilstichproben und im Vergleich zu Düvel et al. (2017)
Anmerkung. Teilstichprobengrößen an der x-Achse stammen aus der vorliegenden Replikationsstudie.
Antwortverhalten zu den einzelnen Thesen
Neben der Diskriminationsleistung, die die Fähigkeit der richtigen Zuordnung für alle Thesen oder Thesengruppen (musikbezogen bzw. allgemein) misst, ist es interessant den Anteil richtiger Antworten bei den einzelnen Thesen zu betrachten. Hieraus lässt sich entnehmen, welche Thesen besonders häufig falsch eingeschätzt werden und daher in der pädagogischen Ausbildung aufgeklärt werden sollten.
Die Mythen, dass bestimmte Genres einen bestimmten Hörzugang erzwingen (Mythos 4) und dass die Gehirnentwicklung zwischen dem 11. und 12. Lebensjahr abgeschlossen sei (Mythos 10), entlarvten 90 % aller Proband*innen der Gesamtstichprobe der Replikation. Noch mehr korrekte Antworten erzielte lediglich der Fakt, dass wiederholtes und langfristiges Training die Form und Struktur mancher Gehirnregionen verändern kann (Fakt 10, 93 % korrekte Antworten). Vier der Mythen erhielten höchstens 25 % richtige Antworten: Improvisationsfähigkeit am Klavier würde besonders durch die rechte Hirnhälfte gesteuert (Mythos 7, 25 %); es gäbe nicht nur eine, sondern mehrere, voneinander unabhängige Intelligenzen, die in unterschiedlichen Gehirnregionen lokalisiert seien (Mythos 9, 22 %); Musikunterricht sei ein Weg, die kognitiven Fähigkeiten eines Kindes effektiv zu fördern (Mythos 6, 20 %); und zuletzt der Mythos, dass Schüler*innen besser lernen, wenn ihnen Informationen entsprechend ihrem Lerntyp (z. B. visuell, auditiv, kinästhetisch) vermittelt werden (Mythos 8, 17 %). Hier fallen besonders Fehlvorstellungen zur Lateralisation und zur Organisation des Gehirns auf. Auch in der vorliegenden Untersuchung zeigt sich deutlich die weit verbreitete Annahme, dass man mit Musikunterricht kognitive Fähigkeiten fördern könne - dies zeigte sich bereits in der Referenzstudie. Bezüglich der allgemeinen Thesen überrascht auch die weite Verbreitung des Lerntypen-Mythos kaum.
Die Einschätzungen der Musik-Lehramtsstudierenden aus der Replikation und der Referenzstudie unterscheiden sich insgesamt nur wenig (Tabelle 5), jedoch wurde der Mythos zur Leistungssteigerung durch klassische Musik (Mythos 3) in der Referenzstudie deutlich häufiger zurückgewiesen als in der Replikation (65 % statt 45 %). Hingegen wurde der Fakt zur Informationsverarbeitung (Fakt 7) in der Replikation häufiger korrekt beurteilt (89 % statt 78 %).
Tabelle 5
Anteile richtiger Antworten für die 20 Thesen
| Bezeichnung | Musik/allgemein | Kurztitel | Anteil richtiger Antworten | ||
|---|---|---|---|---|---|
| Gesamte Stichprobe der Replikationsstudie (N = 439) | Musik-Lehramts-studierende der Replikationsstudie (n = 44) | Musik-Lehramts-studierende in Düvel et al. (2017, n = 125) | |||
| Fakt 8 | allg. | Lernen und Nervenzellen | .49 | .50 | — |
| Fakt 4 | Musik | Wahrnehmung | .84 | .82 | .74 |
| Mythos 4 | Musik | Hörzugang | .90 | .95 | .90 |
| Fakt 7 | Musik | Informationsverarbeitung | .86 | .89 | .78 |
| Mythos 5 | Musik | Händigkeit | .55 | .61 | .62 |
| Mythos 7 | Musik | Improvisationsfähigkeit | .25 | .36 | .41 |
| Fakt 5 | Musik | Plastizität durch Musiküben | .76 | .75 | .79 |
| Mythos 1 | Musik | Intelligenz | .70 | .77 | .81 |
| Mythos 2 | Musik | Rechenleistung | .57 | .57 | .51 |
| Fakt 9 | allg. | Schlaf-Wach-Rhythmus | .84 | .82 | — |
| Fakt 3 | Musik | Amusie | .86 | .89 | .81 |
| Mythos 6 | Musik | Musikunterricht und kognitive Fähigkeiten | .20 | .23 | .25 |
| Mythos 9 | allg. | Intelligenzen und ihre Lokalisation | .22 | .16 | — |
| Fakt 10 | allg. | Plastizität allgemein | .93 | 1.00 | — |
| Mythos 10 | allg. | Gehirnentwicklung | .90 | .89 | — |
| Mythos 8 | allg. | Lerntypen | .17 | .34 | — |
| Fakt 2 | Musik | Passivhören | .61 | .73 | .68 |
| Fakt 6 | Musik | Sprachförderung | .59 | .68 | .76 |
| Fakt 1 | Musik | Kopplung Hören und Spielen | .82 | .84 | .87 |
| Mythos 3 | Musik | Leistungssteigerung durch klassische Musik | .44 | .45 | .65 |
Anmerkung. Die Reihenfolge der Thesen in dieser Tabelle entspricht der Reihenfolge im Fragebogen. Für eine bessere Übersichtlichkeit sind hier nur die Kurztitel aufgeführt, die vollständigen Formulierungen der Thesen befinden sich in Tabelle 1. Die Ergebnisse der Thesen mit besonders hohen oder niedrigen Anteilen richtiger Antworten oder mit einem besonders großen Unterschied zwischen den beiden Erhebungen sind fett markiert und werden im Text diskutiert.
Diskussion
Die hier vorgestellten Befunde zeigen gemäß den formulierten Hypothesen verschiedene Facetten der Prävalenz von Neuromythen in studentischen Stichproben. Mit Sensitivitätswerten im positiven Bereich zeigen alle Teilstichproben eine Diskriminationsleistung über Rate-Niveau. Musik-Lehramtsstudierende zeigen dabei keine statistisch höhere Diskriminationsleistung der Musikthesen als die Studierenden anderer Fächer (Hypothese 2 wurde verworfen). Die erwartete Expertisierung aufgrund eines fachbezogenen Studiums zeigte sich nicht. Entgegen den Befunden von Dekker et al. (2012) scheint fachspezifisches Wissen in dieser Teilstichprobe nicht in Zusammenhang mit der erhobenen Diskriminationsleistung zu stehen.
Dass hinsichtlich der Diskriminationsleistungen zu allgemeinen Thesen keine Unterschiede zwischen Lehramtsstudierenden mit und ohne das Fach Musik feststellbar sind (H3), erscheint einsichtig: Als Themen der pädagogischen Psychologie sind Mechanismen und Prozesse des Lernens relevante Studieninhalte in allen Lehramtsstudiengängen. Dass bezüglich allgemeiner neurowissenschaftlicher Thesen allerdings kein Unterschied zwischen Lehramtsstudierenden (mit und ohne das Fach Musik) und Studierenden anderer Studiengänge/-fächer nachweisbar ist (H4), erscheint zunächst kontraintuitiv und könnte einer möglicherweise zu groben Kategorisierung (Lehramt vs. Nicht-Lehramt) geschuldet sein: Fachspezifische Anforderungen und Inhalte des jeweiligen Studiums sind nicht differenzierbar. Zwar vermutet Novak-Geiger (2023) aufgrund signifikant besserer Diskriminationsleistung und eines geringeren Response Bias bei Psychologie- gegenüber Lehramtsstudierenden einen Einfluss der Studieninhalte. Zu einem tiefergehenden Vergleich liegen allerdings bislang noch keine belastbaren empirischen Befunde vor, sodass unsere Studie hier einen ersten Ansatzpunkt für eine weitere Hypothesenbildung bietet.
Hinsichtlich der in der Referenzstudie erzielten Befunde zeigen sich bemerkenswerte Unterschiede. So ist die Diskriminationsleistung (Sensitivität) der Musik-Lehramtsstudierenden in der Replikation auf mittlerem Niveau der Effektstärke signifikant geringer als in der Referenzstudie (H1). Auch konnten die in der Referenzstudie für die studentische Stichprobe ermittelten Prädiktoren der gezeigten Diskriminationsleistung (Anzahl gelesener Medien, bisherige Studiendauer) nicht repliziert werden (H5). Eine einsichtige Erklärung für diesen Befund ist aus den erhobenen Daten allerdings nicht ableitbar. Ob sich hierin ein systematischer Kohorteneffekt äußert, ist daher nicht begründbar. Empirische Befunde, die lediglich geringe Unterschiede zwischen Lehramtsstudierenden des ersten und höherer Fachsemester feststellen, legen zudem die Vermutung nahe, dass die Studiendauer kein hinreichend verlässlicher Prädiktor sein könnte (Deibl & Zumbach, 2020; Grospietsch & Mayer, 2019). Darum müssten in zukünftigen Untersuchungen weitere mögliche Einflussfaktoren hinsichtlich sozialer Faktoren der Bildung von Neuromythen und etwaiger Vermittlungskontexte (Medien, Studium, Freizeit, …) stärker einbezogen werden. Dabei wären auch aktuelle didaktische Themen, wie eine veränderte Lernkultur und die potenzielle Rolle der Digitalisierung, stärker als mögliche Prädiktoren zu berücksichtigen und auch der Einfluss von Neuromythen auf die Unterrichtspraxis zu analysieren. Grundsätzlich aber sollten die bekannten und auch hier geprüften Prädiktoren weiter untersucht werden, da diese in den bislang vorliegenden Studien nicht einheitlich replizierbar waren. Es gilt also sowohl bildungsbezogene wie auch soziale Faktoren hinsichtlich ihres Einflusses auf die Prävalenz und Persistenz von Neuromythen zu befragen.
Die Prävalenz und die Prädiktoren von Neuromythen bei (Musiklehramts-)Studierenden könnten so im Rahmen der von Vidal und Müller (2018) genannten Begründungszusammenhänge sinnvoll kontextualisiert werden, um Einflussfaktoren und Prozesse der Ausformung und Akzeptanz von Neuromythen im Studium zu ermitteln. Hierzu sollten neben der Erhebung individueller Hintergründe und relevanter Interessen wie freiwillige Weiterbildungen auch Lehr- und Studieninhalte, (hochschul-)didaktische Prinzipien und Theorien der Vermittlung von Bedeutungen sowie Funktionsweisen des Gehirns und kognitiver Prozesse in der Beschäftigung mit Musik (Hören, Machen, Lernen) untersucht werden – neben Musikstudierenden wären so auch Hochschullehrende als weitere Zielgruppe in den Blick zu nehmen, die bislang in der Forschung noch nicht eingehend untersucht wurde.
Limitationen
Die Thesen wurden in der vorliegenden Untersuchung – anders als in der Referenzstudie – in einer festen Reihenfolge im Fragebogen präsentiert. Obgleich aufgrund der Aufgabenstellung und der Art der Präsentation der Items Reihenfolgeneffekte auszuschließen waren, da die Items jeweils separat einzuschätzen waren und dabei von einem Rate-Niveau von 50 % ausgegangen werden konnte, könnten sich in den Bewertungen der einzelnen Thesen doch Bearbeitungseffekte widergespiegelt haben. Der große Unterschied an richtigen Antworten zwischen der Referenzstudie und der vorliegenden Erhebung hinsichtlich der zuletzt präsentierten These (Mythos 3) könnte auf einen solchen Effekt zurückzuführen sein, wenn das schlechtere Ergebnis durch Ermüdung zu Stande gekommen sein sollte. In der über alle Thesen oder Thesengruppen gemittelt errechneten Diskriminationsleistung macht sich dies jedoch nicht mehr bemerkbar, sodass schließlich eine Vergleichbarkeit mit der Referenzstudie sichergestellt ist.
Während die vorliegende Studie zwar insgesamt eine größere Stichprobe aufweist (N = 439), war der Anteil der Musik-Lehramtsstudierenden jedoch relativ gering (n = 44). Daraus folgt Vorsicht im Umgang mit den Ergebnissen, die auf dieser Teilstichprobe beruhen: Sie sollten als Indizien für Veränderungen und aktuelle Entwicklungen verstanden werden, benötigen jedoch weitere Bestätigung und Untersuchung durch nachfolgende Studien. Das hier vorwiegend verwendete Convenience Sampling hat eine Stichprobe mit Studierenden aus einem breiten Fächerspektrum ermöglicht, was dem Forschungsinteresse im Sinne einer breiten Vergleichsgruppe dienlich war. Für weiterführende gezieltere Fragestellungen, bspw. der Prüfung einzelner Zielgruppen hinsichtlich bestimmter Prädiktoren, müssten andere Verfahren der Stichprobenziehung gewählt werden. Jedoch wären zuvor hinreichend belastbare theoretische Grundlagen zu schaffen, die bislang so noch nicht vorliegen. Tatsächlich ist die Plausibilität bereichspezifischer Annahmen anhand des aktuellen Forschungsstandes nicht eindeutig nachweisbar: Ob also das (Haupt-)Studienfach grundsätzlich einen Einfluss auf die Prävalenz und Persistenz von Neuromythen hat, ist noch nicht hinreichend gesichert – zumindest mit Blick auf bislang vorliegende empirische Befunde. Die von der Referenzstudie abweichenden Ergebnisse unserer Replikation zeigen eben dies.
Bislang sind nur wenige solcher didaktischen Implikationen formuliert, was eine praktische Umsetzung der gewonnenen Erkenntnisse erschwert (Dekker et al., 2012; Jolles & Jolles, 2021). Um der Persistenz von Neuromythen entgegenzuwirken, sollte die Lehramtsausbildung nicht nur allgemein neurowissenschaftliche Befunde vermitteln, sondern gezielt auf diese Mythen eingehen. Besonders relevant erscheinen dabei jene, deren Umsetzung negative Auswirkungen auf die schulische Lehr-Lern-Praxis haben könnte (Krammer et al., 2019; Hennes et al., 2024). Künftige Studien könnten hier tiefer einsteigen und Methoden der Vermittlung bzw. Aneignung entsprechender Wissensbestände in einzelnen Studienfächern betrachten und mögliche Effekte auf subjektive Einschätzungen untersuchen, um Unterschiede bzgl. fachspezifischer Perspektiven und Studieninhalte stärker herauszuarbeiten (Deibl & Zumbach, 2020; Grospietsch & Mayer, 2021; Novak-Geiger, 2023). Sinnfällige Vorarbeiten dazu könnten aus qualitativen Ansätzen gewonnen werden, die subjektive Einstellungen zu neurowissenschaftlichen Fragestellungen und Forschungsergebnissen ermitteln, wie auch individuelle Kompetenzen im Umgang damit erheben, z. B. in der Gestaltung von Lern- oder Lehrprozessen oder im alltagsbezogenen Austausch im Freundeskreis. Solcherart implizite Theorien könnten dann tiefergehende Perspektiven eröffnen und auch in eine didaktische Diskussion der Vermittlung neurowissenschaftlicher Erkenntnisse, bspw. in Lehramtsfächern, einfließen.
This is an open access article distributed under the terms of the