Prävalenz und Prädiktoren von Neuromythen bei (Musik-) Studierenden: Eine Teilreplikation der Studie von Düvel et al. (2017)

Prevalence and Predictors of Neuromyths in (Music) Students: A Partial Replication of the Study by Düvel et al. (2017)

Kim Ehler¹, Nina Düvel² , Kai Lothwesen*¹

[1] Staatliche Hochschule für Musik Trossingen, Trossingen, Germany. [2] Institute for Applied Data Science Hannover (Data|H), Hochschule Hannover, Hannover, Germany.

Article information

Jahrbuch Musikpsychologie, 2025, Vol. 33, Article e207, https://doi.org/10.5964/jbdgm.207

Received: 2024-08-27. Accepted: 2025-01-05. Published (VoR): 2025-04-02.

Reviewed by: Jens Knigge; Stephan Sallat.

*Corresponding author at: Staatliche Hochschule für Musik, Schultheiß-Koch-Platz 3, 78647 Trossingen, Germany. E-Mail: k.lothwesen@doz.hfm-trossingen.de

This is an open access article distributed under the terms of the Creative Commons Attribution 4.0 International License, CC BY 4.0, which permits unrestricted use, distribution, and reproduction, provided the original work is properly cited.

Zusammenfassung

Der Begriff Neuromythen kennzeichnet falsche bzw. durch Vereinfachung verfälschte Darstellungen neurowissenschaftlicher Forschungsergebnisse im wissenschaftlichen Diskurs, in der öffentlichen Wahrnehmung und in pädagogischen Praxisfeldern. Bislang vorliegende Befunde belegen das Vorherrschen von Neuromythen in pädagogischen Kontexten. Düvel et al. (2017) haben erstmals die Prävalenz und Prädiktoren von musikbezogenen Neuromythen vergleichend bei Musiklehrenden und Musik-Lehramtsstudierenden im Paradigma der Signalentdeckungstheorie ermittelt. Daran anschließend fragt unsere Replikation (N = 439) nach etwaigen Veränderungen der Diskriminationsleistung von Musik-Lehramtsstudierenden in Bezug auf musikbezogene und allgemeine Thesen zu neurowissenschaftlichen Befunden (Neuromythen und Neurofakten) und auch im Vergleich mit Studierenden anderer Studienfächer sowie im Vergleich mit der studentischen Stichprobe der Referenzstudie. Die Ergebnisse der Replikation zeigen, dass Musik-Lehramtsstudierende, Studierende anderer Lehramtsfächer und Studierende anderer Studiengänge keine signifikanten Unterschiede dahingehend aufweisen, wie gut sie musikbezogene oder allgemeine Neuromythen und Neurofakten als wissenschaftlich belegt oder wissenschaftlich nicht belegt beurteilen können. Im Vergleich mit der Referenzstudie ist die Diskriminationsleistung der Musik-Lehramtsstudierenden in der Replikation signifikant geringer; auch konnten die in der Referenzstudie ermittelten Prädiktoren (Anzahl gelesener Medien, bisherige Studiendauer) nicht repliziert werden. Um die Ausformung und Akzeptanz von Neuromythen im Studium weiterführend zu ergründen, sollten neben individuellen Hintergründen und Interessen auch Lehr- und Studieninhalte sowie die Vermittlung von Bedeutungen und Funktionsweisen des Gehirns und kognitiver Prozesse in der Beschäftigung mit Musik (Hören, Machen, Lernen) untersucht werden.

Keywords: Fehlkonzeptionen, Neuromythen, (Musik-) Studierende, pädagogische Neurowissenschaft, Replikationsstudie

Abstract

The term neuromyth characterizes false or simplified representations of neuroscientific research findings in scientific discourses, public perception, and educational practices. Findings to date confirm the prevalence of neuromyths in educational contexts. Düvel et al. (2017) were the first to compare the prevalence and predictors of neuromyths among music teachers and music teacher students based on the paradigm of signal detection theory (SDT). Following this, our replication investigates possible changes in the abilities of music teacher students to distinguish between music-related and general theses regarding neuroscientific findings (neuromyths and neurofacts) both in comparison to students from other subject areas and the student sample of the reference study. The results of the replication show that music teacher students, teacher students with other subjects, and students from different degree programs do not show any significant differences in how well they can judge whether music-related or general neuromyths and neurofacts are scientifically proven or not. Compared to the reference study, the replication sample of music teacher students shows a significantly lower performance in discriminating neuromyths and neurofacts; moreover, the predictors determined in the reference study (amount of media read, previous duration of study) could not be replicated. To further investigate the formation and acceptance of neuromyths in higher education contexts, it will be necessary to analyze not only individual backgrounds and interests but also various teaching methods and course contents together with the role played by the brain and different cognitive processes in the study of music (listening, making, learning).

Keywords: misconceptions, neuromyths, (music) students, educational neuroscience, replication study

Neuromythen: Phänomen und Diskussionskontexte

Der Begriff Neuromythen kennzeichnet falsche bzw. durch Vereinfachung verfälschte Darstellungen neurowissenschaftlicher Forschungsergebnisse im wissenschaftlichen Diskurs, in der öffentlichen Wahrnehmung und in pädagogischen Praxisfeldern (Clark, 2015). Das Missverstehen oder Vernachlässigen grundlegender Prinzipien wissenschaftlichen Forschens sowie Unsicherheiten im Umgang mit (neuro-) wissenschaftlichen Erkenntnissen können begünstigen, dass diese verkürzt dargestellt, falsch interpretiert oder fehlerhaft aufgefasst und vermittelt werden. Das Phänomen zeigt nach Vidal und Müller (2018) drei Perspektiven: Zum einen sind Neuromythen kulturell verankerte, „weit verbreitete Annahmen und Vorurteile über das Gehirn und seine Arbeitsweise“ (S. 82), die aufklärerisch wirken wollen und sich „gegen gesellschaftliche und alltagsweltliche Vorurteile“ (S. 84) richten; zum zweiten sind mit diesem Begriff „Fehldeutungen, Überinterpretationen oder Simplifizierungen neurowissenschaftlicher Wissensbestände und Forschungsergebnisse“ (S. 83) bezeichnet, die eine Grenze „zwischen Wissenschaft und Nicht-Wissenschaft“ (S. 84) ziehen; und zum dritten werden Neuromythen mit „überzogenen Deutungsansprüchen der Neuro- und Kognitionswissenschaften assoziiert, die zur Mythenproduktion beitragen“ (S. 83), um „zwischen unterschiedlichen Wissenschaften und Wissenschaftsverständnissen“ (S. 84) zu differenzieren. Diese Begriffsfacetten finden sich in wissenschaftlichen, pädagogischen und journalistisch-publizistischen Kontexten wie auch im alltäglichen Sprachgebrauch und verdeutlichen die weite Verbreitung von Neuromythen sowie damit verknüpfte Anwendungsorientierungen. Zu den bekanntesten musikbezogenen Fehlvorstellungen neuro- und kognitionswissenschaftlicher Befunde zählt der weithin rezipierte und problematisierte Mozart-Effekt, der eine temporäre Leistungssteigerung in standardisierten Intelligenztests (räumliches Vorstellungsvermögen) durch Musikhören nahelegt (Rauscher et al., 1993). Zahlreiche Replikationen zeigen jedoch lediglich kleine Effekte und keinen Einfluss bestimmter Musikstücke oder -stile (Pietschnig et al., 2010).¹

Gängige Bezeichnungen wie Neuropädagogik, Neurodidaktik, Neuroeducation oder Educational Neuroscience (Vidal & Müller, 2018) spiegeln das Interesse, aus den Neurowissenschaften fruchtbare Impulse für pädagogische Praxiskontexte zu gewinnen. Die Prävalenz von Neuromythen unter Lehrenden ist empirisch gut belegt; ob und wie diese auf Lernleistungen und Effektivität des Unterrichts einwirkt, ist noch nicht geklärt (Horvath et al., 2018; Krammer et al., 2019; Hennes et al., 2024). Die Entstehung von Neuromythen kann einerseits als Folge eines Mangels an wissenschaftlichem Wissen, sodann aufgrund einer Kommunikationslücke zwischen Forschung und Lehrpraxis oder durch Konsultation von Informationsquellen minderer Qualität seitens der Lehrenden verstanden werden, wie Torrijos-Muelas et al. (2021) mit einer systematischen Auswertung von 24 empirischen Studien der Jahre 2012 bis 2020 aus 20 verschiedenen Ländern (mit N = 13.767 Proband*innen) zeigen. Die Befunde von Dekker et al. (2012) legen zudem nahe, dass ein erhöhtes allgemeines Wissen über das Gehirn und seine Funktionen nicht zwingend vor Fehlkonzeptionen schützt: Lehrende, die angaben, viel über das Gehirn zu wissen, schätzten Neuromythen häufiger als wahre Aussagen ein. Derartige Hintergründe spielen eine Rolle für die Verbreitung musikbezogener Neuromythen u. a. in musikpädagogischen Kontexten. Es scheint daher wenig erstaunlich, dass entsprechende Fehlvorstellungen auch unter fachlich gut informierten und ausgebildeten Musiklehrenden und Musik-Lehramtsstudierenden auftreten, wie Düvel et al. (2017) erstmals feststellten.

Zusammenfassung der Referenzstudie (Düvel et al., 2017)

Düvel et al. (2017) untersuchten die Verbreitung musikbezogener Neuromythen unter Musiklehrkräften und Musik-Lehramtsstudierenden.² In einem mehrstufigen Prozess wurden musikbezogene Neuromythen und Neurofakten recherchiert und in einem Expert*innenrating geprüft, sodass jeweils sieben wissenschaftlich nicht belegte (Neuromythen) und wissenschaftlich belegte Aussagen (Neurofakten) als einzuschätzende Thesen ausgewählt werden konnten. Diese wurden in zwei separaten Online-Erhebungen von Musiklehrenden (n = 91) und Musik-Lehramtsstudierenden (n = 125), dem Paradigma der Signalentdeckungstheorie folgend (siehe dazu unten), als „wissenschaftlich nicht belegt“ oder „wissenschaftlich belegt“ bewertet.³ Auch wurden Kontroll- und Prädiktorvariablen erhoben, wie die Einschätzung des Einflusses von Genetik gegenüber Umwelt auf erfolgreiches Lernen, der höchste erreichte Bildungsabschluss, das Interesse an Neurowissenschaften und dessen Bedeutung für den Lehrberuf, ob eine Aus- oder Weiterbildung in Neurowissenschaften absolviert wurde, ob neurowissenschaftliche Lehrmethoden bekannt sind und ob Bücher, Zeitschriften oder Webseiten zu neurowissenschaftlichen oder ähnlichen Themen gelesen wurden. Studierende wurden zusätzlich nach der Länge ihres bereits absolvierten Studiums und der voraussichtlichen Zeit bis zum Studienabschluss in Fachsemestern gefragt sowie ob sie beabsichtigen, den Lehrberuf zu ergreifen.

Die Ergebnisse zeigten, dass die Studierenden die gegebenen Thesen über Rate-Niveau den korrekten Kategorien zuordneten (d’ = 1.48, SD = 1.22). Tendenziell wurden die präsentierten Thesen eher als wissenschaftlich belegt bewertet (c_Studierende = −0.41). Daraus folgt, dass die gegebenen Neurofakten häufiger korrekt zugeordnet wurden (77,7 %) als Neuromythen (59,3 %). Als signifikante Prädiktoren für eine hohe Diskriminationsleistung zeigten sich in der studentischen Stichprobe die Anzahl gelesener Medien (Bücher, Zeitschriften, Webseiten, β_{standardisiert} = 0.237) sowie die bisherige Studiendauer (β_{standardisiert} = 0.240).

Trotz dieser ersten Einblicke in die Verbreitung musikbezogener Neuromythen unter Musik-Lehramtsstudierenden kann auf der Basis dieser einen bislang vorliegenden Studie noch nicht als gesichert gelten, wie gut jene Zielgruppe zwischen falschen Annahmen (Neuromythen) und wissenschaftlich belegten Aussagen (Neurofakten) unterscheiden kann und wie sich dies in einem Vergleich verschiedener Studienfächer äußert. Daher ist das Ziel unserer Studie, die vorliegenden Befunde von Düvel et al. (2017) in einer Replikation zu überprüfen.

Motivation für eine Replikation

In der empirischen Forschung bieten Replikationsstudien ein wichtiges Mittel zur Sicherung des fachlichen Wissensbestandes, da sie die Anzahl an Beobachtungen erhöhen und so die Verlässlichkeit empirischer Befunde steigern sowie mit der Reflektion angewandter methodischer Verfahren in direkten oder konzeptuellen Replikationen einen Beitrag zur methodologischen Diskussion leisten (Frieler et al., 2013). Da empirische Befunde stets an Merkmale der jeweils untersuchten Stichproben gebunden sind, ist eine Überprüfung der daran erzielten Befunde sinnvoll, besonders im Hinblick auf individuelle Einstellungen und Fähigkeiten, die zudem auch zeit- und kulturbedingten Veränderungen unterworfen sein können. Insofern erscheint eine Replikation der Befunde von Düvel et al. (2017) nach etwa sechs Jahren durchaus einleuchtend, da dieser Zeitraum in etwa eine Studierendenkohorte umfasst. Die Daten der Referenzstudie (Düvel et al., 2017) wurden primär 2015 erhoben (10.06.–21.09.2015, n = 91 Lehrende; 13.11.2015–02.01.2016, n = 125 Studierende), die der Replikationsstudie im Jahr 2021 (07.12.–17.12.2021, N = 439 Studierende).

Forschungsfragen und Hypothesen

Das Ziel der Replikation war zu prüfen, ob die von Düvel et al. (2017) beobachteten Diskriminationsleistungen auch in einer anderen Studierendenkohorte auftreten – und ob und in welcher Weise fachspezifische Wissensstände damit zusammenhängen. Wir erwarteten zunächst, dass sich die Diskriminationsleistung der Musik-Lehramtsstudierenden zwischen den beiden Erhebungen nicht signifikant unterscheidet, da die inhaltlich-fachlichen Kompetenzen beider Kohorten ähnlich sein sollten (Lehramtsstudium mit dem Fach Musik):

H1: Die Diskriminationsleistung (Sensitivität d‘) und die Antworttendenz (Bias c) bei musikbezogenen Thesen unterscheidet sich bei Musik-Lehramtsstudierenden in dieser Erhebung nicht signifikant von den Ergebnissen der von Düvel et al. (2017) erhobenen Stichprobe an Musik-Lehramtsstudierenden.

Zusätzlich werden Studierende anderer Fächer befragt, um Personengruppen mit unterschiedlicher fachlicher Expertise vergleichen zu können. Da auch hier eine fachliche Kompetenz (Fach Musik) bzw. spezifische Qualifikationsmerkmale (Inhalte pädagogischer Psychologie wie Mechanismen des Lernens) in den Blick genommen sind, liegt folgende Vermutung nahe:

H2: Bezogen auf musikbezogene Thesen, zeigen die Musik-Lehramtsstudierenden eine höhere Diskriminationsleistung (Sensitivität d‘) als Lehramtsstudierende anderer Fächer. Diese wiederum zeigen eine höhere Diskriminationsleistung als Studierende in anderen Studiengängen ohne Lehramtsbezug.

Neben 14 musikbezogenen Thesen wurden jeweils drei weitere allgemeine Neuromythen und Neurofakten ausgewählt und abgefragt (siehe Tabelle 1). Da eine fachliche Expertisierung (Fach Musik) hinsichtlich der Einschätzung allgemeiner Thesen keinen Einfluss zeigen sollte, ergibt sich folgende Hypothese:

H3: Bezogen auf die allgemeinen Thesen zeigt sich kein Gruppenunterschied zwischen Lehramtsstudierenden mit dem Fach Musik und Lehramtsstudierenden mit anderen Fächern hinsichtlich ihrer Diskriminationsleistung (Sensitivität d‘).

Auch wird angenommen, dass Lehramtsstudierende aufgrund ihrer Studieninhalte größere Kompetenzen hinsichtlich der Einschätzung von Aussagen über allgemeine Funktionsweisen des Gehirns und Mechanismen des Lernens aufweisen sollten als Studierende anderer Studiengänge, sodass als Hypothese formuliert wird:

H4: Bezogen auf die allgemeinen Thesen zeigen die Lehramtsstudierenden (sowohl mit Fach Musik als auch ohne Fach Musik) eine höhere Diskriminationsleistung (Sensitivität d‘) als die Studierenden anderer Fächer.

Über die Erhebung von Kontroll- und Prädiktorvariablen sollen mögliche Einflussfaktoren auf eine gute Diskriminationsleistung erkundet und mit der Referenzstudie abgeglichen werden. Es liegt folgende Vermutung nahe:

H5: Wie bei Düvel et al. (2017) zeigen erneut Prädiktoren, die mit guter akademischer Bildung im Zusammenhang stehen, einen signifikanten Zusammenhang mit der Diskriminationsleistung (Sensitivität d‘).

Methode

Studiendesign, Ablauf der Befragung und erhobene Variablen

Die Datenerhebung wurde, wie schon die Referenzstudie von Düvel et al. (2017), als Online-Survey auf der Plattform SoSci Survey (https://www.soscisurvey.de/) umgesetzt. Nach einer einleitenden Beschreibung der Forschungsabsicht und dem Hinweis auf eine mögliche Teilnahmevergütung im Rahmen eines Gewinnspiels wurde das Einverständnis zur Datenerhebung eingeholt.

Auf der ersten Seite des Online-Fragebogens wurde nach Alter, Geschlechtsidentität und Zugehörigkeit zu u. a. einer der folgenden Gruppen gefragt: „Lehramtsstudent*in“, „Student*in (kein Lehramt)“. Weitere Gruppen (z. B. Referendare, Berufstätige) waren nur marginal vertreten und ihre Antworten wurden nicht ausgewertet (siehe Filterkriterien im Abschnitt Datenaufbereitung).

Die Lehramtsstudierenden wurden anschließend nach ihrer Fächerkombination und ihrem Studiensemester gefragt sowie, wie viele Semester sie noch bis zum Abschluss benötigen. Die Studierenden anderer Fächer wurden nach ihrem Studiengang, ihrem Studiensemester und der Anzahl der Semester bis zum Abschluss gefragt. Es folgten bei allen Studierenden Fragen zum Bereich der Neuro-Education, die insgesamt denen der Referenzstudie glichen.

Den Kern der Replikation bildete die Bewertung von Thesen (Neuromythen und Neurofakten) durch die Teilnehmenden gemäß des A-Not A-Paradigmas der Signalentdeckungstheorie (Düvel & Kopiez, 2022; Hautus et al., 2022, Kapitel 1 und 2)⁴.

Die Signalentdeckungstheorie (SDT) ist ein Überbegriff für verschiedene Paradigmen, die seit den 1950er Jahren in der Psychophysik entwickelt wurden (Green & Swets, 1966). In typischen Experimenten wurde den Proband*innen entweder ein akustisches Rauschen präsentiert (Noise) oder das gleiche Rauschen zusammen mit einem leisen Ton (Signal). Die Aufgabe bestand darin zu entscheiden, ob ein Ton im Gehörten vorhanden ist, oder nicht. Für die Auswertung ist ausschlaggebend, dass nicht nur die Anteile richtiger und falscher Antworten berechnet werden, sondern die richtigen und falschen Antworten je nach Stimulus-Typ (Noise oder Signal) getrennt betrachtet werden. Diese beiden Anteile werden zum Maß der Sensitivität d‘ (Diskriminationsleistung) verrechnet (siehe Abschnitt Auswertungsplan für Details). Zusätzlich wird angegeben, ob Proband*innen eher dazu tendieren ein Signal zu vermuten oder eher nur das Rauschen wahrzunehmen. Diese Tendenz wird durch das Maß der Antworttendenz c (Bias) abgebildet. Beim A-Not A-Design wird den Proband*innen stets nur ein Stimulus zur selben Zeit präsentiert, der einer der beiden Kategorien Signal („A“) oder Noise („Not A“) zugeordnet werden muss. Bei anderen Paradigmen innerhalb der SDT kann die konkrete Aufgabe anders ausfallen.

Im Fall der vorliegenden Studie entspricht ein Neurofakt dem Typ A (Signal), ein Neuromythos dem Typ Not A. Bei der Durchführung der Studie wurde den Proband*innen jede These einzeln präsentiert, und sie mussten diese als wissenschaftlich belegt oder als nicht wissenschaftlich belegt einordnen. Die insgesamt 20 Thesen wurden in einer zufällig wirkenden, aber gleichbleibenden Reihenfolge abgefragt und auf drei Fragebogenseiten verteilt. Am Ende der Befragung konnten sich die Teilnehmenden für eine Verlosung (10 Gutscheine eines Online-Händlers im Gesamtwert von 50 €) mit ihrer E-Mail-Adresse registrieren; diese wurde getrennt vom Datensatz gespeichert.

Auswahl der Thesen

Die musikbezogenen Thesen wurden aus der Referenzstudie übernommen und anhand aktueller Forschungsberichte überprüft. Aufgrund des mehrstufigen Auswahlprozederes (Düvel et al., 2017) war davon auszugehen, dass diese Thesen reliabel sind und sinnvoll verwendet werden können. Die daraus resultierenden je sieben musikbezogenen Neurofakten und Neuromythen wurden in der Replikation um jeweils drei allgemeine Neurofakten und Neuromythen ergänzt, die aus der Studie von Krammer et al. (2019) übernommen wurden. Damit standen insgesamt je zehn Neurofakten und Neuromythen zur Einschätzung bereit (Tabelle 1).

Tabelle 1

Liste der präsentierten Thesen mit Klassifikation als Mythos oder Fakt und je einem Kurztitel

Bezeichnung	Typ	Kurztitel	These
Musikbezogene Thesen (Düvel et al., 2017)
Mythos 1	Not A	Intelligenz	Hervorragende klassische Musikerinnen sind durchschnittlich intelligenter als Nichtmusikerinnen oder als die nicht-musikalische Bevölkerung mit Hochschulabschluss.
Mythos 2	Not A	Rechenleistung	Durch Musikausbildung werden die Leistungen im Rechnen merkbar verbessert.
Mythos 3	Not A	Leistungssteigerung durch klassische Musik	Das passive Hören von klassischer Musik führt während bestimmter Lernphasen zur Leistungssteigerung
Mythos 4	Not A	Hörzugang	Bestimmte Genres/Stilistiken erzwingen einen bestimmten Hörzugang. Für klassische Musik kommt z. B. nur ein intellektueller Hörzugang in Frage.
Mythos 5	Not A	Händigkeit	Bei Rechtshändern wird Sprache in der linken und Musik in der rechten Hirnhälfte verarbeitet.
Mythos 6	Not A	Musikunterricht und kognitive Fähigkeiten	Musikunterricht ist ein Weg, die kognitiven Fähigkeiten (z. B. Intelligenz) eines Kindes effektiv zu fördern.
Mythos 7	Not A	Improvisationsfähigkeit	Improvisationsfähigkeit am Klavier wird besonders durch die rechte Hirnhälfte gesteuert. Spezielle Übungen können die Leistungsfähigkeit dieser Hemisphäre steigern.
Fakt 1	A	Kopplung Hören und Spielen	Musikerinnen besitzen eine starke neurophysiologische „Kopplung“ zwischen Hören und Spielbewegung. Diese haben sich die Musikerinnen durch intensives Lernen aufgebaut.
Fakt 2	A	Passivhören	Der Einfluss von passivem Musikhören hängt z. B. von der Musikbildung, der emotionalen Wirkung und den Eigenschaften der Musik ab.
Fakt 3	A	Amusie	Es gibt Personen, die Töne, Melodien und Rhythmen nicht verstehen können, obwohl ihre Hörleistung nicht beeinträchtigt ist.
Fakt 4	A	Wahrnehmung	Musikerinnen können Musik besser (schneller, genauer, effizienter) wahrnehmen und verarbeiten als Nichtmusikerinnen.
Fakt 5	A	Plastizität durch Musiküben	Durch intensives Üben eines Instruments verändert sich die anatomische Struktur des Gehirns.
Fakt 6	A	Sprachförderung	Durch Musikunterricht können sprachliche Fähigkeiten gefördert werden.
Fakt 7	A	Informationsverarbeitung	Durch Musik wird allgemein die Verarbeitung von auditorischen Informationen geschult.
Allgemeine Thesen (Krammer et al., 2019)
Mythos 8	Not A	Lerntypen	Schüler*innen lernen besser, wenn ihnen Informationen entsprechend ihrem Lerntyp (z. B. visuell, auditiv, kinästhetisch) vermittelt werden.
Mythos 9	Not A	Intelligenzen und ihre Lokalisation	Es gibt nicht nur eine, sondern mehrere, voneinander unabhängige Intelligenzen, die in unterschiedlichen Gehirnregionen lokalisiert sind.
Mythos 10	Not A	Gehirnentwicklung	Die Gehirnentwicklung ist zwischen dem 11.–12. Lebensjahr abgeschlossen.
Fakt 8	A	Lernen und Nervenzellen	Lernen erfolgt nicht durch die Bildung neuer Nervenzellen.
Fakt 9	A	Schlaf-Wach-Rhythmus	Der zirkadiane Rhythmus („Schlaf-Wach-Rhythmus“) verändert sich während der Pubertät, was dazu führt, dass Schüler*innen während der ersten Stunden des Schultages müde sind.
Fakt 10	A	Plastizität allgemein	Wiederholtes und langfristiges Training bestimmter geistiger Abläufe kann die Form und Struktur mancher Gehirnregionen verändern.

Datenerhebung

Nach einem Pretest (N = 8) wurden im Dezember 2021 die Daten erhoben. Um gezielt Studierende anzusprechen, wurde die Einladung zur Teilnahme an einer Online-Befragung per E-Mail über Musikhochschulen und Universitäten sowie Social-Media-Kanäle und persönliche Kontakte zu Musikstudierenden verbreitet. Die Teilnahme erfolgte freiwillig und ohne Gegenleistung, als Anreiz war eine Verlosung von Gutscheinen eines Online-Händlers gegeben.⁵ Der Umfang der Stichprobe wurde an die Stichprobengröße der Referenzstudie angelehnt, die dort betrachtete Stichprobe von n = 125 Studierende sollten in dieser Erhebung übertroffen werden. Nach einigen Tagen der Datenerhebung lagen bereits 475 Datensätze vor, weshalb die Erhebung geschlossen wurde. Es war davon auszugehen, dass auch nach dem Ausschluss nicht-geeigneter Fälle (siehe folgender Abschnitt) eine Stichprobe von deutlich größerem Umfang als jene der Referenzstudie verfügbar wäre.

Datenaufbereitung

Das Sampling ergab 475 Fälle im Datensatz, der anhand mehrerer Kriterien gefiltert wurde, um eine möglichst gute Datenqualität zu erreichen (Abbildung 1). Diese Kriterien fokussieren die Zielpopulation der Untersuchung (Studierende) und betreffen den Status der Studienteilnehmer*innen (Schule, Ausbildung, Studium, Beruf), eine Mindest-Antwortquote im Fragebogen (vorletzte Seite) sowie zeitliche Grenzwerte in der Bearbeitung des Fragebogens. Eine maximale Bearbeitungsdauer von 20 Minuten wird als Indikator für eine unkonzentrierte oder unterbrochene Bearbeitung der Aufgaben verstanden; aufgrund der als Online-Befragung durchgeführten Datenerhebung sollte eine zeitliche Begrenzung zudem die Möglichkeit einschränken, dass Studienteilnehmer*innen die Beantwortung der Thesen mittels gezielter Online-Recherche unterstützen. Eine minimale Bearbeitungsdauer von mindestens 100 Sekunden wurde festgelegt als Durchschnittswert: Die so verfügbare Bearbeitungszeit von fünf Sekunden je These erscheint unrealistisch schnell und legt ein willkürliches bzw. nicht-reflektiertes Antwortverhalten nahe. Ebenfalls exkludiert wurde ein inkonsistenter Fall, bei dem sich eine Person als Lehramtsstudierende zuordnete, jedoch keine Fächerkombination angab und Freitexteingaben auf Englisch beantwortete, was eine Sprachbarriere nahelegt. Insgesamt resultierte dies in einem Datensatz mit N = 439 gültigen Fällen, der die Basis für alle folgenden Auswertungsschritte bildet.

Vergrößern

Abbildung 1

Flowchart zur Filterung des Datensatzes

Die Primärdaten der Referenzstudie (Düvel et al., 2017) lagen vor, sodass die Replikation einen unmittelbaren Vergleich hinsichtlich der in den relevanten Stichproben gezeigten Diskriminationsleistungen statistisch gesichert auf Datenebene durchführen konnte.

Auswertungsplan

Für die Quantifizierung der Diskriminationsfähigkeit und der Antworttendenz gemäß der SDT ist die Kategorisierung der Antworten auf der Basis des in Tabelle 2 dargestellten Schemas zentral.

Tabelle 2

Schematische Darstellung der Klassifikation von Antworten als Treffer, Auslassung, Falscher Alarm oder Korrekte Zurückweisung gemäß der Signalentdeckungstheorie SDT

		Neurofakt (A) (wissenschaftlich belegt)	Neuromythos (Not A) (wissenschaftlich nicht belegt)
		Einschätzung der Befragten
Eigenschaft der Thesen	Neurofakt (A) (wissenschaftlich belegt)	Treffer (engl.: Hit) korrekte Entscheidung: zutreffende Aussage wird als solche erkannt und angenommen	Auslassung (Fehler zweiter Art, falsch negativ, engl.: Miss) falsche Entscheidung: zutreffende Aussage wird als nicht zutreffend aufgefasst
Eigenschaft der Thesen	Neuromythos (Not A) (wissenschaftlich nicht belegt)	Falscher Alarm (FA; Fehler erster Art, falsch positiv, engl.: False Alarm) falsche Entscheidung: nicht zutreffende Aussage wird als zutreffend aufgefasst	Zurückweisung (engl.: Correct Rejection) korrekte Entscheidung: nicht zutreffende Aussage wird als solche erkannt und abgelehnt

Die Berechnung der Sensitivität d‘ als Maß für die Diskriminationsleistung sowie die Antworttendenz c erfolgt aus dem Anteil an Hits bei der Zuordnung von Neurofakten sowie dem Anteil an FAs bei der Zuordnung von Neuromythen (zur Berechnung siehe Düvel & Kopiez, 2022, S. 2339–2340)⁶. Eine Sensitivität von d‘ = 0 entspricht dem Rate-Niveau, negative Werte spiegeln eine entgegengengesetzte Zuordnung wider, positive Werte eine korrekte Zuordnungsfähigkeit. Bei korrekter Bewertung aller Thesen (Fakten wie Mythen) würde die Person eine Sensitivität von d‘ ≈ 3 erzielen, analog d‘ ≈ −3 bei ausschließlich falschen Zuordnungen. Der neutrale Wert der Antworttendenz (Reaktionsschwelle) ist c = 0; davon abweichende Werte indizieren eine Reaktionsverzerrung: Ein negativer Wert zeigt eine progressive Entscheidungsstrategie an (Personen bewerten tendenziell eher positiv, d. h. die Thesen eher als „wissenschaftlich belegt“), ein positiver Wert eine konservative Entscheidungsstrategie an (Personen bewerten tendenziell eher negativ, d. h. die Thesen eher als „wissenschaftlich nicht belegt“).

Zur Prüfung der Hypothesen wurden folgende statistische Tests durchgeführt: Der Vergleich der Sensitivität bei Musik-Lehramtsstudierenden zwischen der Referenzstudie und der vorliegenden Replikation (H1) erfolgt mit einem Zweistichproben-t-Test für unabhängige Stichproben. Anschließend werden die mittleren Sensitivitäten (mit SD und 95 % CI) für die gesamte Stichprobe und alle Teilstichproben jeweils für alle 20 Thesen wie auch für die 14 musikbezogenen Thesen und für die sechs allgemeinen Thesen einzeln berechnet. Inferenzstatistische Tests erfolgen gemäß der formulierten Hypothesen: H2 erfordert eine between-subjects ANOVA mit den drei genannten Gruppen und der Sensitivität der Musik-Thesen als abhängige Variable. Falls die ANOVA signifikant ist, werden die in der Hypothese genannten Unterschiede durch post-hoc-Tests überprüft. H3 und H4 beziehen sich auf die allgemeinen Thesen und können gemeinsam durch eine between-subjects ANOVA mit ggf. post-hoc-Tests beantwortet werden. Zur Bestimmung von Prädiktoren für eine hohe Diskriminationsleistung (H5) wird eine multiple Regression berechnet (vgl. dazu Düvel et al., 2017).

Beschreibung der Stichprobe

Die alle Befragten umfassende Gesamtstichprobe wurde anhand der Angaben zu Studiengängen und -fächern in drei Teilstichproben gegliedert, um mögliche Unterschiede zwischen Studierenden unterschiedlicher Studienfächer zu untersuchen. Diese Gruppen sind hinsichtlich Geschlecht und Alter ähnlich, Frauen sind stets deutlich stärker vertreten als Männer. Das mittlere Alter lag in allen Teilstichproben bei etwa 23 Jahren (Tabelle 3).

Tabelle 3

Gruppengröße, Geschlecht und Alter der Stichprobe und der Teilstichproben aufgeteilt nach Studiengängen

Stichprobe	Größe der Gruppe	Geschlecht (in Prozent)			Alter (in Jahren)
Stichprobe	Größe der Gruppe	weiblich	männlich	divers / keine Angabe	M	SD	[Min; Max]
Lehramtsstudierende mit Fach Musik	44	81.8	15.9	2.3	23.41	4.40	[18; 44]
Lehramtsstudierende ohne Fach Musik	119	78.2	21.0	0.8	23.06	4.39	[17; 42]
andere Studienfächer (kein Lehramt)	276	74.6	22.5	2.9	22.59	4.69	[18; 70]
gesamte Stichprobe	439	76.3	21.4	2.3	22.80	4.58	[17; 70]

Die ohne Berücksichtigung der möglichen Fächerkombinationen einzelner Studiengänge am häufigsten genannten Fächer der Befragten sind Deutsch (n = 67), Mathematik (n = 63), Musik (n = 45), Biologie (n = 32) und Englisch (n = 31), gefolgt von Geschichte sowie zusammengefasst theologische Fächer und Philosophie/Ethik (jeweils n = 19) sowie Chemie (n = 16); im Mittelfeld der Verteilung mit Nennungen von n = 10 bis n = 2 finden sich Fächer wie u. a. Sachunterricht, Französisch, Geographie und Wirtschaftswissenschaften; jeweils nur einmal genannt wurden Chinesisch, Physik, Sonderpädagogik, Sozialkunde und Spanisch. Damit sind in der Gesamtstichprobe bis auf die Ingenieurwissenschaften alle nach DFG-Systematik klassifizierten Wissenschaftsbereiche vertreten (Natur-, Lebens-, Geistes- und Sozialwissenschaften). Auf eine Auswertung nach einzelnen Fächern wurde aufgrund komplexer Einflussfaktoren (Haupt-, und Nebenfachkombinationen wie auch individuelle Interessen), zu kleiner Teilstichproben und besonders mangelnder theoretischer Grundlage zur Bildung von Hypothesen verzichtet; mit Blick auf das Forschungsinteresse zielführender ist die hier vorgenommene Gruppierung musikbezogener und musikferner Fächer. Die Teilnehmenden wurden gefragt, in welchem Semester sie studieren und wie viele Semester sie noch bis zum Abschluss ihres Studiums benötigen (Tabelle 4). Durchschnittlich waren die Studierenden im 5. Bachelor-Semester (Median) und benötigten noch vier Semester bis zum Abschluss (ebenfalls Median). Die Teilstichproben zeigten große Ähnlichkeiten, die auf keine relevanten Unterschiede zwischen den Teilstichproben schließen lassen. In der Referenzstudie wurde das aktuelle Studiensemester geringfügig anders erhoben, was ermöglichte, aus dem Semester und den verbleibenden Semestern bis zum Abschluss die voraussichtliche Studiendauer zu berechnen. Da hier das Studiensemester ordinalskaliert erhoben wurde, war hier eine Berechnung der voraussichtlichen Studiendauer nicht möglich.

Tabelle 4

Beschreibung der Stichprobe und der Teilstichproben aufgeteilt nach Studiengängen hinsichtlich des aktuellen Studiensemesters und der Semester bis zum Abschluss

Stichprobe	Studiensemester^b				Semester bis zum Abschluss
Stichprobe	n^a	1. Quartil	Mdn	3. Quartil	n	1. Quartil	Mdn	3. Quartil
Lehramtsstudierende mit Fach Musik	42	3.5	5.5	7	44	2	4	6
Lehramtsstudierende ohne Fach Musik	117	1	5	7	119	2	4	7
andere Studienfächer (kein Lehramt)	262	1	5	7	276	2	4	5
gesamte Stichprobe	421	1	5	7	439	2	4	6

^aAusgeschlossen wurden insg. n = 18 Fälle, deren Angabe ungültig war. ^bDas aktuelle Studiensemester wurde ordinalskaliert erhoben und wie folgt kodiert: 1 = Bachelor 1. Semester, 2 = Bachelor 2. Semester, 3 = Bachelor 3. Semester, 4 = Bachelor 4. Semester, 5 = Bachelor 5. Semester, 6 = Bachelor 6. Semester oder höher, 7 = Master 1. Semester, 8 = Master 2. Semester, 9 = Master 3. Semester, 10 = Master 4. Semester oder höher.

Ein Vergleich demografischer Eigenschaften der Musik-Lehramtsstudierenden aus der Replikation und Referenzstudie zeigt einen kleinen, nicht signifikanten Effekt bzgl. des Alters, Welchs t(54.2) = −1.38, p = .17, Cohens d = 0.30: Die Teilstichprobe der Replikation war etwas jünger als die der Referenzstudie. Den Einfluss von Genen gegenüber Umwelt auf das Lernen schätzen beide Teilstichproben gleich ein, ebenso glich sich das jeweilige Interesse an neurowissenschaftlichen Themen. Die Musik-Lehramtsstudierenden der Referenzstudie hatten jedoch mehr Medien zu neurowissenschaftlichen und neuropädagogischen Themen gelesen (Mdn = 1, Interquartilsabstand [IQR] = 2) als jene der Replikationsstudie (Mdn = 0, IQR = 1).

Ergebnisse

Die Aufbereitung des Datensatzes und die Berechnung der SDT-Variablen erfolgte in Microsoft Excel 365. Der finale Datensatz wurde als CSV-Datei exportiert, die weitere Auswertung erfolgte in RStudio (Version 2023.09.1) mittels R (Version 4.3.2) und der Pakete tidyverse (Wickham et al., 2019), effsize (Torchiano, 2016), ggpubr (Kassambara, 2023a), lsr (Navarro, 2015) und rstatix (Kassambara, 2023b). Das Auswertungsskript ist frei verfügbar (s. Ergänzende Materialien).

Diskriminationsleistung und Antworttendenz bei Musik-Lehramtsstudierenden und im Vergleich zur Referenzstudie von Düvel et al. (2017; Hypothese 1)

Die n = 125 Musik-Lehramtsstudierenden der Referenzstudie (Düvel et al., 2017) zeigten eine mittlere Sensitivität von d‘ = 1.48 (SD = 1.22, siehe auch Abbildung 2 für ein Fehlerbalkendiagramm) und eine Antworttendenz c = −0.41 (SD = 0.71). Um diese mit den n = 44 Musik-Lehramtsstudierenden aus der Replikation zu vergleichen, wurden zunächst die Sensitivität und die Antworttendenz für diese Teilstichprobe hinsichtlich der musikbezogenen Thesen ermittelt. Dies ergab Werte von d‘ = 1.05 (SD = 0.70, s. Abbildung 2) und c = −0.34 (SD = 0.40), d. h. sie tendierten ebenfalls leicht dazu, die Thesen als wissenschaftlich belegt einzuschätzen. Zweistichproben-t-Tests für unabhängige Stichproben ergaben einen signifikanten, kleinen Unterschied in der Sensitivität zwischen den beiden Gruppen, Welchs t(132.6) = 2.81, p = .006, Cohens d = 0.38 mit 95 % CI [0.04, 0.73]. Der geringe Unterschied zwischen den beiden Stichproben hinsichtlich der Antworttendenz erreichte jedoch keine statistische Signifikanz, Welchs t(133.3) = −0.85, p = .40, Cohens d = −0.12 mit 95 % CI [−0.46, 0.23]. Auf dieser Grundlage ist davon auszugehen, dass die Diskriminationsleistung der Musik-Lehramtsstudierenden in der Replikation etwas geringer ist als in der Referenzstudie. Hypothese 1 (es besteht kein Unterschied in der Diskriminationsleistung zwischen der vorliegenden Replikationsstudie und der Originalstudie) ist somit abzulehnen. Hinsichtlich der Antworttendenz liegt jedoch wahrscheinlich kein Unterschied zwischen den beiden Grundgesamtheiten vor, Hypothese 1 kann bzgl. der Antworttendenz angenommen werden.

Vergrößern

Abbildung 2

Fehlerbalkendiagramm der Sensitivität für die verschiedenen Teilstichproben und im Vergleich zu Düvel et al. (2017)

Anmerkung. Teilstichprobengrößen an der x-Achse stammen aus der vorliegenden Replikationsstudie.

Unterschiede in der Diskriminationsleistung zwischen den Teilstichproben (Hypothesen 2, 3 und 4)

Die Sensitivität wurde für die beschriebenen Teilstichproben jeweils für alle insgesamt 20 Thesen sowie separat für die 14 musikbezogenen Thesen und die sechs allgemeinen Thesen berechnet und in Abbildung 2 als Fehlerbalkendiagramm dargestellt.

Hypothese 2 vermutet Unterschiede zwischen den Gruppen hinsichtlich ihrer Diskriminationsleistung bezüglich musikbezogener Thesen (Abbildung 2). Um die Mittelwertsunterschiede auf Signifikanz zu überprüfen, wurde eine one-way ANOVA mit dem Faktor Gruppe (between-Faktor, 3 Stufen: [1] Lehramt Musik, [2] Lehramt andere Fächer und [3] andere Studiengänge) berechnet: F(1, 437) = 0.806, p = .37, $η_{p}^{2} = .002$ . Mit Blick auf die Testwerte ist Hypothese 2 abzulehnen: Zwar zeigt die Gruppe der Musik-Lehramtsstudierenden die höchsten Sensitivitätswerte, jedoch konnte kein Beleg für statistisch signifikant unterschiedliche Diskriminationsleistungen zwischen Studierenden unterschiedlicher Studiengänge bezüglich der musikbezogenen Thesen gefunden werden.

Hypothesen 3 und 4 formulieren Gruppenunterschiede hinsichtlich der Diskriminationsleistungen bezüglich allgemeiner Thesen (Abbildung 2). Analog zur Prüfung von Hypothese 2 wurde eine weitere ANOVA berechnet: F(1, 437) = 0.197, p = .658, $η_{p}^{2} = .0005$ . Diese zeigte ebenfalls keinen statistisch signifikanten Unterschied zwischen den Teilstichproben. Dieser Befund ist mit Hypothese 3 vereinbar, die formuliert, dass sich die Diskriminationsleistungen bezüglich allgemeiner Thesen zwischen Lehramtsstudierenden mit dem Fach Musik und Lehramtsstudierenden anderer Fächer nicht unterscheidet. Hingegen ist Hypothese 4 abzulehnen: Es wurde keine statistisch signifikant höhere Diskriminationsleistung in den Gruppen der Lehramtsstudierenden (mit und ohne das Fach Musik) als bei Studierenden anderer Studiengänge gefunden.

Prädiktoren für die Diskriminationsleistung (Hypothese 5)

Um mögliche Prädiktoren für eine gute Diskriminationsleistung zu bestimmen, wurde wie in der Referenzstudie eine multiple Regression berechnet. Im Vergleich zur Referenzstudie konnte die Variable Promotion nicht mit einbezogen werden, da diese in der Replikation nicht erhoben wurde. Folgende Variablen wurden als Prädiktoren mit einbezogen:

Alter,
Geschlecht (wobei die n = 10 Personen mit den Angaben „divers“ oder „keine Angabe“ für diese multiple Regression ausgeschlossen wurden),
Studiengang (als Dummy-Variable: Lehramt vs. kein Lehramt),
Einfluss von Genen und Umwelt auf das Lernen (ein Fall wurde wegen fehlendem Wert ausgeschlossen),
Interesse an Neurowissenschaften (als Dummy-Variable: sehr großes Interesse vs. kein bis etwas Interesse),
Lehrveranstaltungen zu Neurodidaktik (als Dummy-Variable: mind. eine vs. keine Lehrveranstaltung),
Anzahl gelesener Medien
Semester (ohne n = 18 Fälle mit fehlenden oder ungültigen Werten)
Semester bis zum Abschluss

Die multiple Regression wurde in R mittels der Funktion lm() mit den Standard-Parametern berechnet. Sie ergab für die n = 410 vollständigen Fälle p = .73 mit R² = .015 und konnte demnach keinen relevanten Prädiktor für die Diskriminationsleistung anhand des vorliegenden Datensatzes ermitteln. Hypothese 5, die ähnliche Prädiktoren wie bei der Referenzstudie vermutete, kann daher nicht angenommen werden.

Explorative Analysen

Weitere Untersuchung der Antworttendenz

Weitere Hypothesen zu den Unterschieden zwischen den Teilstichproben oder zwischen musikbezogenen und allgemeinen Thesen konnten vorab nicht aufgestellt werden. Im Rahmen der Auswertungen wurden jedoch für alle Thesen die entsprechenden Werte der Antworttendenz berechnet (Abbildung 3). Es zeigt sich ein kleiner Effekt in der stärkeren Antworttendenz bei den allgemeinen Thesen, c = −0.45, als bei den musikbezogenen Thesen, c = −0.36; t(438) = 3.36, p < .001, d = 0.21 mit 95 % CI [0.09, 0.33]. Die allgemeinen Thesen scheinen demnach insgesamt noch etwas wissenschaftlicher eingeschätzt zu werden als die Thesen mit Musikbezug. Dieser Unterschied zeigte sich jedoch kaum bei Lehramtsstudierenden, stattdessen besonders bei den Studierenden anderer Studiengänge.

Vergrößern

Abbildung 3

Fehlerbalkendiagramm der Antworttendenz für die verschiedenen Teilstichproben und im Vergleich zu Düvel et al. (2017)

Anmerkung. Teilstichprobengrößen an der x-Achse stammen aus der vorliegenden Replikationsstudie.

Antwortverhalten zu den einzelnen Thesen

Neben der Diskriminationsleistung, die die Fähigkeit der richtigen Zuordnung für alle Thesen oder Thesengruppen (musikbezogen bzw. allgemein) misst, ist es interessant den Anteil richtiger Antworten bei den einzelnen Thesen zu betrachten. Hieraus lässt sich entnehmen, welche Thesen besonders häufig falsch eingeschätzt werden und daher in der pädagogischen Ausbildung aufgeklärt werden sollten.

Die Mythen, dass bestimmte Genres einen bestimmten Hörzugang erzwingen (Mythos 4) und dass die Gehirnentwicklung zwischen dem 11. und 12. Lebensjahr abgeschlossen sei (Mythos 10), entlarvten 90 % aller Proband*innen der Gesamtstichprobe der Replikation. Noch mehr korrekte Antworten erzielte lediglich der Fakt, dass wiederholtes und langfristiges Training die Form und Struktur mancher Gehirnregionen verändern kann (Fakt 10, 93 % korrekte Antworten). Vier der Mythen erhielten höchstens 25 % richtige Antworten: Improvisationsfähigkeit am Klavier würde besonders durch die rechte Hirnhälfte gesteuert (Mythos 7, 25 %); es gäbe nicht nur eine, sondern mehrere, voneinander unabhängige Intelligenzen, die in unterschiedlichen Gehirnregionen lokalisiert seien (Mythos 9, 22 %); Musikunterricht sei ein Weg, die kognitiven Fähigkeiten eines Kindes effektiv zu fördern (Mythos 6, 20 %); und zuletzt der Mythos, dass Schüler*innen besser lernen, wenn ihnen Informationen entsprechend ihrem Lerntyp (z. B. visuell, auditiv, kinästhetisch) vermittelt werden (Mythos 8, 17 %). Hier fallen besonders Fehlvorstellungen zur Lateralisation und zur Organisation des Gehirns auf. Auch in der vorliegenden Untersuchung zeigt sich deutlich die weit verbreitete Annahme, dass man mit Musikunterricht kognitive Fähigkeiten fördern könne - dies zeigte sich bereits in der Referenzstudie. Bezüglich der allgemeinen Thesen überrascht auch die weite Verbreitung des Lerntypen-Mythos kaum.

Die Einschätzungen der Musik-Lehramtsstudierenden aus der Replikation und der Referenzstudie unterscheiden sich insgesamt nur wenig (Tabelle 5), jedoch wurde der Mythos zur Leistungssteigerung durch klassische Musik (Mythos 3) in der Referenzstudie deutlich häufiger zurückgewiesen als in der Replikation (65 % statt 45 %). Hingegen wurde der Fakt zur Informationsverarbeitung (Fakt 7) in der Replikation häufiger korrekt beurteilt (89 % statt 78 %).

Tabelle 5

Anteile richtiger Antworten für die 20 Thesen

Bezeichnung	Musik/allgemein	Kurztitel	Anteil richtiger Antworten
Bezeichnung	Musik/allgemein	Kurztitel	Gesamte Stichprobe der Replikationsstudie (N = 439)	Musik-Lehramts-studierende der Replikationsstudie (n = 44)	Musik-Lehramts-studierende in Düvel et al. (2017, n = 125)
Fakt 8	allg.	Lernen und Nervenzellen	.49	.50	—
Fakt 4	Musik	Wahrnehmung	.84	.82	.74
Mythos 4	Musik	Hörzugang	.90	.95	.90
Fakt 7	Musik	Informationsverarbeitung	.86	.89	.78
Mythos 5	Musik	Händigkeit	.55	.61	.62
Mythos 7	Musik	Improvisationsfähigkeit	.25	.36	.41
Fakt 5	Musik	Plastizität durch Musiküben	.76	.75	.79
Mythos 1	Musik	Intelligenz	.70	.77	.81
Mythos 2	Musik	Rechenleistung	.57	.57	.51
Fakt 9	allg.	Schlaf-Wach-Rhythmus	.84	.82	—
Fakt 3	Musik	Amusie	.86	.89	.81
Mythos 6	Musik	Musikunterricht und kognitive Fähigkeiten	.20	.23	.25
Mythos 9	allg.	Intelligenzen und ihre Lokalisation	.22	.16	—
Fakt 10	allg.	Plastizität allgemein	.93	1.00	—
Mythos 10	allg.	Gehirnentwicklung	.90	.89	—
Mythos 8	allg.	Lerntypen	.17	.34	—
Fakt 2	Musik	Passivhören	.61	.73	.68
Fakt 6	Musik	Sprachförderung	.59	.68	.76
Fakt 1	Musik	Kopplung Hören und Spielen	.82	.84	.87
Mythos 3	Musik	Leistungssteigerung durch klassische Musik	.44	.45	.65

Anmerkung. Die Reihenfolge der Thesen in dieser Tabelle entspricht der Reihenfolge im Fragebogen. Für eine bessere Übersichtlichkeit sind hier nur die Kurztitel aufgeführt, die vollständigen Formulierungen der Thesen befinden sich in Tabelle 1. Die Ergebnisse der Thesen mit besonders hohen oder niedrigen Anteilen richtiger Antworten oder mit einem besonders großen Unterschied zwischen den beiden Erhebungen sind fett markiert und werden im Text diskutiert.

Diskussion

Die hier vorgestellten Befunde zeigen gemäß den formulierten Hypothesen verschiedene Facetten der Prävalenz von Neuromythen in studentischen Stichproben. Mit Sensitivitätswerten im positiven Bereich zeigen alle Teilstichproben eine Diskriminationsleistung über Rate-Niveau. Musik-Lehramtsstudierende zeigen dabei keine statistisch höhere Diskriminationsleistung der Musikthesen als die Studierenden anderer Fächer (Hypothese 2 wurde verworfen). Die erwartete Expertisierung aufgrund eines fachbezogenen Studiums zeigte sich nicht. Entgegen den Befunden von Dekker et al. (2012) scheint fachspezifisches Wissen in dieser Teilstichprobe nicht in Zusammenhang mit der erhobenen Diskriminationsleistung zu stehen.

Dass hinsichtlich der Diskriminationsleistungen zu allgemeinen Thesen keine Unterschiede zwischen Lehramtsstudierenden mit und ohne das Fach Musik feststellbar sind (H3), erscheint einsichtig: Als Themen der pädagogischen Psychologie sind Mechanismen und Prozesse des Lernens relevante Studieninhalte in allen Lehramtsstudiengängen. Dass bezüglich allgemeiner neurowissenschaftlicher Thesen allerdings kein Unterschied zwischen Lehramtsstudierenden (mit und ohne das Fach Musik) und Studierenden anderer Studiengänge/-fächer nachweisbar ist (H4), erscheint zunächst kontraintuitiv und könnte einer möglicherweise zu groben Kategorisierung (Lehramt vs. Nicht-Lehramt) geschuldet sein: Fachspezifische Anforderungen und Inhalte des jeweiligen Studiums sind nicht differenzierbar. Zwar vermutet Novak-Geiger (2023) aufgrund signifikant besserer Diskriminationsleistung und eines geringeren Response Bias bei Psychologie- gegenüber Lehramtsstudierenden einen Einfluss der Studieninhalte. Zu einem tiefergehenden Vergleich liegen allerdings bislang noch keine belastbaren empirischen Befunde vor, sodass unsere Studie hier einen ersten Ansatzpunkt für eine weitere Hypothesenbildung bietet.

Hinsichtlich der in der Referenzstudie erzielten Befunde zeigen sich bemerkenswerte Unterschiede. So ist die Diskriminationsleistung (Sensitivität) der Musik-Lehramtsstudierenden in der Replikation auf mittlerem Niveau der Effektstärke signifikant geringer als in der Referenzstudie (H1). Auch konnten die in der Referenzstudie für die studentische Stichprobe ermittelten Prädiktoren der gezeigten Diskriminationsleistung (Anzahl gelesener Medien, bisherige Studiendauer) nicht repliziert werden (H5). Eine einsichtige Erklärung für diesen Befund ist aus den erhobenen Daten allerdings nicht ableitbar. Ob sich hierin ein systematischer Kohorteneffekt äußert, ist daher nicht begründbar. Empirische Befunde, die lediglich geringe Unterschiede zwischen Lehramtsstudierenden des ersten und höherer Fachsemester feststellen, legen zudem die Vermutung nahe, dass die Studiendauer kein hinreichend verlässlicher Prädiktor sein könnte (Deibl & Zumbach, 2020; Grospietsch & Mayer, 2019). Darum müssten in zukünftigen Untersuchungen weitere mögliche Einflussfaktoren hinsichtlich sozialer Faktoren der Bildung von Neuromythen und etwaiger Vermittlungskontexte (Medien, Studium, Freizeit, …) stärker einbezogen werden. Dabei wären auch aktuelle didaktische Themen, wie eine veränderte Lernkultur und die potenzielle Rolle der Digitalisierung, stärker als mögliche Prädiktoren zu berücksichtigen und auch der Einfluss von Neuromythen auf die Unterrichtspraxis zu analysieren. Grundsätzlich aber sollten die bekannten und auch hier geprüften Prädiktoren weiter untersucht werden, da diese in den bislang vorliegenden Studien nicht einheitlich replizierbar waren. Es gilt also sowohl bildungsbezogene wie auch soziale Faktoren hinsichtlich ihres Einflusses auf die Prävalenz und Persistenz von Neuromythen zu befragen.

Die Prävalenz und die Prädiktoren von Neuromythen bei (Musiklehramts-)Studierenden könnten so im Rahmen der von Vidal und Müller (2018) genannten Begründungszusammenhänge sinnvoll kontextualisiert werden, um Einflussfaktoren und Prozesse der Ausformung und Akzeptanz von Neuromythen im Studium zu ermitteln. Hierzu sollten neben der Erhebung individueller Hintergründe und relevanter Interessen wie freiwillige Weiterbildungen auch Lehr- und Studieninhalte, (hochschul-)didaktische Prinzipien und Theorien der Vermittlung von Bedeutungen sowie Funktionsweisen des Gehirns und kognitiver Prozesse in der Beschäftigung mit Musik (Hören, Machen, Lernen) untersucht werden – neben Musikstudierenden wären so auch Hochschullehrende als weitere Zielgruppe in den Blick zu nehmen, die bislang in der Forschung noch nicht eingehend untersucht wurde.

Limitationen

Die Thesen wurden in der vorliegenden Untersuchung – anders als in der Referenzstudie – in einer festen Reihenfolge im Fragebogen präsentiert. Obgleich aufgrund der Aufgabenstellung und der Art der Präsentation der Items Reihenfolgeneffekte auszuschließen waren, da die Items jeweils separat einzuschätzen waren und dabei von einem Rate-Niveau von 50 % ausgegangen werden konnte, könnten sich in den Bewertungen der einzelnen Thesen doch Bearbeitungseffekte widergespiegelt haben. Der große Unterschied an richtigen Antworten zwischen der Referenzstudie und der vorliegenden Erhebung hinsichtlich der zuletzt präsentierten These (Mythos 3) könnte auf einen solchen Effekt zurückzuführen sein, wenn das schlechtere Ergebnis durch Ermüdung zu Stande gekommen sein sollte. In der über alle Thesen oder Thesengruppen gemittelt errechneten Diskriminationsleistung macht sich dies jedoch nicht mehr bemerkbar, sodass schließlich eine Vergleichbarkeit mit der Referenzstudie sichergestellt ist.

Während die vorliegende Studie zwar insgesamt eine größere Stichprobe aufweist (N = 439), war der Anteil der Musik-Lehramtsstudierenden jedoch relativ gering (n = 44). Daraus folgt Vorsicht im Umgang mit den Ergebnissen, die auf dieser Teilstichprobe beruhen: Sie sollten als Indizien für Veränderungen und aktuelle Entwicklungen verstanden werden, benötigen jedoch weitere Bestätigung und Untersuchung durch nachfolgende Studien. Das hier vorwiegend verwendete Convenience Sampling hat eine Stichprobe mit Studierenden aus einem breiten Fächerspektrum ermöglicht, was dem Forschungsinteresse im Sinne einer breiten Vergleichsgruppe dienlich war. Für weiterführende gezieltere Fragestellungen, bspw. der Prüfung einzelner Zielgruppen hinsichtlich bestimmter Prädiktoren, müssten andere Verfahren der Stichprobenziehung gewählt werden. Jedoch wären zuvor hinreichend belastbare theoretische Grundlagen zu schaffen, die bislang so noch nicht vorliegen. Tatsächlich ist die Plausibilität bereichspezifischer Annahmen anhand des aktuellen Forschungsstandes nicht eindeutig nachweisbar: Ob also das (Haupt-)Studienfach grundsätzlich einen Einfluss auf die Prävalenz und Persistenz von Neuromythen hat, ist noch nicht hinreichend gesichert – zumindest mit Blick auf bislang vorliegende empirische Befunde. Die von der Referenzstudie abweichenden Ergebnisse unserer Replikation zeigen eben dies.

Bislang sind nur wenige solcher didaktischen Implikationen formuliert, was eine praktische Umsetzung der gewonnenen Erkenntnisse erschwert (Dekker et al., 2012; Jolles & Jolles, 2021). Um der Persistenz von Neuromythen entgegenzuwirken, sollte die Lehramtsausbildung nicht nur allgemein neurowissenschaftliche Befunde vermitteln, sondern gezielt auf diese Mythen eingehen. Besonders relevant erscheinen dabei jene, deren Umsetzung negative Auswirkungen auf die schulische Lehr-Lern-Praxis haben könnte (Krammer et al., 2019; Hennes et al., 2024). Künftige Studien könnten hier tiefer einsteigen und Methoden der Vermittlung bzw. Aneignung entsprechender Wissensbestände in einzelnen Studienfächern betrachten und mögliche Effekte auf subjektive Einschätzungen untersuchen, um Unterschiede bzgl. fachspezifischer Perspektiven und Studieninhalte stärker herauszuarbeiten (Deibl & Zumbach, 2020; Grospietsch & Mayer, 2021; Novak-Geiger, 2023). Sinnfällige Vorarbeiten dazu könnten aus qualitativen Ansätzen gewonnen werden, die subjektive Einstellungen zu neurowissenschaftlichen Fragestellungen und Forschungsergebnissen ermitteln, wie auch individuelle Kompetenzen im Umgang damit erheben, z. B. in der Gestaltung von Lern- oder Lehrprozessen oder im alltagsbezogenen Austausch im Freundeskreis. Solcherart implizite Theorien könnten dann tiefergehende Perspektiven eröffnen und auch in eine didaktische Diskussion der Vermittlung neurowissenschaftlicher Erkenntnisse, bspw. in Lehramtsfächern, einfließen.

Anmerkungen

1) Die nicht-wissenschaftliche Diskussion verschob den Fokus von Erwachsenen (Studierende als Studienteilnehmer*innen) auf Kinder und sogar Babys (Bangerter & Heath, 2004). Damit einher ging eine Verformung der eigentlichen Erkenntnis: Es wurde nicht thematisiert, dass kognitives Problemlösen u. a. durch musikinduzierte körperliche Erregungszustände positiv beeinflusst werden kann (Schellenberg, 2012), sondern eine Wirkung der Musik Mozarts wurde auf menschliche Intelligenz verallgemeinert (Schumacher, 2006).

2) Im Folgenden werden neben dem methodischen Vorgehen lediglich die Ergebnisse der studentischen Stichprobe als Basis der vorliegenden Replikation kurz referiert.

3) In der Veröffentlichung wurde das Design als ein Two-Alternative Forced-Choice (2-AFC) Paradigma benannt (Düvel et al., 2017, S. 4), tatsächlich handelt es sich eigentlich um ein A-Not A Design, wie Düvel und Kopiez (2022) nachträglich erläuterten: In beiden Fällen wird die Zuordnung von Stimuli zu einer von zwei Kategorien geprüft. Im 2-AFC-Paradigma werden dazu zwei Stimuli aus zwei unterschiedlichen Kategorien präsentiert, während im A-Not A-Design nur ein Stimulus präsentiert wird und zwei Antwortkategorien zur Auswahl bereitstehen. Durch die Möglichkeit des Vergleichs ist die 2-AFC-Aufgabe leichter als die A-Not A-Aufgabe, weist jedoch oft eine geringere ökologische Validität als Aufgaben im A-Not A-Design auf (Düvel & Kopiez, 2022, S. 2335–2337).

4) Das Design der vorliegenden Studie ist jedoch kein paired A-Not A-Design, welches den Fokus von Düvel und Kopiez (2022) bildet. Grund hierfür ist, dass nicht jeweils ein Mythos und ein Fakt eine inhaltliche Einheit bilden, sondern alle Mythen von allen Fakten voneinander thematisch unabhängig sind. Daraus folgt, dass der McNemar’s Test als Signifikanztest für die Diskriminationsfähigkeit nicht berechnet werden kann. Wie bei Düvel und Kopiez (2022) im Fokus stehend handelt es sich jedoch auch hier um ein replicated A-Not A-Design, da jedem*jeder Proband*in nicht nur eine These präsentiert wird, sondern mehrere Thesen zur Bewertung vorgelegt werden.

5) Im Sinne einer Replikation fokussiert unsere Studie die Überprüfung der in der Referenzstudie ermittelten Diskriminationsleistungen an studentischen Stichproben. Die bei einer solchen nicht-kontrollierten Stichprobenbildung möglichen Verzerrungen bzgl. des subjektiven Interesses der Studienteilnehmer*innen am Untersuchungsgegenstand (Bortz & Schuster, 2010, S. 81) erscheinen darum akzeptabel, zumal neben einer gezielten Ansprache Studierender auch ein offenes Verfahren angewandt wurde, das auch nicht-studentische Personen erreichen konnte.

6) Die dafür notwendige z-Transformation erfordert eine Korrektur von Anteilen, die genau 1 oder 0 sind. Düvel und Kopiez (2022) schlagen die Berechnung nach Macmillan und Creelman (2005, S. 8) vor, bei der die Anzahl der Stimuli zum Einsatz kommt. In der vorliegenden Studie werden sowohl alle 20 Thesen gemeinsam ausgewertet, als auch die 14 musikbezogenen Thesen und die sechs allgemeinen Thesen einzeln betrachtet. Hierbei wurde nicht die jeweilige Thesenanzahl für den Korrekturvorgang verwendet (20, 14 oder 6), sondern stets 14, um die Vergleichbarkeit zwischen den drei Thesen-Gruppen und den Vergleich zur Referenzstudie zu gewährleisten.

Finanzierung

Die Autor*innen haben keine Finanzierung für das Forschungsprojekt erhalten.

Interessenkonflikte

Die Autor*innen haben erklärt, dass keinerlei konkurrierende Interessen bestehen.

Danksagung

Die Autor*innen haben keine weitere (d. h. nicht-finanzielle) Unterstützung erhalten.

Datenverfügbarkeit

Aus datenschutzrechtlichen Gründen ist die Nutzung der Daten den Autor*innen vorbehalten. Das Auswertungsskript ist über OSF (Düvel, 2025) verfügbar und kann mit Pseudo-Daten ausgeführt werden (siehe Supplementary Materials). Diese wurden nicht erhoben, sondern zufällig generiert und ähneln dem Original-Datensatz z. B. hinsichtlich Benennung, Skalenniveaus und Verteilungen der Variablen.

Ergänzende Materialien

Für diesen Artikel sind das Analyseskript und Pseudo-Datensätze verfügbar (s. Düvel, 2025).

Quellenverzeichnis der ergänzenden Materialien

Düvel, N. (2025). Auswertungsskript zu: Prävalenz und Prädiktoren von Neuromythen bei (Musik-)Studierenden: Eine Teilreplikation der Studie von Düvel et al. (2017) [Analyseskript, Pseudo-Datensätze]. OSF. https://osf.io/bv4mf

Literatur

Bangerter, A., & Heath, C. (2004). The Mozart effect: Tracking the evolution of a scientific legend. British Journal of Social Psychology, 43(4), 605–623. https://doi.org/ 10.1348/0144666042565353
Bortz, J., & Schuster, C. (2010). Statistik für Human- und Sozialwissenschaftler (7. Auflage). Springer.
Clark, J. (2015). Philosophy, neuroscience and education. Educational Philosophy and Theory, 47(1), 36–46. https://doi.org/ 10.1080/00131857.2013.866532
Deibl, I., & Zumbach, J. (2020). „Ich bin eher der auditive Lerntyp“ – der Glaube an Neuromythen bei Lehramtsstudierenden und Implikationen für die Lehrer*innenbildung. In M. Krämer, J. Zumbach, & I. Deibl (Hrsg.), Psychologiedidaktik und Evaluation (Bd. XIII, S. 111–120). Shaker.
Dekker, S., Lee, N. C., Howard-Jones, P., & Jolles, J. (2012). Neuromyths in education: prevalence and predictors of misconceptions among teachers. Frontiers in Psychology, 3, Article 429. https://doi.org/ 10.3389/fpsyg.2012.00429
Düvel, N., & Kopiez, R. (2022). The paired A-Not A design within signal detection theory: Description, differentiation, power analysis and application. Behavior Research Methods, 54(5), 2334–2350. https://doi.org/ 10.3758/s13428-021-01728-w
Düvel, N., Wolf, A., & Kopiez, R. (2017). Neuromyths in music education: Prevalence and predictors of misconceptions among teachers and students. Frontiers in Psychology, 8, Article 629. https://doi.org/ 10.3389/fpsyg.2017.00629
Frieler, K., Müllensiefen, D., Fischinger, T., Schlemmer, K., Jakubowski, K., & Lothwesen, K. (2013). Replication in music psychology. Musicae Scientiae, 17(3), 265–276. https://doi.org/ 10.1177/1029864913495404
Green, D. M., & Swets, J. A. (1966). Signal detection theory and psychophysics. John Wiley.
Grospietsch, F., & Mayer, J. (2021). Angebot, Nutzung und Ertrag von Konzeptwechseltexten zu Neuromythen bei angehenden Biologielehrkräften. Zeitschrift für Didaktik der Naturwissenschaften, 27(1), 83. 107. https://doi.org/ 10.1007/s40573-021-00127-0
Grospietsch, F., & Mayer, J. (2019). Pre-service science teachers’ neuroscience literacy: Neuromyths and a professional understanding of learning and memory. Frontiers in Human Neuroscience, 13, Article 20. https://doi.org/ 10.3389/fnhum.2019.00020
Hautus, M., Macmillan, N. A., & Creelman, C. D. (2022). Detection theory: A user's guide (3. Aufl.). Routledge. https://doi.org/ 10.4324/9781003203636 https://doi.org/ 10.4324/9781003203636
Hennes, A.-K., Schabmann, A., & Schmidt, B. M. (2024). The prevalence and usage of “neuromyths” among German in-service- and pre-service teachers – compared to neuroscience specialists and the general public. Mind, Brain and Education: The Official Journal of the International Mind, Brain, and Education Society, 18(1), 135–147. https://doi.org/ 10.1111/mbe.12401
Horvath, J. C., Donoghue, G. M., Horton, A. J., Lodge, J. M., & Hattie, J. A. C. (2018). On the irrelevance of neuromyths to teacher effectiveness: Comparing neuro-literacy levels amongst award-winning and non-award winning teachers. Frontiers in Psychology, 9, Article 1666. https://doi.org/ 10.3389/fpsyg.2018.01666
Jolles, J., & Jolles, D. D. (2021). On neuroeducation: Why and how to improve neuroscientific literacy in educational professionals. Frontiers in Psychology, 12, Article 752151. https://doi.org/ 10.3389/fpsyg.2021.752151
Kassambara, A. (2023a). ggpubr: 'ggplot2' based publication ready plots (Version 0.6.0) [R-Paket]. https://CRAN.R-project.org/package=ggpubr
Kassambara, A. (2023b). rstatix: Pipe-friendly framework for basic statistical tests (Version 0.7.2) [R-Paket]. https://CRAN.R-project.org/package=rstatix
Krammer, G., Vogel, S. E., Yardimci, T., & Grabner, R. H. (2019). Neuromythen sind zu Beginn des Lehramtsstudiums prävalent und unabhängig vom Wissen über das menschliche Gehirn. Zeitschrift für Bildungsforschung, 9(2), 221–246. https://doi.org/ 10.1007/s35834-019-00238-2
Macmillan, N. A., & Creelman, C. D. (2005). Detection theory: A user’s guide (2. Aufl.). Lawrence Erlbaum.
Navarro, D. J. (2015). Learning statistics with R: A tutorial for psychology students and other beginners (Version 0.6). University of New South Wales, Sydney, Australia. https://learningstatisticswithr.com/lsr-0.6.pdf
Novak-Geiger, V. (2023). Prevalence of neuromyths among psychology students: Small differences to pre-service teachers. Frontiers in Psychology, 14, Article 1139911. https://doi.org/ 10.3389/fpsyg.2023.1139911
Pietschnig, J., Voracek, M., & Formann, A. K. (2010). Mozart effect–Shmozart effect: A meta-analysis. Intelligence, 38(3), 314–323. https://doi.org/ 10.1016/j.intell.2010.03.001
Rauscher, F. H., Shaw, G. L., & Ky, K. N. (1993). Music and spatial task performance. Nature, 365(6447), 611. https://doi.org/ 10.1038/365611a0
Schellenberg, E. G. (2012). Cognitive performance after listening to music: A review of the Mozart effect. In R. MacDonald, G. Kreutz, & L. Mitchell (Hrsg.), Music, health, and wellbeing (S. 325–338). Oxford University Press. https://doi.org/ 10.1093/acprof:oso/9780199586974.003.0022
Schumacher, R. (Ed.). (2006). Macht Mozart schlau? Die Förderung kognitiver Kompetenzen durch Musik. Bundesministerium für Bildung und Forschung. https://www.bildungsserver.de/onlineressource.html?onlineressourcen_id=37388
Torchiano, M. (2016). Effsize - A package for efficient effect size computation [R-Paket]. Zenodo. https://doi.org/ 10.5281/ZENODO.1480624
Torrijos-Muelas, M., González-Víllora, S., & Bodoque-Osma, A. R. (2021). The persistence of neuromyths in the educational settings: A systematic review. Frontiers in Psychology, 11, Article 591923. https://doi.org/ 10.3389/fpsyg.2020.591923
Vidal, N., & Müller, T. (2018). Der Mythos von den Neuromythen: Kritische Anmerkungen zu einem neuropädagogischen Argumentationsmuster. In S. Schenk & M. Karcher (Hrsg.), Überschreitungslogiken und die Grenzen des Humanen: (Neuro-)Enhancement – Kybernetik – Transhumanismus (S. 79–104). Martin-Luther-Universität Halle-Wittenberg.
Wickham, H., Averick, M., Bryan, J., Chang, W., McGowan, L. D., François, R., Grolemund, G., Hayes, A., Henry, L., Hester, J., Kuhn, M., Pedersen, T. L., Miller, E., Bache, S. M., Müller, K., Ooms, J., Robinson, D., Seidel, D. P., Spinu, V., . . .Yutani, H. (2019). Welcome to the tidyverse. Journal of Open Source Software, 4(43), Article 1686. https://doi.org/ 10.21105/joss.01686