<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article
  PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD with MathML3 v1.2 20190208//EN" "JATS-journalpublishing1-mathml3.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:ali="http://www.niso.org/schemas/ali/1.0/" article-type="research-article" dtd-version="1.2" xml:lang="de">
<front>
<journal-meta>
<journal-id journal-id-type="publisher-id">JM</journal-id>
<journal-id journal-id-type="nlm-ta">Jahrb Musik</journal-id>
<journal-title-group>
<journal-title>Jahrbuch Musikpsychologie</journal-title>
<abbrev-journal-title abbrev-type="pubmed">Jahrb. Musik.</abbrev-journal-title>
</journal-title-group>
<issn pub-type="epub">2569-5665</issn>
<publisher><publisher-name>PsychOpen</publisher-name></publisher>
</journal-meta>
<article-meta>
<article-id pub-id-type="publisher-id">jbdgm.89</article-id>
<article-id pub-id-type="doi">10.5964/jbdgm.89</article-id>
<article-categories>
<subj-group subj-group-type="heading"><subject>Forschungsberichte</subject></subj-group>
</article-categories>
<title-group>
<article-title>Musikalischer g-Faktor oder multiple Faktoren? Struktur und Leistungskennwerte der musikalischen Hörfähigkeit von Jugendlichen</article-title>
<trans-title-group xml:lang="en">
<trans-title>Musical g Factor or Multiple Factors? Structure and Norms of Musical Ability of Adolescents</trans-title>
</trans-title-group>
<alt-title alt-title-type="right-running">Struktur musikalischer Fähigkeiten im Jugendalter</alt-title>
<alt-title specific-use="APA-reference-style" xml:lang="de">Musikalischer g-Faktor oder multiple Faktoren? Struktur und Leistungskennwerte der musikalischen Hörfähigkeit von Jugendlichen</alt-title>
</title-group>
<contrib-group>
<contrib contrib-type="author"><name name-style="western"><surname>Pausch</surname><given-names>Viola</given-names></name><xref ref-type="aff" rid="aff1"><sup>1</sup></xref></contrib>
  <contrib contrib-type="author" corresp="yes"><name name-style="western"><surname>Müllensiefen</surname><given-names>Daniel</given-names></name><xref ref-type="corresp" rid="cor1">*</xref><xref ref-type="aff" rid="aff1"><sup>1</sup></xref><xref ref-type="aff" rid="aff2"><sup> 2</sup></xref></contrib>
<contrib contrib-type="author"><name name-style="western"><surname>Kopiez</surname><given-names>Reinhard</given-names></name><xref ref-type="aff" rid="aff1"><sup>1</sup></xref></contrib>
  
  <contrib contrib-type="reviewer"><name name-style="western"><surname>Schäfer</surname><given-names>Thomas</given-names></name></contrib>
  
  <contrib contrib-type="reviewer"><name name-style="western"><surname>Schwarzer</surname><given-names>Gudrun</given-names></name></contrib>
  
<aff id="aff1"><label>1</label><institution>Musikwissenschaftliches Institut, Hochschule für Musik, Theater und Medien Hannover</institution>, <addr-line><city>Hannover</city></addr-line>, <country country="">Deutschland</country></aff>
<aff id="aff2"><label>2</label>Goldsmiths College, University of London, London, Großbritannien</aff>
</contrib-group>
<author-notes>
  <corresp id="cor1"><label>*</label>Musikwissenschaftliches Institut, Hochschule für Musik, Theater und Medien Hannover, Neues Haus 1, 30175 Hannover, Deutschland. <email xlink:href="D.Mullensiefen@gold.ac.uk">D.Mullensiefen@gold.ac.uk</email></corresp>
</author-notes>
<pub-date pub-type="epub"><day>16</day><month>03</month><year>2022</year></pub-date>
  <pub-date pub-type="collection" publication-format="electronic"><year>2022</year></pub-date>
<volume>30</volume>
  <volume-id pub-id-type="title">Musikpsychologie – Empirische Forschungen - Ästhetische Experimente</volume-id><elocation-id>e89</elocation-id>
<history>
<date date-type="received">
<day>21</day>
<month>01</month>
<year>2021</year>
</date>
<date date-type="accepted">
<day>17</day>
<month>01</month>
<year>2022</year>
</date>
  <date date-type="published">
    <day>##</day>
    <month>##</month>
    <year>2022</year>
  </date>
</history>
<permissions><copyright-year>2022</copyright-year><copyright-holder>Pausch, Müllensiefen &amp; Kopiez</copyright-holder><license license-type="open-access" specific-use="CC BY 4.0" xlink:href="https://creativecommons.org/licenses/by/4.0/"><license-p>This is an open-access article distributed under the terms of the Creative Commons Attribution (CC BY) 4.0 License, which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.</license-p></license></permissions>
<abstract>
<p>Die Struktur musikalischer Fähigkeiten ist bislang nicht eindeutig identifiziert. Die vorliegende Studie untersucht, ob es analog zu Gardners Konzept der multiplen Intelligenzen mehrere unabhängige Musikalitäten gibt oder analog zu Spearmans Generalfaktor der Intelligenz hingegen nur einen allgemeinen Musikalitätsfaktor. Hierbei wird Musikalität im Rahmen der LongGold-Studie mittels Tests zur Beat- und Intonationswahrnehmung sowie zur Melodie- und Emotionsunterscheidung an einer Stichprobe aus Jugendlichen (N = 1786) zwischen acht und 18 Jahren (M = 11,78, SD = 1,68) in Deutschland und Großbritannien gemessen. Insgesamt zeigen die Testwerte mittlere bis hohe Korrelationen. Der Vergleich zweier latenter Variablenmodelle und eine konfirmatorische Faktorenanalysen geben Hinweise darauf, dass das Modell des allgemeinen g-Faktors der Intelligenz wahrscheinlich ebenfalls für musikalische Fähigkeit konzeptualisiert als einfaktorielles Modell gilt. Für die einzelnen Musikalitätstests werden Normwerte bereitgestellt, die nach Alter, Geschlecht und Ausmaß der musikalischen Ausbildung differenziert sind.</p>
</abstract><trans-abstract xml:lang="en">
<p>The structure of musical abilities has not yet been clearly identified. The present study investigates whether musicality is best modelled as a collection of several independent musicalities, analogous to Gardner's concept of multiple intelligences, or as one general musicality factor, analogous to Spearman's general “g” factor of intelligence. As part of the LongGold study, we measured musicality using tests of beat and intonation perception as well as melodic and emotional discrimination in a sample of adolescents (N = 1786, age range: 8–18 years, M = 11,78, SD = 1,68) from Germany and the United Kingdom. Overall, test scores correlated with medium to high effect sizes. The comparison of several latent variable models and a confirmatory factor analysis suggested that probably, a model similar to the general g-factor model of intelligence also applies to musical listening ability conceptualized as a single-factor model. Norm values are provided for the individual musicality tests differentiated according to age, gender, and the extent of musical training.</p></trans-abstract>
<kwd-group kwd-group-type="author" xml:lang="de"><kwd>musikalische Fähigkeit</kwd><kwd>Musikalität</kwd><kwd>Gold-MSI-Fragebogen</kwd><kwd>Jugendliche</kwd><kwd>empirische Normen</kwd></kwd-group>
<kwd-group kwd-group-type="translator" xml:lang="en"><kwd>musical ability</kwd><kwd>musicality</kwd><kwd>Gold-MSI questionnaire</kwd><kwd>adolescents</kwd><kwd>empirical norms</kwd></kwd-group>
</article-meta>
</front>
<body>
  <sec sec-type="intro"><title/>
    <p>Ist es möglich, dass eine Person ein gutes Rhythmusgefühl hat, aber beim Singen keinen Ton trifft? Gibt es Personen, die zwar mit Leichtigkeit jede Melodie im Gedächtnis behalten, aber kein Gespür dafür haben, welche Emotionen ein Musikstück vermittelt? Obwohl bereits seit mehr als 200 Jahren über Musikalität und musikalische Fähigkeiten geforscht wird (siehe z. B. <xref ref-type="bibr" rid="r27">Michaelis, 1805</xref>), gibt es keine definitive Antwort auf diese Fragen, da nicht bekannt ist, wie viele verschiedene, unabhängige Facetten von Musikalität existieren. Die Struktur musikalischer Fähigkeiten ist bislang nicht eindeutig identifiziert (<xref ref-type="bibr" rid="r34">Müllensiefen &amp; Hemming, 2018</xref>, S.&nbsp;115; <xref ref-type="bibr" rid="r11">Gembris, 1997</xref>, S. 869) und aus den Forschungsergebnissen bisheriger Studien können „keine endgültigen Aussagen” (<xref ref-type="bibr" rid="r12">Gembris et al., 1997</xref>, S. 869) darüber abgeleitet werden. Angelehnt an <xref ref-type="bibr" rid="r8">Fodors (1983)</xref> Theorie der Modularität des Geistes haben <xref ref-type="bibr" rid="r39">Peretz und Coltheart (2003)</xref> ein Modell für die Verarbeitung von Musik formuliert, welches in verschiedene Module gegliedert ist. Dieses Modell legt nahe, dass die Verarbeitung von Musik modular in neuronal isolierbaren Komponenten organisiert ist. Als Beleg dafür werden musikbezogene Defizite bei neurologisch beeinträchtigten Menschen aufgeführt. In der hier vorgestellten Studie wird die Frage beantwortet, ob dieses Konzept der Einteilung musikalischer Verarbeitungsprozesse in mehrere Module auch auf musikalische Fähigkeiten im Jugendalter übertragbar ist. Musikalische Fähigkeiten werden hierbei verstanden als geschätztes und nicht direkt beobachtbares Entwicklungspotential, welches musikalischen Fertigkeiten zugrunde liegt. Musikalische Fertigkeiten sind wiederum definiert als tatsächlich erbrachte und über geeignete Tests messbare, lern- und erfahrungsabhängige, musikalische Leistungen (<xref ref-type="bibr" rid="r34">Müllensiefen &amp; Hemming, 2018</xref>, S.&nbsp;97; <xref ref-type="bibr" rid="r12">Gembris et al., 1997</xref>, S. 868).</p>
    <p>In der Geschichte der Musikalitätstests spiegelt sich die Grundfrage über die Struktur musikalischer Fähigkeiten in den Testkonzeptionen und -konstruktionen von <xref ref-type="bibr" rid="r56">Wing (1961)</xref> und <xref ref-type="bibr" rid="r46">Seashore (1919b)</xref> wider: Als „der erste moderne standardisierte Musiktest” (<xref ref-type="bibr" rid="r34">Müllensiefen &amp; Hemming, 2018</xref>, S. 95) ermittelt der Test <italic>Seashore Measures of Musical Talent</italic> (<xref ref-type="bibr" rid="r46">Seashore, 1919b</xref>) mittels sechs Subtests für Tonhöhe, Lautstärke, Rhythmus, Tondauer, Timbre und tonales Gedächtnis (<xref ref-type="bibr" rid="r34">Müllensiefen &amp; Hemming, 2018</xref>, S. 103) „ein Profil einzelner und unverbundener grundlegender musikalischer Fertigkeiten” (<xref ref-type="bibr" rid="r34">Müllensiefen &amp; Hemming, 2018</xref>, S. 99) gemäß eines multifaktoriellen Musikalitätskonzepts. Die Ergebnisse der einzelnen Subtests werden jedoch nicht zu einem Summenwert zusammengefasst, sondern bilden stattdessen ein Profil multipler, voneinander relativ unabhängiger musikalischer Fähigkeiten (<xref ref-type="bibr" rid="r3">Boyle &amp; Radocy, 1987</xref>, S. 143). Dies macht deutlich, dass Seashore ein einheitliches Konstrukt musikalischer Fähigkeiten als eine einzelne Begabung ablehnte. Im Gegensatz dazu stehen <xref ref-type="bibr" rid="r56">Wings (1961)</xref> <italic>Standardized Tests of Musical Intelligence</italic> und sein Konzept des musikalischen General- bzw. <italic>g</italic>-Faktors. Gemäß eines Generalfaktormodells (<xref ref-type="bibr" rid="r12">Gembris et al., 1997</xref>, Sp. 869) nimmt er an, dass einzelnen elementaren, „messbaren musikalischen Fertigkeiten ein einheitliches Konstrukt zugrunde liegt” (<xref ref-type="bibr" rid="r34">Müllensiefen &amp; Hemming, 2018</xref>, S. 99) – und kein multiples Konstrukt wie bei Seashore – und dass sie als musikalischer Generalfaktor miteinander verbunden sind. Daher aggregiert der Wing-Test die Ergebnisse der einzelnen sieben Subtests zu einem einzigen Gesamttestwert für musikalische Intelligenz, dem sogenannten Musikalitätsquotienten (MQ; <xref ref-type="bibr" rid="r3">Boyle &amp; Radocy, 1987</xref>, S. 146), der eine Analogie zum <italic>g</italic>-Faktor in der Intelligenzforschung darstellt.</p>
<p>Eine frühere Studie, die allgemeiner die Faktorenstruktur von Hörfähigkeiten untersuchte, stammt von <xref ref-type="bibr" rid="r51">Stankov und Horn (1980</xref>; vgl. <xref ref-type="bibr" rid="r30">Müllensiefen, 2017b</xref>, S.&nbsp;130). In einer Re-Analyse der Testbatterien, unter anderem von <xref ref-type="bibr" rid="r47">Seashore et al. (1960)</xref>, <xref ref-type="bibr" rid="r57">Wing (1962)</xref> und <xref ref-type="bibr" rid="r6">Drake (1954)</xref>, fanden sie zwischen den Ergebnissen von 241 erwachsenen Männern in vielen der insgesamt 44 untersuchten Subtests starke Korrelationen. Dadurch konnten sie „sieben Faktoren auditorischer Fähigkeiten” (<xref ref-type="bibr" rid="r30">Müllensiefen, 2017b</xref>, S. 130) identifizieren, von denen drei hauptsächlich musikalische Fähigkeiten beschreiben: „auditorische Kognition von Zusammenhängen, Unterscheidung von Soundmustern, Beibehalten und Beurteilen von Rhythmen“ (vgl. <xref ref-type="bibr" rid="r30">Müllensiefen, 2017b</xref>, S.&nbsp;130). Da die Studie von <xref ref-type="bibr" rid="r51">Stankov und Horn (1980)</xref> nicht ausschließlich musikalische Wahrnehmungsfähigkeiten betrachtet, sind die Ergebnisse nicht direkt auf die oben genannte Problemstellung übertragbar. Die vorliegende Arbeit beschränkt sich daher auf musikalische Fähigkeiten und untersucht zudem eine größere Stichprobe (<italic>N</italic> = 1786) als die von Stankov und Horn. Eine Studie von <xref ref-type="bibr" rid="r21">Kidd et al. (2007)</xref> verwendete ebenfalls den faktoranalytischen Ansatz und Modellvergleiche, betrachtet jedoch allgemeinere auditorische Fähigkeiten und arbeitete zudem nicht mit musikbezogenen Tests.</p>
<p>Im Rahmen der Langzeitstudie <italic>LongGold</italic> (<ext-link ext-link-type="uri" xlink:href="https://longgold.org">https://longgold.org</ext-link>) zur Entwicklung musikalischer Fähigkeiten im Jugendalter werden musikalische Fähigkeiten in verschiedenen, unabhängig voneinander konstruierten Musikalitätstests zur Beat- und Intonationswahrnehmung sowie zur Melodie- und Emotionsunterscheidung untersucht. Auf dieser Datengrundlage soll in der hier vorgestellten Studie die Frage beantwortet werden, ob das Konzept der Einteilung musikalischer Verarbeitungsprozesse in mehrere Module wie bei <xref ref-type="bibr" rid="r39">Peretz und Coltheart (2003)</xref> auch auf musikalische Fähigkeiten im Jugendalter übertragbar ist. Die Herangehensweise ist hierbei „durch die Intelligenzforschung inspiriert” (<xref ref-type="bibr" rid="r12">Gembris et al., 1997</xref>, Sp. 869), da diese bereits ähnliche Überlegungen über die Struktur allgemeiner kognitiver Fähigkeiten und entsprechende Strukturmodelle lieferte, obgleich nach wie vor Uneinigkeit darüber herrscht, ob Intelligenz als einzelne Fähigkeit oder als Repertoire mehrerer heterogener, unabhängiger und unkorrelierter Fähigkeiten zu konzeptualisieren sei (<xref ref-type="bibr" rid="r35">Myers, 2014</xref>, S.&nbsp;400; <xref ref-type="bibr" rid="r36">Neyer &amp; Asendorpf, 2018</xref>, S. 154).</p>
    <p>Eines der Strukturmodelle ist <xref ref-type="bibr" rid="r10">Gardners (2006)</xref> Modell der multiplen Intelligenzen, in dem mehrere Formen von Intelligenz unterschieden werden. <xref ref-type="bibr" rid="r50">Spearman (1904b)</xref>, <xref ref-type="bibr" rid="r20">Jensen (1989)</xref> und <xref ref-type="bibr" rid="r25">Mackintosh (2011)</xref> hingegen gehen von einem Generalfaktor der Intelligenz aus, mit dem alle anderen Subfaktoren verbunden sind. Spearmans einfaches Faktormodell wurde über die letzten Jahrzehnte zu hierarchischen Modellen mit mehreren Ebenen ausdifferenziert: zum Beispiel zusammengefasst in der Cattell-Horn-Carroll-Theorie der kognitiven Fähigkeiten (CHC-Theorie; <xref ref-type="bibr" rid="r26">McGrew, 2005</xref>). Dabei wird weiterhin der <italic>g</italic>-Faktor als grundlegende mentale Fähigkeit angenommen. Musikalische Fähigkeiten werden in der CHC-Theorie unter der breiten Domäne <italic>Auditory processing</italic> eingeordnet. Dort werden <italic>Musical Discrimination and Judgment</italic> und <italic>Maintaining and Judging Rhythm</italic> als spezifische Fähigkeiten unterschieden. Die Frage, die in unserer Studie beantwortet werden soll, ist, ob diese spezifisch musikalischen Fähigkeiten auch wieder eine hierarchische Struktur aufweisen oder eher unverbunden sind.</p>
<sec sec-type="other1"><title>Ziel der Studie</title>
  <p>Durch eine Faktorenanalyse sollen im ersten Teil dieser Arbeit folgende Leitfragen beantwortet werden: Existiert nur ein einziger allgemeiner Musikalitätsfaktor analog zu <xref ref-type="bibr" rid="r50">Spearmans (1904b)</xref> Generalfaktor der Intelligenz, der den Zusammenhang zwischen verschiedenen Musikalitätstests erklären könnte, oder sind sie hingegen – vergleichbar zu <xref ref-type="bibr" rid="r10">Gardners (2006)</xref> Konzept der multiplen Intelligenzen – als multiple Musikalitätsfaktoren unverbunden und liegen damit mehrere unabhängige Formen musikalischer Fähigkeiten vor? Ist eines der konkurrierenden Modelle von Gardner und Spearman auf die Struktur musikalischer Fähigkeiten übertragbar?</p>
<p>Da für viele wichtige Musiktests, wie zum Beispiel denen von <xref ref-type="bibr" rid="r45">Seashore (1919a</xref>, S. 11) und <xref ref-type="bibr" rid="r14">Gordon (2004</xref>, S. 24), Normen existieren, jedoch noch nicht für die in der <italic>LongGold</italic>-Studie eingesetzten Musiktests, ist ein weiteres Ziel, abhängig von Alter, Geschlecht und Ausmaß musikalischer Ausbildung für jeden Test Normwerte aus den empirischen Daten zu erstellen.</p></sec>
<sec sec-type="other2"><title>Das LongGold-Projekt</title>
<p>Die empirischen Daten, die die Grundlage dieser Arbeit bilden, wurden im Rahmen des Forschungsprojekts <italic>LongGold</italic> erhoben (<ext-link ext-link-type="uri" xlink:href="https://longgold.org">https://longgold.org</ext-link>). <italic>LongGold</italic> ist eine Langzeitstudie, die musikalische Hörfähigkeiten und nicht-verbale Intelligenz in adaptiven Tests, Persönlichkeit durch das Big-Five-Persönlichkeitsinventar sowie Einstellungen, Selbstkonzept, mentales Wohlbefinden, soziale Fähigkeiten, musikalische und nicht-musikalische Freizeitaktivitäten und demographische Variablen erfasst (<xref ref-type="bibr" rid="r31">Müllensiefen &amp; Elvers, 2018</xref>). Ziel des Projekts ist es zu verstehen, wie sich musikalische Fähigkeiten im Alter zwischen zehn und 20 Jahren in Zusammenhang mit Intelligenz, sozialen Kompetenzen und Persönlichkeit entwickeln, und ob Transfereffekte zwischen diesen Bereichen oder Folgeeffekte musikalischer Betätigung auf Schulleistung existieren (<xref ref-type="bibr" rid="r31">Müllensiefen &amp; Elvers, 2018</xref>). Darüber hinaus sollen Faktoren identifiziert werden, welche die musikalische Entwicklung beeinflussen, fördern oder verursachen können (<xref ref-type="bibr" rid="r31">Müllensiefen &amp; Elvers, 2018</xref>; <xref ref-type="bibr" rid="r29">Müllensiefen, 2017a</xref>). Die Durchführung der Studie an Schulen wurde von den Ethikkommissionen der Leibniz Universität Hannover und des Goldsmiths College der University of London sowie den Kultusministerien von Baden-Württemberg und Hessen genehmigt.</p></sec></sec>
<sec sec-type="other3"><title>Methode</title>
<sec><title>Vorgehensweise</title>
<p>In dieser Studie wird das am besten passende Strukturmodell für musikalische Fähigkeiten anhand einer Stichprobe aus 622 britischen Jugendlichen identifiziert. Anschließend wird geprüft, ob dieses Modell seine Gültigkeit für eine größere Stichprobe aus 1164 Kindern der 5. und 6. Klassen mehrerer Schulen in Deutschland behält.</p></sec>
<sec><title>Stichprobe</title>
<p>Im Rahmen der Langzeitstudie <italic>LongGold</italic> wurden im Schuljahr 2018/19 in Großbritannien 622 und in Deutschland 1168 Jugendliche bezüglich ihrer musikalischen Fähigkeiten untersucht. Vier Schüler*innen aus Deutschland wurden wegen einer auditiven Wahrnehmungsstörung (<italic>n</italic> = 1) und dem Tragen von Hörgeräten (<italic>n</italic> = 3) aus der endgültigen Gesamtstichprobe ausgeschlossen, sodass die verbleibende Gruppe <italic>N</italic> = 1786 Kinder und Jugendliche umfasste. Sie waren zwischen acht und 18 Jahre alt (<italic>M</italic> = 11,78, <italic>SD</italic> = 1,68; GB: <italic>M</italic>&nbsp;=&nbsp;13,47, <italic>SD</italic>&nbsp;=&nbsp;1,63; DE: <italic>M</italic> = 10,87, <italic>SD</italic> = 0,78). Da eine der untersuchten, britischen Schulen eine reine Mädchenschule war, bestand die britische Stichprobe zum Großteil aus Mädchen (72,03% weiblich, 24,44% männlich sowie 3,54% andere oder „möchte ich nicht sagen”). In der Stichprobe aus Deutschland waren 48,11% Mädchen und 46,48% Jungen (5,41% andere oder „möchte ich nicht sagen”). Insgesamt folgt daraus ein Gesamtanteil von 56,44% Mädchen und 38,80% Jungen (4,76% andere oder „möchte ich nicht sagen“). In Großbritannien wurden die Daten an verschiedenen privaten weiterführenden Schulen und in Deutschland an verschiedenen staatlichen weiterführenden Schulen (Gymnasien, Gesamtschulen und eine Realschule) erhoben. An den britischen Schulen wurde der sozioökonomische Status in Anlehnung an <xref ref-type="bibr" rid="r41">Rose (2005)</xref> sowie <xref ref-type="bibr" rid="r42">Rose und Pevalin (2001)</xref> durch den Bildungsgrad der Eltern und die berufliche Tätigkeit des*der Haupteinkommensbezieher*in der Familie erfasst. Der Großteil der Eltern hatte als höchsten Bildungsabschluss einen (Fach-)Hochschulabschluss oder die (Fach-)Hochschulreife und arbeitete in Führungs-, Verwaltungs- und Fachberufen. In Großbritannien gaben die meisten Schüler*innen als Muttersprache Englisch (89,07%), Chinesisch (3,86%) oder Russisch (1,45%) an. In ihrer Freizeit oder in der Familie sprachen 13,83% eine weitere Sprache (außer Englisch). Als Staatsbürgerschaft wurden britisch (85,69%), chinesisch (3,86%) oder russisch (1,61%) genannt. In Deutschland wurde der sozioökonomische Status nicht erhoben. Hier war die Nationalität der Schüler*innen größtenteils deutsch (93,13%), gefolgt von türkisch (0,86%). Neben Deutsch (75,77%) waren die häufigsten Muttersprachen Türkisch (4,38%), Russisch (3,95%), Arabisch (1,89%), Polnisch (1,72%) und Serbisch (1,20%). Mehr als ein Viertel (27,66%) sprach außerhalb der Schule eine weitere Sprache neben Deutsch.</p></sec>
<sec><title>Die verwendeten Tests</title>
<p>Den in dieser Studie verwendeten Musiktests liegt die Annahme zugrunde, dass musikalische Fähigkeiten durch das Abschneiden in den Aufgaben, welche die verschiedenen Aspekte der Musikwahrnehmung testen, messbar sind. Musikalität als latente Variable bzw. Konstrukt ist nicht direkt beobachtbar und wird daher durch die Leistungen in den vier performativen Musiktests operationalisiert (vgl. <xref ref-type="bibr" rid="r54">Werner et al., 2016</xref>, S. 949). Alle Tests basieren messtheoretisch auf der Item-Response-Theorie (IRT), die mit Ausnahme des Emotionsunterscheidungstests deren adaptive Verwendung ermöglicht. Das bedeutet, dass für jede Versuchsperson während der Testung ein eigenes Itemset dynamisch ausgewählt wird und sich die Schwierigkeit der Items somit individuell nach der Fähigkeit jeder einzelnen Person richtet (<xref ref-type="bibr" rid="r9">Frey, 2012</xref>, S. 275). Die Tests nutzen außerdem realistische und damit ökologisch valide Stimuli aus dem den Schüler*innen vertrauten Rock-Pop-Bereich (<xref ref-type="bibr" rid="r34">Müllensiefen &amp; Hemming, 2018</xref>, S. 113). Für die Lösung der Testaufgaben werden nicht zwingend Fähigkeiten benötigt, die „an das Erlernen eines Instruments oder an formalen Musikunterricht gekoppelt sind” (<xref ref-type="bibr" rid="r34">Müllensiefen &amp; Hemming, 2018</xref>, S. 93). Alle Hörtests – bis auf den Emotionsunterscheidungstest – beinhalteten Beispiele und eine Trainingsphase. <xref ref-type="table" rid="tA.1">Tabelle A1</xref> im Anhang gibt einen Überblick über die vier verschiedenen Tests, deren Reliabilitätswerte, die Größe der Stichprobe dieser Studie und Referenzen zur Kalibrierungsstudie.</p>
<sec><title>Beat-Wahrnehmungstest (BAT)</title>
<p>Der <italic>Computerised Adaptive Beat Alignment Test</italic> (<italic>CA-BAT</italic>, kurz <italic>BAT</italic>) bewertet die Fähigkeit einer Person, den Grundschlag bzw. Beat in einem kurzen Musikausschnitt wahrzunehmen und danach zu beurteilen, ob dieser mit einem gleichzeitig erklingenden Metronom übereinstimmt. Beat-Wahrnehmung bezeichnet hierbei den Prozess, einen zugrunde liegenden Puls oder Grundschlag aus einem Musikausschnitt abzuleiten (<xref ref-type="bibr" rid="r16">Harrison &amp; Müllensiefen, 2018</xref>, S. 1; <xref ref-type="bibr" rid="r38">Patel &amp; Iversen, 2014</xref>, S. 2). In einer 2AFC-Aufgabe (Two-Alternative-Forced-Choice-Aufgabe) müssen die Versuchspersonen entscheiden, in welcher von zwei Versionen die Beep-Töne exakt mit dem Beat synchronisiert sind.</p></sec>
<sec><title>Emotionsunterscheidungstest (EDT)</title>
<p>Der Emotionsunterscheidungstest (engl. „Musical Emotion Discrimination Task”) bestimmt die Fähigkeit einer Person, den beabsichtigten emotionalen Ausdruck aus dargebotener Musik gemäß dem Production-Recogniti<?glue?>on-Paradigma zu erkennen (<xref ref-type="bibr" rid="r23">MacGregor &amp; Müllensiefen, 2019</xref>). Dafür gibt die Person an, welcher von zwei Musikausschnitten eher eine bestimmte Emotion transportiert. Ein Item besteht hierbei aus zwei Versionen derselben Phrase, die sich nur in der intendierten Emotion unterscheiden. Die Aufgabe der Testpersonen ist es, in einem 2AFC-Format auszuwählen, welche der beiden Versionen eher mit einer der vier Zielemotionen übereinstimmt, also beispielsweise, welche Version einen fröhlicheren Ausdruck hat.</p></sec>
<sec><title>Melodieunterscheidungstest (MDT)</title>
<p>Der Melodieunterscheidungstest (engl. „Melodic Discrimination Test”) erfasst die Fähigkeit einer Person, Unterschiede in verschiedenen kurzen Melodien zu erkennen (<xref ref-type="bibr" rid="r17">Harrison et al., 2017</xref>, S. 2), indem getestet wird, wie gut Veränderungen in einem Ton bei einer von insgesamt drei transponierten Versionen derselben Melodien identifiziert werden können (<xref ref-type="bibr" rid="r17">Harrison et al., 2017</xref>).</p></sec>
<sec><title>Intonationswahrnehmungstest (MPT)</title>
<p>Der Intonationswahrnehmungstest (engl. „Mistuning Perception Test”) misst die Fähigkeit, unterscheiden zu können, ob eine Gesangsstimme zu hoch oder zu tief im Verhältnis zur Hintergrundmusik intoniert ist. In einer 2AFC-Aufgabe muss entschieden werden, welche von zwei Versionen desselben Musikausschnitts falsch, also „verstimmt“ klingt (<xref ref-type="bibr" rid="r22">Larrouy-Maestri et al., 2019</xref>).</p></sec>
<sec><title>Goldsmiths Musical Sophistication Index (Gold-MSI)</title>
<p>Der <italic>Goldsmiths Musical Sophistication Index</italic> ist ein Selbstauskunftsfragebogen für Nicht-Musiker*innen, der musikalische Erfahrenheit nicht nur im Sinne musikalischer Expertise durch Instrumentalspiel und -unterricht misst, sondern auch als Folge weiterer allgemeiner, aktiver Auseinandersetzung und Umgangsweisen mit Musik in all ihren Facetten (<xref ref-type="bibr" rid="r44">Schaal et al., 2014</xref>, S. 423; <xref ref-type="bibr" rid="r32">Müllensiefen et al., 2014</xref>, S. 1). Das psychometrische Konstrukt des <italic>Gold-MSI</italic> gliedert sich in einen globalen Faktor (<italic>GMSI</italic>) und die fünf Faktoren <italic>F1 Aktiver Umgang mit Musik</italic>, <italic>F2 Musikalische Wahrnehmungsfähigkeiten</italic>, <italic>F3 Musikalische Ausbildung</italic>, <italic>F4 Emotionen</italic> und <italic>F5 Gesangsfähigkeiten</italic> (<xref ref-type="bibr" rid="r32">Müllensiefen et al., 2014</xref>; <xref ref-type="bibr" rid="r34">Müllensiefen &amp; Hemming, 2018</xref>, S. 98; Übersetzungen aus <xref ref-type="bibr" rid="r44">Schaal et al., 2014</xref>).</p></sec>
<sec><title>Intelligenztest (MIQ)</title>
<p>Der Intelligenztest <italic>MIQ</italic> (engl.: „Matrix Reasoning IQ Test“; <xref ref-type="bibr" rid="r5">Chan &amp; Kosinski, 2015</xref>) ist ein nonverbaler, computergestützter, adaptiver Test, der fluide Intelligenz, nonverbales Schlussfolgern und abstrakte Problemlösungsfähigkeit in neuen Situationen misst (<xref ref-type="bibr" rid="r33">Müllensiefen et al., 2015</xref>, S. 4). Ziel ist es, die deduktive Fähigkeit – aus etwas Abstraktem einen Sinn abzuleiten – zu erfassen (<xref ref-type="bibr" rid="r40">Raven, 2008</xref>, S. 22). Er basiert auf Ravens progressiven Matrizen (<xref ref-type="bibr" rid="r40">Raven, 2008</xref>; <xref ref-type="bibr" rid="r5">Chan &amp; Kosinski, 2015</xref>). Die Items des <italic>MIQ</italic> zeigen eine Grafik, in der in einer 3×3-Matrix acht Elemente aus abstrakten einfachen Mustern dargestellt sind. Das neunte Element fehlt. Die Aufgabe besteht darin, aus acht möglichen anderen Mustern jenes auszuwählen, das die Matrix vervollständigt (<xref ref-type="bibr" rid="r40">Raven, 2008</xref>, S. 18; <xref ref-type="bibr" rid="r33">Müllensiefen et al., 2015</xref>, S. 4). In der <italic>LongGold</italic>-Studie wurden acht Matrizen (Items) benutzt.</p></sec></sec>
<sec><title>Strukturmodelle</title>
  <p>Im Folgenden werden mögliche Strukturmodelle, die für die Beschreibung der Struktur musikalischer Fähigkeiten in Frage kommen und sich in der Anzahl der Faktoren unterscheiden, beschrieben. Die Ergebnisse der vier Musikalitätstests bilden hierbei die vier manifesten Variablen. Analog zu <xref ref-type="bibr" rid="r50">Spearmans (1904b)</xref> Generalfaktormodell der Intelligenz und dem Generalfaktormodell der Musikalität, so wie es <xref ref-type="bibr" rid="r56">Wing (1961)</xref> seinem Musiktest zugrunde legte, ergibt sich als erstes potenzielles Modell, das 1×4-Modell, das schematisch in <xref ref-type="fig" rid="f1">Abbildung 1</xref> dargestellt ist. Es enthält einen Musikalitätsfaktor, der die vier verbundenen manifesten Variablen – gemessen durch die vier Musikalitätstests – beeinflusst. Mit zwei Freiheitsgraden ist es überidentifiziert. <xref ref-type="bibr" rid="r46">Seashore (1919b)</xref> hingegen favorisierte eine multifaktorielle Theorie mit mehreren voneinander unabhängigen musikalischen Fähigkeiten. Davon und von <xref ref-type="bibr" rid="r10">Gardners (2006)</xref> Konzept der multiplen Intelligenzen sind die Modelle 2a und 2b abgeleitet (siehe <xref ref-type="fig" rid="f2">Abbildung 2</xref>): In diesen 4×1-Modellen bilden die vier Musikalitätstests vier einzelne Faktoren. In Modell 2a werden diese vier Faktoren als statistisch abhängig angenommen. Modell 2a und 1 sind hierarchisch geschachtelt. Weil in Modell 2a mit abhängigen Faktoren die Anzahl der zu schätzenden Parameter genauso groß ist wie die Anzahl der empirischen Informationen (<italic>df</italic> = 0), ist es genau identifiziert (<xref ref-type="bibr" rid="r54">Werner et al., 2016</xref>, S. 964). Betrachtet man ein 4×1-Modellen mit statistisch unabhängigen Faktoren, erhält man das überidentifizierte Modell 2b.</p>
  
  <fig id="f1" position="anchor" fig-type="figure" orientation="portrait"><label>Abbildung 1</label><caption>
    <title>Das 1×4-Modell (Modell 1): Ein Faktor mit vier Indikatorvariablen</title>
      <p><italic>Anmerkung.</italic> Die Faktorladung der ersten Indikatorvariable (<italic>MDT</italic>) muss nicht geschätzt werden, da sie zum Festlegen der Maßeinheit der latenten Variable auf den Wert 1 gesetzt wurde. Aus diesem Grund ist sie mit einer gestrichelten Linien dargestellt.</p></caption><graphic xlink:href="jbdgm.89-f1" position="anchor" orientation="portrait"/></fig>
  
  <fig id="f2" position="anchor" fig-type="figure" orientation="portrait"><label>Abbildung 2</label><caption>
    <title>Die 4×1-Modelle mit vier voneinander abhängigen bzw. unabhängige Faktoren mit je einer Indikatorvariable</title><p><italic>Anmerkung.</italic> Die Faktorladung jeder latenten Variable wird jeweils auf den Wert 1 gesetzt, um Maßeinheiten für die latente Variable sinnvoll festlegen zu können (<xref ref-type="bibr" rid="r54">Werner et al., 2016</xref>, S. 954). Die Messfehlervarianzen jedes Faktors werden auf den Wert 0 gesetzt (<xref ref-type="bibr" rid="r1">Beaujean, 2014</xref>, S. 40). Da diese Werte nicht geschätzt werden müssen, sind sie mit gestrichelten Linien dargestellt. Dies gilt auch für die Korrelationen zwischen den unabhängigen Faktoren in Modell 2b.</p></caption><graphic xlink:href="jbdgm.89-f2" position="anchor" orientation="portrait"/></fig>
  
  <p>Insgesamt gibt es weitere sieben theoretisch denkbare Modelle von Musikalität mit zwei latenten Faktoren und einer unterschiedlichen Verteilung der manifesten Variablen auf diese Faktoren (2 + 2 oder 3 + 1). Rein kombinatorisch wären noch weitere sechs Modelle mit insgesamt drei Faktoren (jeweils zwei Faktoren mit einem Indikator und ein Faktor mit zwei Indikatoren) denkbar. Diese werden jedoch nicht berücksichtigt, weil sie unteridentifiziert sind. Das rührt daher, dass es mehr zu schätzende Parameter (in diesem Fall elf: ein Pfadkoeffizient, vier Messfehlervarianzen sowie die drei Varianzen und drei Kovarianzen der drei latenten Variablen) als nicht-redundante Informationen aus den Daten (in diesem Fall zehn: vier Varianzen und sechs Kovarianzen) gibt. Da die Intelligenzmodelle von <xref ref-type="bibr" rid="r50">Spearman (1904b)</xref> und <xref ref-type="bibr" rid="r10">Gardner (2006)</xref> sowie <xref ref-type="bibr" rid="r56">Wings (1961)</xref> und <xref ref-type="bibr" rid="r46">Seashores (1919b)</xref> Konstruktionen für Musikalitätstests ein einfaktorielles oder ein Modell mit vier Faktoren implizieren, bleiben diese weiteren Modelle hier unberücksichtigt und nur das 1×4-Modell und die 4×1-Modelle werden in Hinblick auf ihre Passung zu den Daten evaluiert.</p>
<p>In der Vergangenheit wurden musikalische Fähigkeiten oft durch Aufgaben gemessen, in denen Melodien voneinander unterschieden oder memoriert werden sollten (z. <xref ref-type="bibr" rid="r27">B. Michaelis, 1805</xref>, und <xref ref-type="bibr" rid="r13">Gordon, 1989</xref>). Daher misst der <italic>MDT</italic> im Vergleich zum <italic>BAT</italic>, <italic>EDT</italic> und <italic>MPT</italic> am ehesten das, was traditionellerweise in Musikalitätstests gemessen und unter dem Konstrukt <italic>Musikalität</italic> verstanden wurde. Aus diesem Grund wird bei allen Modellen die Testleistung des <italic>MDTs</italic> auf die erste manifeste Variable gesetzt (<xref ref-type="bibr" rid="r54">Werner et al., 2016</xref>, S. 955), die die Einheit der latenten Variable vorgibt und in <xref ref-type="fig" rid="f1">Abbildung 1</xref> mit einer gestrichelten Linie erscheint.</p>
</sec></sec>
  
<sec sec-type="other4"><title>Ergebnisse</title>
<sec><title>Deskriptive Statistiken der Musikalitätstests</title>
<p><xref ref-type="table" rid="t1">Tabelle 1</xref> gibt die deskriptiven Statistiken der verwendeten Leistungstests sowie der Schulnoten und der selbst eingeschätzten musikalischen Expertise anhand des <italic>Gold-MSI</italic> wieder.</p>
  <table-wrap id="t1" position="anchor" orientation="portrait">
<label>Tabelle 1</label><caption><title>Deskriptive Statistiken der Musikalitäts- und Intelligenztests, der Schulnoten sowie des Globalfaktors (GMSI) und der Teilskalen F1 bis F5 des Gold-MSI</title></caption>
    <table frame="hsides" rules="groups">
<col width="40%" align="left"/>
<col width="10%"/>
<col width="10%"/>
<col width="10%"/>
<col width="10%"/>
<col width="10%"/>
<col width="10%"/>
<thead>
<tr>
<th>Variable</th>
<th><italic>n</italic></th>
<th>Fehlend</th>
<th><italic>M</italic></th>
<th><italic>SD</italic></th>
<th>Minimum</th>
<th>Maximum</th>
</tr>
</thead>
<tbody>
<tr>
<td>Beat-Wahrnehmungstest</td>
<td>1786</td>
<td>0</td>
  <td align="char" char=",">−1,23</td>
  <td align="char" char=",">1,31</td>
  <td align="char" char=",">−4,00</td>
  <td align="char" char=",">2,15</td>
</tr>
<tr>
<td>Emotionsunterscheidungstest</td>
<td>699</td>
<td>1087</td>
  <td align="char" char=",">0,78</td>
  <td align="char" char=",">0,15</td>
  <td align="char" char=",">0,28</td>
  <td align="char" char=",">1,00</td>
</tr>
<tr>
<td>Melodieunterscheidungstest</td>
<td>1750</td>
<td>36</td>
  <td align="char" char=",">−1,23</td>
  <td align="char" char=",">1,14</td>
  <td align="char" char=",">−3,80</td>
  <td align="char" char=",">2,71</td>
</tr>
<tr>
<td>Intonationswahrnehmungstest</td>
<td>1786</td>
<td>0</td>
  <td align="char" char=",">−0,43</td>
  <td align="char" char=",">1,18</td>
  <td align="char" char=",">−4,00</td>
  <td align="char" char=",">2,66</td>
</tr>
<tr>
<td>Intelligenztest</td>
<td>1786</td>
<td>0</td>
  <td align="char" char=",">−1,74</td>
  <td align="char" char=",">1,08</td>
  <td align="char" char=",">−4,00</td>
  <td align="char" char=",">1,71</td>
</tr>
<tr>
<td>Schulnoten (in %)</td>
<td>1413</td>
<td>373</td>
  <td align="char" char=",">68,58</td>
  <td align="char" char=",">13,89</td>
  <td align="char" char=",">21,03</td>
  <td align="char" char=",">100,00</td>
</tr>
<tr>
<td>Allg. Musikal. Erfahrenheit (GMSI)</td>
<td>1694</td>
<td>92</td>
  <td align="char" char=",">3,81</td>
  <td align="char" char=",">0,87</td>
  <td align="char" char=",">1,00</td>
  <td align="char" char=",">6,72</td>
</tr>
<tr>
<td><italic>F1 Aktiver Umgang mit Musik</italic></td>
<td>1694</td>
<td>92</td>
  <td align="char" char=",">3,55</td>
  <td align="char" char=",">0,98</td>
  <td align="char" char=",">1,00</td>
  <td align="char" char=",">6,89</td>
</tr>
<tr>
<td><italic>F2 Musikalische Wahrnehmungsfähigkeiten</italic></td>
<td>1694</td>
<td>92</td>
  <td align="char" char=",">4,57</td>
  <td align="char" char=",">0,84</td>
  <td align="char" char=",">1,11</td>
  <td align="char" char=",">7,00</td>
</tr>
<tr>
<td><italic>F3 Musikalische Ausbildung</italic></td>
<td>1694</td>
<td>92</td>
  <td align="char" char=",">3,18</td>
  <td align="char" char=",">1,20</td>
  <td align="char" char=",">1,00</td>
  <td align="char" char=",">6,43</td>
</tr>
<tr>
<td><italic>F4 Emotionen</italic></td>
<td>1694</td>
<td>92</td>
  <td align="char" char=",">4,35</td>
  <td align="char" char=",">0,97</td>
  <td align="char" char=",">1,00</td>
  <td align="char" char=",">7,00</td>
</tr>
<tr>
<td><italic>F5 Gesangsfähigkeiten</italic></td>
<td>1694</td>
<td>92</td>
  <td align="char" char=",">4,22</td>
  <td align="char" char=",">1,03</td>
  <td align="char" char=",">1,00</td>
  <td align="char" char=",">7,00</td>
</tr>
</tbody>
</table>
<table-wrap-foot>
  <p><italic>Anmerkung.</italic> Da bei der Auswertung der Ergebnisse des <italic>BATs</italic>, <italic>MDTs</italic>, <italic>MPTs</italic> und <italic>MIQs</italic> die Item-Response-Theorie zum Tragen kam, liegen die Ergebnisse zwischen −4 und +4. Sie entsprechen dem geschätzten Personenparameter. Die Schulnoten sind auf Prozentwerte standardisiert. Die Items des Faktors <italic>Musikalische Ausbildung</italic> des <italic>Gold-MSI</italic> wurden auf einer Zustimmungsskala von 1 = „stimme ganz und gar nicht zu” bis 7 = „stimme voll und ganz zu” erhoben und gemittelt.</p>
</table-wrap-foot>
</table-wrap></sec>
<sec><title>Korrelationen zwischen den Tests</title>
<p>In der Interkorrelationsmatrix in <xref ref-type="table" rid="t2">Tabelle 2</xref> lässt sich ablesen, wie stark je zwei der vier untersuchten Variablen miteinander korrelieren (unkorrigierte und korrigierte Pearson-Korrelationen unter- und oberhalb der Diagonale) und, wie reliabel die einzelnen Tests sind (Diagonale). Die Korrelationskoeffizienten zwischen den vier Variablen reichen von <italic>r</italic> = ,34 (Korrelation zwischen Beat-Wahrnehmungstest und Intonationswahrnehmungstest) bis <italic>r</italic> = ,42 (Melodieunterscheidungstest und Emotionsunterscheidungstest). Gemäß <xref ref-type="bibr" rid="r7">Ellis' (2010</xref>, S. 41) Benchmarks sprechen diese Ergebnisse für eine mittlere bis hohe Korrelation. Die anhand der Reliabilitäten der Kalibrierungsstudien korrigierten Korrelationen liegen zwischen <italic>r</italic> = ,51 und <italic>r</italic> = ,65. <xref ref-type="bibr" rid="r52">Watson (2017</xref>, S. 232) zufolge wird eine Interkorrelationsmatrix als für eine Faktorisierung geeignet erachtet, wenn die Mehrheit der Korrelationskoeffizienten zwischen ,20 und ,80 liegen. Dies ist der Fall.</p>
<table-wrap id="t2" position="anchor" orientation="portrait">
<label>Tabelle 2</label><caption><title>Korrelationen zwischen den Musikalitätstests und deren Reliabilität</title></caption>
<table frame="hsides" rules="groups">
<col width="40%" align="left"/>
<col width="15%"/>
<col width="15%"/>
<col width="15%"/>
<col width="15%"/>
<thead>
<tr>
<th>Test</th>
<th>1</th>
<th>2</th>
<th>3</th>
<th>4</th>
</tr>
</thead>
<tbody>
<tr>
  <td>1. Emotionsunterscheidungstest (<italic>EDT</italic>)</td>
  <td align="char" char=",">Rel. = ,690</td>
  <td align="char" char=",">,585</td>
  <td align="char" char=",">,646</td>
  <td align="char" char=",">,558</td>
</tr>
<tr>
  <td>2. Melodieunterscheidungstest (<italic>MDT</italic>)</td>
  <td align="char" char=",">,422</td>
  <td align="char" char=",">Rel. = ,754</td>
  <td align="char" char=",">,536</td>
  <td align="char" char=",">,510</td>
</tr>
<tr>
  <td>3. Intonationswahrnehmungstest (<italic>MPT</italic>)</td>
  <td align="char" char=",">,414</td>
  <td align="char" char=",">,359</td>
  <td align="char" char=",">Rel. = ,595</td>
  <td align="char" char=",">,564</td>
</tr>
<tr>
  <td>4. Beat-Wahrnehmungstest (<italic>BAT</italic>)</td>
  <td align="char" char=",">,362</td>
  <td align="char" char=",">,346</td>
  <td align="char" char=",">,340</td>
  <td align="char" char=",">Rel. = ,610</td>
</tr>
</tbody>
</table>
<table-wrap-foot>
<p><italic>Anmerkung.</italic> Unterhalb der Diagonalen stehen die Pearson-Korrelationen – berechnet aus je einem kompletten Wertepaar – zwischen den vier Testscores, die mit <italic>p</italic> &lt; ,001 signifikant sind. Auf der Diagonalen stehen die Reliabilitäten (Rel.) der einzelnen Tests. Oberhalb der Diagonalen stehen die anhand der Reliabilitäten der Kalibrierungsstudien (Referenz zu den Studien siehe letzte Spalte in <xref ref-type="table" rid="tA.1">Tabelle A1</xref>) korrigierten Korrelationen (Minderungskorrektur; <xref ref-type="bibr" rid="r49">Spearman, 1904a</xref>, S. 90).</p>
</table-wrap-foot>
</table-wrap></sec>
<sec><title>Modellierung der latenten Variablenmodelle</title>
  <p>Die Hypothesen aus der Literatur über ein einfaktorielles Modell oder ein Modell mit vier unverbundenen Faktoren motivieren einen Modellvergleich zwischen dem 1×4-Modell und den 4×1-Modellen. Weil gegebenenfalls Unterschiede bestehen könnten, erfolgt der Vergleich getrennt für beide Länder. Daher sei zunächst ausschließlich die Stichprobe aus Großbritannien betrachtet. Eine explorative Faktorenanalyse der Daten der britischen Stichprobe legt Modell 1 nahe (Ergebnisse siehe <xref ref-type="bibr" rid="app">Anhang</xref>). Die folgende Betrachtung untersucht Modell 1, Modell 2a und 2b in einer konfirmatorischen Faktorenanalyse auf Grundlage der Daten der britischen Stichprobe mit <italic>n</italic> = 622 für die vier Musikalitätstests <italic>BAT</italic>, <italic>EDT</italic>, <italic>MDT</italic> und <italic>MPT</italic> mit Full-Information-Maximum-Likelihood-Verfahren (<xref ref-type="bibr" rid="r1">Beaujean, 2014</xref>, S. 119 und <xref ref-type="bibr" rid="r43">Rosseel, 2012</xref>, S. 30) und robuster Maximum-Likelihood-Schätzmethode (<xref ref-type="bibr" rid="r53">Werner, 2015</xref>, S. 9) und überprüft das Ergebnis der explorativen Faktorenanalyse. Die latenten Variablen wurden standardisiert.</p>
<p>Ein Chi-Quadrat-Test untersucht „globale […] Abweichungen zwischen Modell und Daten“ (<xref ref-type="bibr" rid="r54">Werner et al., 2016</xref>, S. 957) und beurteilt damit deren Passung. Das Ergebnis des Chi-Quadrat-Tests für das 1×4-Modell mit einem Musikalitätsfaktor und vier verbundenen manifesten Variablen (Modell 1) ist nicht signifikant (siehe <xref ref-type="table" rid="t3">Tabelle 3</xref> zweite und dritte Spalte, <italic>p</italic> = ,391). Das bedeutet, dass die Nullhypothese beibehalten wird (<xref ref-type="bibr" rid="r54">Werner et al., 2016</xref>, S. 967), die Annahmen des Modells richtig sind (vgl. <xref ref-type="bibr" rid="r54">Werner et al., 2016</xref>, S. 958) und Modell 1 und Daten nicht signifikant voneinander abweichen (<xref ref-type="bibr" rid="r54">Werner et al., 2016</xref>, S. 959). Alle weiteren Gütekriterien (<italic>RMSEA</italic>, <italic>SRMR</italic>, <italic>GFI</italic> und <italic>CFI</italic>) befinden sich innerhalb der jeweils passenden Wertebereiche der Schwellenwerte (siehe <xref ref-type="table" rid="t3">Tabelle 3</xref> letzte Zeile). Zusammen deutet dies auf einen sehr guten Modellfit für das 1×4-Modell hin.</p>
<table-wrap id="t3" position="anchor" orientation="portrait">
<label>Tabelle 3</label><caption><title>Robuste Güte- und Informationskriterien der Modelle für die Maximum-Likelihood-Schätzung mit robuster Standardfehlerschätzung (MLR)</title></caption>
<table frame="hsides" rules="groups" style="borders">
<col width="20%" align="left"/>
<col width="10%"/>
<col width="10%"/>
<col width="10%"/>
<col width="10%"/>
<col width="10%"/>
<col width="10%"/>
<col width="10%"/>
  <col width="10%"/>
<thead>
<tr>
<th rowspan="3" valign="bottom">Modell</th>
<th colspan="3" rowspan="2" scope="colgroup" valign="bottom"><inline-formula><mml:math id="m1"><mml:msup><mml:mrow><mml:mi mathvariant="normal">χ</mml:mi></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:msup></mml:math></inline-formula><hr/></th>
  <th colspan="3" scope="colgroup" valign="bottom">RMSEA<hr/></th>
<th rowspan="3" valign="bottom">SRMR</th>
<th rowspan="3" valign="bottom">BIC</th>
</tr>
<tr>
  <th rowspan="2" valign="bottom">Wert</th>
  <th colspan="2" scope="colgroup" valign="bottom">90% CI<hr/></th>
</tr>
<tr>
  <th rowspan="2" scope="colgroup" valign="bottom" align="center">Wert</th>
  <th rowspan="2" valign="bottom"><italic>p</italic></th>
  <th rowspan="2" valign="bottom"><italic>df</italic></th>
<th scope="colgroup"><italic>LL</italic></th>
<th><italic>UL</italic></th>
</tr>
</thead>
<tbody>
<tr>
  <td></td>
  <th colspan="8" align="center">GB (<italic>n</italic> = 622)</th>
</tr>
<tr>
<td>1 (1×4)</td>
<td align="char" char=",">1,9</td>
  <td align="char" char=",">,391</td>
  <td align="char" char=",">2</td>
  <td align="char" char=",">,000</td>
  <td align="char" char=",">,000</td>
  <td align="char" char=",">,079</td>
  <td align="char" char=",">0,01</td>
  <td align="char" char=",">4552</td>
</tr>
<tr>
  <td>2a (4×1; abhängig)</td>
  <td>—</td>
  <td>—</td>
  <td align="char" char=",">0</td>
  <td>—</td>
  <td>—</td>
  <td>—</td>
  <td>—</td>
  <td align="char" char=",">4563</td>
</tr>
<tr>
  <td>2b (4×1; unabhängig)</td>
  <td align="char" char=",">309,7</td>
  <td align="char" char=",">&lt; ,001</td>
  <td align="char" char=",">6</td>
  <td align="char" char=",">,296</td>
  <td align="char" char=",">,268</td>
  <td align="char" char=",">,324</td>
  <td align="char" char=",">0,23</td>
  <td align="char" char=",">4857</td>
</tr>
  <tr style="grey-border-top">
    <td></td>
    <th colspan="8" align="center">DE (<italic>n</italic> = 1164)</th>
</tr>
<tr>
  <td>1 (1×4)</td>
  <td align="char" char=",">0,4</td>
  <td align="char" char=",">,824</td>
  <td align="char" char=",">2</td>
  <td align="char" char=",">,000</td>
  <td align="char" char=",">,000</td>
  <td align="char" char=",">,036</td>
  <td align="char" char=",">0,01</td>
  <td align="char" char=",">10881</td>
</tr>
  <tr style="grey-border-top">
    <td></td>
    <th colspan="8" align="center">GB &amp; DE (<italic>n</italic> = 1786)</th>
</tr>
<tr>
  <td>1 (1×4)</td>
  <td align="char" char=",">0,6</td>
  <td align="char" char=",">,725</td>
<td>2</td>
  <td align="char" char=",">,000</td>
  <td align="char" char=",">,000</td>
  <td align="char" char=",">,036</td>
  <td align="char" char=",">0,01</td>
  <td align="char" char=",">15777</td>
</tr>
  <tr style="grey-border-top">
    <td></td>
    <th colspan="8" align="center">Schwellenwerte</th>
</tr>
<tr>
<td/>
<td>5,99 (<italic>df</italic> = 2) bzw. 12,59 (<italic>df</italic> = 6)</td>
  <td align="char" char=",">&gt; ,05</td>
  <td>—</td>
  <td align="char" char=",">≤ ,06</td>
  <td>—</td>
  <td>—</td>
  <td align="char" char=",">≤ 0,08</td>
  <td>—</td>
</tr>
</tbody>
</table>
<table-wrap-foot>
<p><italic>Anmerkung.</italic> <inline-formula><mml:math id="m2"><mml:msup><mml:mrow><mml:mi mathvariant="normal">χ</mml:mi></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:msup></mml:math></inline-formula> = Model Fit Test Statistic; SRMR = Standardized Root Mean Square Residual; BIC = Bayes'sches Informationskriterium. Goodness-of-Fit-Index und Comparative-Fit-Index von Modell 1 sind für alle Stichproben 1,000, für Modell 2a beide 1,00 und für Modell 2b 0,98 und 0,00, wobei der Schwellenwert bei ≥ 0,95 liegt (GFI: <xref ref-type="bibr" rid="r48">Shevlin und Miles, 1998</xref>; CFI: <xref ref-type="bibr" rid="r19">Hu und Bentler, 1999</xref>). In der letzten Zeile sind die üblichen Schwellenwerte für gute Modellpassung angegeben (<xref ref-type="bibr" rid="r19">Hu und Bentler, 1999</xref>).</p>
</table-wrap-foot>
</table-wrap>
<p>Da Modell 2a keine Freiheitsgrade hat (<italic>df</italic> = 0), kann kein Chi-Quadrat-Test durchgeführt werden. Stattdessen wird als Nächstes durch einen <inline-formula><mml:math id="m3"><mml:msup><mml:mrow><mml:mi mathvariant="normal">χ</mml:mi></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:msup></mml:math></inline-formula>-Differenztest die Frage geklärt, ob Modell 1 oder 2a besser zu den Daten passt. Ein Vergleich ist hier möglich, weil Modell 1 und 2a geschachtelt sind. Modell 1 wird gegen das Referenzmodell Modell 2a getestet. Das Ergebnis ist in <xref ref-type="table" rid="t3">Tabelle 3</xref> (fünfte Zeile) abzulesen und zeigt, dass der Unterschied zwischen Modell 1 und 2a (<inline-formula><mml:math id="m4"><mml:msub><mml:mrow><mml:mo>∆</mml:mo></mml:mrow><mml:mrow><mml:msup><mml:mrow><mml:mi>χ</mml:mi></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:msup></mml:mrow></mml:msub></mml:math></inline-formula> = 1,9) nicht signifikant ist (<italic>p</italic> = ,391). Das bedeutet, dass Modell 1 keinen signifikant schlechteren Chi-Quadrat-Wert hat als das komplexere, abhängige 4×1-Modell. Da es gleichzeitig einen besseren <italic>BIC</italic> (Bayes'sches Informationskriterium) hat und weniger komplex ist als Modell 2a, wird das einfaktorielle Modell 1 dem multifaktoriellen Modell mit vier abhängigen Faktoren (Modell 2a) vorgezogen.</p>
<p>Im Folgenden wird Modell 2b bestehend aus vier unabhängigen Faktoren mit jeweils einer Indikatorvariable untersucht. Hier ist der Chi-Quadrat-Test signifikant, was auf eine Abweichung zwischen Modell und Daten schließen lässt (vgl. <xref ref-type="bibr" rid="r54">Werner et al., 2016</xref>, S. 958). Die restlichen Gütekriterien mit Ausnahme des Goodness-of-Fit-Index liegen jenseits der empfohlenen Bereiche. Das Bayes'sches Informationskriterium (<italic>BIC</italic>) ist für das einfaktorielle Modell 1 kleiner als für die multifaktoriellen Modelle (siehe <xref ref-type="table" rid="t3">Tabelle 3</xref> letzte Spalte). Aus diesen Gründen und der Tatsache, dass die Leistungen in den Musikalitätstests mäßig bis stark miteinander korrelieren, können die 4×1-Modelle und die Möglichkeit, dass die Testleistungen als vier Faktoren unverbunden sind, ausgeschlossen werden.</p>
<p>Angesichts der Gütekriterien kann davon ausgegangen werden, dass Modell 1 korrekt spezifiziert ist und damit die Ergebnisse der Parameterschätzung sinnvoll inhaltlich interpretiert werden können (vgl. <xref ref-type="bibr" rid="r54">Werner et al., 2016</xref>, S. 958): Diese zeigen standardisierte Ladungen zwischen 0,55 und 0,64 und liegen somit in einem Bereich, der in der Literatur generell akzeptiert wird (vgl. hierzu die Faktorladungen bei <xref ref-type="bibr" rid="r55">Wing, 1941</xref>, Tabelle 2, S. 34 und bei <xref ref-type="bibr" rid="r4">Carroll, 1993</xref>, Tabellen 9.5 und 9.6). Die Variablen <italic>MDT</italic> und <italic>MPT</italic> haben die höchsten Ladungen (,64 und ,61). Das heißt, dass sie am stärksten mit dem Konstrukt <italic>Musikalität</italic> zusammenhängen und es am besten abbilden (vgl. <xref ref-type="bibr" rid="r54">Werner et al., 2016</xref>, S. 951). Die Kommunalitäten der Faktorladungen sind niedrig (,30 bis ,41) bzw. die Uniqueness (standardisierte Messfehlervarianzanteile der einzelnen Tests) hoch (,59 bis ,70), was bedeutet, dass das latente Konstrukt <italic>Musikalität</italic> die Zusammenhänge zwischen den vier Musikalitätstests nicht vollständig erklärt. Da die beiden 4×1-Modelle verworfen wurden und das 1×4-Modell mit einem Faktor (siehe <xref ref-type="fig" rid="f3">Abbildung 3</xref>) einen guten Modellfit hat, wird es im Anschluss favorisiert.</p>
  
  <fig id="f3" position="anchor" fig-type="figure" orientation="portrait"><label>Abbildung 3</label><caption>
<title>Faktorstruktur als Ergebnis der konfirmatorischen Faktorenanalyse mit standardisierten Ladungen (britische Stichprobe)</title>
    <p><italic>Anmerkung.</italic> Je breiter die Pfeile sind, desto größer ist die Faktorladung.</p>
  </caption><graphic xlink:href="jbdgm.89-f3" position="anchor" orientation="portrait"/></fig>
  
<p>Insgesamt kann die Schlussfolgerung gezogen werden, dass eine Operationalisierung des Konstrukts <italic>Musikalität</italic> durch nur einen Generalfaktor – bestehend aus den Leistungen der vier Tests <italic>BAT</italic>, <italic>EDT</italic>, <italic>MDT</italic> und <italic>MPT</italic>&nbsp;– möglich ist und das Konstrukt <italic>Musikalität</italic> als latente Variable des einfaktoriellen Strukturgleichungsmodells aufgefasst werden kann. Das Generalfaktormodell passt gut auf die Daten, wobei der Generalfaktor die Zusammenhänge zwischen den vier Musikalitätstests nicht vollständig erklärt. Dies kommt daher, dass alle Tests verschiedene Aspekte musikalischer Wahrnehmungsfähigkeiten messen. Die Residualvarianzen der einzelnen Tests sind demnach unter anderem auf deren spezielle Zielkonstrukte zurückzuführen.</p></sec>
<sec><title>Übertragung auf die Stichprobe aus Deutschland</title>
<p>Im nächsten Schritt wird überprüft, ob das gefundene Ergebnis der Generalfaktorhypothese auf die in Deutschland erhobene Stichprobe übertragen werden kann und ob damit eine Generalisierung möglich ist. Eine konfirmatorische Faktorenanalyse überprüft, ob die Korrelationen zwischen den Ergebnissen der vier Musikalitätstests aus dem Einfluss eines zugrunde liegenden Generalfaktors resultieren wie im Falle der britischen Stichprobe. Dafür wird analog zur vorherigen Analyse Modell 1 (ein Faktor mit den vier Indikatorvariablen <italic>BAT</italic>, <italic>EDT</italic>, <italic>MDT</italic> und <italic>MPT</italic>) analysiert.</p>
  <p>In <xref ref-type="table" rid="t3">Tabelle 3</xref> (neunte Zeile) sind die Güte- bzw. Informationskriterien der Modellierung des latenten Variablenmodells anhand der deutschsprachigen Stichprobe berichtet. Die Tabelle zeigt, dass Modell 1 gut zu den Daten passt, da der Chi-Quadrat-Test nicht signifikant ist und alle anderen Gütekriterien (<italic>RMSEA</italic>, <italic>SRMR</italic>, <italic>GFI</italic> und <italic>CFI</italic>) ober- oder unterhalb des jeweiligen Schwellenwerts liegen. Die standardisierten Ladungen der Indikatorvariablen auf dem Generalfaktor <italic>g</italic> liegen zwischen ,49 und ,56. Die Variablen <italic>EDT</italic> und <italic>MDT</italic> sind am engsten mit der latenten Variable <italic>g</italic> verknüpft und zeigten auch in der britischen Stichprobe den stärksten Zusammenhang mit <italic>g</italic>. Die Residualvarianzen der einzelnen Tests sind relativ hoch (zwischen ,68 und ,76), was auf Messfehlereinflüsse schließen lässt. Die Kommunalitäten der manifesten Variablen – also der Anteil ihrer Varianz, der durch die latenten Variablen des Modells erklärt wird – sind teilweise niedriger als in der vorherigen Analyse. Das bedeutet, dass das latente Konstrukt <italic>Musikalität</italic> die Varianzen der Indikatorvariablen nicht vollständig erklärt und der Einfluss des gefundenen Generalfaktors nicht alle Zusammenhänge zwischen den vier Musikalitätstests vollständig begründen kann.</p></sec>
<sec><title>Der musikalische Generalfaktor</title>
<p>Aus den bisherigen Ergebnissen dieser Studie geht folgende Überlegung hervor: Bei Annahme eines Zusammenhangs zwischen den Leistungen in den unterschiedlichen Tests ist dieser durch den Einfluss eines und nicht mehrerer zugrunde liegender Faktoren begründet. Damit sprechen die Ergebnisse der Analysen beider Stichproben für die Generalfaktorhypothese.</p>
<sec><title>Bildung des Generalfaktors</title>
<p>Der im ersten und zweiten Teil der Studie identifizierte Generalfaktor – bestehend aus den vier Variablen <italic>BAT</italic>, <italic>EDT</italic>, <italic>MDT</italic> sowie <italic>MPT</italic> – diente anschließend als neue Variable für weitere Analysen. Daher wurde eine dritte konfirmatorische Faktorenanalyse eines einfaktoriellen, latenten Variablenmodells (entsprechend Modell 1, siehe <xref ref-type="fig" rid="f1">Abbildung 1</xref>) auf Grundlage der deutschen und britischen Stichprobe durchgeführt und die Faktorwerte der latenten Variable <italic>g</italic> als neue Variable <italic>GF</italic> durch die Regressionsmethode extrahiert. Dank der Verwendung des Full-Information-Maximum-Likelihood-Verfahrens war dies auch für Fälle mit fehlenden Werten möglich. Die Güte- und Informationskriterien der Modellierung stehen in <xref ref-type="table" rid="t3">Tabelle 3</xref> (elfte Zeile) und sprechen für eine gute Modellpassung. Die Ergebnisse der Parameterschätzung für das Generalfaktormodell sind in <xref ref-type="fig" rid="f4">Abbildung 4</xref> abgedruckt. Die standardisierten Ladungen der vier Indikatorvariablen liegen im Bereich zwischen, 56 und, 66, der in der Literatur generell akzeptiert wird (vgl. hierzu die Faktorladungen bei <xref ref-type="bibr" rid="r55">Wing, 1941</xref>, Tabelle 2, S. 347 und bei <xref ref-type="bibr" rid="r4">Carroll, 1993</xref>, Tabellen 9.5 und 9.6). Die höchste Ladung hat die Variable <italic>EDT</italic> mit ,66. Das entspricht dem Ergebnis der Faktorenanalyse der deutschen Stichprobe, in der die Variable <italic>EDT</italic> ebenfalls die höchste Ladung (,56) hatte.</p>
  
  <fig id="f4" position="anchor" fig-type="figure" orientation="portrait"><label>Abbildung 4</label><caption>
<title>Faktorstruktur als Ergebnis der konfirmatorischen Faktorenanalyse mit standardisierten Ladungen (britische und deutsche Stichprobe)</title>
    <p><italic>Anmerkung.</italic> Je breiter die Pfeile, desto größer ist die Faktorladung.</p>
  </caption><graphic xlink:href="jbdgm.89-f4" position="anchor" orientation="portrait"/></fig>

  
  <p>Die Werte der Kommunalität bewegen sich zwischen ,32 und ,44 und sind damit höher als in den vorherigen Faktorenanalysen. Das bedeutet, dass durch die latente Variable <italic>g</italic>, also durch den Generalfaktor, insgesamt teilweise mehr Varianz der manifesten Variablen erklärt werden konnte als in den separaten Faktorenanalysen der britischen und der deutschen Stichproben. Trotzdem liegt der Anteil an durch <italic>g</italic> unerklärter Varianz bei allen Indikatorvariablen über 50%. Die geschätzten Faktorwerte der latenten Variable <italic>g</italic>, die als Generalfaktor aufgefasst wird, haben den Mittelwert 0, da sie standardisiert sind (<italic>SD</italic> = 0,558). Die Faktorwerte liegen zwischen −1,706 und 1,527. Die Verteilung der Variable <italic>GF</italic> weicht von einer Normalverteilung ab (vgl. <xref ref-type="fig" rid="f5">Abbildung 5</xref> und Shapiro-Wilk-Test: <italic>W</italic> = 0,99, <italic>p</italic> &lt; ,001).</p>
  
  <?figure f4?>
  
  <fig id="f5" position="anchor" fig-type="figure" orientation="portrait"><label>Abbildung 5</label><caption>
<title>Histogramm mit Dichtefunktion der Normalverteilung</title></caption><graphic xlink:href="jbdgm.89-f5" position="anchor" orientation="portrait"/></fig>
  
<p>Als Nächstes kann nun der Zusammenhang zwischen dem ebenfalls für die Gesamtstichprobe identifizierten Generalfaktor und anderen interessierenden Merkmalen untersucht werden und es können Normen für die Musikalitätstests generiert werden.</p></sec>
<sec><title>Korrelation des Generalfaktors mit anderen Variablen</title>
<p><xref ref-type="table" rid="t4">Tabelle 4</xref> informiert über die Korrelationen zwischen dem Generalfaktor, der Leistung im Intelligenztest <italic>MIQ</italic>, den Schulnoten, dem Globalfaktor der <italic>Allgemeinen Musikalischen Erfahrenheit</italic> des <italic>Gold-MSI</italic> (<italic>GMSI</italic>; <xref ref-type="bibr" rid="r32">Müllensiefen et al., 2014</xref>), den Faktoren <italic>Aktiver Umgang mit Musik</italic>, <italic>Musikalische Wahrnehmungsfähigkeiten</italic>, <italic>Musikalische Ausbildung</italic>, <italic>Emotionen</italic> und <italic>Gesangsfähigkeiten</italic> des <italic>Gold-MSI</italic>.</p>
<table-wrap id="t4" position="anchor" orientation="portrait">
<label>Tabelle 4</label><caption><title>Interkorrelationen (Pearson) des Generalfaktors (GF) mit dem Intelligenztest MIQ, den Schulnoten, der Globalskala Allgemeine Musikalische Erfahrenheit (GMSI) und den Gold-MSI-Teilskalen (F1 bis F5)</title></caption>
<table frame="hsides" rules="groups">
<col width="44%" align="left"/>
<col width="7%"/>
<col width="7%"/>
<col width="7%"/>
<col width="7%"/>
<col width="7%"/>
<col width="7%"/>
<col width="7%"/>
<col width="7%"/>
<thead>
<tr>
<th>Tests und Faktoren</th>
<th>1</th>
<th>2</th>
<th>3</th>
<th>4</th>
<th>5</th>
<th>6</th>
<th>7</th>
<th>8</th>
</tr>
</thead>
<tbody>
<tr>
<td>1. Generalfaktor</td>
<td>—</td>
<td/>
<td/>
<td/>
<td/>
<td/>
<td/>
<td/>
</tr>
<tr>
<td>2. Intelligenztest <italic>MIQ</italic></td>
  <td align="char" char=",">,396*</td>
<td>—</td>
<td/>
<td/>
<td/>
<td/>
<td/>
<td/>
</tr>
<tr>
<td>3. Schulnoten</td>
  <td align="char" char=",">,168*</td>
  <td align="char" char=",">,150*</td>
<td>—</td>
<td/>
<td/>
<td/>
<td/>
<td/>
</tr>
<tr>
<td>4. <italic>Allg. Musikal. Erfahrenheit</italic> (<italic>GMSI</italic>)</td>
  <td align="char" char=",">,286*</td>
  <td align="char" char=",">,059*</td>
  <td align="char" char=",">,127*</td>
<td>—</td>
<td/>
<td/>
<td/>
<td/>
</tr>
<tr>
<td>5. <italic>F1 Aktiver Umgang mit Musik</italic></td>
  <td align="char" char=",">,202*</td>
  <td align="char" char=",">,037</td>
  <td align="char" char=",">,025</td>
  <td align="char" char=",">,769*</td>
<td>—</td>
<td/>
<td/>
<td/>
</tr>
<tr>
<td>6. <italic>F2 Musikalische Wahrnehmungsfähigkeiten</italic></td>
  <td align="char" char=",">,323*</td>
  <td align="char" char=",">,111*</td>
  <td align="char" char=",">,162*</td>
  <td align="char" char=",">,676*</td>
  <td align="char" char=",">,478*</td>
<td>—</td>
<td/>
<td/>
</tr>
<tr>
<td>7. <italic>F3 Musikalische Ausbildung</italic></td>
  <td align="char" char=",">,291*</td>
  <td align="char" char=",">,087*</td>
  <td align="char" char=",">,139*</td>
  <td align="char" char=",">,757*</td>
  <td align="char" char=",">,488*</td>
  <td align="char" char=",">,432*</td>
<td>—</td>
<td/>
</tr>
<tr>
<td>8. <italic>F4 Emotionen</italic></td>
  <td align="char" char=",">,296*</td>
  <td align="char" char=",">,129*</td>
  <td align="char" char=",">,096*</td>
  <td align="char" char=",">,579*</td>
  <td align="char" char=",">,585*</td>
  <td align="char" char=",">,515*</td>
  <td align="char" char=",">,344*</td>
<td>—</td>
</tr>
<tr>
<td>9. <italic>F5 Gesangsfähigkeiten</italic></td>
  <td align="char" char=",">,190*</td>
  <td align="char" char=",">,007</td>
  <td align="char" char=",">,081*</td>
  <td align="char" char=",">,804*</td>
  <td align="char" char=",">,565*</td>
  <td align="char" char=",">,589*</td>
  <td align="char" char=",">,397*</td>
  <td align="char" char=",">,456*</td>
</tr>
</tbody>
</table>
<table-wrap-foot>
<p><italic>Anmerkung.</italic> 1330 ≤ <italic>df</italic> ≤ 1780.</p>
<p>*<italic>p</italic> &lt; ,05.</p>
</table-wrap-foot>
</table-wrap>
<p>Der extrahierte Generalfaktor korreliert mäßig mit der Teilskala <italic>Musikalische Wahrnehmungsfähigkeiten</italic> (<italic>r</italic>&nbsp;=&nbsp;,32, <italic>p</italic> &lt; ,001; vgl. <xref ref-type="bibr" rid="r32">Müllensiefen et al., 2014</xref>). Dies spiegelt die Tatsache wider, dass alle hier verwendeten Musikalitätstests Aspekte der Musikwahrnehmung untersuchen. Die mäßig starke Korrelation mit der Teilskala <italic>Emotionen</italic> des <italic>Gold-MSI</italic> (<italic>r</italic> = ,30, <italic>p</italic> &lt; ,001) stützt das Ergebnis der Faktorenanalyse mit der deutschen und der gesamten Stichprobe, wonach die Ergebnisse des <italic>EDTs</italic> die latente Variable <italic>Musikalität g</italic> am besten abbilden. Außerdem korreliert der Generalfaktor <italic>GF</italic> mäßig stark mit dem Globalfaktor des <italic>Gold-MSI</italic> und dessen Teilskala <italic>Musikalische Ausbildung</italic> (beide <italic>r</italic> = ,29, <italic>p</italic> &lt; ,001) sowie mäßig bis stark mit dem Intelligenztest <italic>MIQ</italic> (<italic>r</italic> = ,40, <italic>p</italic> &lt; ,001).</p>
  <p>Intelligenz und <italic>Musikalische Ausbildung</italic> (Faktor <italic>F3</italic>) korrelieren nur gering miteinander (<italic>r</italic> = ,09, <italic>p</italic> &lt; ,001). Diese Korrelation verschwindet und ist nicht mehr signifikant, wenn man den Generalfaktor kontrolliert und die partielle Korrelation zwischen <italic>MIQ</italic> und <italic>F3</italic> betrachtet (<italic>r<sub>(MIQ, F3 | GF)</sub></italic> = −,03, n. s.). Dies bedeutet, dass entweder die musikalische Ausbildung die Musikalität beeinflusst und diese wiederum Einfluss auf die Intelligenz hat oder das umgekehrt die Intelligenz die Musikalität beeinflusst und diese dann wiederum Auswirkungen darauf hat, wie viel musikalische Ausbildung eine Person erhält. Wir wissen also nicht, ob hohe kognitive Fähigkeiten zu mehr musikalischer Ausbildung führen oder umgekehrt.</p></sec></sec>
<sec><title>Normwerte der Referenzstichprobe für BAT, MDT und MPT</title>
<p>Die Normierung eines Tests dient der Erstellung eines objektiven „Bezugssystems, mit dessen Hilfe die Ergebnisse einer Testperson im Vergleich zu den Merkmalsausprägungen anderer Personen eindeutig eingeordnet und interpretiert werden können” (<xref ref-type="bibr" rid="r28">Moosbrugger &amp; Kelava, 2012</xref>, S. 19). Im vorliegenden Fall besteht die Zielpopulation aus Jugendlichen der Sekundarstufe I in Deutschland und Großbritannien, die einen ähnlichen sozioökonomischen Hintergrund wie die hier untersuchte und im Methodenteil beschriebene Stichprobe aufweisen.</p>
  <p>Es wird angenommen, dass musikalische Entwicklung im Jugendalter – und damit die Entwicklung der getesteten Fähigkeiten – durch Alter, Geschlecht und musikalische Ausbildung beeinflusst wird (<xref ref-type="bibr" rid="r15">Hargreaves &amp; Lamont, 2017</xref>; vgl. <xref ref-type="fig" rid="f6">Abbildung 6</xref>). Um diese Vermutung empirisch zu untersuchen, wird musikalische Entwicklung durch das Modell einer nicht-parametrischen Regression beschrieben, wobei der jeweilige Testwert (z. B. <italic>BAT</italic>) die abhängige Variable und die Variablen <italic>Alter</italic>, <italic>Geschlecht</italic> und <italic>Musikalische Ausbildung</italic> (Faktor <italic>F3</italic> des <italic>Gold-MSI</italic>) die unabhängigen Variablen bilden. Die Prüfung der Linearität zwischen den abhängigen Variablen und den unabhängigen Variablen <italic>Alter</italic> und <italic>Musikalische Ausbildung</italic> erfolgt graphisch in Lowess-Diagrammen (vgl. <xref ref-type="fig" rid="f6">Abbildung 6</xref>). Da keine lineare Beziehung zwischen den Variablen herrscht, wird ein non-parametrisches Modell verwendet. Die Annahme des Modells ist hierbei, dass die Variable des jeweiligen Testscores abhängig von den Variablen <italic>Alter</italic>, <italic>Geschlecht</italic> und <italic>Musikalische Ausbildung</italic> ist. Dies wurde in einem Unabhängigkeitstest mit der Maximum-Statistik als Teststatistik untersucht (R-Paket <italic>coin</italic>, Funktion <italic>independence_test</italic>). Dessen Nullhypothese ist, dass zwei Gruppen von Variablen <italic>y<sub>1</sub></italic>, …, <italic>y<sub>q</sub></italic> und <italic>x<sub>1</sub></italic>, …, <italic>x<sub>p</sub></italic>, die auf beliebigen Skalen gemessen wurden, voneinander unabhängig sind (<xref ref-type="bibr" rid="r18">Hothorn et al., 2021</xref>, S. 25). Das Modell einer nicht-parametrischen Regression und ein Unabhängigkeitstest wurden einer multiplen linearen Regression oder einer Korrelation vorgezogen, da der Anstieg in der abhängigen Variable und in den Variablen <italic>Alter</italic>, <italic>Geschlecht</italic> und <italic>Musikalische Ausbildung</italic> nicht linear ist. Das Ergebnis zeigt, dass Unterschiede in allen unabhängigen Variablen zu Unterschieden in der abhängigen Variable (Testscores) führen (<italic>p</italic> &lt; ,001). Man kann daher davon ausgehen, dass die Testleistungen in den Musikalitätstests tatsächlich mit dem Alter, dem Geschlecht und dem Ausmaß an musikalischer Ausbildung zusammenhängen. Aus diesem Grund wurden für alle Kombinationen der unabhängigen Variablen <italic>Alter</italic>, <italic>Geschlecht</italic> und <italic>Musikalische Ausbildung</italic> die Normen der Tests <italic>BAT</italic>, <italic>MDT</italic> und <italic>MPT</italic> entsprechend differenziert, wobei die ursprünglich metrische Variable <italic>Musikalische Ausbildung</italic> in eine ordinale Variable umgewandelt wurde.</p>
  
  <fig id="f6" position="anchor" fig-type="figure" orientation="portrait"><label>Abbildung 6</label>
    <caption>
<title>Lowess-Diagramme der Testscores im Verhältnis zum Alter (in Monaten) und zur musikalischen Ausbildung (Faktor F3 des Gold-MSI)</title>
      <p><italic>Anmerkung.</italic> Loess-Anpassungslinien beruhen auf einer non-parametrischen, lokal gewichteten Regressionsmethode mit smoothing-Eigenschaften.</p>
    </caption><graphic xlink:href="jbdgm.89-f6" position="anchor" orientation="portrait"/></fig>
  
<p>Für die Auswahl der Referenzstichprobe des <italic>BATs</italic>, des <italic>MDTs</italic> und des <italic>MPTs</italic> wurden aus der deutschen und britischen Stichprobe (zusammen <italic>N</italic> = 1786) alle Fälle ausgeschlossen, die fehlende Werte für den Faktor <italic>Musikalische Ausbildung</italic> des <italic>Gold-MSI</italic> (<italic>n</italic> = 92) oder für die Variable <italic>Alter</italic> (<italic>n</italic> = 1) hatten oder die als Geschlecht nicht männlich oder weiblich angegeben hatten (<italic>n</italic> = 85), weil später Normen unter anderem nach Geschlechtern getrennt erstellt wurden. Diese zusätzlich nach Alter und musikalischer Ausbildung aufzuteilen, hätte sehr kleine Substichproben mit <italic>n</italic> &lt; 50 ergeben. Die verbliebenen 1614 Fälle wurden als Nächstes in Subgruppen nach Geschlecht (weiblich und männlich) und Alter eingeteilt (z. B. alle zehnjährigen Mädchen; vgl. <xref ref-type="table" rid="tA.2">Tabelle A2</xref>). Daraufhin wurden alle Subgruppen ausgeschlossen, die kleiner als <italic>n</italic> = 50 waren. Dieser Grenzwert wurde gewählt, um sicherzustellen, dass eine Substichprobe aus mindestens zwei Schulklassen mit <italic>n</italic> ≈ 25 besteht, und um so einen Klassenbias zu vermeiden. Das Ergebnis war eine Referenzstichprobe aus <italic>n</italic> = 1443 Fällen unterteilt in neun Subgruppen (für die Einteilung der Subgruppen und deren Größen siehe Spalte eins bis drei in <xref ref-type="table" rid="tA.2">Tabelle A2</xref>). Waren diese Subgruppen größer oder gleich <italic>n<sub>Subgruppe</sub></italic> = 100, wurden sie anschließend in mehrere Substichproben anhand der Variable <italic>Musikalische Ausbildung</italic> geteilt, sodass jede Substichprobe mindestens 50 Fälle umfasste. Im Folgenden wird durch die Begriffe „Subgruppe“ und „Substichprobe“ zwischen den nur nach Alter und Geschlecht (Subgruppe) und den zusätzlich nach <italic>Musikalischer Ausbildung</italic> eingeteilten Stichproben (Substichproben) unterschieden. Wenn die Subgruppe größer oder gleich <italic>n</italic> = 100 ist, bilden mehrere Substichproben eine Subgruppe. Zur Festlegung eines Kriteriums für die Einteilung in <italic>k</italic> ungefähr gleich große, endgültige Substichproben, wurden die Ergebnisse der Variable <italic>Musikalische Ausbildung</italic> in <italic>k</italic> Leistungsstufen bzw. Level sortiert und so Quantile gebildet. Die Variablen, für welche die Normen erstellt wurden, sind in den jeweiligen Substichproben nicht normalverteilt.</p>
  <p>Die Normwerte sind entsprechend der Subgruppen in <xref ref-type="table" rid="tA.2">Tabelle A2</xref> in Form von Mittelwerten und Standardabweichungen aufgelistet. Sie  erlauben eine näherungsweise Einschätzung des Leistungsniveaus eines Jugendlichen in Abhängigkeit zu Alter, Geschlecht und musikalischer Ausbildung. Wenn beispielsweise ein zehnjähriger Junge auf der Teilskala <italic>Musikalische Ausbildung</italic> zwei Punkte (Level 1) und im <italic>BAT</italic> einen Testscore von −0,70 erreicht, bedeutet dies, dass er, dafür, dass er keinerlei musikalische Ausbildung genießt, eine überdurchschnittliche Beat-Wahrnehmungsfähigkeit im Vergleich zur Referenzgruppe besitzt. Denn für zehnjährige Jungen ohne musikalisches Training (Level 1) ist der Normmittelwert −1,82 (Standardabweichung&nbsp;=&nbsp;1,08) und der Wert −0,70 somit mehr als eine Standardabweichung vom Mittelwert entfernt. Die Normen für den <italic>EDT</italic> werden in dieser Arbeit nicht berichtet, da der <italic>EDT</italic> zum Zeitpunkt der Datenauswertung weiterentwickelt wurde (<xref ref-type="bibr" rid="r24">MacGregor, Ruth &amp; Müllensiefen, 2021</xref>), sodass damit zu rechnen ist, dass in Zukunft ein neuer (adaptiver) Emotionsunterscheidungstest mit neuen Normwerten verfügbar sein wird.</p>
  <?figure f6?>
</sec></sec>
<sec sec-type="other5"><title>Diskussion</title>
  <p>Das wesentliche Ziel der vorliegenden Untersuchung war, eine Antwort auf die Frage nach der Struktur von Musikfähigkeit zu finden. Der Stand der Forschung zu diesem Thema ist noch nicht zufriedenstellend, da es konkurrierende ein- und multifaktorielle Modelle (vgl. <xref ref-type="bibr" rid="r56">Wing, 1961</xref>, vs. <xref ref-type="bibr" rid="r46">Seashore, 1919b</xref>) gibt. Im ersten Teil dieser Studie wurden die Daten einer großen englischsprachigen Stichprobe für vier Musikalitätstests zur Beat- und Intonationswahrnehmung sowie zur Melodie- und Emotionsunterscheidung analysiert, deren Ergebnisse mäßig stark miteinander korrelieren. In Analogie zu ein- und multifaktoriellen Modellen der Intelligenz wurden mehrere Modelle aufgestellt, die diese Korrelation als Folge des Einflusses eines oder mehrerer dahinterliegender Faktoren und im Zuge dessen die Struktur musikalischer Fähigkeiten beschreiben. Aufgrund der Ergebnisse eines <inline-formula><mml:math id="m5"><mml:msup><mml:mrow><mml:mi mathvariant="normal">χ</mml:mi></mml:mrow><mml:mrow><mml:mn>2</mml:mn></mml:mrow></mml:msup></mml:math></inline-formula>-Differenztests und eines Chi-Quadrat-Tests und der Korrelationen zwischen den Leistungen in den vier Musiktests kann ein multiples Konstrukt aus verbundenen und unverbundenen musikalischen Einzelfähigkeiten – wie von Seashore angenommen – abgelehnt werden. Vielmehr spricht die Struktur der Korrelationen für ein Generalfaktormodell, welches im zweiten Teil dieser Studie anhand einer größeren, deutschsprachigen Stichprobe bestätigt werden konnte. Dies erlaubte es, im dritten Teil einen musikalischen Generalfaktor – bestehend aus den Leistungen der vier Musikalitätstests – zu formulieren. Die empirische Evidenz dieser Studie spricht demnach dagegen, dass musikalische Fähigkeiten modular organisiert sind, wie es <xref ref-type="bibr" rid="r39">Peretz und Coltheart (2003)</xref> für die Verarbeitung von Musik annehmen, und trägt durch die Favorisierung des einfaktoriellen Modells zu einer klareren Theorielage bei. Anhand der Ergebnisse der ersten beiden Teile der Studie wurden die Faktorwerte eines Generalfaktors für die zusammengeführte Stichprobe berechnet und schließlich für die einzelnen Tests alters-, geschlechts- und übungsabhängige Normwerte ermittelt.</p>
<p>Die gemeinsame Varianz der Leistungen auf den vier Musikalitätstests konnte nur teilweise auf das latente Konstrukt <italic>Musikalität</italic> zurückgeführt werden. Gründe dafür könnten sein, dass sich die einzelnen Tests auf jeweils unterschiedliche Aspekte der Musikwahrnehmung beschränken und damit jeweils vermeintlich verschiedene Aspekte musikalischer Wahrnehmungsfähigkeit messen. Das liegt daran, dass sie unabhängig voneinander und nicht mit der Absicht konstruiert wurden, ein gemeinsames Konstrukt (allgemeine Musikalität) zu erfassen, sondern immer nur eine ganz bestimmte Teilfähigkeit (Referenzen zu den Studien siehe letzte Spalte in <xref ref-type="table" rid="tA.1">Tabelle A1</xref>). Dass die einzelnen Tests dennoch so hoch korrelieren und viel gemeinsame Varianz haben, weist nicht auf mehrere voneinander unabhängige Teilfähigkeiten hin, sondern darauf, dass diese Korrelationen durch nur eine dahinterliegende latente Fähigkeit, wie zum Beispiel einen musikalischen Generalfaktor, generiert werden könnten, welcher die Leistung auf allen Tests beeinflusst. Weitere Gründe dafür, dass der Generalfaktor die Zusammenhänge zwischen den vier Musikalitätstests nicht vollständig erklärt, könnten Mediatorvariablen wie Gedächtnis oder allgemeines Hörvermögen sein, die einen Einfluss auf die Leistungen in den Musikalitätstests haben. Schüler*innen mit hohen Werten im Generalfaktor sind tendenziell auch musikalisch ausgebildet, spielen also ein Instrument oder haben Instrumentalunterricht, weisen eine hohe allgemeine musikalische Erfahrenheit auf und schnitten im Intelligenztest gut ab. Anhand dieser Ergebnisse können allerdings keine Aussagen darüber getroffen werden, ob musikalische Ausbildung zu hohen Werten im Generalfaktor führt oder umgekehrt. Genauso wenig kann darüber spekuliert werden, ob intelligentere Schüler*innen wegen ihrer Intelligenz so hohe Generalfaktorwerte haben oder, ob ihre allgemeine Musikalität beeinflusst, wie gut sie im Intelligenztest abgeschnitten haben. Die Korrelation zwischen Generalfaktor und Leistung im Intelligenztest könnte dafür sprechen, dass darüber hinaus allgemeine Intelligenz eine Mediatorvariable darstellt. Das würde bedeuten, dass intelligentere Schüler*innen möglicherweise die Aufgabenstellung der Musiktests besser verstehen, dadurch besser darin abschneiden und dementsprechend auch höhere Werte im Generalfaktor zeigen.</p>
<p>Alternativ kann man in der Korrelation auch eine Bestätigung der Zwei-Faktoren-Theorie der Intelligenz von Spearman sehen, nach der allgemeine Intelligenz und verschiedene Einzelfähigkeiten in Intelligenztests zusammenhängen (<xref ref-type="bibr" rid="r36">Neyer &amp; Asendorpf, 2018</xref>, S. 155). Wenn man den Begriff der Einzelfähigkeiten auf die durch Musikalitätstests gemessenen Fähigkeiten ausweitet, ließe sich eine Korrelation zwischen allgemeiner Intelligenz und musikalischer Fähigkeit durch die Zwei-Faktoren-Theorie begründen. Eine weitere Erklärung wäre ein hierarchisches Intelligenzmodell, wie beispielweise die Cattell-Horn-Carroll-Theorie der kognitiven Fähigkeiten (CHC-Theorie; <xref ref-type="bibr" rid="r26">McGrew, 2005</xref>). Darin ist Musikalität ein Unterfaktor der auditorischen Fähigkeiten, die wiederum mit der allgemeinen Intelligenz verbunden sind.</p>
  <p>Ausgangspunkt für diese Studie waren verschiedene Intelligenzmodelle und die Frage, ob Musikalität durch ein vergleichbares Modell beschrieben werden kann. Die Ergebnisse der durchgeführten Studien geben Anhaltspunkte dafür, dass Musikalität durch ein Ein-Faktor-Modell entsprechend <xref ref-type="bibr" rid="r50">Spearmans (1904b)</xref> Generalfaktormodell der Intelligenz konzeptualisiert werden kann. Ein Musikalitätskonzept, das zu <xref ref-type="bibr" rid="r10">Gardners (2006)</xref> Modell der multiplen, unverbundenen Intelligenzen analog ist, kann wegen der hohen Korrelationen zwischen den Musiktests ausgeschlossen werden. In die Vorüberlegungen zu dieser Arbeit wurden außerdem verschiedene Studien aus der musikpsychologischen Literatur aufgenommen. Eine davon ist die von <xref ref-type="bibr" rid="r51">Stankov und Horn (1980)</xref>, die drei Faktoren musikalischer Wahrnehmung identifizieren konnten. Dies steht im Gegensatz zum Ergebnis des einzelnen musikalischen <italic>g</italic>-Faktors der vorliegenden Arbeit. Das musikalische Generalfaktormodell ist vereinbar mit dem Musikalitätskonzept, das mittels <xref ref-type="bibr" rid="r56">Wings (1961)</xref> <italic>Standardized Tests of Musical Intelligence</italic> gemessen wird. Es widerspricht <xref ref-type="bibr" rid="r46">Seashores (1919b)</xref> Auffassung von multiplen Musikalitätsfaktoren, die unabhängig voneinander durch die <italic>Seashore Measures of Musical Talent</italic> (<xref ref-type="bibr" rid="r45">Seashore, 1919a</xref>) erhoben werden.</p>
  <p>Eine Stärke dieser Studie und allgemein des <italic>LongGold</italic>-Projekts sind die Anwendung der Item-Response-Theorie und die dadurch möglichen modernen adaptiven Testverfahren. Außerdem kann durch die sehr großen Stichproben aus zwei verschiedenen Ländern eine Generalisierung der Ergebnisse angestrebt werden. Von <xref ref-type="bibr" rid="r37">Okada (2018)</xref> stammt eine andere Studie, in der die Struktur musikalischer Fähigkeiten an einer deutlich kleineren Stichprobe bestehend aus 165 Personen zwischen 18 und 29 Jahren (<italic>M</italic> = 20 Jahre) untersucht wurde. Sie untersuchte darin die Leistungen in 15 Musiktests (aufgeteilt in Musikwahrnehmungs- und Produktionstests). Die Höhe der Korrelation zwischen diesen Tests ist annähernd vergleichbar mit den in <xref ref-type="table" rid="t2">Tabelle 2</xref> berichteten Korrelationen (<italic>r</italic> = ,34 bis <italic>r</italic> = ,42). Durch eine konfirmatorische Faktorenanalyse konnte Okada vier Musikalitätsfaktoren für (1) Tonhöhe, (2) Timing, (3) Wahrnehmung und (4) Produktion identifizieren. Allerdings korrelierten der Tonhöhen- und Timing- sowie der Wahrnehmungs- und Produktionsfaktor stark miteinander (<italic>r</italic> = ,67 bzw. <italic>r</italic> = ,71; vgl. <xref ref-type="bibr" rid="r7">Ellis, 2010</xref>, S. 41), sodass man davon ausgehen kann, dass sie dasselbe dahinterliegende Musikalitätskonstrukt messen und das Modell daher auf zwei Faktoren reduziert werden kann. Auch wenn die Ergebnisse der Studie von <xref ref-type="bibr" rid="r37">Okada (2018)</xref> durch die Einschränkung dieser hohen Korrelation nicht vollkommen eindeutig sind, geben sie trotzdem Hinweise darauf, dass eine Übertragbarkeit der Ergebnisse unserer Studie, die für Kinder und Jugendliche im Alter von ungefähr zwölf Jahren gelten, auf eine Stichprobe aus älteren Jugendlichen oder Erwachsenen nicht ohne Weiteres möglich ist. Insbesondere ist nicht geklärt, ob das Generalfaktormodell auch für eine Stichprobe aus erwachsenen Profimusiker*innen seine Gültigkeit behält. In Bezug auf Unterschiede zwischen Kindern und Erwachsenen werfen <xref ref-type="bibr" rid="r12">Gembris et al. (1997</xref>, Sp. 869) die Frage auf, „ob die Struktur der Musikalität im Laufe des Lebens gleichbleibt oder ob sie sich verändert“. Diese Frage kann auf Grundlage der Daten, auf denen diese Arbeit basiert, nicht beantwortet werden, da diese nur eine Momentaufnahme aus einem Schuljahr widerspiegeln. Dank des Langzeitdesigns der <italic>LongGold</italic>-Studie ist es jedoch möglich, eine derartige Untersuchung mit denselben Jugendlichen in einigen Jahren zu wiederholen. Erst dann wird sich herausstellen, ob das Generalfaktormodell auch bei älteren Jugendlichen gilt und wie stabil es über einen längeren Zeitraum bleibt.</p>
</sec>
</body>
<back>
<app-group>
  <app id="app"><title>Appendix</title>
<sec><title>Tabellen</title>
  
  <table-wrap id="tA.1" position="anchor" orientation="portrait">
    <label>Tabelle A1</label><caption><title>Die verwendeten adaptiven Musikalitätstests im Überblick</title></caption>
    <table frame="hsides" rules="groups" style="compact-1">
      <col width="8%" align="left"/>
      <col width="20%" align="left"/>
      <col width="20%" align="left"/>
      <col width="7%"/>
      <col width="10%"/>
      <col width="10%"/>
      <col width="6.5%"/>
      <col width="6.5%"/>
      <col width="14%" align="left"/>
      <thead>
        <tr>
          <th valign="bottom">Test-<?linebreak?>kürzel</th>
          <th valign="bottom">Name (dt.)</th>
          <th valign="bottom">Name (engl.)</th>
          <th valign="bottom">Item-<?linebreak?>anzahl</th>
          <th valign="bottom">Retest-Reliabilität</th>
          <th valign="bottom">empirische Reliabilität</th>
          <th valign="bottom"><italic>n</italic><sub>GB</sub></th>
          <th valign="bottom"><italic>n</italic><sub>DE</sub></th>
          <th valign="bottom">Referenz</th>
        </tr>
      </thead>
      <tbody>
        <tr>
          <td><italic>BAT</italic></td>
          <td>Beat-Wahrnehmungstest</td>
          <td>Computerised Adaptive Beat Alignment Test</td>
          <td>22</td>
          <td>,610</td>
          <td>,601</td>
          <td>622</td>
          <td>1164</td>
          <td><xref ref-type="bibr" rid="r16">Harrison und Müllensiefen (2018)</xref></td>
        </tr>
        <tr style="transparent-border-top">
          <td><italic>EDT</italic></td>
          <td>Emotionsunterscheidungstest</td>
          <td>Musical Emotion Discrimination Task</td>
          <td>18</td>
          <td>,690</td>
          <td>—</td>
          <td>505</td>
          <td>194</td>
          <td><xref ref-type="bibr" rid="r23">MacGregor und Müllensiefen (2019)</xref></td>
        </tr>
        <tr style="transparent-border-top">
          <td><italic>MDT</italic></td>
          <td>Melodieunterscheidungstest</td>
          <td>Melodic Discrimination Test</td>
          <td>18</td>
          <td>,754</td>
          <td>,571</td>
          <td>596</td>
          <td>1154</td>
          <td><xref ref-type="bibr" rid="r17">Harrison et al. (2017)</xref></td>
        </tr>
        <tr style="transparent-border-top">
          <td><italic>MPT</italic></td>
          <td>Intonationswahrnehmungstest</td>
          <td>Mistuning Perception Test</td>
          <td>22</td>
          <td>,595</td>
          <td>,641</td>
          <td>622</td>
          <td>1164</td>
          <td><xref ref-type="bibr" rid="r22">Larrouy-Maestri et al. (2019)</xref></td>
        </tr>
      </tbody>
    </table>
    <table-wrap-foot>
      <p><italic>Anmerkung</italic>. Die Retest-Reliabilität ist die (simulierte) Test-Retest-Korrelation in der jeweiligen Kalibrierungsstudie. Sie unterscheidet sich von der in der Referenz genannten empirischen Reliabilität durch die unterschiedliche Anzahl an für die Berechnung verwendeten Items. Die empirische Reliabilität ist aus den <italic>Standard Errors of the Estimate</italic> (Messfehlern) der Gesamtstichprobe mit dem R-Paket <italic>mirt</italic> (Funktion <italic>empirical_rxx</italic>) berechnet.</p>
    </table-wrap-foot>
  </table-wrap>
  
<table-wrap id="tA.2" position="anchor" orientation="portrait">
  <label>Tabelle A2</label><caption><title>Normen des Beat-Wahrnehmungstests (BAT), des Melodieunterscheidungstests (MDT) und des Intonationswahrnehmungstests (MPT) nach Alter, Geschlecht und Musikalische Ausbildung (Faktor F3 des Gold-MSI)</title></caption>
<table frame="hsides" rules="groups">
<col width="10%" align="left"/>
<col width="20%"/>
<col width="10%"/>
<col width="10%"/>
<col width="10%"/>
<col width="10%"/>
<col width="10%"/>
<col width="10%"/>
<col width="10%"/>
<thead>
<tr>
<th rowspan="2" valign="bottom">Level</th>
  <th rowspan="2" valign="bottom">Quantil Faktor <italic>F3 Musikal. Ausbildung</italic></th>
<th rowspan="2" valign="bottom"><italic>n<sub>Level</sub></italic></th>
<th colspan="2" scope="colgroup"><italic>BAT</italic><hr/></th>
<th colspan="2" scope="colgroup"><italic>MDT</italic><hr/></th>
<th colspan="2" scope="colgroup"><italic>MPT</italic><hr/></th>
</tr>
<tr>
<th scope="colgroup"><italic>M</italic></th>
<th><italic>SD</italic></th>
<th><italic>M</italic></th>
<th><italic>SD</italic></th>
<th><italic>M</italic></th>
<th><italic>SD</italic></th>
</tr>
</thead>
<tbody>
  <tr>
<th colspan="9">Subgruppe A: 10 Jahre und weiblich</th>
</tr>
<tr>
<td>1</td>
<td>2,71</td>
<td>65</td>
<td>-1,69</td>
<td>1,34</td>
<td>-1,50</td>
<td>0,98</td>
<td>-0,93</td>
<td>1,21</td>
</tr>
<tr>
<td>2</td>
<td>3,86</td>
<td>53</td>
<td>-1,31</td>
<td>1,23</td>
<td>-1,15</td>
<td>0,95</td>
<td>-0,31</td>
<td>1,19</td>
</tr>
<tr>
<td>3</td>
<td>6,14</td>
<td>52</td>
<td>-1,16</td>
<td>1,30</td>
<td>-1,16</td>
<td>1,05</td>
<td>-0,31</td>
<td>1,16</td>
</tr>
<tr>
<td>gesamt</td>
  <td>—</td>
<td>170</td>
<td>-1,41</td>
<td>1,31</td>
<td>-1,29</td>
<td>1,00</td>
<td>-0,55</td>
<td>1,22</td>
</tr>
  <?pagebreak?>
  <tr style="grey-border-top">
<th colspan="9">Subgruppe B: 10 Jahre und männlich</th>
</tr>
<tr>
<td>1</td>
<td>2,29</td>
<td>61</td>
<td>-1,82</td>
<td>1,08</td>
<td>-1,65</td>
<td>0,98</td>
<td>-1,14</td>
<td>1,21</td>
</tr>
<tr>
<td>2</td>
<td>3,14</td>
<td>52</td>
<td>-1,98</td>
<td>1,14</td>
<td>-1,62</td>
<td>1,03</td>
<td>-0,95</td>
<td>1,20</td>
</tr>
<tr>
<td>3</td>
<td>6,14</td>
<td>56</td>
<td>-1,27</td>
<td>1,24</td>
<td>-1,24</td>
<td>1,20</td>
<td>-0,78</td>
<td>1,13</td>
</tr>
<tr>
<td>gesamt</td>
  <td>—</td>
<td>169</td>
<td>-1,69</td>
<td>1,19</td>
<td>-1,50</td>
<td>1,08</td>
<td>-0,96</td>
<td>1,18</td>
</tr>
  <tr style="grey-border-top">
<th colspan="9">Subgruppe C: 11 Jahre und weiblich</th>
</tr>
<tr>
<td>1</td>
<td>2,29</td>
<td>64</td>
<td>-1,79</td>
<td>1,46</td>
<td>-1,74</td>
<td>0,93</td>
<td>-0,59</td>
<td>1,05</td>
</tr>
<tr>
<td>2</td>
<td>3,14</td>
<td>51</td>
<td>-1,53</td>
<td>1,18</td>
<td>-1,27</td>
<td>1,01</td>
<td>-0,53</td>
<td>1,36</td>
</tr>
<tr>
<td>3</td>
<td>3,71</td>
<td>55</td>
<td>-1,49</td>
<td>1,15</td>
<td>-1,41</td>
<td>1,10</td>
<td>-0,29</td>
<td>0,96</td>
</tr>
<tr>
<td>4</td>
<td>4,43</td>
<td>51</td>
<td>-1,36</td>
<td>1,43</td>
<td>-0,96</td>
<td>1,24</td>
<td>-0,53</td>
<td>1,18</td>
</tr>
<tr>
<td>5</td>
<td>6,29</td>
<td>54</td>
<td>-1,16</td>
<td>1,33</td>
<td>-0,83</td>
<td>1,19</td>
<td>0,02</td>
<td>0,96</td>
</tr>
<tr>
<td>gesamt</td>
  <td>—</td>
<td>275</td>
<td>-1,48</td>
<td>1,33</td>
<td>-1,26</td>
<td>1,14</td>
<td>-0,39</td>
<td>1,12</td>
</tr>
  <tr>
<th colspan="9">Subgruppe D: 11 Jahre und männlich</th>
</tr>
<tr>
<td>1</td>
<td>2,00</td>
<td>64</td>
<td>-1,95</td>
<td>1,28</td>
<td>-1,66</td>
<td>1,01</td>
<td>-1,36</td>
<td>1,26</td>
</tr>
<tr>
<td>2</td>
<td>2,86</td>
<td>68</td>
<td>-1,64</td>
<td>1,36</td>
<td>-1,76</td>
<td>1,02</td>
<td>-1,00</td>
<td>1,30</td>
</tr>
<tr>
<td>3</td>
<td>4,00</td>
<td>58</td>
<td>-1,19</td>
<td>1,36</td>
<td>-1,34</td>
<td>1,08</td>
<td>-0,64</td>
<td>1,05</td>
</tr>
<tr>
<td>4</td>
<td>5,86</td>
<td>56</td>
<td>-1,18</td>
<td>1,35</td>
<td>-1,15</td>
<td>1,15</td>
<td>-0,40</td>
<td>1,11</td>
</tr>
<tr>
<td>gesamt</td>
  <td>—</td>
<td>246</td>
<td>-1,51</td>
<td>1,37</td>
<td>-1,50</td>
<td>1,08</td>
<td>-0,87</td>
<td>1,24</td>
</tr>
  <tr style="grey-border-top">
<th colspan="9">Subgruppe E: 12 Jahre und weiblich</th>
</tr>
<tr>
<td>1</td>
<td>2,43</td>
<td>61</td>
<td>-1,18</td>
<td>1,31</td>
<td>-1,25</td>
<td>0,90</td>
<td>-0,36</td>
<td>1,07</td>
</tr>
<tr>
<td>2</td>
<td>3,43</td>
<td>57</td>
<td>-0,93</td>
<td>1,20</td>
<td>-1,14</td>
<td>1,18</td>
<td>-0,10</td>
<td>1,01</td>
</tr>
<tr>
<td>3</td>
<td>4,15</td>
<td>49</td>
<td>-0,87</td>
<td>1,06</td>
<td>-0,60</td>
<td>1,15</td>
<td>0,21</td>
<td>0,78</td>
</tr>
<tr>
<td>4</td>
<td>6,29</td>
<td>55</td>
<td>-0,56</td>
<td>1,30</td>
<td>-0,55</td>
<td>1,14</td>
<td>0,12</td>
<td>1,13</td>
</tr>
<tr>
<td>gesamt</td>
  <td>—</td>
<td>222</td>
<td>-0,89</td>
<td>1,24</td>
<td>-0,90</td>
<td>1,13</td>
<td>-0,05</td>
<td>1,03</td>
</tr>
  <tr style="grey-border-top">
<th colspan="9">Subgruppe F: 12 Jahre und männlich</th>
</tr>
<tr>
<td>1</td>
<td>2,14</td>
<td>54</td>
<td>-1,61</td>
<td>1,24</td>
<td>-1,77</td>
<td>1,16</td>
<td>-0,82</td>
<td>1,10</td>
</tr>
<tr>
<td>2</td>
<td>3,29</td>
<td>49</td>
<td>-1,76</td>
<td>1,31</td>
<td>-1,58</td>
<td>1,25</td>
<td>-0,80</td>
<td>1,14</td>
</tr>
<tr>
<td>3</td>
<td>6,43</td>
<td>50</td>
<td>-1,16</td>
<td>1,46</td>
<td>-1,21</td>
<td>1,28</td>
<td>-0,23</td>
<td>1,10</td>
</tr>
<tr>
<td>gesamt</td>
  <td>—</td>
<td>153</td>
<td>-1,51</td>
<td>1,35</td>
<td>-1,53</td>
<td>1,24</td>
<td>-0,62</td>
<td>1,14</td>
</tr>
  <tr style="grey-border-top">
<th colspan="9">Subgruppe G: 13 Jahre und weiblich</th>
</tr>
<tr>
  <td>—</td>
  <td>—</td>
<td>92</td>
<td>-0,65</td>
<td>1,17</td>
<td>-0,84</td>
<td>1,10</td>
<td>0,21</td>
<td>1,01</td>
</tr>
  <tr style="grey-border-top">
<th colspan="9">Subgruppe H: 13 Jahre und männlich</th>
</tr>
<tr>
  <td>—</td>
  <td>—</td>
<td>54</td>
<td>-0,91</td>
<td>1,20</td>
<td>-1,14</td>
<td>1,12</td>
<td>-0,67</td>
<td>1,17</td>
</tr>
  <tr style="grey-border-top">
<th colspan="9">Subgruppe I: 14 Jahre und weiblich</th>
</tr>
<tr>
  <td>—</td>
  <td>—</td>
<td>62</td>
<td>-0,48</td>
<td>1,09</td>
<td>-0,80</td>
<td>1,24</td>
<td>0,06</td>
<td>1,12</td>
</tr>
</tbody>
</table>
<table-wrap-foot>
  <p><italic>Anmerkung</italic>. Die Werte des <italic>BATs</italic>, <italic>MDTs</italic> und <italic>MPTs</italic> sind teilweise negativ, weil die Metrik gemäß der Item-Response-Theorie nur Werte von −4 bis +4 umfasst und 0 dem Mittelwert der erwachsenen Kalibrierungsstichprobe entspricht. Die Anzahl <italic>k</italic> der Substichproben ist abhängig von <italic>n<sub>Subgruppe</sub></italic>. Die oberen Grenzwerte der Variable <italic>Musikalische Ausbildung</italic>, nach der die Einteilung vorgenommen wurde, sind in Spalte&nbsp;2 abgetragen. Sie entsprechen den <inline-formula><mml:math id="m6"><mml:mfrac><mml:mrow><mml:mn>1</mml:mn></mml:mrow><mml:mrow><mml:mi>k</mml:mi></mml:mrow></mml:mfrac></mml:math></inline-formula>, <inline-formula><mml:math id="m7"><mml:mfrac><mml:mrow><mml:mn>2</mml:mn></mml:mrow><mml:mrow><mml:mi>k</mml:mi></mml:mrow></mml:mfrac></mml:math></inline-formula> usw. Quantilen von <italic>F3</italic>. In Spalte 3 sind die Größen der letztendlichen Substichproben aufgeführt. Wenn die Subgruppe nicht größer als <italic>n<sub>Subgruppe</sub></italic> = 100 war (Subgruppe G, H und I), gibt es nur ein Level der Variable <italic>Musikalische Ausbildung</italic>. Das Minimum von Level 1 hat für alle Subgruppen den Wert 1.</p>
</table-wrap-foot>
</table-wrap></sec>
  
<sec><title>Explorative Faktorenanalyse</title>
<p>Das Kaiser-Meyer-Olkin-Kriterium (KMO), die Measures of Sampling Adequacy (MSA) und das Ergebnis aus Bartletts Test auf Spherizität lassen darauf schließen, dass die Daten für die vier Musikalitätstests der britischen Stichprobe für eine Faktorenanalyse geeignet sind. Zunächst wird der Scree-Plot betrachtet (siehe <xref ref-type="fig" rid="fA.1">Abb. A1</xref>). Gemäß dem Kaiser-Guttman-Kriterium sind nur Faktoren mit einem Eigenwerte über 1 als bedeutsam einzustufen (<xref ref-type="bibr" rid="r2">Bortz &amp; Schuster, 2010</xref>, S. 415; in <xref ref-type="fig" rid="fA.1">Abb. A1</xref> durch die horizontale Linie markiert). Der Eigenwert des ersten Faktors beträgt 1,41 und ist daher größer als eins (vgl. <xref ref-type="fig" rid="fA.1">Abb. A1</xref>). Alle anderen Faktoren weisen einen Eigenwert kleiner als eins auf. Daher wird in der Faktorenanalyse die Anzahl der zu extrahierenden Faktoren auf eins gesetzt. Eine explorative Faktorenanalyse mit obliquer Oblimin-Rotation und Maximum-Likelihood-Methode extrahiert einen Faktor mit 35,2% Varianzaufklärung. Die Variablen <italic>BAT</italic>, <italic>EDT</italic>, <italic>MDI</italic> und <italic>MPT</italic> haben Faktorladungen von 0,560, 0,551, 0,652 und 0,606. Diese sind annähernd so groß wie die Ladungen aus Modell 1.</p>
  
  <fig id="fA.1" position="anchor" fig-type="figure" orientation="portrait"><label>Abbildung A1</label><caption>
<title>Scree-Plot</title></caption><graphic xlink:href="jbdgm.89-fA.1" position="anchor" orientation="portrait"/></fig></sec>
</app>
</app-group>
  
  <fn-group><fn fn-type="financial-disclosure">
    <p>Das <italic>LongGold</italic>-Projekt wird durch das Preisgeld des Anneliese-Meier-Forschungspreises der Humboldt-Stiftung gefördert.</p></fn></fn-group>
  
  <ack><title>Danksagung</title>
<p>Ein großes Dankeschön gebührt Klaus Frieler und Peter Harrison aus dem <italic>LongGold</italic>-Team für die Aufbereitung und Bereitstellung der Daten, Miriam Eisinger und Nicolas Ruth für die Erhebung der Daten in Baden-Württemberg und Hessen sowie Hsin-Rui Lin für seine statistische Fachunterstützung. Selbstverständlich sei allen Schüler*innen für ihre Teilnahme an der <italic>LongGold</italic>-Studie und vor allem unseren Ansprechpartner*innen an den Schulen für die angenehme Zusammenarbeit gedankt.</p></ack>
  
  <notes>
    <title>Ethikerklärung</title>
    <p>Die vorliegende Arbeit wurde in Übereinstimmung mit ethischen Prinzipien und Standards durchgeführt. Die Datenerhebung wurde von den Ethikkommissionen der Leibniz Universität Hannover, der Kultusministerien von Baden-Württemberg und Hessen sowie des Goldsmiths Colleges University of London geprüft und genehmigt.</p>
  </notes>
  
  <notes>
    <title>Datenverfügbarkeit</title>
    <p>Die Forschungsdaten dürfen gemäß der Genehmigungen der Ethikkommissionen und Kultusministerien nicht veröffentlicht werden. Bei begründetem Interesse besteht jedoch die Möglichkeit, eine Anfrage an die Projektleitung (Prof. Dr. Daniel Müllensiefen) zu stellen, welche im Einzelfall über einen eventuellen Zugang zu den anonymisierten Daten entscheidet.</p>
  </notes>
  
<ref-list><title>Literaturverzeichnis</title>
<ref id="r1"><mixed-citation publication-type="book">Beaujean, A. A. (2014). <italic>Latent variable modeling using R: A step-by-step guide</italic>. Routledge.</mixed-citation></ref>
<ref id="r2"><mixed-citation publication-type="book">Bortz, J., &amp; Schuster, C. (2010). <italic>Statistik für Human- und Sozialwissenschaftler</italic> (7. Aufl.). Springer.</mixed-citation></ref>
<ref id="r3"><mixed-citation publication-type="book">Boyle, J. D., &amp; Radocy, R. E. (1987). <italic>Measurement and evaluation of musical experiences</italic>. Schirmer Books.</mixed-citation></ref>
<ref id="r4"><mixed-citation publication-type="book">Carroll, J. B. (1993). <italic>Human cognitive abilities: A survey of factor-analytic studies.</italic> Cambridge University Press. <pub-id pub-id-type="doi">10.1017/CBO9780511571312</pub-id></mixed-citation></ref>
<ref id="r5"><mixed-citation publication-type="web">Chan, Y. W. F., &amp; Kosinski, M. (2015). <italic>ICAR Project Wiki. International Cognitive Ability Resource (ICAR)</italic>. Aufgerufen am 22.08.2019 von <ext-link ext-link-type="uri" xlink:href="https://icar-project.com/projects/icar-project/wiki">https://icar-project.com/projects/icar-project/wiki</ext-link></mixed-citation></ref>
<ref id="r6"><mixed-citation publication-type="book">Drake, R. M. (1954). <italic>Manual for Drake Musical Aptitude Tests</italic>. University of Chicago Press.</mixed-citation></ref>
<ref id="r7"><mixed-citation publication-type="book">Ellis, P. D. (2010). <italic>The essential guide to effect sizes: Statistical power, meta-analysis, and the interpretation of research results</italic>. Cambridge University Press.</mixed-citation></ref>
<ref id="r8"><mixed-citation publication-type="book">Fodor, J. (1983). <italic>The modularity of mind</italic>. MIT Press.</mixed-citation></ref>
<ref id="r9"><mixed-citation publication-type="book">Frey, A. (2012). Adaptives Testen. In H. Moosbrugger &amp; A. Kelava (Hrsg.), <italic>Testtheorie und Fragebogenkonstruktion</italic> (2. Aufl., S. 275–293). Springer. <pub-id pub-id-type="doi">10.1007/978-3-642-20072-4_2</pub-id></mixed-citation></ref>
<ref id="r10"><mixed-citation publication-type="book">Gardner, H. (2006). <italic>Multiple Intelligences</italic>. Basic Books.<pub-id pub-id-type="doi">10.1080/1047621950070122</pub-id></mixed-citation></ref>
<ref id="r11"><mixed-citation publication-type="journal"><person-group person-group-type="author"><string-name name-style="western"><surname>Gembris</surname>, <given-names>H.</given-names></string-name></person-group> (<year>1997</year>). <article-title>Historical phases in the definition of musicality.</article-title> <source>Psychomusicology: Music, Mind, and Brain</source>, <volume>16</volume>(<issue>1–2</issue>), <fpage>17</fpage>–<lpage>25</lpage>. <pub-id pub-id-type="doi">10.1037/h0094070</pub-id></mixed-citation></ref>
<ref id="r12"><mixed-citation publication-type="book">Gembris, H., Steinberg, R., &amp; Kormann, A. (1997). Musikalität. In L. Finscher (Hrsg.), <italic>Die Musik in Geschichte und Gegenwart</italic> (2. Aufl., Sachteil Bd. 6, Sp. 867–921). Bärenreiter.</mixed-citation></ref>
<ref id="r13"><mixed-citation publication-type="book">Gordon, E. E. (1989). <italic>Manual for the Advanced Measures of Music Audiation (AMMA)</italic>. GIA Publications.</mixed-citation></ref>
<ref id="r14"><mixed-citation publication-type="book">Gordon, E. E. (2004). <italic>Continuing studies in music aptitudes</italic>. GIA Publications.</mixed-citation></ref>
<ref id="r15"><mixed-citation publication-type="book">Hargreaves, D., &amp; Lamont, A. (2017). <italic>The psychology of musical development</italic>. Cambridge University Press. <pub-id pub-id-type="doi">10.1017/9781107281868</pub-id></mixed-citation></ref>
<ref id="r16"><mixed-citation publication-type="journal"><person-group person-group-type="author"><string-name name-style="western"><surname>Harrison</surname>, <given-names>P. M.</given-names></string-name>, &amp; <string-name name-style="western"><surname>Müllensiefen</surname>, <given-names>D.</given-names></string-name></person-group> (<year>2018</year>). <article-title>Development and validation of the Computerized Adaptive Beat Alignment Test (CA-BAT).</article-title> <source>Scientific Reports</source>, <volume>8</volume>, <elocation-id>12395</elocation-id>. <pub-id pub-id-type="doi">10.1038/s41598-018-30318-8</pub-id><pub-id pub-id-type="pmid">30120265</pub-id></mixed-citation></ref>
<ref id="r17"><mixed-citation publication-type="journal"><person-group person-group-type="author"><string-name name-style="western"><surname>Harrison</surname>, <given-names>P. M.</given-names></string-name>, <string-name name-style="western"><surname>Collins</surname>, <given-names>T.</given-names></string-name>, &amp; <string-name name-style="western"><surname>Müllensiefen</surname>, <given-names>D.</given-names></string-name></person-group> (<year>2017</year>). <article-title>Applying modern psychometric techniques to melodic discrimination testing: Item response theory, computerized adaptive testing, and automatic item generation.</article-title> <source>Scientific Reports</source>, <volume>7</volume>, <elocation-id>3618</elocation-id>. <pub-id pub-id-type="doi">10.1038/s41598-017-03586-z</pub-id><pub-id pub-id-type="pmid">28620165</pub-id></mixed-citation></ref>
  <ref id="r18"><mixed-citation publication-type="web">Hothorn, T., Winell, H., Hornik, K., &amp; Zeileis, A. (2021). <italic>Package ‘coin‘</italic>. Abgerufen am 05.08.2021 von <ext-link ext-link-type="uri" xlink:href="https://cran.r-project.org/web/packages/coin/coin.pdf">https://cran.r-project.org/web/packages/coin/coin.pdf</ext-link></mixed-citation></ref>
<ref id="r19"><mixed-citation publication-type="journal"><person-group person-group-type="author"><string-name name-style="western"><surname>Hu</surname>, <given-names>L. T.</given-names></string-name>, &amp; <string-name name-style="western"><surname>Bentler</surname>, <given-names>P. M.</given-names></string-name></person-group> (<year>1999</year>). <article-title>Cutoff criteria for fit indexes in covariance structure analysis: Conventional criteria versus new alternatives.</article-title> <source>Structural Equation Modeling</source>, <volume>6</volume>(<issue>1</issue>), <fpage>1</fpage>–<lpage>55</lpage>. <pub-id pub-id-type="doi">10.1080/10705519909540118</pub-id></mixed-citation></ref>
<ref id="r20"><mixed-citation publication-type="book">Jensen, A. (1989). <italic>The g factor: The science of mental ability</italic>. Praeger Publishers/Greenwood Publishing Group.</mixed-citation></ref>
<ref id="r21"><mixed-citation publication-type="journal"><person-group person-group-type="author"><string-name name-style="western"><surname>Kidd</surname>, <given-names>G. R.</given-names></string-name>, <string-name name-style="western"><surname>Watson</surname>, <given-names>C. S.</given-names></string-name>, &amp; <string-name name-style="western"><surname>Gygi</surname>, <given-names>B.</given-names></string-name></person-group> (<year>2007</year>). <article-title>Individual differences in auditory abilities.</article-title> <source>The Journal of the Acoustical Society of America</source>, <volume>122</volume>(<issue>1</issue>), <fpage>418</fpage>–<lpage>435</lpage>. <pub-id pub-id-type="doi">10.1121/1.2743154</pub-id><pub-id pub-id-type="pmid">17614500</pub-id></mixed-citation></ref>
<ref id="r22"><mixed-citation publication-type="journal"><person-group person-group-type="author"><string-name name-style="western"><surname>Larrouy-Maestri</surname>, <given-names>P.</given-names></string-name>, <string-name name-style="western"><surname>Harrison</surname>, <given-names>P. M. C.</given-names></string-name>, &amp; <string-name name-style="western"><surname>Müllensiefen</surname>, <given-names>D.</given-names></string-name></person-group> (<year>2019</year>). <article-title>The Mistuning Perception Test: A new measurement instrument.</article-title> <source>Behavior Research Methods</source>, <volume>51</volume>, <fpage>663</fpage>–<lpage>675</lpage>. <pub-id pub-id-type="doi">10.3758/s13428-019-01225-1</pub-id><pub-id pub-id-type="pmid">30924106</pub-id></mixed-citation></ref>
<ref id="r23"><mixed-citation publication-type="journal"><person-group person-group-type="author"><string-name name-style="western"><surname>MacGregor</surname>, <given-names>C.</given-names></string-name>, &amp; <string-name name-style="western"><surname>Müllensiefen</surname>, <given-names>D.</given-names></string-name></person-group> (<year>2019</year>). <article-title>The Musical Emotion Discrimination Task: A new measure for assessing the ability to discriminate emotions in music.</article-title> <source>Frontiers in Psychology</source>, <volume>10</volume>, <elocation-id>1955</elocation-id>. <pub-id pub-id-type="doi">10.3389/fpsyg.2019.01955</pub-id><pub-id pub-id-type="pmid">31551857</pub-id></mixed-citation></ref>
  <ref id="r24"><mixed-citation publication-type="web">MacGregor, C., Ruth, N., &amp; Müllensiefen, D. (2021). <italic>The Musical Emotion Discrimination Task 2: Developing a large set of short musical clips to test the perception of emotions in music</italic> [Vortrag]. 16. International Conference on Music Perception and Cognition/11. Triennial Conference of the European Society for the Cognitive Sciences of Music, globale Hubs. Abgerufen am 04.08.2021 von <ext-link ext-link-type="uri" xlink:href="https://www.youtube.com/watch?v=m9SFFSr-9Us">https://www.youtube.com/watch?v=m9SFFSr-9Us</ext-link></mixed-citation></ref>
<ref id="r25"><mixed-citation publication-type="book">Mackintosh, N. (2011). <italic>IQ and human intelligence</italic> (2. Aufl.). Oxford University Press.</mixed-citation></ref>
<ref id="r26"><mixed-citation publication-type="book">McGrew, K. S. (2005). <italic>The Cattell-Horn-Carroll Theory of Cognitive Abilities: Past, present, and future.</italic> In D. P. Flanagan &amp; P. L. Harrison (Hrsg.), <italic>Contemporary intellectual assessment: Theories, tests, and issues</italic> (S. 136–181). The Guilford Press.</mixed-citation></ref>
<ref id="r27"><mixed-citation publication-type="journal"><person-group person-group-type="author"><string-name name-style="western"><surname>Michaelis</surname>, <given-names>K. F.</given-names></string-name></person-group> (<year>1805</year>). <article-title>Über die Prüfung musikalischer Fähigkeiten.</article-title> <source>Berlinische Musikalische Zeitung</source>, <volume>1</volume>(<issue>56</issue>), <fpage>222</fpage>–<lpage>230</lpage>.</mixed-citation></ref>
<ref id="r28"><mixed-citation publication-type="book">Moosbrugger, H., &amp; Kelava, A. (2012). Qualitätsanforderungen an einen psychologischen Test (Testgütekriterien). In H. Moosbrugger &amp; A. Kelava (Hrsg.), <italic>Testtheorie und Fragebogenkonstruktion</italic> (2. Aufl., S. 7–26). Springer. <pub-id pub-id-type="doi">10.1007/978-3-642-20072-4_2</pub-id></mixed-citation></ref>
<ref id="r29"><mixed-citation publication-type="confproc">Müllensiefen, D. (2017a, 15.–17. September). <italic>LongGold: Eine Langzeitstudie zur Entwicklung musikalischer Fähigkeiten im Jugendalter</italic> [Vortrag]. 33. Jahrestagung der Deutschen Gesellschaft für Musikpsychologie, Hamburg.</mixed-citation></ref>
<ref id="r30"><mixed-citation publication-type="book">Müllensiefen, D. (2017b). Messung musikalischer Begabung. In M. Hasselhorn &amp; U. Trautwein (Hrsg.), <italic>Tests und Trends – Jahrbuch der pädagogisch-psychologischen Diagnostik: Bd. 15. Begabungen und Talente</italic> (S. 125–144). Hogrefe.</mixed-citation></ref>
  <ref id="r31"><mixed-citation publication-type="web">Müllensiefen, D., &amp; Elvers, P. (2018, 23.–28. Juli). <italic>Development of musical abilities: Literature review and analysis of cohort study data</italic> [aufgezeichneter Vortrag]. 15. International Conference on Music Perception and Cognition/10. Triennial Conference of the European Society for the Cognitive Sciences of Music, Graz. Abgerufen am 31.07.2019 von <ext-link ext-link-type="uri" xlink:href="https://www.youtube.com/watch?v=y84q7VnsNOU&amp;feature=youtu.be&amp;t=826">https://www.youtube.com/watch?v=y84q7VnsNOU&amp;feature=youtu.be&amp;t=826</ext-link></mixed-citation></ref>
<ref id="r32"><mixed-citation publication-type="journal"><person-group person-group-type="author"><string-name name-style="western"><surname>Müllensiefen</surname>, <given-names>D.</given-names></string-name>, <string-name name-style="western"><surname>Gingras</surname>, <given-names>B.</given-names></string-name>, <string-name name-style="western"><surname>Musil</surname>, <given-names>J.</given-names></string-name>, &amp; <string-name name-style="western"><surname>Stewart</surname>, <given-names>L.</given-names></string-name></person-group> (<year>2014</year>). <article-title>The musicality of nonmusicians: An index for assessing musical sophistication in the general population.</article-title> <source>PLOS ONE</source><italic>,</italic> <volume>9</volume>(<issue>2</issue>), <elocation-id>e89642</elocation-id>. <pub-id pub-id-type="doi">10.1371/journal.pone.0089642</pub-id><pub-id pub-id-type="pmid">24586929</pub-id></mixed-citation></ref>
<ref id="r33"><mixed-citation publication-type="journal"><person-group person-group-type="author"><string-name name-style="western"><surname>Müllensiefen</surname>, <given-names>D.</given-names></string-name>, <string-name name-style="western"><surname>Harrison</surname>, <given-names>P.</given-names></string-name>, <string-name name-style="western"><surname>Caprini</surname>, <given-names>F.</given-names></string-name>, &amp; <string-name name-style="western"><surname>Fancourt</surname>, <given-names>A.</given-names></string-name></person-group> (<year>2015</year>). <article-title>Investigating the importance of self-theories of intelligence and musicality for students’ academic and musical achievement.</article-title> <source>Frontiers in Psychology</source>, <volume>6</volume>, <elocation-id>1702</elocation-id>. <pub-id pub-id-type="doi">10.3389/fpsyg.2015.01702</pub-id><pub-id pub-id-type="pmid">26594189</pub-id></mixed-citation></ref>
<ref id="r34"><mixed-citation publication-type="book">Müllensiefen, D., &amp; Hemming, J. (2018). Musikalische Fertigkeiten und ihre Messbarkeit. In A. C. Lehmann &amp; R. Kopiez (Hrsg.), <italic>Handbuch Musikpsychologie</italic> (S. 93–119). Hogrefe.</mixed-citation></ref>
<ref id="r35"><mixed-citation publication-type="book">Myers, D. G. (2014). Intelligenz. In D. G. Myers (Hrsg.), <italic>Psychologie</italic> (3. Aufl., S. 399–436). Springer. <pub-id pub-id-type="doi">10.1007/978-3-642-40782-6_11</pub-id></mixed-citation></ref>
<ref id="r36"><mixed-citation publication-type="book">Neyer, F. J., &amp; Asendorpf, J. B. (2018). Psychologie der Persönlichkeit. In F. J. Neyer &amp; J. B. Asendorpf (Hrsg.), <italic>Psychologie der Persönlichkeit</italic> (6. Aufl., S. 135–235). Springer. <pub-id pub-id-type="doi">10.1007/978-3-662-54942-1_4</pub-id></mixed-citation></ref>
<ref id="r37"><mixed-citation publication-type="web">Okada, B. M. (2018). <italic>Towards a comprehensive model of musical ability</italic> [Dissertation, University of Maryland]. Digital Repository at the University of Maryland. <ext-link ext-link-type="uri" xlink:href="https://drum.lib.umd.edu/handle/1903/21621">https://drum.lib.umd.edu/handle/1903/21621</ext-link></mixed-citation></ref>
<ref id="r38"><mixed-citation publication-type="journal"><person-group person-group-type="author"><string-name name-style="western"><surname>Patel</surname>, <given-names>A. D.</given-names></string-name>, &amp; <string-name name-style="western"><surname>Iversen</surname>, <given-names>J. R.</given-names></string-name></person-group> (<year>2014</year>). <article-title>The evolutionary neuroscience of musical beat perception: The Action Simulation for Auditory Prediction (ASAP) hypothesis.</article-title> <source>Frontiers in Systems Neuroscience</source>, <volume>8</volume>, <elocation-id>57</elocation-id>. <pub-id pub-id-type="doi">10.3389/fnsys.2014.00057</pub-id><pub-id pub-id-type="pmid">24860439</pub-id></mixed-citation></ref>
<ref id="r39"><mixed-citation publication-type="journal"><person-group person-group-type="author"><string-name name-style="western"><surname>Peretz</surname>, <given-names>I.</given-names></string-name>, &amp; <string-name name-style="western"><surname>Coltheart</surname>, <given-names>M.</given-names></string-name></person-group> (<year>2003</year>). <article-title>Modularity of music processing.</article-title> <source>Nature Neuroscience</source>, <volume>6</volume>, <fpage>688</fpage>–<lpage>691</lpage>. <pub-id pub-id-type="doi">10.1038/nn1083</pub-id><pub-id pub-id-type="pmid">12830160</pub-id></mixed-citation></ref>
<ref id="r40"><mixed-citation publication-type="book">Raven, J. (2008). The Raven Progressive Matrices Tests: Their theoretical basis and measurement model. In J. Raven &amp; C. J. Raven (Hrsg.), <italic>Uses and abuses of intelligence: Studies advancing Spearman and Raven's quest for non-arbitrary metrics</italic> (S. 17–68). Royal Fireworks Press.</mixed-citation></ref>
  <ref id="r41"><mixed-citation publication-type="web">Rose, D. (2005). <italic>The ESeC class schema summarized</italic>. Abgerufen am 03.08.2021 von <ext-link ext-link-type="uri" xlink:href="https://www.iser.essex.ac.uk/archives/esec/validation-process">https://www.iser.essex.ac.uk/archives/esec/validation-process</ext-link></mixed-citation></ref>
<ref id="r42"><mixed-citation publication-type="other">Rose, D., &amp; Pevalin, D. J. (2001). <italic>The national statistics socio-economic classification. Unifying official and sociological approaches to the conceptualisation and measurement of social class</italic> (ISER Working Papers 2001-04). University of Essex.</mixed-citation></ref>
<ref id="r43"><mixed-citation publication-type="journal"><person-group person-group-type="author"><string-name name-style="western"><surname>Rosseel</surname>, <given-names>Y.</given-names></string-name></person-group> (<year>2012</year>). <article-title>lavaan: An R package for structural equation modeling.</article-title> <source>Journal of Statistical Software</source>, <volume>48</volume>(<issue>2</issue>), <fpage>1</fpage>–<lpage>36</lpage>. <pub-id pub-id-type="doi">10.18637/jss.v048.i02</pub-id></mixed-citation></ref>
<ref id="r44"><mixed-citation publication-type="journal"><person-group person-group-type="author"><string-name name-style="western"><surname>Schaal</surname>, <given-names>N. K.</given-names></string-name>, <string-name name-style="western"><surname>Bauer</surname>, <given-names>A.-K. R.</given-names></string-name>, &amp; <string-name name-style="western"><surname>Müllensiefen</surname>, <given-names>D.</given-names></string-name></person-group> (<year>2014</year>). <article-title>Der Gold-MSI: Replikation und Validierung eines Fragebogeninstrumentes zur Messung Musikalischer Erfahrenheit anhand einer deutschen Stichprobe.</article-title> <source>Musicae Scientiae</source>, <volume>18</volume>(<issue>4</issue>), <fpage>423</fpage>–<lpage>447</lpage>. <pub-id pub-id-type="doi">10.1177/1029864914541851</pub-id></mixed-citation></ref>
<ref id="r45"><mixed-citation publication-type="book">Seashore, C. E. (1919a). <italic>Manual of instructions and interpretations for Measure of Musical Talent</italic>. Columbia Graphophone Company.</mixed-citation></ref>
<ref id="r46"><mixed-citation publication-type="book">Seashore, C. E. (1919b). <italic>Beverley educational series: The psychology of musical talent</italic>. Silver, Burdett &amp; Company. <pub-id pub-id-type="doi">10.1037/13031-000</pub-id></mixed-citation></ref>
  <ref id="r47"><mixed-citation publication-type="book">Seashore, C. E., Lewis, D., &amp; Saetveit, J. C. (1960). <italic>Manual of instruction and interpretations for the Seashore Measures of Musical Talents</italic> (2nd revision). The Psychological Corporation.</mixed-citation></ref>
<ref id="r48"><mixed-citation publication-type="journal"><person-group person-group-type="author"><string-name name-style="western"><surname>Shevlin</surname>, <given-names>M.</given-names></string-name>, &amp; <string-name name-style="western"><surname>Miles</surname>, <given-names>J. N. V.</given-names></string-name></person-group> (<year>1998</year>). <article-title>Effects of sample size, model specification and factor loadings on the GFI in confirmatory factor analysis.</article-title> <source>Personality and Individual Differences</source>, <volume>25</volume>(<issue>1</issue>), <fpage>85</fpage>–<lpage>90</lpage>. <pub-id pub-id-type="doi">10.1016/S0191-8869(98)00055-5</pub-id></mixed-citation></ref>
<ref id="r49"><mixed-citation publication-type="journal"><person-group person-group-type="author"><string-name name-style="western"><surname>Spearman</surname>, <given-names>C.</given-names></string-name></person-group> (<year>1904</year><comment>a</comment>). <article-title>The proof and measurement of association between two things.</article-title> <source>The American Journal of Psychology</source>, <volume>15</volume>(<issue>1</issue>), <fpage>72</fpage>–<lpage>101</lpage>. <pub-id pub-id-type="doi">10.2307/1412159</pub-id><pub-id pub-id-type="pmid">3322052</pub-id></mixed-citation></ref>
<ref id="r50"><mixed-citation publication-type="journal"><person-group person-group-type="author"><string-name name-style="western"><surname>Spearman</surname>, <given-names>C.</given-names></string-name></person-group> (<year>1904</year><comment>b</comment>). <article-title>“General intelligence,” Objectively determined and measured.</article-title> <source>The American Journal of Psychology</source>, <volume>15</volume>(<issue>2</issue>), <fpage>201</fpage>–<lpage>292</lpage>. <pub-id pub-id-type="doi">10.2307/1412107</pub-id></mixed-citation></ref>
<ref id="r51"><mixed-citation publication-type="journal"><person-group person-group-type="author"><string-name name-style="western"><surname>Stankov</surname>, <given-names>L.</given-names></string-name>, &amp; <string-name name-style="western"><surname>Horn</surname>, <given-names>J. L.</given-names></string-name></person-group> (<year>1980</year>). <article-title>Human abilities revealed through auditory tests.</article-title> <source>Journal of Educational Psychology</source>, <volume>72</volume>(<issue>1</issue>), <fpage>21</fpage>–<lpage>44</lpage>. <pub-id pub-id-type="doi">10.1037/0022-0663.72.1.21</pub-id><pub-id pub-id-type="pmid">7372913</pub-id></mixed-citation></ref>
<ref id="r52"><mixed-citation publication-type="journal"><person-group person-group-type="author"><string-name name-style="western"><surname>Watson</surname>, <given-names>J. C.</given-names></string-name></person-group> (<year>2017</year>). <article-title>Establishing evidence for internal structure using exploratory factor analysis.</article-title> <source>Measurement &amp; Evaluation in Counseling &amp; Development</source>, <volume>50</volume>(<issue>4</issue>), <fpage>232</fpage>–<lpage>238</lpage>. <pub-id pub-id-type="doi">10.1080/07481756.2017.1336931</pub-id></mixed-citation></ref>
  <ref id="r53"><mixed-citation publication-type="web">Werner, C. S. (2015). <italic>Strukturgleichungsmodelle mit R und lavaan analysieren: Kurzeinführung</italic>. Abgerufen am 31.07.2019 von <ext-link ext-link-type="uri" xlink:href="https://www.psychologie.uzh.ch/dam/jcr:ffffffff-b371-2797-ffff-ffffeb61aa16/einfuehrung_lavaan_cswerner.pdf">https://www.psychologie.uzh.ch/dam/jcr:ffffffff-b371-2797-ffff-ffffeb61aa16/einfuehrung_lavaan_cswerner.pdf</ext-link></mixed-citation></ref>
<ref id="r54"><mixed-citation publication-type="book">Werner, C. S., Schermelleh-Engel, K., Gerhard, C., &amp; Gäde, J. C. (2016). Strukturgleichungsmodelle. In N. Döring &amp; J. Bortz (Hrsg.), <italic>Forschungsmethoden und Evaluation in den Sozial- und Humanwissenschaften</italic> (5. Aufl., S. 945–973). Springer. <pub-id pub-id-type="doi">10.1007/978-3-642-41089-5_17</pub-id></mixed-citation></ref>
<ref id="r55"><mixed-citation publication-type="journal"><person-group person-group-type="author"><string-name name-style="western"><surname>Wing</surname>, <given-names>H. D.</given-names></string-name></person-group> (<year>1941</year>). <article-title>A factorial study of musical tests.</article-title> <source>The British Journal of Psychology. General Section</source>, <volume>31</volume>(<issue>4</issue>), <fpage>341</fpage>–<lpage>355</lpage>. <pub-id pub-id-type="doi">10.1111/j.2044-8295.1941.tb00999.x</pub-id></mixed-citation></ref>
<ref id="r56"><mixed-citation publication-type="book">Wing, H. D. (1961). <italic>Standardized tests of musical intelligence</italic>. NFER Pub.</mixed-citation></ref>
<ref id="r57"><mixed-citation publication-type="journal"><person-group person-group-type="author"><string-name name-style="western"><surname>Wing</surname>, <given-names>H. D.</given-names></string-name></person-group> (<year>1962</year>). <article-title>A revision of the Wing Musical Aptitude Test.</article-title> <source>Journal of Research in Musical Education</source>, <volume>10</volume>, <fpage>743</fpage>–<lpage>791</lpage>.</mixed-citation></ref>
</ref-list>
<fn-group>
  <fn fn-type="conflict"><p>Die Autor*innen haben erklärt, dass keinerlei konkurrierende Interessen bestehen.</p></fn>
</fn-group>
</back>
</article>
