Overview
In der musikwissenschaftlichen Strukturanalyse spielte beim Einsatz von Informationstechnologien bisher die Anwendung statistischer Methoden auf grosse Datenbestände eine eher untergeordnete Rolle. Gerade in der Erforschung von Pop- und Rockmusik scheinen die Möglichkeiten des «Data Mining» nicht nur eine zusätzliche Strategie im Repertoire der musikanalytischen Ansätze darzustellen; vielmehr erfordert es die schiere Menge und Vielfalt der Artefakte, dass musikanalytische Befunde auf grossen Datensätzen basieren, um überhaupt verallgemeinert werden zu können. Die Harmonik der Popmusik zeigt diesen Sachverhalt deutlich: Einerseits ist die Formelhaftigkeit der Popharmonik schon auf der Basis von oberflächlichen Repertoirekenntnissen evident – andererseits ist es beim derzeitigen Stand der Forschung nur sehr beschränkt möglich, fundierte Aussagen über tatsächliche Häufigkeit von Modellen, über historische Veränderungen im harmonischen Repertoire oder über die Gebundenheit von harmonischen Formeln an bestimmte Genres zu machen.
Mit dem vorliegenden Projekt wurden die in der Pop- und Rockmusik verwendeten harmonischen Modelle auf Basis eines Musikkorpus von rund 1500 Songs mit Mitteln des «Machine-Learnings» identifiziert. Die Basis des analysierten Repertoires bildete ein bestehender Korpus von 1000 Tonträgern, der von 92 Fachjournalisten zusammengestellt wurde. Der Korpus wurde in einer Datenbank abgebildet und durch Aggregation von zusätzlichen Datenquellen mit Informationen zu den weltweiten Charts-Platzierungen (tsort.info) sowie vergleichbaren Künstlern (www.albumoftheyear.org) auf eine Auswahl von rund 1500 Songs erweitert. In der resultierenden Auswahl sind für alle Fünfjahresperioden zwischen 1960 und 2015 mindestens 120 Songs enthalten. Harmonische Transkriptionen der Tonaufnahmen wurden von zwei professionellen Musikern ausgehend von einer automatisierter Tonart- und Akkord-Erkennung (sonicAPI.com) nach einem Vier-Augen-Prinzip erstellt. Der resultierende Datensatz von Akkordfolgen wird neben einer deskriptiven statistischen Auswertung mit einem Machine-Learning-Algorithmus (SPADE) auf wiederkehrende Sequenzen hin untersucht.
Die Auswertung der Daten zeigt für die Pop-Harmonik ein vielfältiges Bild. Einerseits werden einige bekannte Muster (beispielsweise die «Jazz-Kadenz» I-IV-I-V) stil- und epochenübergreifend relativ häufig eingesetzt. Andererseits finden sich andere erwartete Formeln (beispielsweise der «Pachelbel-Kanon» I-V-vi-iii-IV-I-IV-V) im untersuchten Korpus kein einziges Mal. Die Vielzahl der identifizierten Sequenzen (3740 Sequenzen, die sich zu 80 Muster gruppieren) legt nahe, dass die vordergründig plakative Pop-Harmonik mit einer Kunst der Variation arbeitet, in der bekannte Schemen auf immer andere Art durchbrochen werden.