Audio Retrieval

Audio Retrieval Verfahren versuchen Musikstücke innerhalb einer Musikdatenbank zu finden. Dabei wird der Suche, ähnlich wie beim Image-Retrieval Verfahren, ein Query Song oder auch Seed Song übergeben. Die Charakteristika (Features) des Seed Songs werden extrahiert und mit den Features der Lieder aus der Datenbank verglichen. Audio Retrieval Verfahren dienen bspw. dazu Playlisten nach den Wünschen des Anwenders zu füllen. Auch hier wird oft ein Feedback-System verwendet um die Suchergebnisse zu optimieren.

Die Charakteristika der Lieder werden dabei in drei Abstraktionsstufen ermittelt: Low-, Mid- und Highlevel. Innerhalb der Lowlevel Features werden einzelne Frames des Liedes untersucht. Hier werden bspw. die Lautstärke oder auch der Frequenzbereich extrahiert. Aus zeitlichen Abfolgen dieser Frames werden dann Schlüsse für die Midlevel Charakteristika gezogen. Genutzt werden hierzu der Arithmetische Mittelwert und die Standardabweichung. Letztlich wird dann das gesamte Lied analysiert und einer bestimmten Klasse (Rock, Pop, …) zugeordnet. Hierbei wird der Maschine anhand eines Sets von Übungsbeispielen beigebracht, welche Lieder zu welcher Kategorie gehören. Dies wird auch als „Supervised Learning“ bezeichnet.

siehe auch: Image-Retrieval, Multimedia-Retrieval, Information-Retrieval

Quellen:

  • Detyniecki; Leiner; Nürnberger: "Adaptive Multimedia Retrieval - Identifying, Summarizing, and Recommending Image and Music" 6th InternationalWorkshop, AMR 2008 Berlin, Germany, June 26-27, 2008 Revised Selected Papers
  • McKinney, Martin F.; Breebaart,Jeroen : "Features for Audio and Music Classification"

Kategorie: Datenbanken, Objektrelationale DB, Multimediadatenbanken, M