Features

Die Formulierung von sog. Featuren ist ein Weg zur Unterstüzung der Suche in MultiMedia-Dateien und gehört damit in den Bereich des Multimedia-Retrievals und seinen Spezialgebieten des Image-Retrievals und Audio-Retrievals.

Da die Suche direkt in Medienobjekten aus verschiedenen Gründen (z.B. der Größe) eher ineffizient ist, werden Multi-Mediadaten "vorverarbeitet", in dem ihre für mögliche Anfragen relevanten Eigenschaften, die so genannten Features, bereits beim Einfügen in die Datenbank extrahiert, aufbereitet, normalisiert und einem Index zugefügt werden. Sie sind das Äquivalent zu den Suchtermen aus dem (theoretischen) Information-Retrieval. Bei ihnen handelt es sich um automatisch aus den "Rohdaten" eines Medienobjekts abgeleitete Metadaten und sie werden aus "Segmenten" extrahiert, die aus dem Medienobjekt selbst und einer Segment-Spezifikation, vereinfacht gesagt einer Angabe darüber, welcher Bereich des Medienobjekts Teil des Segments ist, bestehen.


Abbildung 1: Feature-Extraktion (vgl. [Schmitt2006])

Anforderungen

Features enthalten Werte für bestimmte Eigenschaften für Medienobjekte, unterliegen dabei einigen Anforderungen.

  • Adäquatheit

Während der Erkennung der Features muss ihre Adäquatheit gesichert sein, also dass sie die jeweiligen Informationen des Medienobjekts korrekt darstellen.

  • Effizienz

Ebenso die Effizienz, mit der sie durch Algorithmen erkannt werden.

  • Invarianten

Weiterhin ist wichtig, dass sie keine Invarianten, das heißt keine unerwünschten Eigenschaften wie z.B. Bildstörungen enthalten.

  • Minimalität

Im Prozess der Feature-Aufbereitung wird die Minimalität gewährleistet, die sicherstellt, dass Speicherbedarf und Berechnungsaufwand nicht größer als nötig werden und dass die jeweiligen Indexstrukturen effizient bleiben, ebenso die Orthogonalität, die Unabhängigkeit der Features voneinander.

Funktionsweise

Features sind für Ähnlichkeitsberechnungen interessant, da sie automatisch extrahiert werden und somit keine manuellen Eingaben nötig sind. Unter bestimmten Umständen ist mit ihnen sogar eine automatische Interpretation möglich, z.B. können Bilder von Stränden oder Wüsten aufgrund ihrer Farbverläufe leicht von Bildern mit Wäldern oder Städten unterschieden werden.

Probleme

Im Allgemeinen sind Features jedoch stark begrenzt, da sie nur atomare Eigenschaften beschreiben und sich somit stark von der menschlichen Wahrnehmung unterscheiden. Unter anderem deswegen ist es für Menschen sehr schwierig, ihren Suchwunsch anhand von Feature-Werten anzugeben, in dem sie z.B. Farbverteilungen oder Texturen definieren. Sie können ihn eher anhand dessen definieren, was sie selbst wahrnehmen. Ein gutes Beispiel dafür ist die Suche nach Bildern, die einen Fliegenpilz zeigen. Als Suchparameter lässt sich eine runde, rote Fläche mit einem kleinen Weiß-Anteil definieren. Anhand dieser Features würden zwar Bilder von oben aufgenommenen Fliegenpilzen erscheinen, nicht aber von Pilzen, die seitlich fotografiert wurden. Weiterhin würden beispielsweise Bilder von Roten Wasserbällen mit weißer Aufschrift aufgrund ihrer Form und Farbverteilung in die Menge der relevanten Suchergebnisse gelangen. Diese Lücke zwischen menschlicher Inhaltsbeschreibung und den Leistungen der Feature-Werte nennt sich "semantische Lücke".

Quellen:

  • [Schmitt2006] Schmitt, Ingo: "Ähnlichkeitssuche in Multimedia-Datenbanken", Oldenbourg Wissenschaftsverlag GmbH, München 2006.

Kategorie: Datenbanken, Objektrelationale DB, Multimediadatenbanken, M