Web 2.0 - Social Media und ihre Anforderungen an DBS

Der Begriff Web 2.0 ist im Jahr 2003 aufgekommen und derzeit ist er gerade dabei, immer mehr durch den Begriff social media ersetzt zu werden. Hier wird das Schlagwort nur so weit erläutert, um ein grundlegendes Verständnis entwickeln zu können für neue Anforderungen, die im "Web 2.0-Zeitalter" an Datenbanksysteme gestellt werden. Für eine vollständige Definition und ausführliche Diskussion sei hier auf Wikipedia verwiesen.

Zu den technischen Neuerungen, die mit Web 2.0 und Social Media einhergehen gehören Entwicklungen wie: Cloud Computing, Web-Blogs, Mashups, Constent Management Systeme, datenbankgestützte Seiteninhalte, ...

Aber Web 2.0 und Social Media sind mehr als nur neue Technologien. Zentraler Bestandteil ist eine veränderte Nutzung des Internets durch die breite Öffentlichkeit. In den Anfängen des Internets gab es klare Rollenverteilungen. Einige wenige stellten Informationen bereit und die Masse der Nutzer haben die diese konsumiert. Die "einfachen" Internetnutzer haben sich zu Akteuren gewandelt. Es bilden sich im Internet weltweite lose Zusammenschlüssen, won Interessierten, die sich in der Regel gar nicht kennen, die Themen diskutieren und zusammenbearbeiten, die ihr Wissen zu Themen online stellen. Statt Monologe zu führen und nur Wissen bekannt zugeben, werden heute Dialoge geführt über veröffentlichtes Wissen (Soziale Interaktion und Kollaboration, Sozial-mediale Dialoge). Web-Blogs und Social Communities sind Techniken, die dies einfach und intiutiv ermöglichen. Informationen werden nicht nur bekannt gegeben, sondern können von jedermann kommentiert werden. In diesem Zusammenhang wird auch von einer Demokratisierung des Wissens gesprochen und von User Generated Content.

Die neuen Dienste, die mit den Social Communities und dem Cloud Computing aufkommen, ermöglichen es, sehr einfach, Bilder, Texte, Videos,... im Netz zu publizieren, aber auch gemeinsam zu bearbeiten. Damit ist der Grundstein für weiter explodierende Datenmengen im Internet gelegt und damit der Notwendigkeit von NoSQL-Datenbanksystemen.

Hier nun ein paar Anforderungen, die Web 2.0 und Social Media an Datenbanksysteme stellen:

  • Neue Datenquellen sind zu erschließen, Web-Blogs, Einträge in Social Communities.
  • Informationen direkt auf den Internetseiten suchen oder in Dokumenten aus dem Internet
  • „Elastizität“ der Datenstrukturen: Gefundene Daten unterliegen keinem festen Struktur mehr wie es aus RDBMS bekannt ist. Daten können unstrukturiert sein, Dokumente schemafrei.
  • Enorm gestiegene Datenmengen: Wird das Internet automatisch durchsucht, sammeln sich schnell relevante Datenmengen im Tera- und Peta-Bereich, wo sie bislang eher Mega-Bereich lagen.
  • Nutzer stellen rigide Anforderungen an Antwortzeiten (Availability), Schnelligkeit ist das oberstes Postulat, statt wie bislang die Konsistenz. Die Unvereinbarkeit aller drei Basisanforderungen an DBS, die Forderungen nach konsistenten Daten, schnellen Antwortzeiten und hoher Ausfalltolleranz wird im CAP-Theorem formuliert.

Die neuen Datenmodelle und Datenbanksysteme, die sich derzeit so seit ca. 2004 unter dem Schlagwort NoSQL sammeln, versuchen Antworten auf diese neuen Probleme zu geben.

Quellen:

  • Edlich, Friedland, Hampe, Brauer: „NoSQL – Einstieg in die Welt der nichtrelationalen Web2.0- Anwendungen“, Hanser-Verlag, 2010, ISBN 978-3-446-42355-8
  • Wikipedia: „Web 2.0", Web 2.0 - deutsch, Web 2.0 - englisch, Stand 23.03.2011

Weiterführende Literatur:

  • Frey, M.: „Etablierte Datenmodelle der NoSQL-Familie und ihre spezifischen Eigenschaften im Kontext von Cloud-Datenbanken“, Bachelorarbeit, FH Köln, Institut für Informatik, 08/2010
  • Kossmann, D., Kraska T.: „Data Management in the Cloud: Promises, State- of-the-art and Open Questions“, in „Datenbanken und Cloud-Computing“, Datenbank Spektrum, Band 10 Heft 3, Springer-Verlag, 12.2010, S. 121-129

Weiterführende Links:

Kategorie: Neue DB-Entwicklungen , Grundlagen, NoSQL, W