Heterogene Datenquellen

Definition:
Heterogene Datenquellen bezeichnen unterschiedliche Ursprünge von Daten, die sich hinsichtlich Struktur, Format, Inhalt oder Technologie voneinander unterscheiden und nicht ohne Weiteres miteinander kombinierbar sind. Sie erfordern eine gezielte Datenintegration, um gemeinsam analysiert oder verarbeitet werden zu können.


Beispiele für Heterogenität:

  • Unterschiedliche Formate: Excel, CSV, XML, JSON, Datenbankabfragen, unstrukturierte Texte (z. B. Bewertungen)

  • Verschiedene Systeme: CRM-Tools, Buchungssysteme, Social Media, Sensoren, Kassensoftware

  • Abweichende Strukturen: Tabellarisch, hierarchisch, baumartig oder frei formuliert

  • Semantische Unterschiede: Verschiedene Begriffe oder Feldbezeichnungen für dieselbe Information


Anwendungsbeispiel:
In einem Freizeitbad fallen täglich Daten aus verschiedensten Quellen an:

  • Reservierungen über das Online-Buchungssystem (XML)

  • Eintritte an der Tageskasse (CSV)

  • Kundenfeedback aus Google-Rezensionen (Text)

  • Marketing-Kampagnen in Excel-Listen

  • Besucherzähler liefern Sensordaten (JSON)

Diese heterogenen Quellen müssen vereinheitlicht werden, um z. B. fundierte Auswertungen zum Gästeverhalten, zur Auslastung oder zur Wirkung von Marketingmaßnahmen vornehmen zu können.


Bedeutung in der Praxis:
Die sinnvolle Zusammenführung heterogener Datenquellen ist Grundlage für:

  • Ganzheitliche Datenanalysen

  • Automatisierte Prozesse und Entscheidungsfindung

  • Zielgerichtetes Marketing und Angebotsgestaltung

  • Effizientere Planung und Ressourcennutzung


Hinweis:
Moderne Tools wie Power BI, ETL-Plattformen (Extract – Transform – Load), KI-gestützte Auswertungstools oder Automatisierungsdienste wie Zapier oder Make.io helfen dabei, heterogene Datenquellen zu verbinden und nutzbar zu machen.

Quelle: Chat GPT

» E-tivity 6.2: Wissensglossar