Main Navigation Section

Was bedeutet Datenherkunft?

Die Datenherkunft verfolgt den Verlauf Ihrer Unternehmensdaten nach: von ihrer Erstellung an der Quelle über deren Verschiebung und Transformation in und aus Datenplattformen und Repositorys (innerhalb oder außerhalb Ihres Unternehmens) bis hin zu ihrem finalen Speicherort in den Anwendungen und der Business Intelligence, die für reibungslose Abläufe und eine fundierte Entscheidungsfindung notwendig sind. End-to-End-Datenherkunft bietet einen umfassenden und detaillierten Überblick darüber, welche Daten in Ihr Unternehmen gelangen, wie sie sich darin fortbewegen und wie sie aus Ihrem Unternehmen wieder herausfließen. Sie kann Ihnen dabei helfen, IT-Modernisierungen zu planen, Probleme mit der Datenqualität zu beheben, Daten-Governance und Compliance zu erreichen und rasch die verfügbaren Daten und ihre Beziehungen innerhalb Ihres Unternehmens zu erkennen und nachzuvollziehen.

Ist die Datenherkunft Teil der Daten-Governance?

Ja. Eine effektive Daten-Governance setzt voraus, dass sich die Unternehmensnomenklatur, Datenwörterbücher und Datenschutzrichtlinien an einem zentralen Ort befinden. Wenn das Datenvolumen in einem Unternehmen weiter zunimmt, nehmen diese Objekte jedoch verschiedene Formate an, werden an unterschiedlichen Orten gespeichert und auf andere Weise angegeben. Die Datenherkunft hilft dem Unternehmen dabei, Daten im Laufe der Zeit einfach nachzuverfolgen, zu überwachen und zu aktualisieren. Sie bietet Vorteile für Governance-Praktiken, etwa die Einhaltung von konsistenter Terminologie, Behebung von Datenqualitätsproblemen, Auditierung von Datenpipelines und Ursachenanalysen bei Datenvorfällen.

Was ist ein Datenkatalog und Datenherkunft?

Ein Datenkatalog ist eine zentralisierte Ansicht der Datenassets in einem Unternehmen. Er wird dazu verwendet, Unternehmensdaten zu verwalten, zu nutzen, zu schützen, nachzuvollziehen und zu sozialisieren. Datenkataloge enthalten Metadaten (oder Daten, die Ihre Daten beschreiben), die aus verschiedenen Datenquellen, Datenplattformen, Anwendungen und Business-Intelligence-Systemen in Ihrem Unternehmen erfasst werden. Diese werden dann mit geschäftlichem Kontext und Informationen zur Daten-Governance angereichert. Die automatisierte Datenkatalogisierung macht sich die automatische Datenerkennung und Metadaten-Erfassungsfunktionen zunutze und setzt dazu plattformspezifische Datenkonnektoren für ruhende Metadaten ein. Die automatisierte Datenherkunft nutzt ruhende Metadaten. Für die Erfassung von Metadaten während der Übertragung werden die Reverse-Engineering-Funktionen des Datenkonnektors genutzt. Dabei wird der an der Datenverschiebung beteiligte Code analysiert, zum Beispiel prozeduraler Code und ETL, um den Datenfluss im gesamten Unternehmen abzubilden. Die sich daraus ergebende Datenherkunft unterstützt IT- und Daten-Governance-Teams sowie geschäftliche Benutzer dabei, die verfügbaren Datenassets im Unternehmen visuell nachzuvollziehen. Sie veranschaulicht den Weg der Daten von der ursprünglichen Datenquelle zu den Zielanwendungen sowie alle dazwischen ablaufenden Datentransformationen.

Was ist ein Datenherkunfts-Tool?

Ein Datenherkunfts-Tool nutzt Automatisierung, um den Datenfluss von der ursprünglichen Datenquelle bis zu den Endzielen und alle Transformationen und Verarbeitungen dazwischen zu erkennen und abzubilden. Durch die Abbildung der Datenpipelines, die Ihr Data Warehouse auffüllen, kann ein Datenherkunfts-Tool unter Umständen ETL-Aufgaben, , die dem Laden von Daten in das Ziel-Warehouse unmittelbar vorausgehen, per Reverse-Engineering ermitteln. Das Tool durchläuft alle Datenquellen, trägt dabei eine Aufgabenliste zusammen und dokumentiert jedes erkannte Herkunftselement. Zum Ende der Sequenz hat der Prozess die Pipelines zur Auffüllung dieses Warehouse ausgehend vom Zielpunkt erfolgreich abgebildet. Mit automatisierten Datenherkunfts-Tools wird das Erfassen und ständige Aktualisieren der Datenherkunft praktikabler. Datenverantwortliche können damit bis zu 95 Prozent der Zeit einsparen, die normalerweise für manuelle Methoden zur Ermittlung der Datenherkunft investiert werden müsste.