Was ist ein Datenkatalog und Datenherkunft?
Ein Datenkatalog ist eine zentralisierte Ansicht der Datenassets in einem Unternehmen. Er wird dazu verwendet, Unternehmensdaten zu verwalten, zu nutzen, zu schützen, nachzuvollziehen und zu sozialisieren. Datenkataloge enthalten Metadaten (oder Daten, die Ihre Daten beschreiben), die aus verschiedenen Datenquellen, Datenplattformen, Anwendungen und Business-Intelligence-Systemen in Ihrem Unternehmen erfasst werden. Diese werden dann mit geschäftlichem Kontext und Informationen zur Daten-Governance angereichert. Die automatisierte Datenkatalogisierung macht sich die automatische Datenerkennung und Metadaten-Erfassungsfunktionen zunutze und setzt dazu plattformspezifische Datenkonnektoren für ruhende Metadaten ein. Die automatisierte Datenherkunft nutzt ruhende Metadaten. Für die Erfassung von Metadaten während der Übertragung werden die Reverse-Engineering-Funktionen des Datenkonnektors genutzt. Dabei wird der an der Datenverschiebung beteiligte Code analysiert, zum Beispiel prozeduraler Code und ETL, um den Datenfluss im gesamten Unternehmen abzubilden. Die sich daraus ergebende Datenherkunft unterstützt IT- und Daten-Governance-Teams sowie geschäftliche Benutzer dabei, die verfügbaren Datenassets im Unternehmen visuell nachzuvollziehen. Sie veranschaulicht den Weg der Daten von der ursprünglichen Datenquelle zu den Zielanwendungen sowie alle dazwischen ablaufenden Datentransformationen.