Cookie Consent by FreePrivacyPolicy.com

Data Preparation


In Unternehmen werden Daten aus einer Vielzahl von Quellen gewonnen. Nicht alle Quellsysteme liefern jedoch direkt verwendbare Daten. Die Vorbereitung von Daten ist ein wichtiger Schritt in jeder Datenpipeline.

Daten aus Quellsystemen können inkorrekt, redundant, inkonsistent oder falsch formatiert sein. Bei der Datenvorbereitung werden die Daten korrigiert, validiert und vereinheitlicht. Um von Anfang an eine hohe Datenqualität zu garantieren, erfolgt die Datenvorbereitung am Anfang einer Datenpipeline.

Unterschiedliche Datensätze können sich auf die gleichen Gegenstände, Personen oder Sachverhalte beziehen. Bei der Datenvorbereitung werden die Datensätze diesen gemeinsamen Entitäten zugeordnet und mit geeigneten Identifikationsschlüsseln versehen. Durch diese eindeutige Zuordnung wird sichergestellt, dass alle über eine Entität vorliegende Informationen für die Analyse verwendet werden können. Außerdem wird das Hinzufügen von neuen Informationen vereinfacht.

Die Datenvorbereitung ist ein wichtiger Arbeitsschritt um aus Rohdaten eine hochwertige und belastbare Informationsbasis zu extrahieren. Zuerst müssen die notwendigen Vorbereitungsschritte definiert werden. Anschließend müssen sie implementiert und automatisiert werden, damit auch neu hinzukommende Daten nach den gleichen Regeln vorbereitet werden. Eine Datenvorbereitungsworkflow muss anpassbar sein, um auch neue Anforderungen umsetzen zu können.

Im Beratungsfeld Data Preparation helfen wir unseren Kunden, eine dauerhaft hohe Qualität der Daten mithilfe von geeigneten Vorbereitungsschritten sicherzustellen. Wir untersuchen Rohdaten aus verschiedenen Quellen, entwerfen und implementieren Vorbereitungsworkflows und lassen die Daten ins Data Warehouse einfließen. Dafür verwenden wir sowohl erprobte ETL-Tools als auch individuell konfigurierbare Codelösungen.

Unsere Technologien
  • Microsoft SSIS
  • Azure Data Factory
  • Azure Data Studio
  • PowerQuery
  • Tableau Prep
  • Alteryx
  • SAP Data Services (BODS)
  • Apache Airflow
  • Scripte auf Basis geeigneter Programmiersprachen (Python, Scala, C#)
Niklas
Niklas Rodenhausen
Unternehmensentwicklung und Strategie

Tel: 0221 / 2220 4968

Per Mail kontaktieren