Bildnachweis: Standortagentur Tirol

Digitalisierung

Die Datenkultur bildet die Basis für die Organisation und Speicherung von Daten.

Datenkultur: Ordnung schafft Erfolg!

16.07.2024
Mit einem simplen "Ich räum' mal eben auf" lässt sich in komplexen IT-Umgebungen schon lange nichts mehr gewinnen. Das Reizwort heißt vielmehr "Datenkultur". Sie bildet nicht nur die unverzichtbare Basis zur Organisation und Speicherung der Daten. Vielmehr geht sie über das reine Ansammeln hinaus und gewährleistet, dass Beteiligte die Daten verstehen, korrekt interpretieren und daraus smarte Entscheidungen für Geschäftsprozesse ableiten.

Am Anfang jeder Datenkultur steht die Frage nach der passenden Datenstruktur. Sie wird als Objekt verstanden, in dem Daten beispielsweise als Zeichen oder größere Einheiten (Zahlen, Wörter, Wortfolgen, …) abgelegt werden. Die so definierte Struktur kümmert sich darum, dass der Datenbestand in einem Speicher richtig verwahrt und durch Programmanweisungen verwaltet werden kann. Hier geht es vor allem um die Operationen „einfügen“, „löschen“ und „suchen“.   

In beinahe jeder Programmiersprache ist ein Satz dieser Datenstrukturen integriert. Ein smart gestaltetes Datenmodell wirkt sich auf die Performance von Algorithmen aus. Operationen wie „suchen“, „sortieren“ oder „aktualisieren“ werden deutlich optimiert. Einmal intelligent gewählt, organisiert die Datenstruktur die Daten logisch und ermöglicht den effizienten Zugriff auf den Bestand.    

Statisch oder dynamisch? 
 
Statische Datenstrukturen arbeiten mit einem fixen Speicherschema, die Größe wird zuvor festgelegt und kann nicht mehr verändert werden.

  • Primitive Datentypen: Integer (ganze Zahlen), Boolean (Aussagen sind wahr/falsch), Float (Kommazahlen), Char (Buchstaben)
  • Array: Vergleichbar mit einem Schrank, der eine große Menge von Schubladen enthält. In jedes Fach kann genau ein Objekt hineingelegt oder herausgenommen werden
  • Record: Kann man sich als geschriebenen Lebenslauf vorstellen. Er enthält verschiedene Angaben wie Name und Alter, die in einem „Record“ fester Größe verbunden werden.   

Dynamische Datenstrukturen lassen sich in der Größe variieren. Beim Einfügen oder Löschen eines Objekts wird der Speicher angepasst. Zum Einsatz kommen „Zeiger“, die auf Objekte verweisen, die sich ihrerseits auf das nächste (manchmal vorhergehende) Objekt beziehen.

  • Liste: Schaut wie eine Menschenkette aus, jeder Beteiligte zeigt auf seinen Nachfolger .
  • Queue: Die klassische Warteschlange vor der Kinokasse, wer als Erster kommt, wird auch als Erstes bedient.
  • Stack: Ein Schuhkarton wird auf einen Stapel gestellt und wieder als erstes vom Stapel genommen.
  • Baum: Das Bild stammt aus der Natur. Mit „Wurzeln“, „Blättern“ und „inneren Knoten“ werden Daten hierarchisch gespeichert.
  • Hashtabelle: Beim Umzug werden Gegenstände in Kartons verpackt, beispielsweise zwei Dinge in Kiste 1 und vier Sachen in Kiste 2 usw.   

Daten von Daten von Daten …  
 
Beim Stöbern in einer althergebrachten Bibliothek hat fast jeder schon unbewusst mit sogenannten „Metadaten“ Bekanntschaft gemacht. So fanden sich auf den Kärtchen Angaben zu Autorenschaft, Herausgabe, Erscheinungsjahr und Auflage eines Werkes.

Den Inhalt des Romans „Der Steppenwolf“ von Hermann Hesse kann man als die eigentlichen Daten ansehen, das Erscheinungsjahr 1927 gehört aber zu den Metadaten. Sie enthalten also wichtige Merkmale anderer Daten. Eine Anwendung betrifft digitale Musikaufnahmen. Meta-Informationen wie Künstler:in, Komponist:in, Datum der Veröffentlichung, Genre und Verlag können direkt in der Audio-Datei hinterlegt werden. Die standardisierte Beschreibung von Daten mit der Metaebene bildet die Ebene nach der Datenstruktur.  
 
Schema.org bietet ein allgemeingültiges Werkzeug, wie Daten standardisiert dargestellt werden können. Das Portal hilft dabei, Inhalt und Struktur auf Websites oder cloudbasierten SaaS-Lösungen („Software as a Service“) so auszuzeichnen, dass Suchmaschinen optimal erfassen und indexieren können.

Search Engines verstehen semantische Zusammenhänge einer Seite und ordnen Inhalte dann in einen Kontext, wenn strukturierte Daten vorliegen. Schema.org assistiert beim Vorgang, häufig auftretende Inhalte für Suchmaschinen hervorzuheben. Dazu gehören Personen, Orte, Produkte, Angebote, Bewertungen, Events, Gesundheit, Bücher, Musik und einiges mehr.    
 
Wie „gesund“ sind Daten? 
 
Mit dem Begriff „Datenqualität“ wird im engeren Sinn der Gesundheitszustand der Daten beschrieben. Dabei geht es um Dimensionen wie Vollständigkeit, Konsistenz, Zuverlässigkeit, Exaktheit, Gültigkeit etc., also um die korrekte Abbildung von Daten nach definierten Regeln und Bedingungen. Selbstredend, dass beispielsweise kaufmännische Entscheidungen in hohem Maß von der Qualität der zugrundeliegenden Daten abhängen.  
 
So können sich Fehler in Datenbanken fatal auf Strategien und Marketing-Maßnahmen auswirken. Exquisite Datenqualität führt zu Wettbewerbsvorteilen, effizienter Betriebsführung und generiert letztlich Kundenvertrauen. Das passiert nicht zufällig, daher setzt innovatives und nachhaltiges Business auf Datenqualitätsmanagement. 

In einem der nächsten Beiträge wird das Thema „Datenqualität“ detailliert behandelt.  

Links

>>Schema.org
>>Blogbeitrag zu Datenkultur

Zurück

nach oben