IT Architektur – die Basis für Data Analytics
Juni 5, 2020
Im ersten Hauptteil bekommen wir eine Einführung zum Thema IT Architektur. Wie üblich werden zuerst zwei grundsätzliche Fragen diskutiert:
Erstens, was ist eine Architektur? Die Architektur definiert sich aus zwei Hauptmerkmalen:
Zweitens, wieso ist IT Architektur wichtig? Mit einer Struktur und Systematik ist es viel einfacher, Standards zu setzen und Silos zu eliminieren. Diese zwei Vorteile sind fundamental, wenn es darum geht Lösungen in einem Unternehmen zu skalieren und operationalisieren.
Im IT Kontext legt sie Grundstrukturen und Regeln fest um das dynamische Zusammenspiel aller Komponenten zu koordinieren.
Eine wichtiger Zusammenhang besteht zwischen der Enterprise Architecture und Solution Architecture. Enterprise Architecture versteht man dabei einen Stadtplan. Es gibt einen Überblick wie ein Unternehmen aufgebaut ist und welche Applikationen welche Geschäftsprozesse unterstützen. Weiter können damit Rahmenbedingungen definiert, wie zum Beispiel für den Datenschutz. Im Gegensatz dazu beschreibt die Solution Architektur eine einzelne Lösung. Im Kontext eines Stadtplans eine einzelne Gegend und deren Strassen.
Die IT Architektur muss genauso geplant werden wie bei einer Strategie. Sie muss auf die Strategie abgestimmt sein und die Fähigkeiten bestimmen, die es braucht, damit die Unternehmensziele erreicht werden. Anpassungen sind früher oder später notwendig. Demzufolge sollte es keine starre Lösung sein, die fest für die nächsten sechs bis sieben Jahre gilt und schwer anpassbar ist. Parallel dazu werden mehrere Versionen unterhalten und über die Jahre entwickelt.
Um die IT Architektur besser zu verstehen, ist es wichtig in verschiedenen Domänen und Schichten zu denken, die sich auf verschiedenen Abstraktionsebenen befinden. Interessiert man sich beispielsweise für die Compliance-Domäne: So kann man den Compliance-Ausschnitt aus dem ganzen Gefüge herausziehen und tiefer hineinschauen.
Wie anfangs erwähnt geht es bei der IT Architektur um Bausteine. Ein bausteinmässiger Ansatz unterstützt dabei verschiedene Fähigkeiten (Capabilities) von einzelnen Modulen (Building Blocks) wiederzuverwenden und transparent zu machen.
Mit Principles und Patterns sollen möglichst viele Standards durchzusetzen und nur wenige Ausnahmen zuzulassen werden. Dies damit kein Wildwuchs innerhalb der Enterprise Architecture entsteht. Das Pareto-Prinzip eignet sich ideal dafür an mit 80 % Standards und 20 % Ausnahmen. Die Arbeit mit Views reduziert die Komplexität. Sie helfen beim Eingrenzen von bestimmten Objekten in einem bestimmten Kontext, wie zum Beispiel ‘Alle Applikationen einer Domäne mit Schnittstellen’.
Bei der Umsetzung einer IT Architektur wird ein 3-Phasen Vorgehen empfohlen. In der ersten Phase wird eine Baseline Architecture definiert, gefolgt von einer Target Architecture. In der dritten Phase wird die Brücke zwischen der ersten und zweiten Phase geschlagen. Dabei wird klar definiert, was es braucht, damit man von der Baseline zum Target Architecture gelangt.
TOGAF und Enterprise Architekt (EA) sind typische Tools, die beim Design von Enterprise Architecture unterstützen. Sie werden eher in grossen Unternehmen eingesetzt und bei KMUs nur selten betrieben.
Im Kontext von Data Analytics ist eine IT Architektur deshalb wichtig, weil zuerst eine Ordnung bestehen muss, bevor Data Analytics Fähigkeiten aufgebaut werden. Dies ist eine wichtige Voraussetzung, da oft Daten aus mehreren System benötigt werden und somit Abhängigkeiten in der IT Architektur entstehen.
Referenzarchitekturen für Data Analytics: Es gibt viele verschieden Referenzarchitekturen. Zusammenfassend lässt sich festhalten, dass jede IT Architektur ihre eigene Vorteile und Nachteile hat. Es gibt nicht die eine perfekte Lösung, die für alle möglichen Anwendungsfälle passt. Jedes Unternehmen muss selbst herausfinden, wo der Nutzen liegt und was die richtige Kombination ausmacht.
In den Beispielen kommt augenscheinlich die Lambada und Kappa als Referenzarchitektur öfters vor. Sie ist zum Abarbeiten von Realtime Daten optimiert ist und somit für Streaming Anwendungsfälle geeignet. Zudem wird der Begriff Data Lake genauer diskutiert, da er im Zusammenhang mit AI relevant ist. Ein Data Lake ist ein zentraler Ort in der IT Architektur, wo sich verschiedene Rohdaten in unbereinigter Form befinden. Es steht Data Science Teams zur Verfügung, um Daten herauszuziehen und zu formen. In der Praxis sind besonders hybride IT Architekturen in Zusammenspiel mit Cloud gefragt.
Im zweiten Hauptteil behandeln wir die Konzepte und Technologien in Bezug auf Data Management, welches den gesamten Lebenszyklus von Daten steuert.
Klassische SQL Datenbanken sind ungeeignet für schnelle und komplexe Analytics-Abfragen. Eine No-SQL-DB dagegen schon, da semistrukturierte oder unstrukturierte Daten unterhält, und somit optimiert ist für komplexe und schnelle Abfragen.
Im Unterschied zu den klassichen Datenbank Systemen gibt es auch verteilte Systeme. Diese gewinnen aktuell stark an Bedeutung, nicht zuletzt mit dem Aufkommen von Blockchainanwendungen wie Bitcoin. Die Vorteile von verteilten Systeme lassen sich auch für Data Analytics übertragen.
In Bezug auf AI geht die Tendenz stark Richtung OpenSource. Die Gründe liegen in der schnellen Verfügbarkeit und der Aktualität. In der Praxis jedoch geht es meistens um spezifische Anwendungsfälle. Hier stellt sich heraus, dass OpenSource Lösungen oftmals nicht ausgereift ist und der Softwarehersteller kein Support bietet.
Wichtig: In Unternehmen werden oft kommerzielle Produkte von SAP, Microsoft und Co eingesetzt. Diese holen auf und implementieren AI Funktionalitäten wie zum Beispiel auch Chatbots, oder ML/AI Funktionen in Ihre Anwendungen mit ein.
Auch bei den Technologien bewegen sich die meisten Unternehmen Richtung Cloud Lösungen, womit wir am Ende des Vormittags sind und somit zum zweiten Teil übergehen können – über den Markus schreibt.
Wir haben interessante Insights gewonnen. Herzlichen Dank dafür Matthias.
Unser Newsletter liefert dir brandaktuelle News, Insights aus unseren Studiengängen, inspirierende Tech- & Business-Events und spannende Job- und Projektausschreibungen, die die digitale Welt bewegen.