Data Platform und Data Science - Mit moderner Datenverarbeitung zu mehr Erfolg

In unserem Interview mit Kris Cocozza sprechen wir dieses mal über die Data Platform von Microsoft. Er führt aus, welche Vorbereitungen für die Einführung einer modernen Datenstrategie notwendig sind und welche Vorteile es für kleine und große Unternehmen bringt.

Hi Kris, heute soll es um dein Spezialgebiet gehen: Data Platform und Data Science. Zunächst würde uns interessieren was man grundsätzlich unter einer Datenplattform versteht.

Wir bauen eine Datenplattform auf, um Daten zu verarbeiten. Diese können aus unterschiedlichen Töpfen gesammelt werden. Im nächsten Schritt können aus diesen Daten Informationen generiert und auch Mehrwerte abgeleitet werden. So haben Unternehmen die Möglichkeit datengetrieben zu agieren. Sie erhalten klare Fakten und müssen Entscheidungen nicht mehr aus dem Bauch heraus treffen.

Nun gibt es viele verschiedene Umsetzungsmöglichkeiten. Was ist die Besonderheit an der Microsoft-Datenplattform?

Die Plattform ist einfach zu bedienen und sehr nutzerzentriert. Mit Microsoft 365 wird zum Beispiel auch Power BI bereitgestellt. Power BI ist für den Endnutzer der Einstieg in die Data Discovery. Die Mitarbeiter:innen haben die Chance Firmendaten selbst aufzubereiten oder direkt in Berichte umzuwandeln, zu visualisieren und so neue Erkenntnisse zu schaffen. Wer eine stärkere Plattform sucht, findet schnell die notwendigen Services in Azure.

Also ist auch das Zusammenspiel der Produkte ein großer Vorteil für Unternehmen? Viele nutzen ja schon Microsoft 365 und können vorhandene Tools somit in die Plattform integrieren?

Richtig. Mit der passenden Microsoft 365 Lizenz ist Power BI schon vorhanden. Man kann direkt loslegen. Hat der Kunde zusätzlich schon ein Azure Abonnement, dann kann er auch noch einen Data Lake realisieren. Dort kann er Daten kostengünstig aus unterschiedlichen Quellsystemen zentralisiert ablegen. Der Einstieg ist einfach und schnell.

Du hast gerade erwähnt, dass man Daten aus unterschiedlichen Quellen einbinden kann. Ich bin also nicht auf eine Microsoft-Datenbank angewiesen.

Genau, gerade hier setzt die Microsoft-Datenplattform an. Azure bietet vorbereitete Schnittstellen für die bekannten Hersteller wie SAP, Oracle und auch für andere Cloud Services. Zusätzlich hat man die Möglichkeit eigene Schnittstellen direkt in Azure zu konfigurieren. An sich gibt es keine Einschränkungen bei der Integration verschiedener Datenquellen.

Kann bei der Entscheidung für oder gegen eine Datenplattform ein Unterschied bei der Unternehmensgröße gemacht werden? Profitieren nur große Unternehmen davon, oder ist dies auch etwas für KMUs?

Ich glaube, das ist die Angst, die viele haben. Der Begriff Datenplattform ist nur ein anderes Wort für ein Data Warehouse. Hier denken viele an große Plattformen, auf denen alle Unternehmensdaten zentralisiert liegen und viele Anforderungen der einzelnen Fachbereiche geprüft werden müssen. Also Synonym für: Das wird teuer.
Die cloudbasierten Plattformen agieren da anders. Sie lassen sich skalieren, der Einstieg ist günstig und durch ein agiles, Use-Case-basiertes Vorgehen, können erste Ergebnisse innerhalb weniger Wochen realisiert werden. Das wäre vor ein paar Jahren einfach unmöglich gewesen! Genau das macht moderne Datenplattformen auch für kleinere Unternehmen attraktiv. Denn auch sie haben Fragestellungen und möchten aus ihren Daten Antworten generieren.

Wie sähe das für ein kleines Unternehmen dann aus?

Power BI deckt die gängigen Bedürfnisse eines kleinen Unternehmens ab!

Für komplexere Datenlandschaften bietet Azure mit dem Data Lake und den Analytics Services vielfältige Möglichkeiten, bei denen nur nach Nutzung abgerechnet wird.

Die Hürde in die Datenverarbeitung einzusteigen ist also durch Microsoft Cloud Produkte eher gering?

Ja, ich finde Microsoft gibt einem das Gefühl, alles selbst machen zu können.
Power BI ist ein sogenanntes Self-Service Tool und du kannst als Nutzer sofort allein loslaufen.

Ohne Unterstützung in eine Datenplattform einzusteigen kann aber auch gefährlich sein.
Insbesondere am Anfang sollte man sich von einem Berater unterstützen lassen.
Gemeinsam klärt man zu Beginn: Wie gehe ich überhaupt vor? Was ist der Prozess? Die Umsetzung sollte von Anfang an richtig gemacht werden. So umgeht man die Gefahr, dass ein System nicht richtig eingeführt wird. Das könnte ansonsten nach ein paar Jahren zu großen Problemen führen.

Wie sieht da dein Beratungsansatz aus?

Mir ist es wichtig den Unternehmen nicht alles abzunehmen. Viel wichtiger ist es, Wissen aufzubauen. Der Kunde soll seine Plattform selbst betreuen, betreiben und eigene Berichte erstellen können.
Ich möchte den Kunden befähigen. Das schaffe ich durch einen Trainings- und Coachingansatz.

Wir haben viel über Datenplattformen gesprochen und du hast oft erwähnt, dass wir natürlich auch Mehrwerte schaffen wollen. Hier setzt der Bereich der Data Science an. Welches Potential haben all diese Daten, die ich nun gesammelt habe?

Da betreten wir die Ebene der Predictive Analytics und der Predictive Maintenance.
Es geht darum Modelle zu bauen, die Machine Learning Prozesse durchführen. Man nimmt die vorhandenen Daten und leitet Hinweise für die Entwicklung in der Zukunft ab.

Ein einfaches Beispiel aus der Logistik: Was ist die richtige Menge, die ich bestelle? Wie sorge ich dafür, dass die Produkte in meinem Lager dort nicht zu lange liegen und wertvollen Platz verbrauchen? Wie schaffe ich also die optimale Platznutzung in meinem Lager?
Machine Learning Modelle helfen dabei, dass die richtigen Mengen zu den richtigen Zeiten geliefert werden. Viel Potential sehe ich in der Lebensmittel- und Getränkebranche. Hier können Unternehmen von Data Science Projekten profitieren und Trends erkennen.

Und hier spielen Schlüsseltechnologien, wie BI, Machine Learning und AI eine große Rolle.

Ja, auf jeden Fall. Microsoft bietet auch dafür eine Plattform. In Azure findet man schon vorgefertigte Machine Learning Modelle. Es gibt eine Suite für AI-Funktionalitäten und -Features, die in Azure und auch in Power BI existieren. Man hat die Möglichkeit diese out of the Box anzuwenden, ohne sehr viel Programmierkenntnisse am Anfang zu haben. Für diejenigen, die doch noch tiefer einsteigen wollen, sind diese Modelle an das eigene Unternehmen oder an die eigenen Prozesse anpassbar. So werden Use Cases dann auch wertvoll.

Ja, alles gut, bis dann die Ever Given den Suezkanal versperrt und die Daten von den letzten Jahren alle wertlos sind.

Ja, das ist schwierig. Ich kenne ein paar Use Cases wo Predictive Analytics genutzt wird, um Kosten über die Zeit zu sparen. Dort werden Dinge identifiziert, die mit dem bloßen Auge oder anhand von bestehenden Daten nicht sofort auffallen würden. Und das ist das Gute an der AI-Technologie. Selbst winzige Ausreißer werden aufgedeckt. Das kann dann auf ein kleines Problem hindeuten. Solche Kleinigkeiten können jedoch über einen längeren Zeitraum zu großen Problemen führen und teuer werden.

Das finde ich spannend an der AI-Welt. Es geht nicht immer um etwas Großes. Sondern um die Früherkennung kleiner Dinge, um so Problemen in der Zukunft vorzubeugen. Das ist auf jeden Fall ein großes Sparpotential für Unternehmen.

Manchmal hat man als User so ein Gefühl und denkt, dieser Fall geht vielleicht so in die oder die Richtung. Wenn das mit entsprechenden Tools und Methoden aufgedeckt und mit Daten hinterlegt werden kann, ist es bestimmt ein richtig spannender Prozess.

Ja, es macht auch wirklich viel Spaß die ersten Erkenntnisse zu gewinnen und die Reaktionen von Kunden zu sehen: „Wow ok, das ist richtig cool.“ Oder dieser Aha-Effekt, wenn erkannt wird:
„Ah, ok, ich hab‘ doch ein Problem. Das wusste ich gar nicht.“

Der Kunde hat eine Fragestellung und denkt, dass er sie anhand der vorhandenen Daten nicht beantworten kann. Dann etwas zu entwickeln, um für die Zukunft eine Antwort zu finden, ist spannend.

Und dafür muss ich nicht immer ein Entwickler sein. Der Low-Code Ansatz von Microsoft macht es besonders einfach ein Modell zu erstellen.

Den von dir erwähnten Low-Code-Ansatz haben wir jetzt schon überall, auch in den Datenplattformen mit Power BI. Zum Beispiel das Verarbeiten von Daten aus mehreren Quellen in Power BI Dataflows. Man braucht im Hintergrund nicht unbedingt ein komplexes Data Warehouse, welches der Kunde nicht versteht.

Das heißt: Ja, du kannst den klassischen BI-Entwickler beauftragen und er kann Code schreiben. Alternativ kannst du den „Citizen Developer“ dransetzen und er kann mit Low-Code-Techniken viele Dinge zusammenklicken und erstellen. So erreichen beide fast das Gleiche.

Moderne Plattformen sind schon sehr verbreitet. Welche Herausforderungen haben Unternehmen, wenn sie eine Migration durchführen wollen von einer on-premise Datenplattform zur Cloudtechnologien oder zu hybriden Modellen?

Die moderne Datenplattform soll anders sein als das, was man von den klassischen Plattformen kennt.

Vom veralteten einmal-am-Tag-batch-loading muss man wegkommen und einen sogenannten Micro Batching Rhythmus anwenden. Hier verarbeite ich nicht große Mengen an Daten einmal am Tag, sondern ich breche das runter in viel kleinere Schritte.

Das klingt nach Veränderung des Nutzerverhaltens auf Kundenseite, oder?

Die große Herausforderung ist, dass die Unternehmen diese Änderungen mitmachen. Damit ist auch ein Change Prozess verbunden.

Dann sollte ich nicht versuchen eine on-premises Plattform in der Cloud nachzubauen. Das wäre sonst so, als ob wir eine Karosserie von einem Lamborghini bauen und dort einen Trabbi Motor reinpacken. Eine on-premises Landschaft ist statisch und in der Cloud haben wir ein skalierbares System. Dort sind Rechenleistung und Speicher komplett voneinander getrennt und so ist viel mehr möglich.

Das Geschäft hat sich über die Zeit verändert und Daten werden schneller angereichert. Zusätzlich gibt es viele neue Dateiformate. Diese Datenflut kann nur eine moderne Plattform bewältigen und dafür braucht es eine komplett andere Sicht, auf das, was ich mit meinen Daten erreichen will.

Zum Schluss: Hast du ein Learning aus den letzten Jahren für unsere Leser?

Es ist unglaublich wichtig, dass man vorher eine Datenstrategie hat.
Ohne eine solche Strategie wird es sehr, sehr schwierig. Man sollte nicht loslaufen und es einfach so machen. Dann stellt man am Ende fest, dass man doch ein 20-köpfiges Beratungsteam hat und keine Mitarbeiter:innen, die entsprechend geschult sind. Da wird dann eine Plattform realisiert, die am Ende keiner versteht.

Daher sehe ich mich eher als Trusted Advisor und Data Coach für diese Unternehmen.
Ich berate und stelle die richtigen Fragen, damit mein Kunde an alles denkt.
Nur so kann man mit einer modernen Plattform Erfolg haben.

Das ist doch ein schöner Abschluss. Vielen Dank Kris. Wir fangen gleich bei dir im Team an.

Ja, Platz gibt es noch, ich suche Leute. 


Wenn du einen unverbindlichen und kostenlosen Beratungstermin mit Kris möchtest, dann melde dich hier: Kris.Cocozza@LM-AG.de

Unsere aktuellen Stellenangebote findest du unter https://www.lm-ag.de/karriere/