Das Webinar Data Science in der Praxis - vom Buzzword zur praktischen Umsetzung versammelte interessante Gäste zum Talk.
Bei Data Science handelt es sich um eine interdisziplinäre Wissenschaft. Diese befasst sich mit der Wissensgewinnung aus Daten. Die aus großen Datenmengen generierten Informationen sind Firmen dienlich, um unternehmerische Entscheidungen qualitativ zu verbessern und die Effizienz von Arbeitsabläufen zu optimieren. In einer Welt, die nur so von Daten überquillt, ist die Datenwissenschaft wichtig. Denn sie befindet sich genau im Schnittpunkt zwischen Informatik, Mathematik (Stochastik) und dem branchenspezifischen Fachwissen.
Zum Webinar
Die Moderation übernahm bei diesem interessanten Webinar Helga Pattart-Drexler, MA (Head of Executive Education | WU Executive Academy). Sie tauschte sich mit folgenden Experten aus:
- Kurt Buchleitner | Industrie 4.0 & IoT | Eurofoam GmbH
- PD Dr. Ronald Hochreiter | Principal Investigator / Artificial Intelligence & FinTech | WU Reserach
- Alin Kalam, MSc. | Strategic BI & Analytics Lead | Lufthansa Group & Scientific Coordinator | Hub Talent Garden Europe & Part-time Professor
- Martina Paul, MBA | Bereichsleitung Software Operations | IT Services der Sozialversicherung GmbH
- Klaus Puchner, MA MBA | Program Manager AI & Team Lead | xxxldigital
Das Thema: Sowohl Informatik als auch Statistik verstehen
Das Heikle in Hinblick auf den Data Science Context ist, so Roland Hochreiter, es auch noch in den entsprechenden Business-Context zu setzen. Data Science ist somit die Königsdisziplin für alle, welche die Domain wirklich gut verstanden haben.
Was benötigt ein erfolgreicher Data Scientist?
Nach der Auffassung von Martina Paul benötigt ein Data Scientist ein sehr hohes Domänen-Verständnis. Zudem sollte der Data Scientist in puncto Statistik, Engineering-Informatik sowie Linguistik und Semantik ein entsprechendes Know-how mitbringen. Bei Data Science geht es um eine bestimmte Form, durchaus auch um eine Verknüpfung zwischen Business und Engineering. Diese Verknüpfung von technischem Know-how und Business-Know-how setzt erst voraus, dass ein Data Scientist in der Lage ist zu verstehen, was er oder sie mit sehr unterschiedlichen, heterogenen Datenmengen machen kann. Die Annäherung kann über wissenschaftliche Methoden erfolgen, die statisch sein können, aber natürlich nicht nur.
Data Science: Die Definition
Gemäß dem geladenen Gast Alin Kalam ist Data Science eine angewandte, interdisziplinäre Wissenschaftsform. Hierbei geht es insbesondere darum, Wissen aus Daten zu regenerieren. Die Praxisnähe ist für diese Disziplin kennzeichnend. Alin Kalam wollte im Zuge des Webinars weniger auf die Rolle bzw. den Fähigkeiten eines Data Scientisten eingehen. Ihm ging es vielmehr darum, Data Science als ein Ökosystem darzustellen und zu begreifen. Ein Ökosystem, das mehrere Dinge in sich zu tragen hat. Es ist eine holistische Betrachtungsweise, wobei viel Wissen, Fähigkeiten und Komponenten (Data Governance/Datenqualität) ineinanderfließen müssen. Data Science in der Praxis ist sehr wohl auch personenzentrisch, aber auch in einem hohen Maße technologiegetrieben.
Wie sieht es mit der Relevanz von Data Science aus?
Die Moderatorin stellte der erlesenen Gruppe von Experten die Frage, ob denn für jedes Unternehmen Data Science relevant ist. Klaus Puchner vertritt die Meinung, dass Data Science für jedes Unternehmen, egal ob groß oder klein, entscheidend ist. Es besteht diesbezüglich ein Missverständnis, dass Data Science notgedrungen Big Data voraussetzt. Data Science ist interdisziplinär. Das heißt, es können viele Faktoren, Möglichkeiten und Methoden eine Rolle spielen, um aus Daten einen Mehrwert generieren zu können. Es gilt, sich als UnternehmerIn lediglich darauf einzulassen.
Alin Kalam ergänzte, dass Data Science vor allem auch dort von Relevanz ist, wo man es gar nicht vermuten würde. Dies gilt insbesondere für kleinere Unternehmen. Viele Jahre lang war es so, dass sich kleinere Betriebe Data Science nicht aneignen konnten, da es nur für ganz große Firmen ein Thema war.
Voraussetzungen, um Data Science Prozesse im Unternehmen einzuführen
Eine Grundvoraussetzung für Data Science, so Martina Paul, sind digitalisierte Prozesse. Verfügt ein Betrieb nicht über Daten, so gelingt es auch nicht, Daten mithilfe von Data Science zu generieren. Für Data Science ist die Digitalisierung ein ganz wichtiges Momentum. Die Firma braucht somit ein datengenerierendes Ökosystem. Ansonsten macht es auch keinen Sinn, sich mit Data Science zu beschäftigen. Es braucht in der Regel ein sehr bunt durchgemischtes Team, um sich mit Erfolg an die Daten annähern zu können.
Für Klaus Puchner ist die Bereitschaft eine wesentliche Voraussetzung, nämlich um Datenquellen, Datensilos freizugeben. Das dazugehörige Kontextwissen, dieses Domänen Know-how der Experten, in Projekten auch wirklich zugänglich zu machen, ist die Grundvoraussetzung. Herausforderungen zuzulassen, das sollte im Mindset (Denkweise) des Unternehmers vorhanden sein. Neue Ansätze für Problemstellungen sind notwendig, um sich bis zum Ziel durcharbeiten zu können.
Kurt Buchleitner ist überzeugt davon, dass Data Science nur dann funktioniert, wenn das Unternehmen die richtige Infrastruktur hat und wenn die Verantwortlichen im Betrieb die Daten unter Kontrolle haben. Diese Thematik stellt für viele Unternehmen eine große Challenge dar und das ist für Buchleitner wirklich eine Überraschung.
Worauf richtet sich der Fokus bei der Data Science Strategie?
Neben dem Mindset ist es laut dem Experten Puchner beim Starten von Data Science wichtig zu definieren und zu erarbeiten, was der Betrieb mit der strategischen Initiative will, warum und unter welchen Rahmenbedingungen etwas erreicht werden soll. Worauf genau richtet sich der Fokus der Strategie? Gerade beim Einstieg ist es essenziell, die richtigen Schritte zu setzen.
Hierbei gilt es, die Schmerzen (Pains) des Unternehmens zu verstehen bzw. im Kontext der Daten zu projizieren. Dasselbe gilt auch für das, was im Unternehmen oder in einer Organisation gut läuft. Wenn beides hinsichtlich der Daten projiziert werden kann, dann gelingt es einzusteigen und auch Akzeptanzkriterien klar zu definieren. Das ist auch die Voraussetzung, um überhaupt das Ganze in Projekte gießen zu können. Auf diese Weise wird den Data Science Projekten die Chance geboten, auch über die Laufzeit Ergebnisse zu liefern.
Ziele definieren
Kleine Unternehmen sollten Ziele definieren, was sie von Data Science erwarten. Alin Kalam sprach hierbei von drei Punkten:
1. Eine bessere Grundlage für Entscheidungsfindungen durch Data Science herbeiführen.
2. Automatisierung und Digitalisierung von Prozessen.
3. Wettbewerbsvorteil durch Data Science nutzen.
Klaus Puchner zeigte den spannenden Aspekt auf, dass man den Erfolg und den Wertbeitrag von Data Science nicht nur an dem finalen Projektergebnis messen kann. Vielmehr ist es interessant zu beobachten, wie ein Unternehmen an den Erkenntnissen während eines Data Science Projektes profitieren kann. Wird im Zuge des Projektes diese datengetriebene Sicht etabliert, dann werden die neuen Perspektiven durchaus wohlwollend angenommen und ermöglichen auch in Bezug auf das Business ein Umdenken bzw. eine völlig neue Sicht auf die Daten.
Als Data Scientist, so die Expertin Martina Paul, ist es wesentlich, den Kunden klar zu machen, was sie leisten können. Das Entscheidende ist das Erwartungsmanagement. Die Entzauberung dessen, was Data Science Experten tun. Die Idee der Kunden ist insofern falsch, dass wenn mit Daten gearbeitet wird, etwas Magisches passiert. Kalam sprach bezogen auf die Zielsetzung von Data Science, dass es wesentlich ist, die nötige Flexibilität mitzubringen und zuzulassen.
Fazit aus unserem progressiven Webinar mit den Experten Kurt Buchleitner, Dr. Ronald Hochreiter, Alin Kalam, Martina Paul und Klaus Puchner:
Data Science definiert die Extraktion von Wissen aus Daten. Der Begriff wurde erstmals vom dänischen Informatik-Pionier und Turing-Preisträger Peter Naur im Jahr 1960 verwendet. Seitdem hat sich in Hinblick auf die in Unternehmen anfallenden Datenmengen Unglaubliches getan. Dennoch fällt es zahllosen Betrieben noch immer schwer, die Daten richtig zu nutzen und daraus unmissverständliche Erkenntnisse zu ziehen. Unser Webinar hat gezeigt, wie wichtig es ist, Unternehmen über Data Science zu informieren. Denn Daten gelten heutzutage nicht ohne Grund als das „neue Gold“.