Data Science – Ein Hype oder die Zukunft?

Die Begriffe Daten und Data Science sind in aller Munde. Data Scientistin Patricia Feubli erläutert, ob es sich um einen Hype oder um die Zukunft handelt.

Autor Patricia Feubli
Datum 17.08.2017
Lesezeit 9 Minuten

Befindet sich die Welt in einer gerechtfertigten Dateneuphorie oder ist das alles einfach nur ein Hype? Eine Betrachtung in mehreren Akten.

Die beiden Begriffe Daten und Data Science sind in aller Munde. Im Rahmen der 2015 beschlossenen Data-Science-Initiative baut die ETH in Zusammenarbeit mit der EPFL Studiengänge in Datenwissenschaften und ein Data Science Center auf. Letzteres soll der wissenschaftlichen Nutzung und sicheren Handhabung von riesigen Datenmengen dienen.

datascience

Auch der Bund befasst sich zurzeit mit Daten und überarbeitet das Datenschutzgesetz, dessen Vernehmlassungsphase Anfang April 2017 abgeschlossen wurde. In den durchlöcherten Schweizer Alpen wurden alte Militärbunker längst in Datencenter umgewandelt, um grosse Datenmengen sicher zu speichern. Unter Softwareentwicklern ist so etwas wie eine Goldgräberstimmung ausgebrochen. Im Markt wimmelt es nur so von Data-Science-Tools, die den Datenhimmel auf Erden versprechen. Selbst die Harvard University kann sich dem Bann der Daten nicht entziehen: 2012 kürte die Harvard Business Review den Beruf Data Scientist zum «sexiest Job of the 21st century» , was zwar nicht unbestritten ist, in vielen Augen aber auch noch heute Gültigkeit hat.

Befindet sich die Welt in einer gerechtfertigten Dateneuphorie oder ist das alles einfach nur ein Hype?
Eine Betrachtung in mehreren Akten.

Daten werden immer zahlreicher

Es ist sehr wohl gerechtfertigt, sich vertieft mit dem Thema Daten und Datenanalyse auseinanderzusetzen. Denn heutzutage stehen den Unternehmen immer mehr Daten immer günstiger zur Verfügung. Dafür gibt es mehrere Gründe: Das gesellschaftliche und geschäftliche Leben verlagert sich zunehmend in die digitale Welt und hinterlässt Datenspuren. Geräte sammeln immer mehr Daten und sind stärker miteinander vernetzt. Zudem wird die Verarbeitung und Speicherung von sehr grossen Datenmengen mit dem technologischen Fortschritt immer günstiger.

Daten enthalten erfolgsrelevante Informationen

Daten und deren Analyse sind aber nicht einfach Beschäftigungstherapie für Zahlenbegeisterte. Daten enthalten viele wertvolle Informationen, deren Nutzung für den Unternehmenserfolg essentiell ist. Denn mit der zunehmenden Digitalisierung geht einher, dass sich auch die Kunden-, Lieferanten- und Mitbewerberbeziehungen immer stärker ins Internet verlagern. Dadurch ersetzen Daten vielerorts den direkten Kontakt. Für einen Onlinehändler ist es zum Beispiel schwierig, die Bedürfnisse seiner Kunden in persönlichen Gesprächen zu ermitteln. Hier müssen die Pflege der Kundenbeziehung und das bedürfnisgerechte Marketing gezwungenermassen stark auf Daten gestützt werden.

Data Science gräbt die Informationen aus

Aber wie so vieles im Leben geben Daten ihre Informationen nicht so einfach preis. In der Regel sind Daten eine Ansammlung von Zahlen, Buchstaben oder Pixeln, die auf den ersten Blick nur selten Sinn ergibt. Meistens muss man spezifische Analysewerkzeuge anwenden, um an die Informationen heranzukommen. Genau das ist die Aufgabe von Data Science: die Kombination von Mathematik, Statistik, Informationstechnologie, Visualisierungstechnik und Business-Know-how, um aus den Daten Informationen zu gewinnen.

Beschreiben, entdecken und untersuchen

Die Werkzeuge von Data Science sind sehr vielseitig und lassen sich grob in sechs Teilgebiete aufteilen: Es gibt deskriptive, explorative, inferentielle, prädiktive, kausale und mechanistische Werkzeuge.

  • Bei deskriptiven Tätigkeiten geht es darum, ein Gefühl für die Daten zu bekommen, sie zu beschreiben, ihre Charaktereigenschaften zu untersuchen und ihre Entwicklung über die Zeit zu beobachten. Dazu zählen im Prinzip auch Reporting bzw. die Erstellung und Aktualisierung von Dashboards. Diese Tätigkeiten sind essentiell, denn nur wer seine Daten kennt, kann sie auch richtig analysieren.
  • Explorative Tätigkeiten dienen dazu, Strukturen, Muster und Beziehungen in den Daten zu erkennen. Ein gutes Beispiel ist das Clustering. Beim Clustering nimmt man sämtliche Kunden und teilt sie anhand ihrer Eigenschaften – zum Beispiel soziodemografische Merkmale – in Gruppen ein. So ermittelt man seine wichtigsten Zielgruppen. Dieses Clustering erfolgt in der Regel mit Hilfe von Algorithmen, die die Kundendaten scannen und eine Einteilung vornehmen.
  • Bei inferentiellen Tätigkeiten untersucht man das Verhalten und Zusammenspiel von Daten mit Hilfe von Modellen. Man kann zum Beispiel untersuchen, wie das Einkaufsverhalten der Kundschaft mit dem Wetter, dem Angebot und der Wirtschaftslage zusammenhängt.
  • Prädiktive Tätigkeiten prognostizieren die zukünftige Entwicklung von Kennzahlen. Dies ist eine Paradedisziplin von Data Science. Denn schliesslich möchte jedes Unternehmen wissen, was seine Kundschaft in Zukunft will. Aber gleichzeitig ist das Prognostizieren auch die schwierigste Disziplin. Denn bekanntermassen ist die Zukunft mit grosser Unsicherheit behaftet. Deshalb kann das Prognostizieren schon mal zum Kaffeesatzlesen mutieren. Dank der Weiterentwicklung der Computertechnologie wurden in diesem Gebiet in den letzten Jahren jedoch beträchtliche Fortschritte erzielt. Die neuen Technologien ermöglichen zum Beispiel die Verwendung von machine learning. Dabei erkennt ein System Muster und Strukturen in den Daten und überträgt das Gelernte auf zukünftige Daten. So können inzwischen relativ akkurate Prognosen erstellt werden.
  • Insbesondere im Unternehmensalltag etwas weniger verbreitet sind kausale und mechanistische Tätigkeiten. Im kausalen Fachgebiet untersucht man die Ursache für eine bestimmte Veränderung.
  • Im mechanistischen Fachgebiet untersucht man den Veränderungsprozess an sich. Diese Tätigkeiten kommen vor allem in Naturwissenschaften wie Physik oder Chemie zum Tragen. Kommen Menschen ins Spiel, wird die Untersuchung von Ursachen und Veränderungsprozessen jedoch sehr komplex und teilweise kostspielig. Deshalb spielen solche Tätigkeiten im Unternehmensalltag eine eher untergeordnete Rolle.

Garbage in – garbage out

Diese sechs Anwendungsgebiete zeigen, wie vielseitig und unterschiedlich Data Science angewendet werden kann. Jedoch haben die verschiedenen Data-Science-Werkzeuge eine wichtige Gemeinsamkeit: Sie alle können nur zum Einsatz kommen, wenn die Daten in der richtigen Form und der richtigen Qualität vorhanden sind. Schlechte Daten führen zu unbrauchbaren Analyseresultaten, wie die Redewendung «Garbage in, garbage out» so schön illustriert. Bevor also in die Datenanalyse investiert werden kann, muss ein ordentliches Datenmanagement aufgebaut werden. Es wird eine Infrastruktur benötigt, um die Daten in der richtigen Form am richtigen Ort in der richtigen Qualität zu speichern und zu aktualisieren.

Vom Facility Management zur Strategieentwicklung

Neben den vielen verschiedenen Anwendungsgebieten kann Data Science auch sehr unterschiedliche Datenformen verarbeiten: Webdaten, Offlinedaten, Kundendaten, Zuliefererdaten, Mitarbeiterdaten, Patientendaten, Daten zu internen Prozessen, Maschinendaten, Zahlen, Texte, Bilder, Videos … Die Liste ist lang. Data Science kann also viele verschiedene Fragen in vielen verschiedenen Unternehmensbereichen beantworten. Sei dies nun in der optimalen Standortwahl, im Facility Management, in der gezielten Suche nach Fachkräften, im Marketing, in der Buchhaltung, in der Marktanalyse oder der Bestimmung der mittelfristigen Unternehmensstrategie. Deshalb eignet sich Data Science auch für praktisch jedermann. Voraussetzung für ein erfolgreiches Data-Science-Projekt sind einzig Daten, deren ordentliches Management und Spezialisten, die über das entsprechende Fachwissen, Programmierfähigkeiten und Business-Know-how verfügen.

Daten sind eher Krankenkasse als Heil

Die voranschreitende Digitalisierung, die stetig wachsende Datenmenge sowie die vielseitigen Analysemöglichkeiten und Anwendungsgebiete zeigen, dass die Euphorie um das Thema Data Science ihre Berechtigung hat. Daten und Datenanalysen sind bereits heute enorm wichtig und werden in Zukunft noch an Bedeutung gewinnen. Dennoch ist auch hier eine gesunde Portion Realismus empfohlen. Daten widerspiegeln nur immer einen Teil eines Menschen oder einer Situation. Sie als ultimative Lösung aller Probleme und als absolutes Heil zu sehen, ist deshalb nicht angebracht. Daten und deren Analyse sind viel eher wie eine Krankenkasse: obligatorisch und in Krankheitsfällen hilfreich, zuweilen jedoch mit unvollständiger Abdeckung.


Nächster Kurs mit Patricia Feubli

Data Science 1×1 für Digital Marketing («DADMK») am 2. März 2018 bei Digicomp Zürich.
Ein Seminar für Digital-Marketer, das Data Science auch im Kleinen greifbar macht. Jetzt anmelden!


Über den Autor

Patricia Feubli

Patricia Feubli, Dr. oec., ist Data Scientist bei SEMSEA Suchmaschinenmarketing AG. Davor war sie bei der Credit Suisse als Senior Economist tätig, arbeitete an verschiedenen Universitäten und bei der Schweizerischen Nationalbank. Durch diese Tätigkeiten verfügt sie über neun Jahre umfangreiche Erfahrung in Research und Data Science und kennt die Tücken der Datenanalyse im Unternehmensalltag. Als neustes Element der Dienstleistungen hat SEMSEA das Thema «Data Science» ausgebaut und Patricia als Data-Science-Spezialistin eingestellt. Wenn die Grundlagen der Datenanalyse korrekt gelegt sind, lassen sich die optimalen Kampagnen kreieren.