22.07.2018, 26°C
  • 11.01.2018
  • von Benjamin Aunkofer

Weiterbildung: Doktor Data

von Benjamin Aunkofer

Sexiest Man Alive. Johnny Depp erhielt diesen Titel gleich zwei Mal. In dem Film „Transcendence“ spielt er einen Wissenschaftler, der sich mit Daten beschäftigt. Der Beruf „Data Scientist“ gilt übrigens als „Sexiest Job of the 21st Century“. Foto: Michael Nelson/picture alliance / dpa

Freie Stellen für „Data Scientists“ gelten als schwer zu besetzen. Headhunter wissen oft nicht, wen genau sie suchen sollen. Ein Ratgeber.

Welcher ITler kennt das nicht: Ein Recruiter ruft an, spricht von einer tollen neuen Herausforderung für einen IT-Experten – einen Status, den man offensichtlich auf seinem LinkedIn-Profil für sich beansprucht – doch bei der Besprechung der Vakanz stellt sich schnell heraus, dass man über fast keine der geforderten Skills verfügt.

Eine Erfahrung, die heute insbesondere viele Experten für Big Data und Data Science beinahe täglich machen, denn der Wirtschaftstrend zur Nutzung von Daten für die Geschäftsoptimierung boomt wie nie zuvor. In diesem Kontext entstehen gerade viele neue Stellen vom klassischen Datenbank-Administrator über den ETL-Entwickler bis hin zum Data Scientist – und damit eine neue Goldgrube für Recruiter. Der Job des Data Scientist gilt nicht nur laut Harvard Business Review als „Sexiest Job of the 21st Century“, sondern in diesen Zeiten auch als einer, der nur schwer zu besetzen ist. Doch stimmt das?

Sicher ist: Recruiting-Prozesse können schnell beide Seiten ermüden, wenn Kandidaten in Erwägung gezogen werden, die sich erst in weiteren Gesprächen als ungeeignet herausstellen. Der häufige Mismatch liegt vor allem daran, dass unter dem Job des Data Scientist alle möglichen Tätigkeitsprofile, Methoden- und Tool-Wissen zusammengefasst werden, die einen Experten für „irgendwas mit Daten“ so ausmachen könnten, ein einzelner Mensch jedoch kaum in seinem Leben lernen kann, zumindest nicht ohne dann wieder als „in seinem Wissen zu veraltet“ zu gelten.

Ferner sind die potenziellen Mitarbeiter, die sich in Themen wie Big Data oder Data Science technisch eingefunden haben, tendenziell echte Multitalente, deren Intelligenz und Neugier laufend aktiviert werden will. Viele dieser Damen und Herren bezeichnen sich selbst gerne als Hacker (im positiven Sinne) oder als Nerds. Es sind in jedem Fall Autodidakten, die entsprechende Freiräume und Herausforderungen einfordern – oder sich bald nach etwas Neuem umsehen werden.

Werden Personalberater mit der Kandidaten-Suche beauftragt, treffen vielfach zwei Welten aufeinander, die sich nicht wirklich verstehen können. Nur die wenigsten Personalberater werden ihrer Rolle als Berater gerecht, folglich korrigieren sie Suchprofile ihrer Auftraggeber nicht oder haben schlimmstenfalls selbst keine Vorstellung von dem, was zum Beispiel ein Data Scientist eigentlich so (nicht) macht. Um nur einen der gröberen Schnitzer als Beispiel zu nennen, passen viele offene Jobs, die unter der Bezeichnung Data Science besetzt werden sollen, viel eher zum Berufsbild des Data Engineer.

Der Beruf Data Scientist ist gerade erst in der deutschsprachigen Industrie angekommen, schon kommen wieder neue Jobbezeichnungen auf uns zu – oder ältere leben wieder auf. Schnell kommt die Frage auf, ob neue Jobbezeichnungen denn wirklich notwendig seien. Die Antwort darauf lautet allerdings ganz klar: Ja!

WAS EIN DATA SCIENTIST MACHT

Ein Data Scientist verwendet seine Arbeitszeit möglichst dazu, die ihm verfügbar gemachten Daten explorativ und gezielt zu analysieren, die Analyseergebnisse zu visualisieren und in einen roten Faden einzuspannen. Gute Data Scientists beherrschen nicht nur Daten, sondern können auch Storytelling. Anders als etwa ein Datenbank-Administrator oder ein Data Engineer, bekommt ein Data Scientist ein Rechenzentrum nur selten zu Gesicht, denn er zapft Daten über Schnittstellen an, die ihm vom Data Engineer bereitgestellt werden. Ein Data Scientist befasst sich in seinem Fach mit mathematischen Modellen, arbeitet vornehmlich mit statistischen Verfahren und wendet sie auf die Daten an, um Wissen zu generieren. Gängige Methoden des Data Mining und des überwachten maschinellen Lernens sollten einem Data Scientist bekannt sein, wobei natürlich jeder ganz individuelle Schwerpunkte setzt. Data Scientists arbeiten grundsätzlich nahe am Fachbereich und benötigen entsprechendes Fachbereichswissen. Sie arbeiten mit proprietären Tools (zum Beispiel von IBM, SAS oder Microsoft) und programmieren Analysen auch direkt in Programmiersprachen wie Scala, Java, Python, Julia oder R. Data Scientists können vielfältige akademische Hintergründe haben, einige sind Informatiker oder Ingenieure für Elektrotechnik, andere sind Physiker oder Mathematiker, nicht wenige aber auch Wirtschaftswissenschaftler mit Statistikexpertise. Typische Hierarchie-Level sind: 4. Chief Data Scientist; 3. Senior Data Scientist; 2. Data Scientist; 1. Data Analyst oder Junior Data Scientist.

Der Unterschied zwischen einem Data Scientist und einem Data Analyst sorgt immer wieder für Fragezeichen. Die Bezeichnung Data Scientist steht für die neuen Herausforderungen des klassischen Data Analysten, auch aus heterogenen unstrukturierten Datenbeständen einen Wert zu generieren und komplexere Zusammenhänge zu erkennen. Ein Data Analyst betreibt Datenanalysen wie ein Data Scientist, komplexere Themen wie Machine Learning sind aber eher etwas für den Data Scientist.

WAS EIN BUSINESS ANALYST MACHT

Business Analysten können (müssen aber nicht) auch Data Analysten sein. In jedem Fall haben sie einen sehr starken Bezug zum Fachbereich beziehungsweise zum Kerngeschäft des Unternehmens. Im Business Analytics geht es um die Analyse von Geschäftsmodellen und Geschäftserfolgen. Gerade die Analyse von Geschäftserfolgen geschieht in der Regel IT-gestützt und da setzen viele Business Analysten an. Dashboards, KPIs und SQL sind das Handwerkszeug eines guten Business Analysten.

WAS EIN DATA ENGINEER MACHT

Auch wenn es viele Überschneidungspunkte mit dem Data Scientist geben mag, so lässt sich der Data Engineer dadurch abgrenzen, dass er qualitativ hochwertige Daten für Analysen verfügbar macht. Im Data Engineering geht es vor allem darum, Daten zu sammeln beziehungsweise zu generieren, zu speichern, historisieren, aufzubereiten, anzureichern und nachfolgenden Instanzen zur Verfügung zu stellen. Ein Data Engineer, je nach Rang oft auch als Big Data Engineer oder Big Data Architect bezeichnet, modelliert skalierbare Datenbank- und Datenfluss-Architekturen, entwickelt und verbessert die IT-Infrastruktur hardware- und softwareseitig, befasst sich dabei auch mit Themen wie IT-Security, Datensicherheit und Datenschutz. Ein Data Engineer ist je nach Bedarf teilweise Administrator der IT-Systeme und auch ein Software Entwickler, denn er erweitert die Software-Landschaft bei Bedarf um eigene Komponenten. Neben den Aufgaben im Bereich Data Warehousing, führt er auch Analysen durch, zum Beispiel solche, um die Datenqualität oder Nutzerzugriffe zu untersuchen. Möchte ein Data Engineer von einem Datenbank-Administrator abgegrenzt werden, dann dadurch, dass sich der Data Engineer vor allem für die Informationsflüsse zuständig sieht. Etwas vereinfacht dargestellt, geht es im Data Engineering im Kern um ETL, ein weit verbreitetes Akronym, das für Extract / Transform / Load steht und den Prozess der passenden Überführung von Daten von einem Ort zum nächsten Ort meint, wobei daraus schnell anspruchsvolle ETL-Ketten entstehen können. Der Schwierigkeitsgrad steigt mit zunehmender Heterogenität der Datenquellen und anwachsenden Datenmengen bis hin zum Big Data vom Terabyte zum Petabyte-Bereich.

Ein Data Engineer ist in der Regel ein Ingenieur oder Informatiker und tendenziell etwas weiter vom eigentlichen Kerngeschäft des Unternehmens entfernt. Die Karrierestufen des Data Engineers können folgender Reihenfolge entsprechen:

4. (Big) Data Architect

3. Senior Data Engineer

2. Data Engineer

1. ETL-Developer

WIE ES MIT DEM RECRUITING KLAPPT

Sollte die Personalbeschaffung operativ einer Personalberatung überlassen werden, gehört dazu der Nachweis über eine gewisse Kompetenz des Recruiters über dieses Personalsegment. Als Tipp: Eine einfache Frage darüber, worin sich Data Scientists und Data Engineers in ihrem Aufgabenspektrum unterscheiden, offenbart bereits, ob eine Affinität zum Recruiting von Daten-Fachkräften vorliegt.

Sollten Sie sich hingegen nicht (nur) auf Personalberatungen verlassen wollen, können Sie heutzutage auch mit wenig Kosteneinsatz selbst zum Recruiter werden. Zumindest in Großstädten wie Berlin, Hamburg, München oder auch Dresden gibt es regelmäßige MeetUps, das sind kleine Fachtreffen zu bestimmten Themen, die Interessenten und Experten für Data Science zusammenbringen. Auf Social Media Plattformen wie Facebook, Xing oder MeetUp.com finden sich viele solcher Treffen, die auch sehr gerne von Jobsuchenden und Wechselwilligen gezielt aufgesucht werden. Dabei ist die persönliche Anwesenheit oftmals gar nicht notwendig, wenn auch trotzdem empfehlenswert, denn bereits ein Inserat auf der Event-Seite hat eine große Chance auf Aufmerksamkeit. Dabei dürfen Sie sich gerne um etwas Kreativität bei der Formulierung der Suche bemühen.

Denken Sie sich bei der Suche nach Daten-Experten in jene hinein und vergessen Sie nicht: Die besonders guten Data Engineers und Data Scientists sind Nerds, und diese sprechen auf möglichst nerdige Anfragen am besten an.

Der Autor unterrichtet Bachelor- und Master-Studenten in Data Science und Business Analytics an der Hochschule für Technik & Wirtschaft Berlin. Außerdem ist er Gründer von DATANOMIQ, einem Beratungs- und Dienstleistungsunternehmen für angewandte Datenwissenschaften.

Social Media

Umfrage

Die Einengung der Zeppelinstraße in Potsdam hat im Zuge der Dieseldebatte bundesweit Interesse geweckt. Ist die Maßnahme nötig, um ein Dieselfahrverbot in Potsdam zu verhindern? Stimmen Sie ab!