Kapitel 1. Rollen des maschinellen Lernens und der Interviewprozess

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Im ersten Teil dieses Kapitels gehe ich auf die Struktur dieses Buches ein. Dann gehe ich auf die verschiedenen Berufsbezeichnungen und Funktionen ein, die ML-Fähigkeiten in der Industrie nutzen.1 Außerdem kläre ich die Zuständigkeiten der verschiedenen Berufsbezeichnungen wie Data Scientist, Machine Learning Engineer usw., da dies bei Arbeitssuchenden häufig für Verwirrung sorgt. Diese werden mit einer ML-Fähigkeitsmatrix und einem ML-Lebenszyklus veranschaulicht, auf die im gesamten Buch Bezug genommen wird.

Der zweite Teil dieses Kapitels geht den Prozess des Vorstellungsgesprächs von Anfang bis Ende durch. Ich habe Kandidaten betreut, die diesen Überblick zu schätzen wussten, da sich Online-Ressourcen oft auf bestimmte Teile des Vorstellungsgesprächs konzentrieren, aber nicht darauf, wie sie alle zusammenhängen und zu einem Angebot führen. Besonders für neue Absolventen2 und Leser, die aus unterschiedlichen Branchen kommen, hilft dieses Kapitel, alle auf die gleiche Seite zu bringen und den Prozess zu verdeutlichen.

Die miteinander verbundenen Teile von Vorstellungsgesprächen sind komplex und es gibt viele verschiedene Kombinationen, je nachdem, welche ML-Rolle du anstrebst. Dieser Überblick hilft dir dabei, dich vorzubereiten, damit du weißt, worauf du deine Zeit konzentrieren musst. Einige Online-Ressourcen konzentrieren sich zum Beispiel auf Wissen, das für "Produktdatenwissenschaftler/innen" spezifisch ist, betiteln den Kurs oder Artikel aber mit "Tipps für Vorstellungsgespräche von Datenwissenschaftler/innen", ohne zu differenzieren. Für einen Neuling ist es schwer zu erkennen, ob das für deine eigenen beruflichen Interessen relevant ist. Nach diesem Kapitel wirst du in der Lage sein zu erkennen, welche Fähigkeiten für die einzelnen Berufsbezeichnungen erforderlich sind, und in Kapitel 2 wirst du in der Lage sein, diese Informationen selbst aus den Stellenausschreibungen herauszufiltern und deinen Lebenslauf so relevant wie möglich für die Berufsbezeichnung und die Stellenausschreibung zu gestalten.

Überblick über dieses Buch

In diesem Kapitel geht es darum, dass du verschiedene ML-Rollen unterscheiden kannst, und du gehst den gesamten Interviewprozess durch, wie in Abbildung 1-1 dargestellt:

  • Bewerbungen und Lebenslauf(Kapitel 2)

  • Technische Interviews

    • Maschinelles Lernen (Kapitel 3, 4 und 6)

    • Codierung/Programmierung(Kapitel 5)

  • Verhaltensbasierte Interviews(Kapitel 7)

  • Dein Fahrplan für das Vorstellungsgespräch(Kapitel 8)

  • Post-Interview und Nachbereitung(Kapitel 9)

Overview of this book’s chapters and how they tie into the ML interview process
Abbildung 1-1. Überblick über die Kapitel und ihre Einbindung in den ML-Interviewprozess.

Je nachdem, wo du dich auf deiner Reise zum ML-Interview befindest, solltest du dich auf die Kapitel und Abschnitte konzentrieren, die für dich relevant sind. Ich habe das Buch auch so konzipiert, dass du es nach und nach lesen kannst. Du könntest zum Beispiel deinen Lebenslauf mehrmals überarbeiten und dann bei Bedarf zu Kapitel 2 zurückblättern. Das Gleiche gilt für die anderen Kapitel. Mit diesem Überblick können wir nun fortfahren.

Tipp

Die begleitende Website zu diesem Buch, https://susanshu.substack.com, bietet Bonusinhalte, Hilfsmittel und mehr.

Eine kurze Geschichte der Jobtitel für maschinelles Lernen und Datenwissenschaft

Gehen wir zunächst kurz die Geschichte der Berufsbezeichnungen durch ( ). Ich habe mich entschieden, mit diesem Abschnitt zu beginnen, um mit einigen Mythen über die Berufsbezeichnung "Datenwissenschaftler/in" aufzuräumen und ein wenig Licht ins Dunkel zu bringen, warum es so viele ML-bezogene Berufsbezeichnungen gibt. Wenn du diese Geschichte verstanden hast, solltest du besser wissen, welche Berufsbezeichnungen du anstreben solltest. Wenn dich die vielen Bezeichnungen wie Machine Learning Engineer (MLE), Product Data Scientist, MLOps Engineer und andere verwirren, ist dieser Abschnitt genau das Richtige für dich.

ML-Techniken sind nicht neu; 1985 machten David Ackley, Geoffrey E. Hinton und Terrence J. Sejnowski den Algorithmus der Boltzmann-Maschine bekannt.3 Schon vorher wurden Regressionsverfahren4 bereits in den 1800er Jahren entwickelt. Seit langem gibt es Aufträge und Funktionen, die Modellierungstechniken für Vorhersagen und Prognosen nutzen. Ökonomen, Statistiker, Finanzmodellierer, Physikmodellierer und biochemische Modellierer gibt es schon seit Jahrzehnten als Berufe. Der Hauptunterschied besteht darin, dass es im Vergleich zu heute viel kleinere Datensätze gab (abgesehen von Simulationen).

Erst in den letzten Jahren, kurz vor Beginn des 21. Jahrhunderts, begann die Rechenleistung exponentiell zu steigen. Außerdem schufen die Fortschritte im verteilten und parallelen Rechnen einen Kreislauf, in dem "Big Data" immer leichter verfügbar wurde. Dies ermöglichte es den Praktikern, diese fortschrittliche Rechenleistung auf Millionen oder Milliarden von Datenpunkten anzuwenden.

Größere Datensätze wurden für die ML-Forschung gesammelt und verbreitet, wie z. B. WordNet,5 und später auch ImageNet,6 ein Projekt unter der Leitung von Fei-Fei Li. Diese kollektiven Bemühungen legten den Grundstein für noch mehr ML-Durchbrüche. AlexNet7 wurde 2012 veröffentlicht und erreichte eine hohe Genauigkeit bei der ImageNet Challenge,8 Damit wurde bewiesen, dass Deep Learning menschenähnliche Aufgaben in einem noch nie dagewesenen Umfang bewältigen kann.

Viele ML-Praktiker sehen dies als eine Zeit, in der maschinelles Lernen, Deep Learning und verwandte Themen sprunghaft an Anerkennung in der breiten Bevölkerung und nicht nur in der KI-Gemeinschaft gewonnen haben. Die jüngste Popularität der generativen KI (wie ChatGPT) in den Jahren 2022 und 2023 kam nicht aus dem Nichts, ebenso wenig wie die Deepfakes, selbstfahrenden Autos, Schachbots und vieles mehr, die vor ihr kamen; diese Anwendungen waren das Ergebnis vieler Fortschritte der letzten Jahre.

"Data Scientist" als Berufsbezeichnung begann als Oberbegriff, als die Bereiche ML und Daten noch nicht so ausgereift waren. Bei Google Trends, das die Popularität von Suchbegriffen misst, stieg der Begriff "Data Scientist" im Jahr 2012 sprunghaft an. In diesem Jahr wurde dieser Artikel in der Harvard Business Review veröffentlicht : "Data Scientist: The Sexiest Job of the 21st Century".9 Im April 2013 lag die Popularität von "Data Scientist" bereits gleichauf mit der von "Statistiker/in" und übertraf sie später um Größenordnungen, wie in Abbildung 1-2 dargestellt. Damals gab es allerdings noch keine enge Trennung zwischen Infrastrukturaufträgen und Modellschulungen. Kubernetes wurde zum Beispiel erst 2014 veröffentlicht, aber die Unternehmen haben einige Zeit gebraucht, um es für die Orchestrierung von ML-Aufträgen zu übernehmen. Deshalb gibt es jetzt spezifischere Berufsbezeichnungen für ML-Infrastruktur, die es vorher nicht gab.

Search popularity for the terms “data scientist,” “machine learning engineer,” and “statistician” on Google Trends (retrieved August 9, 2023)
Abbildung 1-2. Suchpopularität für die Begriffe "Data Scientist", "Machine Learning Engineer" und "Statistiker" auf Google Trends (abgerufen am 9. August 2023).

Mit der Zunahme von sozialen Medien, Web-Empfehlungssystemen und anderen modernen Anwendungsfällen haben Unternehmen begonnen, viel detailliertere Daten zu sammeln, wie z. B. Clickstream-Daten, also Daten, die gesammelt werden, während ein Nutzer auf einer Website oder App surft. Ein weiterer Fortschritt der letzten Zeit ist, dass ein durchschnittliches Unternehmen in der Lage ist, die schiere Menge an Telemetriedaten von Maschinen und Internet of Things (IoT)-Geräten zu speichern. Früher haben Datenwissenschaftler/innen vielleicht mit Daten gearbeitet, die wöchentlich oder täglich aktualisiert wurden. Jetzt, da viele Anwendungen häufiger oder in Echtzeit aktualisiert werden, wird mehr Infrastruktur benötigt, um ML-Funktionen in Webprodukten und Apps bereitzustellen, so dass auch in diesem Bereich mehr Aufträge entstanden sind.

Kurz gesagt: Da der Lebenszyklus des maschinellen Lernens immer komplexer wurde, wurden mehr Berufsbezeichnungen geschaffen, um die neuen Fähigkeiten zu beschreiben, die ein komplettes ML-Team nun benötigt. Auf die Berufsbezeichnungen und den ML-Lebenszyklus gehe ich später in diesem Kapitel noch genauer ein.

All dies geschah innerhalb der letzten zehn Jahre, und die Unternehmen ändern ihre Stellenbezeichnungen nicht immer, um die Spezialisierung der Aufgaben widerzuspiegeln. Trotzdem kann es dir als Bewerber/in helfen, Verwirrung und Frustration zu vermeiden, wenn du dich auf eine Stelle bewirbst und feststellst, dass sie sich von der Stelle eines anderen Unternehmens mit genau demselben Titel unterscheidet. Siehe Tabelle 1-1 für frühere Trends bei ML-bezogenen Stellenbezeichnungen und Tabelle 1-2 für aktuelle Trends bei ML-Stellenbezeichnungen.

Um dir zu erklären, warum du auf verschiedene Berufsbezeichnungen stoßen wirst, werde ich dir die einzelnen Berufsbezeichnungen und ihre Aufgaben näher erläutern.

Aufträge, die ML-Erfahrung erfordern

Hier ist eine nicht erschöpfende Liste von Berufsbezeichnungen für ML (oder eng verwandte) Aufgaben:

  • Datenwissenschaftler/in

  • Ingenieur für maschinelles Lernen

  • Angewandte Wissenschaftlerin

  • Softwareentwicklung, maschinelles Lernen

  • MLOps Ingenieur

  • Produkt-Datenwissenschaftler

  • Datenanalytiker/in

  • Entscheidungswissenschaftler

  • Dateningenieur10

  • Forschungswissenschaftler

  • Forschungsingenieur11

Wie ich in "Eine kurze Geschichte der Berufsbezeichnungen fürmaschinelles Lernen und Data Science" erläutert habe , ist jede Funktion für einen anderen Teil des ML-Lebenszyklus verantwortlich. Eine Stellenbezeichnung allein sagt nichts darüber aus, was die Stelle beinhaltet. Als Arbeitssuchender sei gewarnt: In verschiedenen Unternehmen können völlig unterschiedliche Titel am Ende ähnliche Aufgaben erfüllen! Wie in Abbildung 1-3 dargestellt, hängt deine ML-Stellenbezeichnung vom Unternehmen, dem Team und dem/den Teil(en) des ML-Lebenszyklus ab, für den du zuständig bist.

Um ein konkretes Beispiel dafür zu geben, wie die Stellenbezeichnungen von dem Unternehmen oder der Organisation abhängen können, das/die die Stelle einstellt - basierend auf realen Personen, mit denen ich gesprochen habe, Stellenbeschreibungen und Vorstellungsgesprächen - könnte die Person, die für die Schulung von ML-Modellen, aber nicht für den Aufbau der zugrundeliegenden Plattform verantwortlich ist, folgendermaßen heißen: :

  • Softwareentwickler (ML) oder Datenwissenschaftler (Google)

  • Angewandte Wissenschaftlerin (Amazon)

  • Ingenieur für maschinelles Lernen (Meta, Pinterest)

  • Datenwissenschaftler (Elastic, das Team, in dem ich arbeite)

  • Datenwissenschaftler (Unity)

What’s in a machine learning job title?
Abbildung 1-3. Was verbirgt sich hinter einer Berufsbezeichnung für maschinelles Lernen?
Hinweis

Wenn dieses Buch veröffentlicht wird, können sich die Berufsbezeichnungen in diesen Unternehmen und Teams bereits geändert haben. Trotzdem zeigt es, dass ML-Titel von Unternehmen zu Unternehmen und sogar von Team zu Team im selben Unternehmen unterschiedlich sein können.

Die Berufsbezeichnung hängt auch von der Organisation, der Abteilung und so weiter ab. Einige Abteilungen bei Google haben die Berufsbezeichnung Data Scientist12 Stellenbezeichnung, andere nicht. In den Unternehmen, in denen ich gearbeitet habe, haben Data Scientists in meinen Teams ML-Modelle trainiert, während MLEs die Infrastruktur aufgebaut haben (sie haben den ganzen Tag mit Tools wie Kubernetes, Terraform, Jenkins usw. gearbeitet). In anderen Unternehmen sind es die MLEs, die ML-Modelle trainieren.

Ein persönliches Beispiel: In meiner Berufserfahrung habe ich viel mit dem Training von ML-Modellen zu tun, deshalb bewerbe ich mich auf Aufträge, die den Titel "Machine Learning Engineer" oder "Data Scientist" tragen. In den folgenden Abschnitten werde ich weitere Beispiele für Fähigkeiten und Aufgaben nennen, die gut zu deinen Interessen und Fähigkeiten passen könnten.

Lebenszyklus des maschinellen Lernens

In der Industrie ist es eine Erwartung für angewandte ML-Projekte, die letztendlich das Kundenerlebnis verbessern - zum Beispiel ein besseres Empfehlungssystem, das dem Nutzer relevantere Videos, Nachrichten und Social Media-Posts zeigt. In der Industrie kann der Begriff "Kunde" auch für interne Kunden stehen: Menschen innerhalb desselben Unternehmens oder derselben Organisation. Dein Team erstellt zum Beispiel ML-Modelle, die die Nachfrage vorhersagen und so der Logistikabteilung deines Unternehmens helfen, ihre Versandpläne besser zu planen. Unabhängig davon, ob es sich um einen externen oder internen Nutzer handelt, sind viele Komponenten an der Erstellung eines vollwertigen ML-Produkts beteiligt. Ich werde ein vereinfachtes Beispiel durchgehen.

Erstens müssen Daten vorhanden sein, denn die meisten ML werden mit großen Datenmengen trainiert und getestet. Jemand muss dafür sorgen, dass die Rohdaten eingespeist werden, damit sie später für Datenanalyse, ML, Berichterstattung und Überwachung usw. leicht zugänglich sind. Dies wird durch Schritt A (Daten) in Abbildung 1-4 veranschaulicht.

Wenn die Daten vorhanden sind, wird jemand, der sich mit ML-Algorithmen und -Tools auskennt, die Daten nutzen, um mit der ML-Entwicklung zu beginnen. Dies wird durch Schritt B (Entwicklung von maschinellem Lernen) in Abbildung 1-4 veranschaulicht. Dazu gehören die Entwicklung von Merkmalen, das Training von Modellen und die Auswertung. Wenn die Ergebnisse nicht gut sind, gibt es in Schritt B viele Iterationen, und die Person kann ihr Feature-Engineering oder die Modellschulung verbessern oder sogar zu Schritt A zurückkehren und um die Aufnahme weiterer Daten bitten.

Wenn die Ergebnisse einigermaßen zufriedenstellend sind, geht es weiter mit Schritt C (Einsatz des maschinellen Lernens), bei dem die ML-Modelle mit den Kunden verbunden werden. Je nach Art des ML-Projekts kann es auf einer Website, einer App, einem internen Dashboard und so weiter eingesetzt werden. Natürlich möchte man sicherstellen, dass die ML-Modelle richtig funktionieren, also hat jedes gute Team eine Möglichkeit, die Ergebnisse zu überwachen. Bei ML gibt es vor allem zwei Arten von möglichen Problemen. Das erste ist, dass etwas in der Softwareschicht nicht funktioniert, z. B. ein Fehler im Code. Das zweite ist ein Problem mit den Daten oder dem ML-Modell - z. B. wenn das Modell in der Modellentwicklungsphase normale Ergebnisse liefert, aber nach der Bereitstellung/Freigabe ein Ungleichgewicht der Daten auftritt, so dass die Modellergebnisse unerwünscht werden. Von Schritt C an kann es weitere Iterationen zurück zu Schritt B geben, um die Modelle zu verbessern und in Schritt C wieder mehr Experimente durchzuführen.

Machine learning lifecycle (the graph is simplified for understanding)
Abbildung 1-4. Lebenszyklus des maschinellen Lernens (die Grafik ist zum Verständnis vereinfacht).

In dem Lebenszyklus des maschinellen Lernens, den ich gerade durchlaufen habe, sind viele Fähigkeiten gefragt. Datenpipelines, Modelltraining, kontinuierliche Integration und kontinuierliches Deployment (CI/CD): Was solltest du als Bewerber lernen, um dich auf das Vorstellungsgespräch vorzubereiten? Wie ich bereits in "Eine kurze Geschichte des maschinellen Lernens und der Data Science-Jobtitel" erwähnt habe, stellen Unternehmen heutzutage zum Glück auch Leute ein, die nur eine Teilmenge dieser Fähigkeiten besitzen. Sie brauchen zum Beispiel Leute, die auf Schritt A (Data Engineering), auf Schritt B (ML-Entwicklung), auf Schritt C (ML-Einsatz) und so weiter spezialisiert sind. Ich betone das "vielleicht", da es je nach Unternehmen oder Team unterschiedlich ist; ich werde einige Szenarien durchgehen.

Startups

Startup-Funktionen tragen in der Regel mehr Hüte, d.h. sie müssen die Aufträge in mehreren Schritten im Lebenszyklus des maschinellen Lernens ausführen, wie in Abbildung 1-4 dargestellt. Hier ist ein Beispiel:

Wir waren ein Team von 5-25 ML-Ingenieuren und mussten regelmäßig an der Einrichtung von Aufträgen zur Datenbeschriftung, an QA-Tests und Leistungsverbesserungen (auf mobilen Geräten) sowie an der Einrichtung von Demos mitwirken.

Dominic Monn, CEO von MentorCruise (zuvor sechs Jahre in ML-Startups)

Normalerweise haben Startup-Unternehmen das Ziel, ein13 Da sie aber weniger Kunden haben, ist ihnen der Umfang und die Stabilität (in der Anfangsphase) vielleicht weniger wichtig. Daher ist es wahrscheinlicher, dass die Person, die ML-Modelle entwickelt und trainiert, dieselbe Person ist, die die Daten analysiert und den Stakeholdern präsentiert, oder sogar dieselbe Person, die die Infrastruktur der Plattform aufbaut. Ein ML-Team in einem Startup könnte einfach weniger Mitarbeiter haben. Ein Startup könnte z. B. insgesamt 30 Softwareentwickler/innen und Datenexpert/innen haben, während größere Unternehmen ein Team von 30 Datenanalyst/innen haben, um die Arbeitslast zu verteilen.

Größere ML-Teams

Wenn das Unternehmen und/oder das Team genug gewachsen ist, ist es wahrscheinlicher, dass sich die ML-Rollen spezialisiert haben. Im Allgemeinen gilt: Je größer das Team, desto spezialisierter die Rolle. Wenn der "Ingenieur für maschinelles Lernen" in einem größeren Unternehmen Modelle trainiert, dann trägt er wahrscheinlich nicht zwei oder drei Hüte auf einmal, wie es in einem Startup der Fall sein könnte. Stattdessen stellt das große Unternehmen mehr Leute ein, um diese Aufgaben zu erfüllen. Das heißt nicht, dass die Arbeit in einem größeren Unternehmen einfacher ist. Tatsächlich gibt es oft mehr Daten, einen größeren Umfang und mehr Nachteile, wenn die ML-Funktionalität ausfällt, so dass die Zeit eines MLEs mit nur einem Hut völlig ausgelastet sein kann.

Hinweis

Je größer ein Unternehmen ist, desto größer sind oft auch die ML-Teams, aber das kommt darauf an. Ein großes Unternehmen in einer traditionell nicht-technischen Branche könnte zum Beispiel seine ersten ML-Teammitglieder in einer eher startup-ähnlichen Umgebung arbeiten lassen, während sie herausfinden, wie ML am besten für das Unternehmen funktioniert.

Gehen wir eine Ebene tiefer und fügen wir weitere Details zu ML- oder Datenverantwortlichkeiten hinzu. In Abbildung 1-5 wird der Lebenszyklus des maschinellen Lernens aus Abbildung 1-4 erweitert, um Teams oder Unternehmen mit detaillierteren Aufgaben darzustellen. (Es lohnt sich zu wiederholen, dass diese Liste zwar eine nützliche und weit verbreitete Heuristik ist, aber zu Illustrationszwecken etwas vereinfacht ist, da es immer Ausnahmen und Ausreißer geben wird).

Machine learning lifecycle with more fine-grained roles (extended version of Figure 1-4)
Abbildung 1-5. Lebenszyklus des maschinellen Lernens mit feiner abgestuften Rollen (erweiterte Version von Abbildung 1-4).

In Abbildung 1-5 siehst du ein Beispiel dafür, wofür deine Rolle innerhalb dieser detaillierteren Rollen zuständig sein könnte:

  • Du baust die Datenpipelines für Analytik und ML auf (Schritt A).

  • Du trainierst ML-Modelle (Schritt B).

  • Du baust die Infrastruktur für den Einsatz von ML-Modellen auf (Schritt C.1).

  • Du entwickelst und führst Hypothesentests, oft A/B-Tests, für neue ML-Produktfunktionen durch (Schritt C.2).

  • Du führst Datenanalysen durch, erstellst Berichte und Dashboards und präsentierst sie den Stakeholdern (Schritt D).

Tipp

AufAbbildung 1-5 wird in späteren Kapiteln oft Bezug genommen, also speichere sie oder setze ein Lesezeichen!

Die drei Säulen der Rollen des maschinellen Lernens

Zur Einstimmung auf den Rest des Buches gehe ich auf die drei Säulen der ML- und Data-Science-Rollen ein, wie ich sie nenne:

  • Algorithmen für maschinelles Lernen und Datenintuition

  • Programmierkenntnisse und Kenntnisse in der Softwareentwicklung

  • Ausführungs- und Kommunikationsfähigkeiten

Dies sind die großen Kategorien von Fähigkeiten, nach denen du in ML-Vorstellungsgesprächen beurteilt wirst. Dieses Buch konzentriert sich darauf, dir zu helfen, diese Fähigkeiten zu verstehen und eventuelle Lücken zwischen deinen derzeitigen Erfahrungen und Fähigkeiten und den Fähigkeiten unter diesen drei Säulen zu schließen (siehe Abbildung 1-6). Auf alle diese Fähigkeiten wird in den folgenden Kapiteln näher eingegangen .

Three pillars of machine learning jobs
Abbildung 1-6. Drei Säulen von Aufträgen zum maschinellen Lernen.

Algorithmen des maschinellen Lernens und Datenintuition: Die Fähigkeit, sich anzupassen

Du bist in der Lage, die zugrundeliegende Funktionsweise von ML-Algorithmen und der Statistiktheorie und ihre jeweiligen Kompromisse zu verstehen - was unerlässlich ist, wenn du in einem realen ML-Projekt bei der Arbeit mit einer offenen Frage konfrontiert wirst. Du befolgst nicht nur Schritte wie bei einer Schulaufgabe.

Datenintuition bedeutet, dass du, wenn du mit einem neuen Problem konfrontiert wirst, weißt, wie du es mit Daten lösen kannst; und wenn du auf neue Daten oder Datenquellen stößt, weißt du, wie du sie auswerten kannst. Du fragst dich: Sind diese Daten für ML geeignet? Für welche Arten von ML-Modellen könnten sie geeignet sein? Gibt es irgendwelche Probleme mit den Daten, bevor du sie für ML verwenden kannst? Du weißt, was du fragen musst und wie du die Antworten findest.

Im ML-Vorstellungsgespräch zielen verschiedene Arten von Interviews und Interviewfragen darauf ab, die Kenntnisse und die Bereitschaft eines Bewerbers in diesem Bereich zu beurteilen, die ich in den Kapiteln 3 und 4 behandeln werde.

Programmierung und Softwareentwicklung: Die Fähigkeit zu bauen

Während du an einem Projekt arbeitest, hast du die Programmierkenntnisse, die für die Umsetzung erforderlich sind, wie z.B. die Bearbeitung von Daten mit Python oder die Verwendung eines internen Bereitstellungsprozesses, damit ein anderes Team die Ergebnisse des ML-Modells nutzen kann.

Selbst wenn du die Theorie gut kennst, kannst du ohne den Sinn für Programmierung oder Softwareentwicklung14 kannst du ML nicht aus dem Ärmel schütteln. Du musst Code verwenden, um die Daten mit ML-Algorithmen zu verbinden, die ebenfalls mit Code implementiert werden - du musst also die Theorie in die Praxis umsetzen.

Weitere gefragte Programmierfähigkeiten für ML-Rollen sind die Fähigkeit des (Software-)Ingenieurs, vom Prototyp zur Produktion überzugehen, d.h. die ML zu integrieren und zu veröffentlichen. Einige Stellen sind für die gesamte ML verantwortlich: von der Erforschung und dem Training der Modelle bis hin zum Einsatz und der Produktion. Einige ML-Rollen, wie z. B. MLOps-Ingenieure, sind für den Aufbau einer Software-Infrastruktur verantwortlich, die große Datenmengen verarbeiten kann, um ML-Antworten innerhalb von Sekunden oder sogar Millisekunden an die Nutzer zu senden.

Im ML-Vorstellungsgespräch werden die Fähigkeiten eines Bewerbers in diesem Bereich durch verschiedene Arten von Vorstellungsgesprächen und Fragen bewertet, die ich in den Kapiteln 5 und6 erläutern werde.

Ausführung und Kommunikation: Die Fähigkeit, Dinge im Team zu erledigen

Du kannst mit Menschen zusammenarbeiten die nicht die gleiche Funktion haben wie du. Bei ML arbeiten wir mit Softwareentwicklern, Dateningenieuren, Produktmanagern und vielen anderen Kollegen zusammen. Die Fähigkeit, Dinge im Team zu erledigen, umfasst einige Soft Skills wie Kommunikation und einige Projektmanagementfähigkeiten.

Wenn du zum Beispiel nicht in der Lage bist, mit Teammitgliedern zu kommunizieren, ist das ein echtes Hindernis15 für Projekte und könnte dazu führen, dass deine ML-Projekte auf der Strecke bleiben oder sogar zurückgestuft werden. Auch wenn du nur mit einer Person zusammenarbeitest (z. B. deinem Chef), musst du in der Lage sein, über deine Projekte zu berichten, was Kommunikationsfähigkeiten erfordert. Daher ist im Bereich ML die Fähigkeit, technische Konzepte mit nicht-technischen Interessengruppen zu kommunizieren, eine sehr gefragte Fähigkeit.

Du brauchst auch einige Projektmanagement-Fähigkeiten, um deine Aufgaben im Griff zu behalten. Wir alle lernen in der Ausbildung oder beim Selbststudium, wie wir unsere Aufgabenlisten und Kalender verwalten, aber es ist noch chaotischer, weil dein Projektkalender jetzt von den Kalendern und Prioritäten anderer abhängt. Auch wenn du einen Projekt- und/oder Produktmanager hast, der das Team auf Kurs hält, musst du dich bis zu einem gewissen Grad selbst managen.

Ohne Soft Skills geht es nicht, Punktum. Sei nicht der Bewerber, der sich nur auf die technischen Fähigkeiten konzentriert, aber den Aufbau und die Demonstration seiner Soft Skills im Vorstellungsgespräch vernachlässigt. In Kapitel 7 werde ich näher darauf eingehen, wie ML-Interviews die Bewerber/innen in Bezug auf diese Säule bewerten.

Clearing-Mindestanforderungen in den drei ML-Säulen

Der Ausbau deiner Fähigkeiten in allen drei ML-Säulen ist eine große Aufgabe, und für Einstiegspositionen wird normalerweise nur ein Minimum (z.B. 3/10) für jede Säule erwartet, wie in Abbildung 1-7 dargestellt. Einem Bewerber, der schon etwas Erfahrung mit dem Programmieren hat, kann man zum Beispiel beibringen, sich zu verbessern, auch wenn er noch keine Erfahrung hat. Idealerweise bist du bei mindestens einer Säule (z. B. 5/10 für Programmieren), die am meisten mit der jeweiligen ML-Rolle zu tun hat, stärker, um dich von anderen Bewerbern abzuheben.

Minimum required skill levels for ML jobs (example)
Abbildung 1-7. Mindestanforderungen an die Qualifikation für ML-Aufträge (Beispiel).

Für höhere Positionen sind die bloßen Mindestanforderungen höher, aber es gilt eine ähnliche Faustregel: Erfülle die Mindestanforderungen an deine Fähigkeiten. Von da an wirst du mit anderen Bewerbern anhand der Fähigkeiten verglichen, die du - je nach Stelle - besonders gut beherrschst. Datenwissenschaftler/innen, die nur ML-Modelle trainieren, diese aber nicht einsetzen, müssen ihre Programmierkenntnisse vielleicht nicht so sehr ausbauen wie ihre ML-Theorie und ihre Kommunikationsfähigkeiten.

Für Einsteiger/innen würde ich sagen, dass die Kommunikation eine geringere Anforderung darstellt (aber bitte nicht 0/10!), denn erst die hart erarbeitete Erfahrung in der Zusammenarbeit mit einer größeren Gruppe von Menschen, einschließlich nicht-technischer Teammitglieder, lässt sie höher werden. Das verschafft einigen Bewerbern auch in dieser Säule einen Vorteil: Bewerber mit einem nicht traditionellen Hintergrund, wie z.B. Autodidakten oder Quereinsteiger aus der Softwareentwicklung oder einem anderen Bereich, können sich durch die Fähigkeit, eine Geschichte geschickt zu erzählen und ein Portfolio zu präsentieren, von anderen Bewerbern abheben.

Nachdem du nun einen Überblick über die drei Säulen bekommen hast, kannst du dieses mentale Modell nutzen, um dich von anderen abzuheben.

Matrix für maschinelle Lernfähigkeiten

Herzlichen Glückwunsch! Du hast es bis zum Ende eines ziemlich dichten Kapitels geschafft! Jetzt, wo du den Überblick über den Lebenszyklus des maschinellen Lernens und die drei Säulen der ML-Fähigkeiten kennengelernt hast, ist es an der Zeit, deine Interessen und Fähigkeiten den Berufsbezeichnungen zuzuordnen.

Tabelle 1-3 gibt dir eine ungefähre Vorstellung davon, welche Fähigkeiten du erlernen musst, um in bestimmten Rollen erfolgreich zu sein. Auf einer Skala von einem bis drei Sternen steht ein Stern für eine weniger wichtige Fähigkeit und drei Sterne für eine sehr wichtige Fähigkeit.

Tabelle 1-3. Matrix für maschinelles Lernen und Datenkompetenz


Fertigkeiten
Job-Titel
Daten
wissenschaftler (DS)
ML-Ingenieur
(MLE)
MLOps
Ingenieur
Daten
Ingenieur
Daten
analyst
Datenvisualisierung, Kommunikation ★★★ ★★ ★★★
Datenexploration, Bereinigung, Intuition ★★★ ★★★ ★★★ ★★★
ML-Theorie, Statistik ★★★ ★★★ ★★
Programmierwerkzeuge (Python, SQL) ★★★ ★★★ ★★★ ★★★
Software-Infrastruktur (Docker, Kubernetes, CI/CD) ★ bis ★★★ ★★★
Tipp

AufTabelle 1-3 wird in späteren Kapiteln oft Bezug genommen, also speichere sie oder setze ein Lesezeichen!

Wenn du dir diese Fähigkeiten ansiehst, kannst du sie grob den drei Säulen der ML-Fähigkeiten aus dem vorherigen Abschnitt zuordnen, wie in Tabelle 1-4 dargestellt.

Tabelle 1-4. Fähigkeiten im Bereich maschinelles Lernen und Daten, die den drei Säulen der ML-Aufträge zugeordnet sind
Säule ML- und Datenkenntnisse
Säule 1 Algorithmen für maschinelles Lernen und Datenintuition: Fähigkeit zur Anpassung Datenexploration, Bereinigung, Intuition
Theorie des maschinellen Lernens, Statistik
Datenvisualisierung
Säule 2 Programmier- und Softwareentwicklungskenntnisse: Fähigkeit zur Erstellung von Programmierwerkzeuge (Python, SQL)
Software-Infrastruktur
Säule 3 Ausführungs- und Kommunikationsfähigkeiten: Fähigkeit, Dinge im Team zu erledigen Kommunikation und so weiter

Es ist in Ordnung, wenn du dir noch nicht ganz sicher bist, was die einzelnen Fertigkeiten bedeuten könnten. In Kapitel 2 werden wir diese Matrix noch einmal durchgehen und es wird Details und eine Checkliste zur Selbsteinschätzung geben.

Lasst uns das alles miteinander verknüpfen. Wir haben uns den Lebenszyklus des maschinellen Lernens(Abbildung 1-5) und die Kompetenzmatrix für maschinelles Lernen(Tabelle 1-3) angesehen. Jetzt müssen wir nur noch herausfinden, auf welche Aufträge du dich am besten bewerben oder welche Fähigkeiten du erwerben kannst! Dazu müssen wir alles mit dem aktuellen Trend der ML- und Daten-Jobtitel(Tabelle 1-2) in Verbindung bringen. Dies wird in Abbildung 1-8 dargestellt.

Common ML job titles and how they correspond to the machine learning lifecycle
Abbildung 1-8. Übliche ML-Auftragsbezeichnungen und ihre Entsprechung im ML-Lebenszyklus.

Die alphabetischen Anmerkungen in Abbildung 1-8 können mit denen in Abbildung 1-5 übereinstimmen, die hier der Einfachheit halber aufgelistet sind:

  • (A) Daten

  • (B) Entwicklung des maschinellen Lernens

  • (C.1) ML/Software-Infrastruktur

  • (C.2) ML-Hypothesenprüfung/Überwachung

  • (D) Berichte und Dashboards

Tipp

AufAbbildung 1-8 wird in späteren Kapiteln oft Bezug genommen, also speichere sie oder setze ein Lesezeichen!

Wenn du eine Stellenbezeichnung siehst und dir die Details der Stellenausschreibung ansiehst, kannst du sie den Aufgaben zuordnen, für die diese Stelle im Alltag wahrscheinlich zuständig ist. Je nachdem, für welchen Teil des ML-Lebenszyklus du dich interessierst, kannst du deine Bewerbungen besser vorbereiten und gezielt einsetzen, damit du nicht aus Versehen den falschen Baum erwischst.

Einführung in ML Vorstellungsgespräche

Nachdem ich dir nun viele Berufsbezeichnungen vorgestellt habe, die für dich interessant sein könnten, ist es an der Zeit, alle Schritte und Arten von Vorstellungsgesprächen durchzugehen, denen du während des Prozesses begegnen wirst! Dieses Buch heißt zwar Machine Learning Interviews, aber Vorstellungsgespräche sind viel mehr als nur Fragen. Es gibt Bewerbungen und deinen Lebenslauf, mit denen du überhaupt erst ein Vorstellungsgespräch bekommst. Wenn du deine Chancen nicht erhöhst, mehr Vorstellungsgespräche zu bekommen, wirst du nicht einmal die Chance bekommen, Vorstellungsfragen zu beantworten! Ich werde den Prozess von Anfang bis Ende behandeln, einschließlich der Nachbereitung des Vorstellungsgesprächs(Kapitel 9).

Machine Learning Job-Interview Prozess

Kommen wir nun zum gesamten Prozess des Vorstellungsgesprächs. Zuerst bewirbst du dich auf Aufträge, dann auf Vorstellungsgespräche und nach einigen Runden erhältst du schließlich Angebote. Dieser Prozess ist in Abbildung 1-9 dargestellt.

Tipp

AufAbbildung 1-9 wird in späteren Kapiteln oft Bezug genommen, also speichere sie oder setze ein Lesezeichen!

ML interview process
Abbildung 1-9. ML-Interview-Prozess.

Bewirb dich auf Aufträge über Websites oder Jobbörsen

Stellen wir uns vor, du bist ein Berufsanfänger und bewirbst dich auf eine ML-Stelle in einem Unternehmen mit einem etablierten HR17 und Einstellungsprozess. Du kannst deine Bewerbung auf verschiedene Arten beginnen: durch eine Kaltbewerbung über die Unternehmenswebsite oder die Stellenbörse (siehe Kapitel 2) oder durch eine Empfehlung von jemandem aus dem Team oder dem Unternehmen. Vorstellungsgespräche kannst du auch durch Kaltakquise auf LinkedIn oder durch E-Mails an Personalverantwortliche erreichen. Bei Unternehmen, die über ein HR-Tracking-System verfügen, musst du in der Regel, auch wenn du von jemandem empfohlen wirst, eine Standardbewerbung in das Online-Portal hochladen, was bedeutet, dass du einen aktualisierten Lebenslauf erstellen und deine Daten eingeben musst.

Hinweis

Du kannst deine Stellensuche auch durch die Zusammenarbeit mit einem externen Personalvermittler ergänzen, der sich von einem internen Personalvermittler unterscheidet, der speziell für das einstellende Unternehmen arbeitet. Dritte Personalvermittler arbeiten oft mit mehreren Unternehmen gleichzeitig zusammen. Berufskollegen, die ich kenne, empfehlen, nur mit bestimmten vertrauenswürdigen externen Personalvermittlern zusammenzuarbeiten, warnen aber auch vor solchen, die zu viele unrealistische Versprechungen machen oder nicht seriös sind. In diesem Forbes-Artikel kannst du mehr über externe Personalvermittler lesen.

Lebenslauf-Screening von Website- oder Job-Board-Bewerbungen

Bei der ersten Methode - der Kaltbewerbung über Unternehmenswebseiten oder Jobbörsen von Drittanbietern - hast du Jobbörsen wie Indeed18 und gehst direkt auf die Karriereseiten der Unternehmen, für die du gerne arbeiten möchtest. In diesem Szenario hast du niemanden, der dich an das Team oder das Unternehmen verwiesen hat (darauf gehe ich im Abschnitt "Bewerben über eine Empfehlung" ein). Du hast einige ML-bezogene Aufträge gesehen, die dir interessant erscheinen, und du hast die Links angeklickt, um dich zu bewerben. Nachdem du deine Bewerbung abgeschickt hast und das Unternehmen deine Daten und deinen Lebenslauf erhalten hat, wird ein Mitarbeiter der Personalabteilung, ein Recruiter oder derjenige, der für die Prüfung der Lebensläufe zuständig ist, den nächsten Schritt unternehmen.

Die Realität ist, dass es für Aufträge viele Bewerber gibt, und du solltest davon ausgehen, dass die erste Gruppe von Bewerbern gefiltert wird, bevor der einstellende Manager sie sieht. Der einstellende Manager ist der Vorgesetzte, mit dem du zusammenarbeiten und dem du unterstellt sein wirst, wenn du ins Team kommst. Du kannst also in der Regel davon ausgehen, dass ein Personalverantwortlicher oder ein interner oder externer Recruiter deinen Lebenslauf zuerst liest. Diese Personalvermittler kennen sich vielleicht ein wenig mit den Aufgaben aus, für die sie die Bewerbungen prüfen, aber sie sind immer noch überwiegend Generalisten und nicht so spezialisiert wie die Ingenieure und ML-Profis, mit denen du tatsächlich zusammenarbeiten wirst. Dieser Teil des Auswahlverfahrens führt zu mehreren versteckten Kriterien für deinen Lebenslauf, weshalb es verwirrend sein kann, wenn dein Lebenslauf diesen Schritt nicht besteht, selbst wenn du einen relevanten Hintergrund hast.

Es ist wichtig, sich daran zu erinnern, dass diese Generalisten deinen Lebenslauf wahrscheinlich an den Personalverantwortlichen weitergeben werden, wenn sie:

  • Siehe Schlüsseltechnologien oder -erfahrungen in deinem Lebenslauf auf der Grundlage der Stellenausschreibung

  • Jahrelange Erfahrung in Schlüsseltechnologien oder -erfahrungen oder, im Falle von Einstiegsjobs oder New-Grad-Jobs, ausreichende Belege dafür, dass du leicht ausgebildet werden kannst

  • Verstehe, dass deine Fähigkeiten und Leistungen relevant sind, in einfacher Sprache

Um festzustellen, ob dein Lebenslauf die Kriterien erfüllt, wird der Personalverantwortliche wahrscheinlich nach Stichworten suchen und deinen Lebenslauf mit der Stellenausschreibung vergleichen. Er wird die Fähigkeiten in deinem Lebenslauf nicht automatisch für dich "übersetzen". Wenn in der Stellenbeschreibung z. B. "Python" und in deinem Lebenslauf "C++" steht, wird der Personalverantwortliche wahrscheinlich nicht berücksichtigen, dass du Python schnell lernen könntest, wenn du dich anstrengen würdest, da beide Programmiersprachen objektorientiert sind.

Wenn du in der Lage bist, deine Erfahrungen so zu beschreiben, dass Personalverantwortliche verstehen, dass sie für die Stellenausschreibung relevant sind, erhöhst du deine Chancen beim Lebenslauf-Screening. Es liegt in der Natur der Sache, dass Personalverantwortliche und Recruiter übergeordnete Technologien kennen und wissen, was in den von ihnen gesuchten Positionen gefragt ist, aber nicht die Details, . Deshalb ist es wichtig, dass dein Lebenslauf gut optimiert ist. (Mehr darüber, wie du deinen Lebenslauf optimierst, erfährst du in Kapitel 2).

Bewerbung über eine Empfehlung

Nachdem ich dir nun Kaltbewerbungen direkt über Jobbörsen oder Websites ohne Empfehlung vorgestellt habe, zeige ich dir nun einige Beispiele, wie du mit Empfehlungen den Prozess beschleunigen kannst.

Angenommen, du interessierst dich für einen ML-Job bei der ARI Corporation.19 Du kennst einen Absolventen deiner Universität, der im ML-Team arbeitet. Du triffst dich mit ihm und bekundest dein Interesse an dem Job. Während des Gesprächs zeigst du dem Ehemaligen einige deiner persönlichen ML-Projekte, die für die ML-Stelle, an der du interessiert bist, relevant sind. Der Ehemalige erklärt sich bereit, dich zu vermitteln und gibt dir Anweisungen, wie du vermittelt werden kannst, was davon abhängt, wie das HR-System des Unternehmens aufgebaut ist.

Da dieser Ehemalige dich kennt und bereit ist, für deine Fähigkeiten zu bürgen, nachdem er deine persönlichen Projekte gesehen hat, landet dein Lebenslauf ganz oben auf dem Stapel. Je nachdem, wie gut die Empfehlung ist, kannst du das Bewerbungsgespräch ganz überspringen und bekommst garantiert einen Rückruf von einem Personalverantwortlichen oder du umgehst den Personalverantwortlichen direkt und kommst in die weiteren Gesprächsrunden. Dies ist in Abbildung 1-11 dargestellt. Beachte, dass ich hier von einer "hohen" Garantie spreche, da es immer noch von verschiedenen Faktoren wie dem Timing abhängt. Ein Beispiel: Vielleicht wurdest du empfohlen, aber die Stelle wurde zufällig gerade neu ausgeschrieben. So bist du nicht zum Rest des Vorstellungsgesprächs gekommen.

In Kapitel 2 werde ich mehr über Empfehlungen und wie du sie über berufliche Netzwerke bekommst, erzählen.

The interview process can be shortcut with a strong referral
Abbildung 1-11. Der Bewerbungsprozess kann mit einer guten Empfehlung abgekürzt werden.

Checkliste für das Vorstellungsgespräch

Du wurdest zu einem Vorstellungsgespräch eingeladen! Wie kannst du dein Bestes geben? Vielleicht ist die Zeit begrenzt; was tust du, um sicherzustellen, dass du dein Ergebnis maximieren kannst?

Überprüfe deine Notizen und Fragen, die du verwechselt hast

Meine persönliche Taktik ist es, zunächst die Arten von Fragen einzugrenzen, die gestellt werden könnten. In der ersten Runde eines Vorstellungsgesprächs bei Amazon zum Beispiel hat der Personalverantwortliche das Format vorgegeben und es wird sich auf Fragen zur statistischen Theorie konzentrieren. Ich werde Online-Ressourcen lesen, meine Notizen überfliegen und sehen, bei welchen Themen ich am schwächsten bin. Ich werde mich weniger auf die Fragen konzentrieren, von denen ich weiß, dass ich sie sicher beantworten kann, sondern mehr auf die, die wahrscheinlich gestellt werden, die ich aber nicht gut kenne. Wie ich "schätze", was wahrscheinlich gefragt werden wird, basiert hauptsächlich auf Gesprächen mit dem Personalverantwortlichen und meinen Folgefragen an den Personalverantwortlichen oder den Einstellungsleiter. Ich bin nicht besonders gut im Raten, und das ist so ähnlich, wie wenn ich versuche zu erraten, was in einer Universitätsprüfung gefragt wird - es kann gut funktionieren oder nach hinten losgehen!

So oder so gibt es den Kompromiss, entweder eine Teilmenge der Fragen gut zu kennen oder alle Fragen ungefähr zu kennen, aber nicht so gut (Tiefe vs. Breite). Wenn ich mir meine Vorbereitungsnotizen ansehe, entscheide ich mich für die Breite, aber je nachdem, wie gut du den Stoff bereits kennst, können deine Ergebnisse variieren.

Zeitplanungsprogramm für das Vorstellungsgespräch

Je nachdem, wo du dich befindest und wo sich deine Gesprächspartner befinden, kann es zu Zeitzonenunterschieden kommen. Ich versuche, die Zeit zu finden, zu der ich die meiste Energie habe. Manchmal sind die verfügbaren Zeitfenster für ein Vorstellungsgespräch nicht ideal, also wähle ich das kleinere Übel (z. B. ein Vorstellungsgespräch von GMT+8 aus zu führen und mit jemandem in GMT-4 zu sprechen, während ich im Ausland unterwegs bin).

Tipp

Um die Zeitzonen für Bewerber/innen, die zu einem Vorstellungsgespräch eingeladen werden, leicht herauszufinden, verfügen Personalplanungsprogramme in der Regel über eine Kalenderfunktion, in die du deine bevorzugten Zeiten eingeben kannst und die dann deine lokalen Zeitzonen berücksichtigt. Manchmal wird die Zeit aber auch per E-Mail festgelegt, und dabei können Tools wie Calendly oder Cal.com helfen.

Sowohl als Interviewer als auch als Interviewter hüte ich mich davor, gleich zu Beginn eines Arbeitstages zu planen. So habe ich nach dem Aufwachen mehr Zeit, mich vorzubereiten. Aber wenn keine anderen Zeitfenster verfügbar sind, wähle ich natürlich die frühe Zeit.

Technische Vorbereitung auf das Vorstellungsgespräch

Als Interviewer habe ich schon unzählige Vorstellungsgespräche erlebt, die wegen Verbindungsproblemen oder der Verwendung einer neuen Webkonferenzsoftware verspätet begannen - zum Beispiel, weil sie Zoom nicht rechtzeitig einrichten konnten, weil sie es noch nie benutzt hatten. Als Bewerberin bin ich auch schon über Microsoft Teams gestolpert und habe Zeit verschwendet, weil ich auf meinen Computern nur Zoom und Google Meet hatte. Am Ende habe ich die Browser-Version benutzt, aber es gab ein Problem mit meinem Login, da mein Microsoft Studentenkonto abgelaufen war. Ein paar Minuten später hatten wir das Problem gelöst. Das hätte vermieden werden können, wenn ich versucht hätte, mich etwas früher oder am Tag vor dem Gespräch anzumelden.

Hier sind einige Tipps, damit dein Vorstellungsgespräch reibungsloser verläuft:

Versuche dein Bestes, um in einer ruhigen Umgebung zu sein.
Manche Software, wie z. B. Zoom, verfügt über eine ziemlich gute integrierte Geräuschunterdrückung, ebenso wie einige kabellose Kopfhörer.
Überprüfe dein Audio- und Videomaterial im Voraus.
Was das Video angeht, achte darauf, dass die Beleuchtung gut und dein Kameraobjektiv sauber ist. Was den Ton angeht, musst du sicherstellen, dass dein Mikrofon klar klingt. Auf Windows und Mac gibt es integrierte Kamera- und Sprachaufnahme-Apps, die ich verwende. Du kannst auch eine neue Zoom-, Google Meet- oder Teams-Sitzung starten und einen Test durchführen.
Führe eine gedankliche Liste mit Backup-Optionen.
Ist das Internet bei dir zu Hause vor dem Vorstellungsgespräch plötzlich ausgefallen? Gibt es in der Nähe ein Café mit (möglichst sicherem) Internet, das du aufsuchen kannst? Kannst du die Daten deines Telefons nutzen? Gibt es auf der Kalendereinladung Einwahlmöglichkeiten per Telefon? Diese Dinge im Voraus zu wissen, kann dir sehr helfen. Ich musste mich schon einmal in ein Vorstellungsgespräch einwählen, und zum Glück wusste ich, dass ich die Möglichkeit dazu hatte.

Recruiter Screening

Herzlichen Glückwunsch, dein Lebenslauf hat es durch das Lebenslauf-Screening geschafft! Gehen wir jetzt ein Beispiel durch, um zu zeigen, was als Nächstes passieren könnte.

Stellen wir uns vor, dass es 200 Bewerber für die Stelle gab. Der Personalverantwortliche ist sie durchgegangen und hat 170 aussortiert, die entweder keine relevante Erfahrung hatten oder aus irgendeinem Grund nicht zu der Stelle zu passen schienen. Es ist möglich, dass ein besserer Lebenslauf mit der gleichen Stellenbezeichnung und dem gleichen Recruiting-Team bestanden hätte. Wenn du eine gute Empfehlung bekommen hättest, wäre dein Lebenslauf vielleicht schon weitergekommen. Wenn nun 30 Bewerber/innen übrig sind, ruft der/die Personalverantwortliche jede/n von ihnen an; das ist normalerweise ein kürzeres Gespräch, das 15 bis 30 Minuten dauert. Wir bezeichnen dies als "Recruiter-Screening" oder "Recruiter-Call".

Im Allgemeinen möchte der Personalverantwortliche sehen, wie du als Person bist und ob es einfach ist, mit dir zu arbeiten. Wenn jemand unverhohlen behauptet, Erfahrungen zu haben, die er nicht hat, könnte das Gespräch auf gefälschte Arbeits- oder Schulerfahrungen hindeuten. Es gibt noch andere logistische Aspekte, die man überprüfen sollte, wie zum Beispiel den Standort, die Gehaltsvorstellungen und den rechtlichen Status.

Tipp

Das Screening durch den Personalverantwortlichen ist eher ein "Geruchstest" als eine gründliche Prüfung deiner fachlichen Fähigkeiten und Erfahrungen.

Mein Tipp für den Erfolg ist es, auf eine Sache zu optimieren: dass der Personalverantwortliche versteht, dass du ein guter Kandidat bist, dass deine Erfahrung relevant ist (oder dass du schnell lernen kannst) und dass du gut in das Team und die Rolle passt, für die sie dich einstellen. Das ist etwas anderes, als wenn du einen Personalverantwortlichen oder ein Vorstellungsgesprächsgremium aus erfahrenen MLEs von denselben Dingen überzeugst. Stattdessen wirst du hier erfolgreich sein, wenn du dich zusätzlich bemühst, deinen Lebenslauf mit der Stellenbeschreibung in diesem Aufruf zu verbinden.

Hier ist ein Beispiel für einige Aufzählungspunkte in einer Stellenbeschreibung:

  • "Der Kandidat hat Erfahrung mit Empfehlungssystemen."

  • "Erfahrung mit Datenverarbeitung wie Spark, Snowflake oder Hadoop.

  • "Der Bewerber hat Erfahrung mit Python."

Ein schlechtes Beispiel dafür, wie du deine Erfahrung im Bewerbungsgespräch für diese Stelle erklärst, ist: "Für dieses letzte Projekt habe ich den ALS-Algorithmus verwendet, der mit PySpark implementiert wurde."

Ein besseres Beispiel für die Erklärung deiner Erfahrung in der Stellenausschreibung ist: "Für das letzte Projekt habe ich den ALS-Algorithmus (Alternating Least Squares) verwendet, einen Algorithmus für Empfehlungssysteme, der auf der Matrixfaktorisierung basiert, und ich habe PySpark verwendet, also Spark mit einer Python-API." Beachte, dass die kursiv gedruckten Sätze auch in der Stellenbeschreibung vorkommen.

Anhand des besseren Beispiels kann der Personalverantwortliche mehr von deinen Fähigkeiten mit der Stellenbeschreibung abgleichen, während das schlechte Beispiel nicht so offensichtlich mit den angegebenen Fähigkeiten übereinstimmt. Wenn du deinen Lebenslauf schreibst, hast du nur begrenzten Platz; das Gespräch in Echtzeit während eines Vorstellungsgesprächs ist eine Chance für dich, Lücken zu füllen, die der Personalverantwortliche vielleicht nicht bemerkt hat.

Es ist auch wichtig, Akronyme zu erläutern. Das gilt auch für Interviews, die mit Fachleuten geführt werden. Ich bin relativ spezialisiert auf Empfehlungssysteme und Reinforcement Learning, aber ich arbeite in meiner täglichen Arbeit nicht mit Computer Vision Aufgaben. Ich habe es geschätzt, wenn ein Bewerber, mit dem ich ein Vorstellungsgespräch geführt habe, über Computer-Vision-Projekte sprach und allgemein die eher nischenorientierten Techniken erklärte. Du kannst (und solltest) dies auf eine Art und Weise tun, die nicht herablassend auf deinen Gesprächspartner wirkt, egal ob er ein Personalverantwortlicher oder Teil deines zukünftigen Teams ist.

Das Gespräch mit dem Personalverantwortlichen ist eine gute Gelegenheit für dich als Bewerber, die Stelle zu beurteilen. Du kannst Fragen stellen, die dir wichtig sind, um herauszufinden, ob du das Gespräch fortsetzen solltest. Ich könnte zum Beispiel nach der Größe des Teams fragen und danach, ob der Schwerpunkt der Stelle eher auf ML- oder Datenanalystenaufgaben liegt. Du kannst auch einige Fragen über das Unternehmen und seine Produkte vorbereiten. Ist das aktuelle Projekt des Teams zum Beispiel darauf ausgerichtet, die Klickrate oder das langfristige Engagement zu verbessern? Wenn du ein Nutzer des Produkts bist, hast du vielleicht eine Menge Ideen und Fragen, die du besprechen kannst. Das ist auch eine Chance, deinen Enthusiasmus und dein Wissen über das Unternehmen zu zeigen.

Überblick über die Hauptinterviewschleife

Auf zum nächsten Schritt. Gute Nachrichten: Der Recruiter hat dich zugelassen! Du hast deine bisherigen Erfahrungen gut erklärt, und der Personalverantwortliche konnte sich ein Bild von deiner bisherigen Arbeit machen und wie sie mit der vorliegenden Stellenbeschreibung zusammenhängt.

Aber es ist noch nicht vorbei. Du gehörst zu den 15 anderen Bewerbern, die das erste Screening des Recruiters bestanden haben. Der Personalverantwortliche informiert dich über die anstehenden technischen Vorstellungsgespräche, die ML-Theorie, Programmierung und ein Fallstudiengespräch beinhalten. Außerdem gibt es immer wieder verhaltensorientierte Interviews. Wenn du diese bestehst, kommst du zum Vorstellungsgespräch vor Ort, das oft die letzte Runde ist. Heutzutage gibt es auch virtuelle Vorstellungsgespräche/Endrunden. Wenn du die letzte Runde bestehst, bekommst du ein Angebot.

Technische Interviews

Schauen wir uns die verschiedenen Arten von Vorstellungsgesprächen an, die nach dem Screening durch den Personalverantwortlichen stattfinden, und zwar zunächst die technischen Gespräche. Technische Vorstellungsgespräche werden in der Regel mit technischen Mitarbeitern geführt, z. B. mit einem MLE oder einem Datenwissenschaftler.

Es kann sein, dass es mehrere Runden technischer Vorstellungsgespräche gibt; es könnte eine Runde geben, die sich auf das Programmieren von Daten konzentriert, oder eine, in der der Interviewer fiktive Beispieldaten präsentiert und dich bittet, SQL oder Python pandas/NumPy zu verwenden (manchmal gibt es mehrere Fragen und du verwendest während des gesamten Gesprächs verschiedene Programmierwerkzeuge). Auf diese Art von Interviewstruktur und Interviewfragen gehe ich in Kapitel 5 näher ein.

Abgesehen von ML- und datenorientierten Programmierinterviews können dir auch Brainteaser-Fragen gestellt werden. Für diese Art von Vorstellungsgesprächen kannst du eine Vorstellungsgesprächsplattform wie CoderPad oder HackerRank nutzen, wo dir der Interviewer eine Frage stellt und du in der integrierten Online-Entwicklungsumgebung (IDE) programmierst, die sowohl du als auch dein Interviewer in Echtzeit sehen können. Manchmal gibt es auch andere Formate, wie z. B. technische Deep Dives, Systemdesign, Take-Home-Übungen in einem privaten Repo oder Google Colab und so weiter. Wie du dich auf diese Arten von Gesprächen vorbereitest, erfährst du in den Kapiteln 5 und 6.

Diese nachfolgenden Gesprächsrunden können die Zahl der Bewerber vor der letzten Runde weiter reduzieren. In unserem Beispiel haben fünfzehn Bewerber die Prüfung durch den Personalverantwortlichen bestanden und acht haben die erste Runde der technischen Interviews bestanden. Nach der zweiten Runde der technischen Vorstellungsgespräche bleiben drei Bewerber übrig, die zum Vorstellungsgespräch vor Ort eingeladen werden.

Verhaltensbasierte Interviews

Während des Vorstellungsgesprächs werden immer wieder Fragen gestellt, mit denen beurteilt werden soll, wie du in bestimmten Situationen reagierst. Oft geht es darum, anhand früherer Erfahrungen die zukünftige Leistung vorherzusagen und zu verstehen, wie du auf Stresssituationen oder schwierige Situationen reagierst. Außerdem werden mit diesen Fragen deine Soft Skills, wie z. B. deine Kommunikations- und Teamfähigkeit, bewertet. Bereite ein paar Erlebnisse aus der Vergangenheit vor und erzähle sie in einer Art Storytelling.

Während deines ersten Gesprächs mit dem Personalverantwortlichen könnte er dich zum Beispiel fragen, wann du bei einem Projekt mit einem schwierigen Zeitplan zu kämpfen hattest. Sobald du geantwortet hast, bist du noch nicht über den Berg. Während des Vorstellungsgesprächs wird oft eine Stunde für verhaltensbezogene Fragen verwendet. Und in manchen technischen Vorstellungsgesprächen werden dir vielleicht ein paar Fragen gestellt, die eine Mischung aus rein technischen Fragen und Fragen zum Verhalten sind. Ich helfe dir in Kapitel 7, in dem du auch Tipps zur unternehmensspezifischen Vorbereitung findest, wie z.B. Amazons Führungsprinzipien.

Die Finalrunde vor Ort

Bei vielen Unternehmen gibt es eine "Vor-Ort"-Abschlussrunde oder das virtuelle Äquivalent. Dabei handelt es sich in der Regel um aufeinander aufbauende Gespräche. Morgens triffst du dich zum Beispiel mit einem technischen Leiter für ein Fallstudieninterview und dann mit einem Senior Data Scientist für ein Programmierinterview. Nach der Mittagspause triffst du dich vielleicht mit zwei Datenwissenschaftlern, die dir Fragen zur ML-Theorie stellen, und dann stellt der Personalverantwortliche mehr verhaltensbezogene Fragen und erkundigt sich nach deinen bisherigen Erfahrungen. Zusätzlich zu den technischen Interviewern kannst du auch mit einem Stakeholder sprechen (z. B. einem Produktmanager in einem benachbarten Team, mit dem das Team, für das du dich bewirbst, eng zusammenarbeitet). Bei mehreren Vorstellungsgesprächen in der Endrunde, die ich erlebt habe, war ein Produktmanager oder jemand aus einer anderen Abteilung dabei, mit der das ML-Team eng zusammenarbeitet, z. B. aus dem Marketing oder der Werbung.

In manchen Unternehmen gibt es danach noch eine kleine Runde, z. B. ein kurzes Gespräch mit einem Skip Level (dem Vorgesetzten deines Vorgesetzten).

Zusammenfassung

In diesem Kapitel hast du etwas über die verschiedenen ML-Rollen, den ML-Lebenszyklus und die verschiedenen Verantwortlichkeiten gelernt, die dem ML-Lebenszyklus zugeordnet sind. Du hast auch gesehen, wie du dich vom Anfang des Prozesses bis zur letzten Runde der Vorstellungsgespräche durchschlägst. Es gibt viel, worauf du dich vorbereiten und was du lernen musst, aber jetzt hast du einen Überblick und hoffentlich ein paar Ideen, wie du dich gezielt vorbereiten kannst.

Nachdem in diesem Kapitel die Grundlagen gelegt wurden, gehe ich nun einen detaillierten Bewerbungsleitfaden durch, einschließlich eines Leitfadens für den Lebenslauf, mit dem du deine Chancen auf ein Vorstellungsgespräch deutlich erhöhen kannst.

1 Dieses Buch konzentriert sich auf industrielle Anwendungen von ML im Gegensatz zu Aufträgen, bei denen es in erster Linie um die Erforschung der ML-Algorithmen selbst, das Publizieren auf Konferenzen usw. geht, wofür meist ein Doktortitel erforderlich ist.

2 In manchen Regionen werden sie auch als "Freshers" bezeichnet. In diesem Buch verwende ich den Begriff "neue Absolventen" oder "neue Absolventen".

3 David H. Ackley, Geoffrey E. Hinton, und Terrence J. Sejnowski, "A Learning Algorithm for Boltzmann Machines", Cognitive Science 9 (1985): 147-169, https://oreil.ly/5bY2p.

4 Jeffrey M. Stanton, "Galton, Pearson, and the Peas: A Brief History of Linear Regression for Statistics Instructors", Journal of Statistics Education 9, no. 3 (2001), doi:10.1080/10691898.2001.11910537.

5 Die offizielle WordNet-Website bietet weitere Informationen.

6 Jia Deng, Wei Dong, Richard Socher, Li-Jia Li, Kai Li, and Li Fei-Fei, "ImageNet: A Large-Scale Hierarchical Image Database," 2009 IEEE Conference on Computer Vision and Pattern Recognition, Miami, FL, USA (2009): 248–255, doi:10.1109/cvpr.2009.5206848.

7 Alex Krizhevsky, Ilya Sutskever, und Geoffrey E. Hinton, "ImageNet Classification with Deep Convolutional Neural Networks," Advances in Neural Information Processing Systems 25 (NIPS 2012), https://oreil.ly/iFMkq.

8 Krizhevsky, Alex, Ilya Sutskever, und Geoffrey E. Hinton, "ImageNet Classification with Deep Convolutional Neural Networks," Communications of the ACM 60, no. 6 (2017): 84-90, doi:10.1145/3065386.

9 Thomas H. Davenport und DJ Patil, "Data Scientist: The Sexiest Job of the 21st Century", Harvard Business Review, 19. Oktober 2022, https://oreil.ly/fvroA.

10 ML und Data Science nutzen Daten; es ist unwahrscheinlich, dass Data Engineers selbst ML-Techniken anwenden, aber ihre Arbeit und ihre Zusammenarbeit sind ein wesentlicher Bestandteil von ML-Workflows.

11 Serena McDonnell (leitende Datenwissenschaftlerin und ehemalige Shopify-Mitarbeiterin) wies darauf hin, dass in der Hedge-Fonds-Branche die Bezeichnungen "Research Scientist" und "Research Engineer" für ML-Rollen verwendet werden.

12 Ich habe auch Stellenausschreibungen für Research Scientists bei Google gesehen, aber diese Stellen sind speziell für die Erforschung von ML, für Veröffentlichungen auf großen Konferenzen zuständig und erfordern einen Doktortitel.

13 Ship ist ein gebräuchlicher Begriff in der Softwarebranche und damit auch im ML, der sich auf die Veröffentlichung eines Softwareprodukts oder eines Code-Updates bezieht.

14 In den spezielleren Rollen, in denen du mit On-Device oder Edge ML zu tun hast, können auch einige Grundkenntnisse über Hardware von Vorteil sein.

15 Die Fachsprache für etwas, das eine andere Sache blockiert, normalerweise ein Projekt oder einen Zeitplan.

16 Wayne Duggan, "Was ist aus den FAANG-Aktien geworden? Sie wurden zu MAMAA-Aktien", Forbes, 29. September 2023, https://oreil.ly/JzMys.

17 Personalabteilung oder eine entsprechende Abteilung im Unternehmen.

18 Eine viel längere Liste und einen Überblick gebe ich in Kapitel 2.

19 Erfundener Name, aber ich wollte mal etwas anderes als ABC Corp. oder Acme Corp. verwenden.

Get Machine Learning Interviews now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.