Kapitel 8. Wake-Word-Erkennung: Ein Modell trainieren

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

In Kapitel 7 haben wir eine Anwendung mit einem Modell entwickelt, das "Ja" und "Nein" erkennt. In diesem Kapitel werden wir ein neues Modell trainieren, das verschiedene Wörter erkennen kann.

Unser Anwendungscode ist recht allgemein gehalten. Alles, was er tut, ist, Audiodaten zu erfassen und zu verarbeiten, sie in ein TensorFlow Lite Modell einzuspeisen und anhand der Ausgabe etwas zu tun. Dabei ist es meist egal, nach welchen Wörtern das Modell sucht. Das heißt, wenn wir ein neues Modell trainieren, können wir es einfach in unsere Anwendung einfügen und es sollte sofort funktionieren.

Hier sind die Dinge, die wir bei der Ausbildung eines neuen Modells beachten müssen:

Eingabe

Das neue Modell muss auf Eingabedaten trainiert werden, die die gleiche Form und das gleiche Format haben und die gleiche Vorverarbeitung wie unser Anwendungscode aufweisen.

Ausgabe

Die Ausgabe des neuen Modells muss dasselbe Format haben: ein Tensor von Wahrscheinlichkeiten, eine für jede Klasse.

Trainingsdaten

Egal, welche neuen Wörter wir auswählen, wir brauchen viele Aufnahmen von Menschen, die sie sagen, damit wir unser neues Modell trainieren können.

Optimierung

Das Modell muss so optimiert werden, dass es auf einem Mikrocontroller mit begrenztem Speicher effizient läuft.

Glücklicherweise wurde unser bestehendes ...

Get TinyML now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.