Kapitel 12. Zauberstab: Ein Modell trainieren

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

In Kapitel 11 haben wir ein 20 KB großes vortrainiertes Modell verwendet, um die Rohdaten des Beschleunigungssensors zu interpretieren und damit zu erkennen, welche Geste ausgeführt wurde. In diesem Kapitel zeigen wir dir, wie dieses Modell trainiert wurde und wie es tatsächlich funktioniert.

Unsere Modelle zur Erkennung von Weckwörtern und Personen benötigten beide große Datenmengen zum Trainieren. Das liegt vor allem an der Komplexität der Probleme, die sie zu lösen versuchen. Es gibt eine riesige Anzahl von Möglichkeiten, wie eine Person "ja" oder "nein" sagen kann - man denke nur an die verschiedenen Akzente, Intonationen und Tonhöhen, die die Stimme einer Person einzigartig machen. Genauso kann eine Person auf einem Bild auf unendlich viele Arten erscheinen: Du kannst ihr Gesicht, ihren ganzen Körper oder nur eine Hand sehen, und sie kann in jeder möglichen Pose stehen.

Damit ein Modell eine solche Vielfalt an gültigen Eingaben genau klassifizieren kann, muss es auf einer ebenso vielfältigen Menge an Trainingsdaten trainiert werden. Das ist der Grund, warum unsere Datensätze für das Weckwort- und Personenerkennungstraining so groß waren und warum das Training so lange dauert.

Unser Problem der Gestenerkennung mit dem Zauberstab ist viel einfacher. In diesem Fall geht es nicht darum, eine Vielzahl ...

Get TinyML now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.