Capítulo 8. Detección de palabras despiertas: Entrenamiento de un modelo

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En el Capítulo 7, construimos una aplicación en torno a un modelo entrenado para reconocer "sí" y "no". En este capítulo, entrenaremos un nuevo modelo que pueda reconocer palabras diferentes.

El código de nuestra aplicación es bastante general. Todo lo que hace es capturar y procesar audio, introducirlo en un modelo TensorFlow Lite y hacer algo basándose en el resultado. En general, no le importa qué palabras busca el modelo. Esto significa que si entrenamos un nuevo modelo, podemos introducirlo en nuestra aplicación y debería funcionar de inmediato.

Estos son los aspectos que debemos tener en cuenta al formar a un nuevo modelo:

Entrada

El nuevo modelo debe entrenarse con datos de entrada que tengan la misma forma y formato, con el mismo preprocesamiento que el código de nuestra aplicación.

Salida

La salida del nuevo modelo debe tener el mismo formato: un tensor de probabilidades, una para cada clase.

Datos de entrenamiento

Sean cuales sean las nuevas palabras que elijamos, necesitaremos muchas grabaciones de personas diciéndolas para poder entrenar nuestro nuevo modelo.

Optimización

El modelo debe optimizarse para que funcione eficazmente en un microcontrolador con memoria limitada.

Afortunadamente para nosotros, nuestro modelo existente se entrenó utilizando un script disponible ...

Get TinyML now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.