Capítulo 16. Construir un coche autónomo en menos de una hora: Aprendizaje por refuerzo con AWS DeepRacer

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Contribución del autor invitado: Sunil Mallya

Si sigues las noticias sobre tecnología, probablemente hayas visto un resurgimiento de los debates sobre cuándo los ordenadores van a dominar el mundo. Aunque es un ejercicio de reflexión divertido, ¿qué ha provocado el resurgimiento de estos debates? Gran parte del mérito puede atribuirse a las noticias de ordenadores que vencen a humanos en tareas de toma de decisiones: ganando en ajedrez, logrando altas puntuaciones en videojuegos como Atari (2013), venciendo a humanos en una compleja partida de Go (2016) y, por último, venciendo a equipos humanos en Defence of the Ancients (Dota) 2 en 2017. Lo más asombroso de estos éxitos es que los "robots" aprendieron los juegos jugando unos contra otros y reforzando las estrategias que descubrieron que les traían el éxito.

Si pensamos más ampliamente en este concepto, no es diferente de cómo los humanos enseñan a sus mascotas. Para adiestrar a un perro, todo buen comportamiento se refuerza recompensando al perro con una golosina y muchos abrazos, y todo comportamiento no deseado se desalienta afirmando "perrito malo". Este concepto de de reforzar los buenos comportamientos y desalentar los malos constituye esencialmente el quid del aprendizaje por refuerzo.

Los juegos de ...

Get Aprendizaje Profundo Práctico para Nube, Móvil y Edge now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.

Start your free trial

Aprendizaje Profundo Práctico para Nube, Móvil y Edge by Anirudh Koul, Siddha Ganju, Meher Kasam

Capítulo 16. Construir un coche autónomo en menos de una hora: Aprendizaje por refuerzo con AWS DeepRacer

Don’t leave empty-handed

It’s yours, free.

Check it out now on O’Reilly