Capítulo 16. Construir un coche autónomo en menos de una hora: Aprendizaje por refuerzo con AWS DeepRacer
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Si sigues las noticias sobre tecnología, probablemente hayas visto un resurgimiento de los debates sobre cuándo los ordenadores van a dominar el mundo. Aunque es un ejercicio de reflexión divertido, ¿qué ha provocado el resurgimiento de estos debates? Gran parte del mérito puede atribuirse a las noticias de ordenadores que vencen a humanos en tareas de toma de decisiones: ganando en ajedrez, logrando altas puntuaciones en videojuegos como Atari (2013), venciendo a humanos en una compleja partida de Go (2016) y, por último, venciendo a equipos humanos en Defence of the Ancients (Dota) 2 en 2017. Lo más asombroso de estos éxitos es que los "robots" aprendieron los juegos jugando unos contra otros y reforzando las estrategias que descubrieron que les traían el éxito.
Si pensamos más ampliamente en este concepto, no es diferente de cómo los humanos enseñan a sus mascotas. Para adiestrar a un perro, todo buen comportamiento se refuerza recompensando al perro con una golosina y muchos abrazos, y todo comportamiento no deseado se desalienta afirmando "perrito malo". Este concepto de de reforzar los buenos comportamientos y desalentar los malos constituye esencialmente el quid del aprendizaje por refuerzo.
Los juegos de ...
Get Aprendizaje Profundo Práctico para Nube, Móvil y Edge now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.