Los videojuegos se han convertido en un campo de prueba para las IA y Uber ha demostrado cómo su nuevo tipo de aprendizaje por refuerzo ha tenido éxito donde otros han fracasado.

Algunos de los juegos más complejos de la humanidad, como Go, no han logrado desafiar a las IA de gente como DeepMind. El aprendizaje por refuerzo entrena a los algoritmos ejecutando escenarios repetidamente con una "recompensa" otorgada por los éxitos, a menudo un aumento en la puntuación.

Dos juegos clásicos de los 80: ¡La venganza y la caída de Montezuma! – hasta ahora han sido inmunes a un enfoque de aprendizaje por refuerzo tradicional. Esto se debe a que tienen pocas recompensas notables hasta más adelante en los juegos.

¡La aplicación del aprendizaje por refuerzo tradicional generalmente da como resultado que no se avance en la primera sala de la Venganza de Montezuma, mientras que en Pitfall! falla completamente

Una forma en que los investigadores han intentado proporcionar las recompensas necesarias para incentivar la IA es agregándolas para la exploración, lo que se denomina "motivación intrínseca". Sin embargo, este enfoque tiene deficiencias.

"Suponemos que una debilidad importante de los algoritmos de motivación intrínseca actuales es el desapego", escribieron los investigadores de Uber. "Donde los algoritmos se olvidan de las áreas prometedoras que han visitado, lo que significa que no regresan a ellos para ver si conducen a nuevos estados".

El equipo de investigación de AI de Uber en San Francisco desarrolló un nuevo tipo de aprendizaje de refuerzo para superar el desafío.

Los investigadores denominan a su enfoque "Ir a explorar" por el cual la IA volverá a una tarea o área anterior para evaluar si produce un mejor resultado. Suplementarse con el conocimiento humano para guiarlo hacia áreas notables aceleró dramáticamente su progreso.

Si no es otra cosa, la investigación nos brinda cierta comodidad. Los seres humanos débiles aún no son completamente redundantes y los mejores resultados se obtendrán trabajando mano a mano con nuestros amos virtuales.

¿Interesado en escuchar a los líderes de la industria discutir temas como este y sus casos de uso? Asistir a la co-ubicación AI y Big Data Expo eventos con los próximos espectáculos en Silicon Valley, Londres y Amsterdam para aprender más. Co-ubicado con el IoT Tech Expo, Blockchain Expoy Cyber ​​Security & Cloud Expo.






Dejar respuesta

Please enter your comment!
Please enter your name here