Hoy día ya usamos inteligencias artificiales para que nos ayuden en prácticamente cualquiera de nuestras necesidades. Y ahora, también las estamos empezando a usar como entretenimiento. Por ejemplo, en las últimas horas se ha vuelto viral una IA que está aprendiendo a pasarse un juego de Mario.
¿Quién es la IA Rupert y cómo está aprendiendo a jugar Mario?
Gizmodo reportó la viralidad de la inteligencia artificial Rupert, que está realizando una transmisión en vivo continua, a través de TikTok y YouTube, en un intento de terminarSuper Mario World. En primera instancia, este proceso de aprendizaje se parece mucho a la experiencia de un jugador novato de Super Nintendo. Rupert corre, salta, choca con enemigos, cae de acantilados y muere repetidamente, y eventualmente comienza a aprender qué cosas funcionan y qué cosas no funcionan para llegar más lejos y avanzar de nivel. Este proceso se basa en la simulación de la selección natural mediante redes neuronales y gracias a él, Rupert ya superó los niveles 1-1 y 1-2.
El sistema de Rupert se basa en conceptos de evolución, como "especies" y "generaciones". La IA prueba diferentes estrategias para cada especie y selecciona las generaciones con puntajes de "aptitud" más altos para desarrollarse sobre ellas. Esto permite que la toma de decisiones de la IA mejore con el tiempo, tomando las decisiones más óptimas con cada nueva "generación", de acuerdo con concimientos pasados. Así, Rupert logró vencer el nivel 1 en 57 generaciones. Puedes ver a Rupert en vivo en TikTok o YouTube aquí:
Para funcionar, Rupert se escribió en un programa de código abierto llamado MarI/O, desarrollado por Seth Hendrickson. MarI/O es muy útil para conceptualizar cómo funcionan las redes neuronales a nivel básico: hacer pruebas en un experimento requerido, quedarse con los resultados positivos y desechar los negativos, y así evolucionar en pos de alcanzar un objetivo. En este caso, el objetivo es finalizar niveles.
El desarrollador de Rupert tenía algunos problemas originalmente, pues el bot no estaba entrenado para niveles superiiores, pero lo ha ido mejorando con el tiempo. Así pues, en teoría el robot ya tiene todo lo necesario para acabar el juego... eventualmente.
Deja tu comentario