Otra victoria de la mente profunda: después del ajedrez y la marcha, la inteligencia artificial conquistó StarCraft

En noviembre de 2017, es decir, poco más de un año.Hace unos años, escribimos que la inteligencia artificial aún no puede derrotar a los jugadores profesionales en StarCraft. Pero menos de un año, ya que esta barrera fue tomada. El mes pasado, en Londres, un equipo de la división inglesa de investigación en inteligencia artificial DeepMind colocó silenciosamente una nueva piedra angular en la confrontación de personas y computadoras. El jueves, ella reveló este logro en un flujo de tres horas en YouTube, durante el cual personas y robots lucharon por la vida o la muerte.

DeepMind derrotó gente en StarCraft

La transmisión de DeepMind mostró que su robot conInteligencia artificial AlphaStar vence a un jugador profesional en una estrategia compleja en tiempo real (RTS) StarCraft II. El campeón de la humanidad Grzegorz Komints de Polonia, de 25 años, se fue con un puntaje de 5: 0. Parece que el software de aprendizaje automático ha encontrado estrategias desconocidas para los profesionales que compiten por los millones de premios que se entregan anualmente en uno de los juegos más rentables para el mundo de los deportes electrónicos.

</ p>

"No fue como ningún StarCraft que jugué", dijo Comince, un conocido profesional con el apodo de MaNa.

La hazaña DeepMind es la más difícil en mucho tiempo.La cadena de concursos que las computadoras impusieron a las mejores personas del mundo en juegos y en las que ganaron. Las damas cayeron en 1994, el ajedrez en 1997, y en 2016 AlphaGo conquistó el juego de go. El robot StarCraft es el jugador más poderoso en el mundo de la inteligencia artificial; y su llegada estaba esperando.

AlphaStar apareció hace unos seis años enLa historia del aprendizaje automático. Si bien la victoria de AlphaGo en 2016 fue abrumadora, los expertos creen que este momento vendría al menos diez años después, la victoria de AlphaStar parece haber llegado más o menos a tiempo. A estas alturas, está claro que con suficientes datos y potencia de cálculo, el aprendizaje automático puede hacer frente a problemas complejos pero específicos.

Mark Riedl, Profesor Asociado, Instituto de TecnologíaGeorgia, encontró la noticia del jueves emocionante, pero no genial. “Ya hemos llegado a este punto, así que era solo una cuestión de tiempo. En cierto sentido, era aburrido ganar personas en los juegos ".

Los videojuegos como StarCraft son matemáticamente más difíciles,que el ajedrez o vaya El número de posiciones válidas en el tablero de go es uno con 170 ceros, y el equivalente de StarCraft se califica como 1 con 270 ceros, no menos. Crear y administrar unidades militares en StarCraft requiere que los jugadores seleccionen y realicen muchas otras acciones, además de tomar una decisión sin poder ver cada paso del oponente.

DeepMind ha superado estas fuertes barreras conpotentes chips TPU que Google inventó para aumentar el poder del aprendizaje automático. La compañía ha adaptado algoritmos diseñados para el procesamiento de textos para la tarea de determinar acciones en el campo de batalla que llevan a la victoria. AlphaStar estudió en StarCraft en los registros de medio millón de juegos entre personas, y luego jugó con clones de sí mismo en constante mejora en una liga virtual, lo que representa un tipo de evolución digital. Los mejores bots que aparecieron en esta liga acumularon experiencia equivalente a 200 años de juego.

AlphaStar, que derrotó a MaNa, está lejos deomnipotente En este momento, el robot puede jugar solo una de las tres carreras disponibles en StarCraft. Además de la inhumanamente larga experiencia del juego, DeepMind también percibe este juego de una manera diferente. Ve todo lo que sucede en el juego al mismo tiempo, mientras que MaNa necesitaba moverse por el mapa para ver qué estaba pasando. AlphaStar también tiene una mayor precisión en el control y la orientación de unidades que una persona que posee un ratón de computadora, aunque el tiempo de reacción de una computadora es menor que el de un jugador profesional.

A pesar de estas fallas, Riedl y otros expertos.Acogió con satisfacción el trabajo de DeepMind. "Fue muy impresionante", dice Jie Tan, un instituto de investigación de IA independiente en OpenAI, que trabaja en bots que juegan a Dota 2, el juego más rentable del mundo para deportes electrónicos. Tales trucos de videojuegos pueden tener efectos secundarios potencialmente beneficiosos. Los algoritmos y el código que OpenAI usó para dominar a Dota el año pasado se han adaptado con éxito variable para hacer que las manos de los robots sean más diestras.

Sin embargo, AlphaStar ilustra la limitación.Los modernos sistemas de aprendizaje de máquinas altamente especializados, dice Julian Togelius, profesor de la Universidad de Nueva York y autor de un libro reciente sobre juegos e inteligencia artificial. A diferencia de su oponente humano, el nuevo campeón DeepMind no puede jugar con toda su fuerza en diferentes cartas de juego o para diferentes razas alienígenas en un juego sin entrenamiento adicional extendido. Tampoco puede jugar damas, ajedrez o versiones anteriores de StarCraft.

Esta incapacidad para hacer frente incluso con pequeñosLas sorpresas son un problema para muchas de las aplicaciones de inteligencia artificial esperadas, como los autos autónomos o los robots adaptables, que los investigadores llaman inteligencia artificial general (AGI). Una batalla más significativa entre el hombre y la máquina puede ser una especie de decatlón, con juegos de mesa, videojuegos y la final en Dungeons and Dragons.

Limitaciones de los altamente especializados.La inteligencia artificial pareció manifestarse cuando MaNa jugó un juego ejemplar contra AlphaStar, que se limitó a ver una carta por tipo de persona, una casilla a la vez. Los datos de DeepMind mostraron que es casi tan bueno como el que venció a MaNa en cinco juegos.

Un nuevo bot ensambló rápidamente un ejército, lo suficientemente poderoso,para aplastar a su rival humano, pero MaNa utilizó maniobras inteligentes y experiencias de derrota para detener las fuerzas de la IA. El retraso le dio tiempo para reunir a sus propias tropas y ganar.

Para encontrar noticias más interesantes, leemos en Zen.

Artículos relacionados