Créditos de la imagen: Mindougo
Los investigadores de IA han creado un bot de Minecraft que puede explorar y ampliar sus habilidades en el mundo abierto del juego, pero a diferencia de otros bots, este bot principalmente escribió su propio código a través de prueba y error y mucho de consultas GPT-4.
Conocido como Voyager, este sistema experimental es un ejemplo de un «agente encarnado», una inteligencia artificial que puede moverse y actuar libremente y con un propósito en un entorno simulado o real. Los asistentes personales tipo IA y los chatbots no tienen que hacer cosas, y mucho menos navegar en un mundo complejo para hacerlas. Pero esto es exactamente lo que se espera que haga el robot doméstico en el futuro, por lo que hay mucha investigación sobre cómo hacerlo.
Minecraft es un buen lugar para probar cosas como esta porque es una representación (muy) aproximada del mundo real, con reglas y física simples y directas, pero también es lo suficientemente complejo y abierto como para obtener mucho para obtener o experimentar. Los simuladores especialmente diseñados también son excelentes, pero tienen sus propias limitaciones.
Mindougo Es un marco de simulación construido alrededor de Minecraft, ya que no puedes simplemente poner una IA aleatoria allí y esperar que entienda lo que están haciendo todos esos bloques y cerdos. Sus creadores (muy superpuestos con el equipo de Voyager) recopilaron videos de YouTube sobre el juego, guiones, artículos de wiki y muchas publicaciones de Reddit de r/minecraft, entre otros datos, para que los usuarios puedan crear o ajustar un modelo de IA. en ellos. También permite que estos modelos se evalúen de manera bastante objetiva al ver qué tan bien hacen cosas como construir una cerca alrededor de las llamas o encontrar y extraer diamantes.
Viajero Sobresale en estas tareas y funciona mucho mejor que el único otro modelo que se le acerca, AutoGPT. Pero tienen un enfoque similar: usan GPT-4 para escribir su código sobre la marcha.
Normalmente, solo entrenarías a un modelo con todos los buenos datos de Minecraft y esperarías haber descubierto cómo luchar contra los esqueletos cuando se pone el sol. Sin embargo, Voyager comienza siendo relativamente ingenuo, y cuando se encuentra con cosas en el juego, tiene una pequeña conversación interna con GPT-4 sobre lo que debe hacer y cómo.
Por ejemplo, digamos que cae la noche y salen esos esqueletos. El agente tiene una idea general de esto, pero se pregunta ¿qué haría un buen jugador en este juego cuando hay monstruos cerca? Bueno, dice GPT-4, si quieres explorar el mundo de manera segura, querrás fabricar y equipar una espada, luego cortar el esqueleto con ella mientras evitas ser golpeado. Y ese sentido general de lo que hay que hacer se traduce en objetivos tangibles: recolectar piedra y madera, construir una espada en la mesa de trabajo, equiparla y luchar contra un esqueleto.
Una vez que se completan, se ingresan en la biblioteca general de habilidades para que luego, cuando la misión sea «adentrarse en una cueva para encontrar mineral de hierro», no tenga que aprender a luchar nuevamente desde cero. Todavía usa GPT, pero el GPT-3.5 más barato y rápido, que le dice qué habilidades son más relevantes para una situación determinada, por lo que no está tratando de extraer esqueleto y luchar contra el mineral.
Es similar a un trabajador como AutoGPT, cuando se encuentra con una interfaz con la que aún no está familiarizado, debe aprender a navegar por ella para lograr su objetivo. Pero Minecraft es un entorno mucho más profundo de lo que está acostumbrado a resolver, por lo que un agente especializado como Voyager funciona mucho mejor. Encuentra más objetos, aprende más habilidades y explora un área mucho más grande que otros robots.
Curiosamente, aunque no sorprende, GPT-4 limpia el suelo con GPT-3.5 (es decir, ChatGPT) cuando se trata de crear código útil. La prueba de sustituir uno por el otro resultó en que el agente chocara contra una pared desde el principio, tal vez incluso literalmente, y no lograra mejorar. Al hablar con los dos modelos, puede que no sea obvio que uno de ellos es más inteligente, pero la verdad es que no tienes que ser particularmente inteligente para tener una conversación que parezca inteligente (pregúntame cómo lo sé). La codificación es más difícil y GPT-4 fue una gran actualización allí.
El objetivo de esta investigación no es descuidar a los jugadores mayores de Minecraft, sino encontrar formas en las que los modelos de IA relativamente simples puedan mejorar en función de sus «experiencias», a falta de una palabra mejor. Si tenemos robots que nos ayudan en nuestros hogares, hospitales y oficinas, deberán aprender estas lecciones y aplicarlas en acciones futuras.
Puedes leer más sobre Voyager aquí.
More Stories
El código en los datos previos al entrenamiento mejora el rendimiento del LLM en tareas que no son de codificación
Un marco para resolver ecuaciones diferenciales parciales equivalentes puede guiar el procesamiento y la ingeniería de gráficos por computadora
Epiroc ha lanzado una nueva plataforma de perforación de producción de pozos largos