La empresa de IA Runway ha revelado su modelo mundial inaugural, GWM-1, lo que representa un avance innovador para la firma, previamente celebrada por su experiencia en generación de video. Este desarrollo es parte de un movimiento más amplio para explorar nuevos territorios a medida que los grandes modelos de lenguaje y las tecnologías de generación multimedia alcanzan una etapa de maduración y mejora en lugar de novedad.
La gama de GWM-1 consiste en tres modelos de autorregresión, cada uno basado en la arquitectura de generación de texto a video Gen-4.5 de Runway y posteriormente ajustado con datos específicos de dominio para atender diferentes aplicaciones. Aquí hay un vistazo más cercano a sus funcionalidades.
Mundos GWM
GWM Worlds introduce una plataforma interactiva para explorar entornos digitales que responden a interacciones de usuario en tiempo real, influyendo en la generación de cuadros subsiguientes. Según Runway, esta característica asegura consistencia y coherencia a lo largo de largas secuencias de movimiento.
Los usuarios pueden personalizar los atributos del entorno: su contenido, apariencia y reglas que lo rigen como la física. Además, pueden implementar acciones en tiempo real como movimientos de cámara o modificaciones del entorno. Aunque esencialmente es una forma avanzada de predicción de cuadros, estos entornos se acercan a un nivel de fiabilidad adecuado para propósitos de simulación.
Los usos potenciales incluyen previsualización y etapas de desarrollo preliminares para diseño de juegos, creación de entornos de realidad virtual y exploraciones educativas de contextos históricos. Una aplicación notable trasciende el alcance tradicional de Runway: emplear modelos mundiales como este para educar sistemas de IA, incluidos modelos de aprendizaje robótico.
Robótica GWM
El segundo modelo, GWM Robotics, está adaptado para mejorar conjuntos de datos robóticos. Permite la generación de datos de entrenamiento sintéticos que complementan los conjuntos de datos robóticos existentes en numerosos aspectos, incluidos objetos novedosos, instrucciones de tareas y variabilidades ambientales, enriqueciendo enormemente el proceso de entrenamiento para agentes de IA y sistemas robóticos.