Una plataforma de código bajo que combina la simplicidad sin código con el poder del código completo 🚀
Empieza ahora gratis
Marzo 4, 2025
4
min leer

Alibaba lanza Wan 2.1: un potente modelo de inteligencia artificial de código abierto para la generación y automatización de videos

George Miloradovich
Investigador, redactor y entrevistador de casos prácticos
Tabla de contenidos.

Alibaba anunció recientemente el lanzamiento público de Wan 2.1, su último modelo de inteligencia artificial de código abierto diseñado para tareas avanzadas de generación de video. Lanzado oficialmente en febrero de 2025, Wan 2.1 ahora está disponible de forma gratuita bajo la licencia Apache 2.0, lo que permite a los desarrolladores y empresas de todo el mundo aprovechar sus capacidades sin restricciones. 

¿Qué es Wan 2.1?

Wan 2.1 es un modelo de lenguaje de gran tamaño para la generación de videos que interactúa con indicaciones de texto e imágenes. Según evaluaciones independientes realizadas con el conjunto de pruebas de rendimiento VBench, Wan 2.1 alcanza una puntuación general de aproximadamente el 84.7 %, lo que lo ubica entre los modelos de generación de videos con IA de mejor rendimiento a nivel mundial. 

Los expertos destacan sus puntos fuertes en la calidad del movimiento dinámico, las relaciones espaciales y las interacciones multiobjeto, lo que lo hace ideal para tareas complejas de generación de vídeo.

Además, Wan 2.1 presenta varias mejoras notables, como compatibilidad con varios idiomas para efectos de texto avanzados, tanto en chino como en inglés, y compatibilidad con más de 100 estilos artísticos. Optimizado para GPU de consumo, el modelo puede generar un video de 480p de cinco segundos en menos de cuatro minutos utilizando una GPU Nvidia RTX 4090, lo que reduce significativamente la barrera de entrada para la creación de videos de calidad profesional.

Características principales y rendimiento de referencia de Wan 2.1

Wan 2.1 ofrece un conjunto completo de funciones de generación multimedia que permiten a los usuarios crear vídeos de alta calidad de forma eficiente. Entre sus principales funciones se incluyen:

  • Texto a vídeo (T2V):Convierte descripciones textuales en vídeos coherentes y visualmente atractivos.
  • Imagen a vídeo (I2V):Anima imágenes estáticas en secuencias de vídeo fluidas con resoluciones de hasta 720p.
  • Edición de video:Permite la edición precisa de vídeos existentes utilizando referencias de texto o imágenes.
  • Texto a imagen (T2I):Genera imágenes detalladas directamente a partir de indicaciones de texto.
  • Vídeo a audio (V2A)): Extrae y genera pistas de audio a partir de contenido de vídeo.

Los datos de referencia de la evaluación de VBench demuestran claramente la ventaja competitiva de Wan 2.1. Por ejemplo, el modelo muestra mejores resultados en comparación con Sore y otros modelos en términos de proporción de artefactos humanos, precisión de posición espacial y control de cámara. 

Estas métricas confirman la capacidad de Wan 2.1 para ofrecer contenido de video de calidad profesional de manera rápida y eficiente, incluso en hardware ampliamente disponible.

Más allá del rendimiento en bruto, el código abierto de Wan 2.1 fomenta la innovación y la personalización. Los desarrolladores pueden adaptar libremente el modelo a casos de uso específicos, lo que fomenta un ecosistema colaborativo que acelera los avances en la generación de multimedia impulsada por IA.

Integración de Wan 2.1 en flujos de trabajo automatizados con Latenode

Latenode es una potente plataforma de automatización sin código o con poco código diseñada para simplificar flujos de trabajo complejos mediante la conexión perfecta de modelos de IA, herramientas de productividad, sistemas CRM y bases de datos. Al integrar Wan 2.1 en Latenode a través de API, las empresas pueden automatizar los procesos de creación de videos, lo que reduce el esfuerzo manual y mejora la productividad.

A continuación se presentan tres escenarios prácticos que demuestran cómo Wan 2.1 se puede integrar de manera efectiva en flujos de trabajo automatizados utilizando Latenode:

Automatización de redes sociales de blog a video

Cree automáticamente videos atractivos para las redes sociales a partir de nuevas publicaciones de blog, aumentando el alcance y la participación de la audiencia.

  • Desencadenante: Nueva publicación de blog (HubSpot)
  • ChatGPT genera un breve mensaje para un video promocional basado en el resumen del blog.
  • Acción: Wan 2.1 genera un vídeo basado en este mensaje
  • Acción: publica automáticamente el video en los canales de redes sociales (LinkedIn)

Vídeos de demostración de funciones automatizadas de productos

Produzca instantáneamente videos de demostración de productos claros y atractivos a partir de descripciones de características textuales, agilizando el intercambio de conocimientos internos.

  • Desencadenante: Nueva característica del producto documentada (Notion)
  • Acción: Wan 2.1 genera un vídeo dinámico que ilustra la función
  • Acción: Carga automáticamente el video en la base de conocimiento interna (como Notion) 
  • Acción: notifica al equipo a través de Slack

Latenode facilita la integración de Wan 2.1 en sus flujos de trabajo existentes, lo que le permite automatizar tareas multimedia complejas sin necesidad de conocimientos de codificación. ¿Está listo para experimentar los beneficios de la automatización de video impulsada por IA? Únase a Latenode hoy, explore las poderosas integraciones de Wan 2.1 y comience a optimizar sus procesos comerciales de inmediato.

Cree integraciones ilimitadas con ramificaciones, múltiples activadores que llegan a un nodo, use código bajo o escriba su propio código con AI Copilot.

Blogs relacionados

Caso de uso

Respaldado por