Uma plataforma de baixo código que combina a simplicidade sem código com o poder do código completo 🚀
Comece gratuitamente
4 de março de 2025
.
4
min ler

Alibaba lança Wan 2.1: um poderoso modelo de IA de código aberto para geração e automação de vídeo

Jorge Miloradovitch
Pesquisador, redator e entrevistador de casos de uso
Índice

O Alibaba anunciou recentemente o lançamento público do Wan 2.1, seu mais recente modelo de IA de código aberto projetado para tarefas avançadas de geração de vídeo. Lançado oficialmente em fevereiro de 2025, o Wan 2.1 agora está disponível gratuitamente sob a licença Apache 2.0, permitindo que desenvolvedores e empresas em todo o mundo aproveitem seus recursos sem restrições. 

O que é Wan 2.1?

Wan 2.1 - é um grande modelo de linguagem para geração de vídeo que interage com prompts de texto e prompts de imagem. De acordo com avaliações independentes usando o conjunto de benchmarks VBench, o Wan 2.1 atinge uma pontuação geral de aproximadamente 84.7%, colocando-o entre os modelos de geração de vídeo de IA de melhor desempenho globalmente. 

Especialistas destacam seus pontos fortes em qualidade de movimento dinâmico, relacionamentos espaciais e interações entre múltiplos objetos, tornando-o ideal para tarefas complexas de geração de vídeo.

Além disso, o Wan 2.1 introduz vários aprimoramentos notáveis, incluindo suporte multilíngue para efeitos de texto avançados em chinês e inglês, e compatibilidade com mais de 100 estilos artísticos. Otimizado para GPUs de nível de consumidor, o modelo pode gerar um vídeo 480p de cinco segundos em menos de quatro minutos usando uma GPU Nvidia RTX 4090, reduzindo significativamente a barreira de entrada para a criação de vídeos de qualidade profissional.

Principais recursos e desempenho de referência do Wan 2.1

O Wan 2.1 oferece um conjunto abrangente de recursos de geração de multimídia, permitindo que os usuários criem vídeos de alta qualidade de forma eficiente. Suas principais funcionalidades incluem:

  • Texto para vídeo (T2V): Converte descrições textuais em vídeos coerentes e visualmente envolventes.
  • Imagem para vídeo (I2V): Anima imagens estáticas em sequências de vídeo suaves em resoluções de até 720p.
  • Edição de Vídeo: Permite a edição precisa de vídeos existentes usando referências de texto ou imagem.
  • Texto para imagem (T2I): Gera imagens detalhadas diretamente de prompts de texto.
  • Vídeo para áudio (V2A): Extrai e gera faixas de áudio de conteúdo de vídeo.

Dados de benchmark da avaliação do VBench demonstram claramente a vantagem competitiva do Wan 2.1. Por exemplo, o modelo mostra melhores resultados em comparação com Sore e outros modelos em termos de compartilhamento de artefatos humanos, precisão de posição espacial e controle de câmera. 

Essas métricas confirmam a capacidade do Wan 2.1 de fornecer conteúdo de vídeo de nível profissional de forma rápida e eficiente, mesmo em hardware amplamente disponível.

Além do desempenho bruto, o código aberto do Wan 2.1 incentiva a inovação e a personalização. Os desenvolvedores podem adaptar livremente o modelo a casos de uso específicos, promovendo um ecossistema colaborativo que acelera os avanços na geração de multimídia orientada por IA.

Integrando Wan 2.1 em fluxos de trabalho automatizados com Latenode

Latenode é uma poderosa plataforma de automação no-code/low-code projetada para simplificar fluxos de trabalho complexos conectando perfeitamente modelos de IA, ferramentas de produtividade, sistemas de CRM e bancos de dados. Ao integrar o Wan 2.1 ao Latenode via API, as empresas podem automatizar processos de criação de vídeo, reduzindo o esforço manual e aumentando a produtividade.

Aqui estão três cenários práticos que demonstram como o Wan 2.1 pode ser efetivamente integrado em fluxos de trabalho automatizados usando o Latenode:

Automação de mídia social de blog para vídeo

Crie automaticamente vídeos envolventes para mídias sociais a partir de novas postagens de blog, aumentando o alcance e o engajamento do público.

  • Gatilho: Nova postagem de blog publicada (HubSpot)
  • O ChatGPT gera um breve prompt para um vídeo promocional com base no resumo do blog
  • Ação: Wan 2.1 gera um vídeo com base neste prompt
  • Ação: Publica automaticamente o vídeo em canais de mídia social (LinkedIn)

Vídeos de demonstração de recursos de produtos automatizados

Produza instantaneamente vídeos de demonstração de produtos claros e envolventes a partir de descrições textuais de recursos, simplificando o compartilhamento interno de conhecimento.

  • Gatilho: Novo recurso de produto documentado (Notion)
  • Ação: Wan 2.1 gera um vídeo dinâmico ilustrando o recurso
  • Ação: Carrega automaticamente o vídeo para a base de conhecimento interna (como o Notion) 
  • Ação: Notifica a equipe via Slack

O Latenode facilita a integração do Wan 2.1 em seus fluxos de trabalho existentes, permitindo que você automatize tarefas multimídia complexas sem conhecimento de codificação. Pronto para experimentar os benefícios da automação de vídeo orientada por IA? Junte-se ao Latenode hoje, explore integrações poderosas do Wan 2.1 e comece a otimizar seus processos de negócios imediatamente.

Crie integrações ilimitadas com ramificações, vários gatilhos em um nó, use low-code ou escreva seu próprio código com o AI Copilot.

Blogs relacionados

Caso de uso

Apoiado por