OpenAI mostra modelo de IA que transforma texto em vídeo

7 meses atrás 158

O novo modelo de geração de vídeo a partir de texto da OpenAI chama-se Sora e consegue “criar cenas realistas a partir de instruções de texto”. O algoritmo permite criar sequências com até um minuto de duração e só precisa mesmo dos inputs escritos pelo utilizador. A OpenAI promete “cenas complexas com múltiplas personagens, tipos específicos de movimento e detalhes pormenorizados no sujeito principal e no cenário de fundo”.

Além de interpretar comandos de texto, o Sora vai ser capaz de gerar vídeo a partir de uma imagem estática ou de preencher os fotogramas em falta em vídeos já criados. Na sua página de blogue, a OpenAI já publicou algumas demonstrações onde, apesar de haver alguns indícios de se tratar de vídeo gerado por máquina, os resultados finais são impressionantes. A empresa admite alguma dificuldade no momento para “simular com precisão a física de uma cena complexa”, cita o The Verge.

Este segmento da Inteligência Artificial, como todos os outros, está a ‘fervilhar’ de ação, com várias empresas a lançarem os seus modelos e com resultados impressionantes.

Nesta fase, o Sora está a ser testado internamente para avaliar potenciais riscos, mas a OpenAI também o disponibilizou a alguns artistas, designers e realizadores para recolher o seu feedback.

Ler artigo completo