Início TECNOLOGIA O modelo VEO 3 AI do Google pode gerar vídeos com som

O modelo VEO 3 AI do Google pode gerar vídeos com som

11
0

Como parte dos anúncios deste ano em sua conferência de desenvolvedor de E/S, o Google revelou seus mais recentes modelos de geração de mídia. O mais notável, talvez, é o Veo 3, que é a primeira iteração do modelo que pode gerar vídeos com sons. Ele pode, por exemplo, criar um vídeo de pássaros com um áudio de canto ou uma rua da cidade com os sons de tráfego em segundo plano. O Google diz que o VEO 3 também se destaca na física do mundo actual e na sincronização labial. No momento, o modelo está disponível apenas para assinantes de Gemini Extremely nos EUA no aplicativo Gemini e para usuários corporativos no Vertex AI. Também está disponível no Circulation, a nova ferramenta de cinema da AI do Google.

O Circulation reúne Veo, Imagen e Gêmeos para criar clipes e cenas cinematográficos. Os usuários podem descrever a saída remaining que desejam na linguagem pure, e o fluxo irá trabalhar, fazendo isso para eles. A nova ferramenta estará disponível apenas para os assinantes do Google AI Professional e Extremely nos EUA por enquanto, mas o Google diz que será lançado em mais países em breve.

Enquanto a empresa lançou um novo modelo de geração de vídeos, ainda não abandonou o Veo 2. Os usuários poderão fornecer ao VEO 2 imagens de pessoas, cenas, estilos e objetos a serem usados ​​como referência para a saída desejada no fluxo. Eles terão acesso aos controles da câmera que lhes permitirão girar cenas e zoom em objetos específicos para o fluxo também. Além disso, eles poderão ampliar seus quadros de retrato para paisagem, se quiserem e adicionar ou remover objetos de seus vídeos.

O Google também introduziu seu mais recente modelo de geração de imagens, Imagen 4, no evento. A empresa disse que a Imagen 4 faz detalhes finos, como tecidos complexos e pêlos de animais com “clareza notável” e se destacam na geração de imagens fotorrealistas e abstratas. Também é significativamente melhor em renderizar tipografia do que seus antecessores e pode criar imagens em várias proporções com resoluções de até 2k. O Imagen 4 já está disponível no aplicativo Gemini, Vertex AI e em aplicativos de espaço de trabalho, incluindo documentos e slides. O Google disse que também está lançando uma versão do Imagen 4 que é 10 vezes mais rápida que o Imagen 3 “Quickly”.

Finalmente, para ajudar as pessoas a identificar conteúdo gerado pela IA, que está se tornando cada vez mais difícil hoje em dia, o Google lançou o detector de sintídeos. É um portal em que os usuários podem fazer add de uma peça de mídia que eles acham que podem ser gerados pela IA, e o Google determinará se contém sintid, sua ferramenta de marca d’água e identificação para a AI Artwork. O Google havia de origem aberta de sua ferramenta de marca d’água, mas nem todos os geradores de imagens a usam, para que o portal ainda não possa identificar todas as imagens geradas por IA.

fonte