Nova ferramenta de IA do Google utiliza prompts de imagem em vez de texto

Ferramenta permite aos usuários gerar imagens utilizando outras imagens como prompts, eliminando a necessidade de longas descrições textuais

Equipe InfoMoney

(Divulgação/Google)
(Divulgação/Google)

Publicidade

A Google anunciou o lançamento do Whisk, uma nova ferramenta de inteligência artificial que permite aos usuários gerar imagens utilizando outras imagens como prompts, eliminando a necessidade de longas descrições textuais.

A empresa diz que busca facilitar a criação de imagens personalizadas, permitindo que os usuários explorem a criatividade de forma mais intuitiva e visual.

Com o Whisk, os usuários podem fornecer imagens para sugerir o assunto, a cena e o estilo da imagem gerada pela IA.

(Divulgação/Google)

É possível usar múltiplas imagens para cada uma dessas categorias, e, se necessário, os usuários também podem inserir textos adicionais.

Para aqueles que não têm imagens à mão, um ícone de dado permite que a Google gere imagens sugeridas, que também são criadas por meio de inteligência artificial.

Embora o uso de textos seja opcional, a ferramenta oferece a flexibilidade de adicionar detalhes extras sobre a imagem desejada.

Continua depois da publicidade

(Divulgação/Google)

Após a seleção das imagens, o Whisk gera uma nova imagem junto com um prompt textual correspondente.

Os usuários têm a opção de favoritar ou baixar a imagem gerada, ou ainda refinar o resultado ao editar os prompts de texto.

A possibilidade de iteração rápida e divertida promete engajar os criadores, que podem experimentar diferentes combinações até alcançar o resultado desejado.

Continua depois da publicidade

Em um post no blog da empresa, o Google enfatizou que o Whisk é projetado para “exploração visual rápida, e não para edições perfeitas em pixel”.

A empresa também alertou que a ferramenta pode “errar” em algumas tentativas, mas permite que os usuários ajustem os prompts subjacentes para obter melhores resultados.

O Whisk utiliza a mais recente versão do modelo de geração de imagens da Google, o Imagen 3.

Continua depois da publicidade

Além disso, a empresa anunciou o Veo 2, uma nova versão de seu modelo de geração de vídeos, que promete uma compreensão mais apurada da “linguagem única da cinematografia”.

O Veo 2 será inicialmente disponibilizado no VideoFX da Google, com expansão prevista para o YouTube Shorts e outros produtos ao longo do próximo ano.