Simple Science

Ciência de ponta explicada de forma simples

O que significa "VISOR"?

Índice

O VISOR é uma ferramenta usada pra medir como os sistemas de computador criam imagens a partir de descrições em texto. Ele confere se as imagens combinam com o que o texto tá dizendo, principalmente em relação à posição dos objetos um em relação ao outro. Por exemplo, ele consegue dizer se um objeto tá corretamente mostrado como "à esquerda de" ou "abaixo" de outro objeto.

Importância do VISOR

Essa ferramenta é importante porque muitos sistemas têm dificuldade em mostrar os lugares exatos dos objetos nas imagens. Ajustando esses sistemas usando um grande conjunto de dados com pares de imagem e legenda, o VISOR ajuda a melhorar a precisão. Assim, as imagens produzidas têm mais chances de combinar com as descrições dadas.

Benefícios

Usar o VISOR leva a resultados melhores na criação de imagens a partir do texto. Mostra melhorias em como esses sistemas funcionam, mesmo quando encontram novos objetos que não faziam parte dos dados de treinamento. No geral, o VISOR garante que as imagens geradas sejam mais precisas e confiáveis.

Artigos mais recentes para VISOR