Simple Science

Ciência de ponta explicada de forma simples

# Informática# Inteligência Artificial

Avaliando Raciocínio Abstrato com ARC

O ARC testa as habilidades de raciocínio abstrato de humanos e máquinas através de várias tarefas.

― 7 min ler


Desafio de RaciocínioDesafio de RaciocínioAbstratocom tarefas visuais.O ARC avalia habilidades de raciocínio
Índice

O Corpus de Raciocínio Abstrato (ARC) é um teste que mede o quanto humanos e máquinas conseguem pensar de forma abstrata. Ele tem um monte de tarefas visuais que exigem habilidades de resolução de problemas. O objetivo do ARC é ver como um solucionador, seja humano ou artificial, consegue deduzir os padrões e regras por trás das diferentes tarefas sem ter sido treinado antes nessas tarefas específicas.

O ARC contém 1.000 tarefas únicas, sendo 800 acessíveis para pesquisa e 200 reservadas para avaliação. Cada tarefa é formada por uma grade cheia de símbolos ou cores. Os solucionadores têm que descobrir como prever a grade de saída correta com base nos padrões da grade de entrada dada.

Características das Tarefas do ARC

Cada tarefa do ARC é estruturada com pares de entrada e saída. A entrada apresenta ao solucionador uma grade cheia de símbolos, enquanto a saída é a grade que o solucionador precisa prever. Os tamanhos das grades podem variar de pequenos a grandes, e cada célula pode exibir um dos vários símbolos. Isso exige que os solucionadores, além de reconhecer padrões, também façam um raciocínio lógico para determinar a saída correta.

Um aspecto importante das tarefas do ARC é que os solucionadores devem gerar suas respostas sem um treinamento explícito para cada tarefa. O ARC é baseado na premissa de que os solucionadores devem usar seu conhecimento e habilidades de raciocínio existentes para resolver as tarefas apresentadas.

Requisitos de Conhecimento Básico

Para enfrentar as tarefas do ARC com sucesso, espera-se que os solucionadores tenham uma compreensão básica de vários conceitos:

  1. Objetividade: Isso envolve reconhecer e entender objetos dentro da grade, sua permanência e como eles interagem entre si.

  2. Objetividade Direcionada: Isso se refere a entender processos e transições de um ponto de partida a um ponto final em uma grade.

  3. Números e Contagem: Os solucionadores devem ser capazes de interpretar quantidades e realizar operações como comparação e ordenação com base na frequência e no tamanho.

  4. Geometria e Topologia: Conhecimento sobre formas, simetria e como os objetos se relacionam espacialmente é essencial para resolver muitas tarefas.

Raciocínio e Resolução de Problemas com VIMRL

Para resolver as tarefas do ARC, usa-se uma linguagem única chamada Linguagem de Raciocínio por Imagem Visual (VIMRL). O VIMRL é projetado especificamente para tarefas de raciocínio no ARC. Ele se concentra em como as instruções são sequenciadas durante a execução do programa, em vez de apenas nas instruções específicas em si.

O principal objetivo do sistema de raciocínio é buscar programas que possam resolver efetivamente as tarefas apresentadas no ARC. Usando o VIMRL, o sistema gera soluções potenciais para as tarefas, examinando as regras e padrões contidos nas grades.

Execução de Programas VIMRL

Quando um programa VIMRL é executado, ele mantém um estado que inclui variáveis definidas, seus valores e a linha de execução atual. O programa começa com duas variáveis pré-definidas: uma para a grade de entrada e outra para a cor de fundo. As operações no VIMRL podem ser categorizadas em dois tipos:

  1. Operações de Baixo Nível: Estas são funções simples que exigem entradas específicas e as manipulam diretamente.

  2. Operações de alto nível: Estas funções analisam a grade de forma mais abrangente e podem deduzir argumentos adicionais com base no estado atual do programa.

Um exemplo de uma operação de baixo nível é uma que remove pixels extras de uma imagem, criando uma caixa delimitadora ao redor dos objetos. Operações de alto nível podem usar regras baseadas na física ou relações espaciais para interagir com os elementos da grade.

Modificando Tarefas com Funções de Alto Nível

Ao executar um programa VIMRL que inclui tanto operações de alto nível quanto de baixo nível, as operações de baixo nível anteriores devem ser consideradas quando a função de alto nível é chamada. Se uma função de alto nível é executada sem levar em conta as mudanças feitas em operações anteriores, os resultados podem não se alinhar adequadamente com os requisitos da tarefa.

Para corrigir isso, cada função de alto nível utiliza quaisquer instruções executadas anteriormente para modificar os pares de entrada e saída. Isso garante que a função de alto nível tenha as informações corretas para analisar ao gerar sua saída.

Tipos de Operações no VIMRL

O VIMRL conta com várias operações, incluindo funções de baixo e alto nível. O design dessas operações é guiado pelo conhecimento básico identificado para o ARC. Elas facilitam uma variedade de tarefas, com a implementação se inspirando em observações do dataset público do ARC.

O sistema atual inclui 11 operações de alto nível e 41 de baixo nível, permitindo diversas maneiras de interagir e resolver as tarefas apresentadas no ARC.

Buscando Soluções

O sistema usa um algoritmo de busca para encontrar programas VIMRL adequados para tarefas específicas do ARC. Esse processo de busca envolve gerar programas candidatos e validar sua eficácia com base no desempenho em tarefas de treinamento. A busca opera em ciclos de geração, execução e teste de programas potenciais até que o número necessário de soluções válidas seja encontrado ou o tempo limite seja atingido.

Existem duas principais estratégias de busca:

  1. Busca de Força Bruta: Essa abordagem gera todos os programas possíveis com base na gramática do VIMRL e testa sistematicamente cada um. No entanto, esse método pode rapidamente levar a um número avassalador de opções.

  2. Busca Estocástica: Essa estratégia amostra nós sucessores potenciais com base em modelos derivados de programas bem-sucedidos existentes. Ao confiar nas interações aprendidas entre as operações, aumenta a probabilidade de encontrar soluções eficazes sem explorar todas as possibilidades.

Para gerenciar o espaço de busca e melhorar a eficiência, o programa limita a profundidade da busca e elimina programas logicamente equivalentes para evitar cálculos desnecessários.

Resultados e Desempenho

Os resultados do uso do VIMRL e das estratégias de busca associadas mostraram promissora. Durante avaliações, o sistema empatou em 4º lugar em um desafio global, demonstrando sua capacidade de raciocinar sobre uma ampla gama de tarefas de forma eficaz.

As melhorias feitas nos algoritmos de busca e na eficiência operacional indicam que o desenvolvimento futuro pode levar a resultados ainda melhores.

Direções Futuras

O trabalho contínuo busca expandir o conjunto de programas e operações disponíveis dentro do VIMRL, focando naqueles que podem ser amplamente aplicados enquanto minimizam o risco de sobrecarregar o espaço de busca. Ao aumentar o conjunto de dados verdadeiro de programas bem-sucedidos, o sistema pode aprimorar suas capacidades de raciocínio e melhorar a forma como as tarefas são abordadas.

Além disso, há interesse em estudar como as características visuais das tarefas se correlacionam com a execução bem-sucedida das funções de resolução. Esse entendimento pode levar a operações mais simplificadas que visem efetivamente tipos específicos de tarefas, aumentando ainda mais o desempenho.

Em resumo, o ARC oferece um terreno rico para o estudo do raciocínio abstrato. À medida que a pesquisa avança, o potencial para criar sistemas robustos que possam resolver tarefas visuais complexas só tende a aumentar, abrindo caminho para avanços na inteligência artificial e nos modelos de raciocínio.

Fonte original

Título: A Neurodiversity-Inspired Solver for the Abstraction \& Reasoning Corpus (ARC) Using Visual Imagery and Program Synthesis

Resumo: Core knowledge about physical objects -- e.g., their permanency, spatial transformations, and interactions -- is one of the most fundamental building blocks of biological intelligence across humans and non-human animals. While AI techniques in certain domains (e.g. vision, NLP) have advanced dramatically in recent years, no current AI systems can yet match human abilities in flexibly applying core knowledge to solve novel tasks. We propose a new AI approach to core knowledge that combines 1) visual representations of core knowledge inspired by human mental imagery abilities, especially as observed in studies of neurodivergent individuals; with 2) tree-search-based program synthesis for flexibly combining core knowledge to form new reasoning strategies on the fly. We demonstrate our system's performance on the very difficult Abstraction \& Reasoning Corpus (ARC) challenge, and we share experimental results from publicly available ARC items as well as from our 4th-place finish on the private test set during the 2022 global ARCathon challenge.

Autores: James Ainooson, Deepayan Sanyal, Joel P. Michelson, Yuan Yang, Maithilee Kunda

Última atualização: 2023-10-31 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2302.09425

Fonte PDF: https://arxiv.org/pdf/2302.09425

Licença: https://creativecommons.org/licenses/by-nc-sa/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes