Simple Science

Ciência de ponta explicada de forma simples

# Informática# Computação e linguagem

Melhorando Modelos de Linguagem com Cadeia de Instruções

Esse artigo fala sobre um método pra melhorar modelos de linguagem usando instruções estruturadas.

― 6 min ler


Cadeia de Instruções paraCadeia de Instruções paraModelos de IAlinguagem.Um novo método pra treinar modelos de
Índice

Nos últimos anos, os grandes modelos de linguagem fizeram um baita barulho no mundo da inteligência artificial. Esses modelos conseguem realizar várias tarefas, como traduzir idiomas, resumir textos e responder perguntas. Eles mandam muito bem quando recebem Instruções claras. Mas a maioria dos modelos atuais só funciona legal com instruções simples e dá uma travada quando o negócio fica complicado e exige várias etapas.

Esse artigo apresenta uma nova ideia chamada Cadeia de Instruções (CoI). A ideia básica é que, em vez de dar uma única instrução, podemos passar uma série de instruções onde a resposta de uma ajuda na próxima. Essa abordagem facilita para o modelo dividir uma tarefa complicada em partes menores e mais fáceis de lidar.

O Que São Cadeias de Instruções?

Uma Cadeia de Instruções é um método onde o modelo recebe um conjunto de tarefas que dependem umas das outras. Por exemplo, se a tarefa geral é criar um título para um post de blog em francês, o modelo pode precisar completar várias tarefas menores:

  1. Criar um título com base nas informações fornecidas.
  2. Mudar o título pra se encaixar no estilo de um post de blog.
  3. Traduzir o título final para o francês.

Ao dividir a tarefa em etapas, o modelo consegue focar em uma parte de cada vez, facilitando todo o processo.

Importância da Qualidade das Instruções

A qualidade das instruções é crucial pro sucesso de qualquer modelo de linguagem. Nas configurações tradicionais, as instruções costumam ser muito longas ou confusas. Focando em instruções mais curtas e claras, conseguimos ajudar o modelo a performar melhor. O método CoI tem o objetivo de criar instruções que não só sejam bem estruturadas, mas também fáceis de seguir.

No nosso trabalho, resumimos instruções longas e complexas em versões mais curtas que vão direto ao ponto. Por exemplo, em vez de dizer "Gere um título de blog de maneira criativa que reflita o tema do texto", poderíamos simplesmente dizer "Crie um título de blog."

Construindo o Conjunto de Dados de Cadeia de Instruções

Pra testar como nossa abordagem de Cadeia de Instruções funciona, precisávamos criar um conjunto de dados cheio de exemplos dessas instruções. O conjunto de dados foi construído a partir de conjuntos de instruções existentes que são comumente usados com grandes modelos de linguagem.

Um dos Conjuntos de dados que usamos tinha mais de 1.300 tarefas únicas de várias categorias. Isso nos permitiu escolher tarefas que poderiam ser transformadas em cadeias de instruções. Pegamos essas tarefas e as dividimos em instruções simples. Assim, conseguimos criar pares de instruções que se conectam logicamente.

Criando Pares de Instruções

O processo de conectar instruções envolve várias etapas:

  1. Resumindo: Primeiro, encurtamos as descrições das tarefas originais pra torná-las mais fáceis de entender.
  2. Verificação de Componibilidade: Depois, verificamos se as instruções poderiam seguir uma após a outra de forma lógica. Por exemplo, se uma instrução pedia um resumo, a próxima poderia pedir uma tradução desse resumo.
  3. Geração do Resultado Final: Por fim, geramos o resultado final com base nas instruções completadas.

Seguindo essas etapas, conseguimos criar um conjunto de dados especificamente desenhado para tarefas de Cadeias de Instruções, facilitando pros modelos aprenderem a sequenciar seu raciocínio.

Vantagens da Cadeia de Instruções

Um dos grandes benefícios de usar a abordagem de Cadeia de Instruções é que ela permite que o modelo trabalhe passo a passo. Isso é especialmente útil ao lidar com tarefas mais complicadas, pois dividir em partes ajuda a entender todo o processo.

Além disso, descobrimos que os modelos treinados com esse novo método performaram muito melhor em tarefas que envolviam várias instruções. Quando comparamos modelos treinados com CoI a aqueles treinados com instruções simples, os modelos treinados com CoI consistently se saíram melhor que os outros.

Avaliando o Desempenho do Modelo

Pra entender como nosso sistema de Cadeia de Instruções funcionou, colocamos os modelos à prova. A Avaliação consistiu em pontuação automática e avaliações humanas. Usamos um método de pontuação conhecido como Rouge-L pra medir o quão bem os resultados se alinharam com o esperado.

Além da pontuação automática, também pedimos a avaliadores humanos que classificassem os resultados dos modelos. Eles analisaram o quanto preferiam os resultados dos modelos treinados com CoI em comparação com os modelos tradicionais. Os resultados do CoI receberam muitos elogios, mostrando que as pessoas acharam eles mais claros e úteis.

Aplicações do Mundo Real

A abordagem de Cadeia de Instruções não é só um exercício acadêmico; ela tem aplicações práticas também. Em situações práticas, ser capaz de dividir tarefas complexas em partes menores pode levar a melhores resultados em várias áreas.

Por exemplo, na área de resumo multilíngue, esse método permite traduções e Resumos mais precisos. Os modelos foram testados em traduções de resumos entre inglês e francês, e os resultados foram promissores. O sistema CoI melhorou a capacidade dos modelos de lidar com esse tipo de tarefa de forma mais eficaz.

Conclusão

Em conclusão, o método de Cadeia de Instruções representa um grande avanço no treinamento de grandes modelos de linguagem. Ao dividir tarefas complexas em instruções mais simples, permitimos um desempenho e entendimento melhores.

À medida que a inteligência artificial continua evoluindo, usar métodos como o CoI vai se tornar cada vez mais importante. Nosso trabalho demonstra que mesmo com modelos menores, podemos alcançar ótimos resultados focando em métodos de instrução composicional.

Olhando para o futuro, há muito potencial para mais melhorias. A ideia de não só compor instruções, mas também dividi-las pode ser explorada mais a fundo. O objetivo é tornar as máquinas mais inteligentes e mais capazes de lidar com a complexidade da linguagem humana, que é cheia de sutilezas e camadas de significado.

Ao adotar essas novas abordagens, podemos abrir caminho pra sistemas mais avançados e inteligentes que podem nos ajudar em várias tarefas. A jornada continua, e a cada passo, trazemos a inteligência artificial mais perto de entender e auxiliar na rica tapeçaria da comunicação humana.

Fonte original

Título: Chain-of-Instructions: Compositional Instruction Tuning on Large Language Models

Resumo: Fine-tuning large language models (LLMs) with a collection of large and diverse instructions has improved the model's generalization to different tasks, even for unseen tasks. However, most existing instruction datasets include only single instructions, and they struggle to follow complex instructions composed of multiple subtasks. In this work, we propose a novel concept of compositional instructions called chain-of-instructions (CoI), where the output of one instruction becomes an input for the next like a chain. Unlike the conventional practice of solving single instruction tasks, our proposed method encourages a model to solve each subtask step by step until the final answer is reached. CoI-tuning (i.e., fine-tuning with CoI instructions) improves the model's ability to handle instructions composed of multiple subtasks as well as unseen composite tasks such as multilingual summarization. Overall, our study find that simple CoI tuning of existing instruction data can provide consistent generalization to solve more complex, unseen, and longer chains of instructions.

Autores: Shirley Anugrah Hayati, Taehee Jung, Tristan Bodding-Long, Sudipta Kar, Abhinav Sethy, Joo-Kyung Kim, Dongyeop Kang

Última atualização: 2024-06-24 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2402.11532

Fonte PDF: https://arxiv.org/pdf/2402.11532

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes