Simple Science

Ciência de ponta explicada de forma simples

Ciência de ponta explicada de forma simples

# Informática # Engenharia de software

Um Novo Quadro para Completação de Código

Apresentando uma abordagem inovadora pra melhorar as ferramentas de preenchimento automático de código.

2025-08-11T09:37:24+00:00 ― 1 min ler

Índice

Fonte original
Ligações de referência

A conclusão é que a nossa nova estrutura para completar código representa um grande avanço em lidar com as complexidades do desenvolvimento de software. Ao usar Engenharia de Prompts e um algoritmo de bandido com múltiplas armas, oferecemos uma solução flexível e eficiente que traz melhorias substanciais em relação às técnicas existentes.

O trabalho futuro vai incluir o refino ainda maior dos prompts e a experimentação com diferentes maneiras de combinar as perspectivas de recuperação. À medida que o campo da Conclusão de Código continua a evoluir, a pesquisa contínua vai se concentrar em alcançar uma integração ainda melhor com as ferramentas de desenvolvimento e aprimorar a adaptabilidade da nossa estrutura a diferentes linguagens de programação e ambientes.

No geral, acreditamos que nossa abordagem tem um grande potencial para melhorar a produtividade dos desenvolvedores e aumentar a qualidade dos sistemas de software. Ao enfrentar os desafios inerentes à compreensão e conclusão de código, nossa estrutura está pronta para causar um impacto duradouro no mundo da programação.

Título: Prompt-based Code Completion via Multi-Retrieval Augmented Generation

Resumo: Automated code completion, aiming at generating subsequent tokens from unfinished code, has been significantly benefited from recent progress in pre-trained Large Language Models (LLMs). However, these models often suffer from coherence issues and hallucinations when dealing with complex code logic or extrapolating beyond their training data. Existing Retrieval Augmented Generation (RAG) techniques partially address these issues by retrieving relevant code with a separate encoding model where the retrieved snippet serves as contextual reference for code completion. However, their retrieval scope is subject to a singular perspective defined by the encoding model, which largely overlooks the complexity and diversity inherent in code semantics. To address this limitation, we propose ProCC, a code completion framework leveraging prompt engineering and the contextual multi-armed bandits algorithm to flexibly incorporate and adapt to multiple perspectives of code. ProCC first employs a prompt-based multi-retriever system which crafts prompt templates to elicit LLM knowledge to understand code semantics with multiple retrieval perspectives. Then, it adopts the adaptive retrieval selection algorithm to incorporate code similarity into the decision-making process to determine the most suitable retrieval perspective for the LLM to complete the code. Experimental results demonstrate that ProCC outperforms state-of-the-art code completion technique by 8.6% on our collected open-source benchmark suite and 10.1% on the private-domain benchmark suite collected from a billion-user e-commerce company in terms of Exact Match. ProCC also allows augmenting fine-tuned techniques in a plug-and-play manner, yielding 5.6% improvement over our studied fine-tuned model.

Autores: Hanzhuo Tan, Qi Luo, Ling Jiang, Zizheng Zhan, Jing Li, Haotian Zhang, Yuqun Zhang

Última atualização: 2024-05-13 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2405.07530

Fonte PDF: https://arxiv.org/pdf/2405.07530

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Ligações de referência

Tópicos referenciados

Mais de autores

Recuperação de informação Mudando o Foco: Ranking Centrado no Usuário nas Recomendações

Uma nova abordagem para melhorar as recomendações de conteúdo priorizando as interações dos usuários.

2025-11-11T00:43:12+00:00 ― 6 min ler

Computação e linguagem Aprimorando Conexões nas Redes Sociais com Apresentações Pessoais

Usando IA pra criar autoapresentações legais a partir da atividade nas redes sociais.

2025-11-10T20:46:12+00:00 ― 6 min ler

Física à mesoescala e à nanoescala Os Efeitos da Polarização Eletrônica na Espectroscopia de Nível de Núcleo

Este artigo fala sobre como a polarização eletrônica influencia a espectroscopia de nível de núcleo em gases nobres.

2025-10-22T08:02:15+00:00 ― 7 min ler

Ciência dos materiais Avanços em Aprendizado de Máquina na Medição de Condutividade Térmica

Esse artigo explora o papel do aprendizado de máquina na compreensão da condutividade térmica.

2025-10-16T22:38:36+00:00 ― 7 min ler

Física à mesoescala e à nanoescala Avanços em Interações Spin-Órbita para Computação Quântica

Pesquisas destacam o papel das interações spin-órbita em melhorar os qubits.

2025-10-10T14:44:45+00:00 ― 7 min ler

Astrofísica terrestre e planetária Pedras arremessadas de Dimorphos após o impacto do DART

Cientistas estudam pedras lançadas de Dimorphos depois do impacto da nave DART.

2025-10-08T17:12:57+00:00 ― 8 min ler

Computação e linguagem Melhorando a NLU nas Redes Sociais com Hashtags

HICL melhora a compreensão de posts nas redes sociais usando hashtags e aprendizado em contexto.

2025-10-06T23:06:24+00:00 ― 6 min ler

Otimização e Controlo Avanços na Otimização Topológica Estrutural

Explorando técnicas modernas para distribuição eficiente de materiais no design de engenharia.

2025-09-26T02:13:27+00:00 ― 7 min ler

Artigos semelhantes

Computação e linguagem Melhorando a Tradução de Documentos Inteiros

Um novo método melhora a qualidade da tradução gerando exemplos de treino extras.

2025-11-19T04:14:42+00:00 ― 5 min ler

Aprendizagem de máquinas Otimizando Múltiplos Objetivos em Modelos de Aprendizado de Máquina

Um novo método melhora a otimização de hiperparâmetros através de abordagens multiobjetivo.

2025-11-19T04:06:48+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Avanços na pesquisa de ReID de texto para imagem

Um novo conjunto de dados melhora a precisão na correspondência de texto para imagem.

2025-11-19T03:58:54+00:00 ― 6 min ler

Física Aplicada Avanços em Computação Neuromórfica Usando Dispositivos SOT

Explorando computação neuromórfica com spintrônica pra uma inteligência de máquina eficiente.

2025-11-19T03:56:30+00:00 ― 7 min ler

Computação e linguagem Entendendo a Aprendizagem de Tokens em Modelos Seq2Seq

Analisando como os tokens aprendem em modelos seq2seq sob várias condições.

2025-11-19T03:51:00+00:00 ― 5 min ler

Linguagens de programação Apresentando o TyRE: Um Parser de Regex Mais Seguro

TyRE melhora a análise de regex com segurança de tipo e saída estruturada.

2025-11-19T03:43:06+00:00 ― 7 min ler

Computação e linguagem Avanços na Extração de Relações com Modelos de Linguagem

Pesquisas mostram como os modelos de linguagem são eficientes em extrair relações do texto.

2025-11-19T03:35:12+00:00 ― 9 min ler

Recuperação de informação Estimando o Viés de Posição na Publicidade Online

Uma nova abordagem melhora a estimativa de viés de posição usando embeddings de itens.

2025-11-19T03:27:18+00:00 ― 6 min ler