Melhorando a Comunicação Entre Agentes de IA
Saiba como os agentes de IA podem trabalhar juntos usando APIs Universais.
― 5 min ler
Índice
- O que é IA Conversacional?
- A Necessidade de Interoperabilidade
- Apresentando APIs Universais
- O Processo de Descoberta
- Como os Agentes de IA se Comunicão
- Diagramas de Estado para Interação de IA
- Papéis dos Agentes de IA
- Casos de Uso que Ilustram a Comunicação de IA
- Direções Futuras para Comunicação de IA
- Conclusão
- Fonte original
- Ligações de referência
A IA Conversacional tá virando uma parte importante das nossas vidas. Muita empresa usa chatbots e assistentes de voz pra ajudar os clientes. Com mais de 200.000 chatbots e voicebots disponíveis, a necessidade deles se comunicarem de um jeito eficaz só aumenta. Este artigo fala sobre como diferentes agentes de IA podem trabalhar juntos usando um conjunto de regras e tecnologias comuns.
O que é IA Conversacional?
IA conversacional é a tecnologia que permite que máquinas entendam e respondam à linguagem humana. Inclui chatbots que conversam por texto e assistentes de voz que escutam e respondem verbalmente. Esses sistemas de IA facilitam pra galera conseguir respostas pras suas perguntas e completar tarefas.
A Necessidade de Interoperabilidade
Conforme o número de agentes de IA cresce, a complexidade de como eles interagem também aumenta. Pra chatbots e voicebots funcionarem bem juntos, eles precisam seguir os mesmos padrões de comunicação. Se não seguirem, pode causar confusão e demorar pra conseguir a ajuda certa. Isso destaca a necessidade de interoperabilidade, que significa que diferentes sistemas de IA podem trabalhar juntos tranquilamente.
Apresentando APIs Universais
Pra resolver esse desafio, surgiu uma nova abordagem chamada APIs Universais. Essas APIs permitem que diferentes agentes de IA conversacionais se comuniquem entre si, independentemente da tecnologia específica que usam. Isso quer dizer que um chatbot pode falar com um assistente de voz sem problemas, tornando as interações mais suaves pros usuários.
O Processo de Descoberta
Um aspecto chave desse framework de comunicação é o processo de Descoberta. Esse processo permite que os agentes de IA se encontrem e entendam quais serviços estão disponíveis. Por exemplo, se um agente de IA precisar de ajuda com uma tarefa, ele pode procurar outros agentes que possam ajudar naquela tarefa específica.
Como os Agentes de IA se Comunicão
Nesse framework de comunicação, as mensagens são enviadas entre os agentes usando algo chamado Envelope de Conversa. Esse envelope contém todas as informações necessárias pra realizar uma tarefa. Os principais tipos de mensagens incluem:
- Utterance: O que um agente diz ou pergunta.
- Whisper: Uma mensagem privada enviada entre agentes que não é compartilhada com o usuário.
- Invite: Um agente pode convidar outro agente pra entrar numa conversa.
- Bye: Uma forma de encerrar uma conversa.
Esses diferentes tipos de mensagem permitem que os agentes se comuniquem claramente e funcionem de forma eficaz.
Diagramas de Estado para Interação de IA
Pra entender melhor como os agentes de IA interagem, podem ser usados diagramas de estado. Esses diagramas representam visualmente os diferentes estados que um agente pode estar durante uma conversa. Eles mostram como os agentes mudam de estado com base em diferentes inputs, ajudando a mapear como a comunicação flui entre eles.
Papéis dos Agentes de IA
Nesse sistema, existem dois papéis principais para os agentes de IA:
- Agente Servidor: Esse agente fornece informações ou assistência. Ele responde a pedidos e resolve dúvidas dos usuários.
- Agente Demandante: Esse agente inicia pedidos. Ele busca ajuda ou informação de outros agentes.
Ambos os tipos de agentes podem trocar de papéis dependendo da situação. Por exemplo, um agente que é um Agente Servidor em um momento pode agir como um Agente Demandante em outro.
Casos de Uso que Ilustram a Comunicação de IA
Dois casos de uso podem ajudar a esclarecer como esse framework de comunicação funciona em cenários da vida real.
Caso de Uso de Tarefas Inteligentes
No primeiro cenário, um humano chamado Emmett quer completar algumas tarefas. Ele tem pedidos pra diversos serviços, como pedir flores e checar um pacote. Sua assistente de IA, Cassandra, se comunica com outros agentes de IA especializados pra lidar com cada tarefa de forma eficiente.
Cada assistente em diferentes pontos de serviço, como a floricultura e os correios, trabalha junto pra atender aos pedidos do Emmett sem que ele precise entrar em contato com cada um separadamente.
Caso de Uso de Biblioteca Inteligente
Em outro cenário, uma humana chamada Lea precisa de ajuda com sua pesquisa literária. Ela pede informações sobre um autor específico. Uma assistente de IA geral encontra uma assistente mais especializada pra coletar essas informações pra ela. A interação entre as assistentes demonstra como elas podem colaborar de forma tranquila pra fornecer respostas precisas e úteis ao usuário.
Direções Futuras para Comunicação de IA
Embora o framework de comunicação atual suporte muitas interações, ainda há áreas pra melhorar. Desenvolvimentos futuros podem incluir:
- Suportar comunicação multimodal, permitindo interações por texto, voz e vídeo.
- Permitir que os agentes compartilhem contexto de fundo e histórico de conversas.
- Melhorar medidas de segurança pra proteger informações sensíveis que estão sendo compartilhadas.
- Estabelecer diretrizes claras para interações éticas entre os agentes de IA.
Conclusão
O aumento do uso de IA conversacional destaca a necessidade de diferentes sistemas se comunicarem de forma eficaz. Usando APIs Universais e um framework de comunicação estruturado, os agentes de IA podem trabalhar juntos pra fornecer um serviço e suporte melhores pros usuários. À medida que a tecnologia continua avançando, esses sistemas vão se integrar ainda mais ao dia a dia, melhorando a forma como interagimos com máquinas.
Título: Conversational AI Multi-Agent Interoperability, Universal Open APIs for Agentic Natural Language Multimodal Communications
Resumo: This paper analyses Conversational AI multi-agent interoperability frameworks and describes the novel architecture proposed by the Open Voice Interoperability initiative (Linux Foundation AI and DATA), also known briefly as OVON (Open Voice Network). The new approach is illustrated, along with the main components, delineating the key benefits and use cases for deploying standard multi-modal AI agency (or agentic AI) communications. Beginning with Universal APIs based on Natural Language, the framework establishes and enables interoperable interactions among diverse Conversational AI agents, including chatbots, voicebots, videobots, and human agents. Furthermore, a new Discovery specification framework is introduced, designed to efficiently look up agents providing specific services and to obtain accurate information about these services through a standard Manifest publication, accessible via an extended set of Natural Language-based APIs. The main purpose of this contribution is to significantly enhance the capabilities and scalability of AI interactions across various platforms. The novel architecture for interoperable Conversational AI assistants is designed to generalize, being replicable and accessible via open repositories.
Autores: Diego Gosmar, Deborah A. Dahl, Emmett Coin
Última atualização: 2024-07-28 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2407.19438
Fonte PDF: https://arxiv.org/pdf/2407.19438
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.
Ligações de referência
- https://orcid.org/0009-0008-7513-1255
- https://orcid.org/0000-0002-3389-2784
- https://orcid.org/0009-0001-3770-4963
- https://smartlibrary1.ee
- https://nationalLibraryArchive1.org
- https://estonianlibrary2.org
- https://smartlibrary1.ee/smartlibrary
- https://chatbottle.co/
- https://www.tidio.com/blog/chatbot-statistics/
- https://plato.stanford.edu/archives/fall2015/entries/agency/
- https://doi.org/10.1007/s43681-024-00463-0
- https://cyberprotection-magazine.com/the-web-layers-introduction-to-surface-deep-and-darknet
- https://github.com/open-voice-interoperability/docs/blob/main/specifications/ConversationEnvelope/0.9.2/InteroperableConvEnvSpec.md
- https://www.w3.org/TR/mmi-arch/
- https://communicator.sourceforge.io/
- https://microsoft.github.io/autogen/
- https://docs.all-hands.dev/modules/usage/intro
- https://www.w3.org/TR/voicexml21/
- https://doi.org/10.1023/A:1010091302035
- https://dx.doi.org/10.21437/ICSLP.2002-133
- https://github.com/open-voice-interoperability/docs/tree/main/specifications
- https://github.com/open-voice-interoperability/docs/tree/main/specifications/DialogEvents
- https://github.com/open-voice-interoperability/docs/blob/main/specifications/AssistantManifest/0.9.0/AssistantManifestSpec.md
- https://github.com/open-voice-interoperability/docs/blob/main/specifications/ConversationEnvelope/0.9.2/InteroperableConvEnvSpec.md#115-invite-event
- https://github.com/open-voice-interoperability/docs/blob/main/specifications/ConversationEnvelope/0.9.2/InteroperableConvEnvSpec.md#-110-utterance-events
- https://github.com/open-voice-interoperability/docs/blob/main/specifications/ConversationEnvelope/0.9.2/InteroperableConvEnvSpec.md#114-bye-event
- https://github.com/open-voice-interoperability/docs/blob/main/specifications/ConversationEnvelope/0.9.2/InteroperableConvEnvSpec.md#116-requestmanifest-event-1
- https://github.com/open-voice-interoperability/docs/blob/main/specifications/ConversationEnvelope/0.9.2/InteroperableConvEnvSpec.md#117-publishmanifest-event-1
- https://github.com/open-voice-interoperability/docs/blob/main/specifications/ConversationEnvelope/0.9.2/InteroperableConvEnvSpec.md#118-findassistant-event-1
- https://github.com/open-voice-interoperability/docs/blob/main/specifications/ConversationEnvelope/0.9.2/InteroperableConvEnvSpec.md#119-proposeassistant-event-1
- https://openvoicenetwork.org/trustmark-initiative/
- https://github.com/open-voice-interoperability/open-voice-sandbox
- https://www.ria.ee/en/state-information-system/personal-services/burokratt
- https://openvoicenetwork.org/interoperability-initiative
- https://github.com/open-voice-interoperability/docs/tree/main/schemas/conversation-envelope/0.9.2/conversation-envelope-schema.json
- https://example.com/message-from
- https://example.com/reply-message-to
- https://openvoicenetwork.org/schema/dialog-envelope.json
- https://organization_url_from
- https://organization_url_to
- https://your-smartlibrary-url-here
- https://someBot.com
- https://your-smartlibrary-url-here/smartlibrary