Estrutura de Correspondência Aprimorada para Soluções em Nuvem
Uma nova estrutura melhora a correspondência B2B para empresas de tecnologia em nuvem.
― 8 min ler
Índice
- Desafios na Combinação de Soluções B2B
- Características Complexas
- Dados Limitados
- Apresentando uma Nova Estrutura
- Estrutura de Combinação Hierárquica
- Estratégias de Aumento de Dados
- Configuração Experimental
- Medindo o Sucesso
- Resultados e Análise
- Resultados Offline
- Resultados Online
- Importância do Aumento de Dados
- Conclusão
- Fonte original
- Ligações de referência
As soluções em nuvem estão bombando na indústria de tecnologia hoje em dia. Elas oferecem ferramentas e serviços que ajudam as empresas a resolver problemas específicos, tipo gerenciar relacionamentos com clientes ou armazenar dados. Mas, muitas vezes, as empresas têm dificuldade em encontrar os clientes certos para suas soluções em nuvem. Isso acontece porque combinar uma solução com o cliente adequado é uma tarefa complicada. Muitos sistemas existentes não conseguem lidar bem com esse desafio, deixando as empresas em desvantagem.
Neste artigo, a gente mergulha mais fundo no problema de combinar soluções em nuvem com empresas que podem se beneficiar delas. A gente identifica dois desafios principais: a necessidade de modelar Características Complexas tanto das soluções quanto das empresas e a falta de dados de transação completos.
Desafios na Combinação de Soluções B2B
Características Complexas
O primeiro desafio é que tanto as soluções em nuvem quanto as empresas potenciais têm uma variedade de características diferentes. Essas características podem incluir descrições em texto, categorias e valores numéricos, o que dificulta uma combinação precisa. Por exemplo, uma solução pode ter múltiplos descritores que variam bastante, e cada empresa pode ter atributos únicos que também diferem significativamente umas das outras.
Modelar essas várias características pode ser complicado. É preciso entender como diferentes tipos de dados interagem enquanto se garante que o sistema consiga processar tudo sem problemas. A presença de vários formatos e tipos de dados pode criar interferências, o que complica ainda mais o processo de combinação.
Dados Limitados
O segundo desafio está relacionado aos dados disponíveis para fazer essas combinações. Muitas vezes, os dados de transação que as empresas têm são limitados, incompletos ou escassos. Muitas empresas podem não ter registrado todas as compras bem-sucedidas ou podem ter informações faltando sobre suas soluções ou detalhes dos clientes.
Essa limitação leva a uma situação onde os dados disponíveis não fornecem um panorama completo necessário para tomar decisões informadas. Além disso, as empresas podem perder clientes potenciais que são, na verdade, muito semelhantes àqueles que já atendem devido a lacunas nos dados ou esforços de vendas ineficazes.
Apresentando uma Nova Estrutura
Para lidar com esses desafios, desenvolvemos uma nova estrutura projetada para melhorar o processo de combinação entre soluções em nuvem e clientes B2B. Nossa estrutura é baseada em duas partes importantes: uma estrutura de combinação hierárquica e Estratégias de Aumento de Dados.
Estrutura de Combinação Hierárquica
Nosso primeiro foco é criar uma estrutura de combinação hierárquica de múltiplos campos. Essa estrutura serve como a espinha dorsal da nossa framework. O segredo é lidar com os diferentes tipos de características de forma eficaz, separando-as em categorias diferentes. Por exemplo, podemos dividir os campos de texto em dois grupos: descrições gerais e atributos específicos. Aplicando técnicas de codificação separadas, conseguimos garantir que cada tipo de dado textual seja processado adequadamente.
Além das características textuais, incluímos métodos para codificar dados numéricos e categóricos. Considerando várias interações entre as características em um nível mais alto, conseguimos modelar suas dependências e capturar melhor como elas se relacionam em termos de pontuações de correspondência.
Estratégias de Aumento de Dados
Para enfrentar a questão dos dados limitados e incompletos, também utilizamos várias estratégias de aumento de dados. Essas estratégias ajudam a gerar novos pares de soluções e empresas, permitindo que a gente expanda o conjunto de dados disponível e melhore o processo de aprendizado do sistema.
Empregamos técnicas como mascaramento de tokens e campos, onde certas partes do texto são escondidas e depois reconstruídas, além de estratégias de substituição de empresas para introduzir mais variabilidade no conjunto de dados. Assim, conseguimos garantir que o sistema aprenda a identificar pares semelhantes, mesmo quando os exemplos originais podem não representá-los totalmente.
Configuração Experimental
Para testar a eficácia da nossa framework proposta, usamos um conjunto de dados do mundo real especificamente construído para a combinação de soluções B2B. Esse conjunto de dados consiste em três partes principais: dados de soluções, dados de empresas e dados de transação.
Os dados de soluções incluem descrições de várias soluções; os dados das empresas incluem perfis detalhados de potenciais clientes; e os dados de transação fornecem insights sobre quais empresas compraram quais soluções. Separando o conjunto de dados em segmentos de treinamento, validação e teste, conseguimos construir e avaliar nosso modelo de combinação de forma eficaz.
Medindo o Sucesso
Medimos o sucesso da nossa estrutura usando várias métricas. Durante as avaliações offline, olhamos para medidas de precisão como Média de Precisão Média (MAP) e Área Sob a Curva (AUC). Essas métricas nos dão uma visão de como o modelo está se saindo com base em dados históricos.
Para avaliações online, analisamos a Taxa de Conversão (CVR), que indica o número de empresas que realmente tomaram uma ação com base nas soluções sugeridas. Essa é uma medida real de quão eficaz nossa combinação realmente é quando aplicada a esforços de vendas ao vivo.
Resultados e Análise
Os resultados dos nossos experimentos mostram que nosso sistema proposto supera significativamente os modelos de referência existentes. Em particular, descobrimos que nossa abordagem hierárquica e as inovadoras estratégias de aumento de dados melhoram o processo geral de combinação.
Resultados Offline
Em ambientes offline, nosso modelo demonstrou um desempenho melhor em comparação com modelos tradicionais de combinação de texto. A inclusão de diferentes tipos de interações entre características levou a um aumento na precisão da combinação. Especificamente, separar características textuais em categorias distintas e modelar interações em um nível mais alto melhorou a eficácia geral das pontuações de combinação.
Resultados Online
Quando implantado em um sistema ao vivo, nossa framework também mostrou resultados impressionantes. Comparamos seu desempenho com modelos anteriores e observamos que nosso modelo melhorou as taxas de conversão em quase 30%. Essa métrica significa que não só nosso modelo se destaca em ambientes controlados, mas também traduz suas forças em cenários de vendas do mundo real.
Importância do Aumento de Dados
Um aspecto importante da nossa abordagem é o uso de várias técnicas de aumento de dados. Essas estratégias ajudam a gerar pontos de dados adicionais que tornam nosso sistema mais robusto.
Mascaramento de Tokens: Isso envolve esconder certos tokens dentro das sequências, ensinando o modelo a depender menos de palavras específicas e mais do contexto geral. Isso ajuda a melhorar o aprendizado de representação, especialmente quando os dados são escassos.
Mascaramento de Campos: Similar ao mascaramento de tokens, essa técnica oculta campos inteiros de dados em vez de apenas tokens individuais. Isso ajuda o modelo a aprender a generalizar melhor a partir de dados incompletos.
Substituição de Empresas: Ao substituir empresas em pares correspondentes por empresas semelhantes, conseguimos maximizar a utilidade dos dados existentes. Esse método nos permite criar variações que representam diferentes combinações potenciais sem exigir nova coleta de dados.
Conclusão
Em resumo, desenvolvemos uma estrutura abrangente para lidar com o problema de combinação de soluções B2B no espaço de tecnologia em nuvem. Reconhecendo os desafios inerentes nessa área, como a complexidade das características e as limitações nos dados de transação, criamos uma abordagem estruturada que melhora os processos existentes.
Nossa framework não só serve para modelar a natureza multifacetada das soluções em nuvem e dos potenciais clientes, mas também utiliza estratégias criativas para superar as limitações dos dados. Testes empíricos extensivos indicam que nossa abordagem gera um forte desempenho tanto em avaliações offline quanto online, provando sua aplicabilidade em cenários do mundo real.
Essa nova estrutura apresenta oportunidades significativas para empresas que buscam melhorar a forma como identificam e se relacionam com clientes potenciais. Ao oferecer um método sistemático para combinar soluções em nuvem com empresas adequadas, esse trabalho agrega um valor considerável à indústria de tecnologia enquanto aborda desafios antigos no campo. Empresas que estão a fim de otimizar suas estratégias de vendas em ambientes B2B podem aproveitar os insights apresentados nesta pesquisa para aprimorar seus esforços.
Título: Enhancing Multi-field B2B Cloud Solution Matching via Contrastive Pre-training
Resumo: Cloud solutions have gained significant popularity in the technology industry as they offer a combination of services and tools to tackle specific problems. However, despite their widespread use, the task of identifying appropriate company customers for a specific target solution to the sales team of a solution provider remains a complex business problem that existing matching systems have yet to adequately address. In this work, we study the B2B solution matching problem and identify two main challenges of this scenario: (1) the modeling of complex multi-field features and (2) the limited, incomplete, and sparse transaction data. To tackle these challenges, we propose a framework CAMA, which is built with a hierarchical multi-field matching structure as its backbone and supplemented by three data augmentation strategies and a contrastive pre-training objective to compensate for the imperfections in the available data. Through extensive experiments on a real-world dataset, we demonstrate that CAMA outperforms several strong baseline matching models significantly. Furthermore, we have deployed our matching framework on a system of Huawei Cloud. Our observations indicate an improvement of about 30% compared to the previous online model in terms of Conversion Rate (CVR), which demonstrates its great business value.
Autores: Haonan Chen, Zhicheng Dou, Xuetong Hao, Yunhao Tao, Shiren Song, Zhenli Sheng
Última atualização: 2024-06-06 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2402.07076
Fonte PDF: https://arxiv.org/pdf/2402.07076
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.