Equilibrando Perspectiva Humana e Aprendizado de Máquina na Construção de Taxonomia
Um olhar sobre como ML e a contribuição humana moldam taxonomias eficazes.
― 6 min ler
Índice
- O Papel do Aprendizado de Máquina na Construção de Taxonomias
- Abordagem Centrada no Humano
- Desafios na Construção de Taxonomias
- Caso de Uso I: Perguntas Coletadas pela Multidão
- Caso de Uso II: Dados Abertos do Governo
- Abordagem Proposta para Construção de Taxonomias
- Sistemas de Visualização de Embedding
- Conceito de Fluxo de Interação
- Interfaces Distintas para Diferentes Grupos de Usuários
- Importância da Interação do Usuário
- Limitações e Direções Futuras
- Conclusão
- Fonte original
- Ligações de referência
Construir Taxonomias é sobre organizar e classificar informações. Isso é importante em várias áreas onde os Dados precisam ser estruturados pra fazer sentido, ainda mais agora que temos cada vez mais informações disponíveis. Nesta conversa, vamos ver como o Aprendizado de Máquina (ML) pode ajudar a criar taxonomias, mas também destacar a necessidade de envolvimento humano nesse processo.
O Papel do Aprendizado de Máquina na Construção de Taxonomias
O aprendizado de máquina consegue lidar com grandes volumes de dados, o que é útil pra tarefas de Classificação. Mas, se a gente depender totalmente dos sistemas de ML sem a participação humana, podemos perder insights valiosos que só os humanos conseguem oferecer. Por isso, sugerimos um método onde as pessoas podem interagir com os resultados do ML, ajudando a melhorar sua compreensão e tomada de decisão.
Abordagem Centrada no Humano
Os humanos têm um papel vital na classificação de dados. As taxonomias ajudam a organizar diferentes tipos de informação de forma sistemática. Cada esquema de classificação precisa atender a padrões específicos relacionados à área em questão. Com o aumento na quantidade e variedade de dados, contar só com o esforço humano não dá. Então, o ML pode ajudar a processar os dados de forma eficiente.
Desafios na Construção de Taxonomias
Dois desafios principais aparecem ao trabalhar com classificação de dados. Primeiro, os dados podem vir de fontes que estão sempre mudando e podem não se encaixar em uma estrutura específica. Isso significa que as categorias podem não ser claras até que padrões apareçam com o tempo. Segundo, mesmo quando há um sistema de classificação estabelecido, a entrada de dados pode não sempre se alinhar a ele, levando a inconsistências.
Caso de Uso I: Perguntas Coletadas pela Multidão
Um exemplo pra ilustrar essas ideias é um projeto onde cidadãos enviam perguntas pra guiar uma agenda de pesquisa. Os gerentes do projeto precisavam de uma forma de organizar essas perguntas em uma taxonomia. O objetivo era dar uma visão geral do que os cidadãos estavam perguntando e ajudar no processo de envio de suas consultas. As perguntas variavam em linguagem e conteúdo, então uma nova taxonomia teve que ser criada com base nas submissões reais ao invés de forçá-las em categorias acadêmicas existentes.
Caso de Uso II: Dados Abertos do Governo
Outro exemplo envolve dados abertos do governo, que promovem transparência das administrações em todo o mundo. Várias organizações criaram padrões pra categorizar esses conjuntos de dados, mas muitas vezes, os dados reais não seguem essas diretrizes. Isso leva a uma mistura de informações. O objetivo era combinar descritores existentes de diferentes conjuntos de dados pra criar uma taxonomia mais coerente que se alinhasse com os padrões estabelecidos.
Abordagem Proposta para Construção de Taxonomias
Pra construir e usar uma taxonomia de forma eficaz, é preciso identificar semelhanças entre os itens. Em ambos os casos de uso, o foco estava em itens baseados em texto. Ferramentas que analisam texto podem ajudar a encontrar similaridades entre diferentes entradas. Embora existam modelos genéricos que podem lidar com várias tarefas, eles vêm com um nível de incerteza em seus resultados. Pra evitar depender totalmente desses processos automatizados, nossa abordagem incentiva os usuários humanos a interagir ativamente com as sugestões do sistema.
Sistemas de Visualização de Embedding
Os sistemas de visualização de embedding ajudam os usuários a ver as relações entre os itens de dados e assistem na organização das informações de forma melhor. Aplicações comuns como motores de busca costumam esconder esses processos subjacentes, dificultando a visualização de como os dados são classificados. Em contraste, nossa abordagem torna as representações visuais dos dados parte da interface. Os usuários podem interagir com esses visuais pra refinar e estruturar suas classificações.
Conceito de Fluxo de Interação
O processo de organizar taxonomias envolve várias etapas. Primeiro, os usuários são apresentados ao conjunto de dados geral. Eles podem escolher um ponto de partida, e o sistema sugerirá itens semelhantes com base na seleção deles. O usuário pode então decidir quais sugestões são candidatas adequadas para classificação. Esse processo pode ser repetido, permitindo uma melhoria contínua na taxonomia.
Interfaces Distintas para Diferentes Grupos de Usuários
Os designs de interface para os dois casos de uso variam de acordo com as necessidades dos usuários. Para os gerentes de projeto, uma versão simplificada permite que eles interajam facilmente sem serem sobrecarregados com muitas informações. Por outro lado, a interface para especialistas em dados abertos do governo oferece ferramentas avançadas pra ajudá-los a analisar vários modelos e visualizar suas descobertas.
Importância da Interação do Usuário
Incentivar a interação do usuário no sistema é essencial. Em vez de receber apenas um resultado do modelo, os usuários podem ver várias opções e entender como diferentes parâmetros influenciam os resultados. Essa capacidade de comparar saídas promove uma melhor compreensão da incerteza inerente ao aprendizado de máquina.
Limitações e Direções Futuras
Enquanto a abordagem discutida mostra potencial, há limitações. Mais testes através de estudos com usuários são necessários pra avaliar sua eficácia e entender como ela apoia as tarefas de classificação. O objetivo final é refinar os processos e possivelmente expandir esses métodos pra outros domínios, a fim de aumentar a conscientização sobre a natureza dinâmica da classificação de dados.
Conclusão
Em conclusão, construir taxonomias de forma eficaz requer um equilíbrio entre o conhecimento humano e as capacidades do aprendizado de máquina. Ao desenvolver sistemas onde os usuários possam interagir com as sugestões do modelo, podemos aprimorar o processo de classificação, garantindo que ele permaneça centrado no humano enquanto também aproveitamos o poder da tecnologia. À medida que reunimos mais dados, trabalhar em direção a uma organização clara e significativa se tornará cada vez mais crucial pra fazer sentido do cenário informativo em constante crescimento.
Título: To Classify is to Interpret: Building Taxonomies from Heterogeneous Data through Human-AI Collaboration
Resumo: Taxonomy building is a task that requires interpreting and classifying data within a given frame of reference, which comes to play in many areas of application that deal with knowledge and information organization. In this paper, we explore how taxonomy building can be supported with systems that integrate machine learning (ML). However, relying only on black-boxed ML-based systems to automate taxonomy building would sideline the users' expertise. We propose an approach that allows the user to iteratively take into account multiple model's outputs as part of their sensemaking process. We implemented our approach in two real-world use cases. The work is positioned in the context of HCI research that investigates the design of ML-based systems with an emphasis on enabling human-AI collaboration.
Autores: Sebastian Meier, Katrin Glinka
Última atualização: 2023-07-31 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2307.16481
Fonte PDF: https://arxiv.org/pdf/2307.16481
Licença: https://creativecommons.org/licenses/by-sa/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.