Os Desafios da Previsão da Próxima Atividade
Analisando problemas em prever ações futuras em processos que estão rolando.
― 6 min ler
Índice
Previsão da próxima atividade é a tarefa de tentar adivinhar o que vai acontecer a seguir em processos que estão rolando. Muitos pesquisadores focam em usar técnicas avançadas de deep learning pra melhorar essas previsões, treinando modelos com logs de eventos disponíveis. Mas, tem uns problemas sérios na forma como esses modelos são avaliados, que levantam questões sobre a eficácia deles.
O Que É Previsão da Próxima Atividade?
Previsão da próxima atividade é prever o próximo passo em um procedimento com base em dados históricos. Por exemplo, em um processo de negócio, alguém pode querer prever qual ação será tomada a seguir, com base no que já aconteceu até agora. Esse processo vai além de simplesmente identificar atrasos ou outros problemas; ele busca prever resultados e obstáculos.
Tradicionalmente, os pesquisadores dependiam de modelos específicos de comportamento de processos. Hoje em dia, muitos focam em redes neurais, especialmente pra prever o próximo passo numa sequência de eventos. O jeito comum é pegar um log de eventos existente, dividir em um conjunto de treino e um de teste, e usar os dados de treino pra ajudar o modelo a aprender como fazer previsões.
Problemas com os Métodos Atuais
Um grande problema com os métodos atuais é que eles geralmente não avaliam de verdade como um modelo pode prever ações futuras em dados completamente novos. Muitos estudos usam o mesmo conjunto de logs de eventos tanto pra treino quanto pra avaliação, levando a resultados tendenciosos. Isso significa que os modelos não são testados de um jeito que mostre a efetividade deles no mundo real.
Ao revisar logs de eventos comuns, é notado que a próxima ação é principalmente determinada pelo que veio antes. Isso significa que muitas previsões simplesmente repetem o que o modelo já viu. As falhas nesses logs criam uma falsa sensação de Precisão.
Além disso, os pesquisadores descobriram que, pra certas previsões, pode haver várias opções válidas. Essa Ambiguidade de Rótulos pode dificultar saber quão bem um modelo realmente se sai, já que ele pode apenas prever o próximo passo mais comum em vez de conseguir se adaptar a diferentes cenários.
Treinamento e Teste com Logs de Eventos
Um log de eventos é só uma coleção de casos, cada um representado por uma sequência de eventos. Cada evento tem detalhes específicos, geralmente a ação realizada e um identificador pro caso que pertence. Também podem existir outros atributos, como um timestamp ou a pessoa que realizou a tarefa.
Pra previsão da próxima atividade, o modelo busca determinar qual ação vai rolar a seguir com base em parte da sequência de eventos. O modelo aprende com os dados de treino, usando ações passadas rotuladas como "próxima atividade" pra guiar suas previsões.
Os modelos são treinados com pares de "prefixos" (a sequência de eventos até agora) e as ações correspondentes a seguir. Os pesquisadores geralmente usam medidas de performance como precisão pra ver quão bem o modelo prevê em um conjunto que ele não viu durante o treino.
Questões de Avaliação
Quando estão avaliando os métodos de previsão da próxima atividade, os pesquisadores precisam ser cuidadosos. Um problema é a vazamento de exemplos, onde exemplos do conjunto de treino também aparecem no conjunto de teste. Isso leva a conclusões excessivamente otimistas sobre a performance de um modelo porque ele simplesmente lembra do que já viu.
Outro ponto significativo é que a eficácia das previsões da próxima atividade é fortemente influenciada pelas características específicas do log de eventos sendo usado. Em muitos casos, logs têm sequências similares de ações que levam a diferentes resultados, criando ambiguidade de rótulos.
A performance de um modelo de previsão é muitas vezes avaliada pela sua precisão, que é apenas a porcentagem de previsões corretas que ele fez. No entanto, se as previsões não estão trazendo novas percepções, então a avaliação pode não refletir de verdade quão bem o modelo poderia se sair em situações reais.
Generalização na Previsão da Próxima Atividade
A generalização é crucial em qualquer tarefa de modelagem preditiva. Em termos simples, refere-se a quão bem um modelo pode fazer previsões precisas em novos casos que não fazem parte dos dados de treinamento. Muitas abordagens atuais não testam corretamente a generalização no contexto da previsão da próxima atividade.
Pra melhorar o processo de avaliação, vários cenários de previsões baseados em diferentes tipos de generalização devem ser considerados. Por exemplo, um modelo deve ser capaz de prever corretamente mesmo quando encontra novas sequências de ações que nunca viu antes.
Cenários para Generalização
Ambiguidade de Rótulo: Um modelo pode enfrentar situações onde várias ações podem seguir após um determinado ponto. É essencial que o modelo aprenda que pode haver mais de uma ação válida mesmo que tenha treinado com dados onde só uma ação parece comum.
Fluxo de Controle Inédito: Um modelo pode precisar prever ações com base em sequências que não encontrou. É importante que o modelo generalize seu conhecimento pra lidar com novos padrões nos dados.
Valores de Contexto Não Vistos: O contexto em torno das ações, como quem as realizou ou quando aconteceram, pode impactar as previsões. Os modelos devem ser capazes de fazer previsões com base em valores conhecidos que podem se combinar de novas maneiras.
Novos Valores de Atributo: Às vezes, novas atividades ou recursos podem ser introduzidos depois que o modelo foi treinado. Nesses casos, o modelo deve ser capaz de indicar incerteza ou fazer palpites educados com base em dados similares passados.
Recomendações para Pesquisa Futura
Dada as dificuldades mencionadas, a pesquisa futura deve focar em criar métodos de avaliação robustos pra previsão da próxima atividade. Isso envolve avaliar quão bem os modelos podem generalizar em diferentes cenários.
Uma abordagem é criar logs de eventos sintéticos que simulem vários cenários de generalização. Isso ajudará a testar os modelos de forma mais eficaz e entender suas verdadeiras capacidades. Outra área de foco pode ser melhorar modelos pra reconhecer e lidar com ambiguidade de rótulos de forma mais eficaz.
No geral, enquanto já teve avanço em prever as próximas ações, ainda tem muito trabalho a ser feito pra garantir que os modelos sejam realmente eficazes e consigam se adaptar a novas situações. Um melhor entendimento da generalização nesse campo pode levar a melhorias em aplicações práticas em várias indústrias.
Título: A Discussion on Generalization in Next-Activity Prediction
Resumo: Next activity prediction aims to forecast the future behavior of running process instances. Recent publications in this field predominantly employ deep learning techniques and evaluate their prediction performance using publicly available event logs. This paper presents empirical evidence that calls into question the effectiveness of these current evaluation approaches. We show that there is an enormous amount of example leakage in all of the commonly used event logs, so that rather trivial prediction approaches perform almost as well as ones that leverage deep learning. We further argue that designing robust evaluations requires a more profound conceptual engagement with the topic of next-activity prediction, and specifically with the notion of generalization to new data. To this end, we present various prediction scenarios that necessitate different types of generalization to guide future research.
Autores: Luka Abb, Peter Pfeiffer, Peter Fettke, Jana-Rebecca Rehse
Última atualização: 2023-09-18 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2309.09618
Fonte PDF: https://arxiv.org/pdf/2309.09618
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.