Simple Science

Ciência de ponta explicada de forma simples

# Física# Física de Altas Energias - Experiência# Instrumentação e Detectores

Melhorias no Sistema de Leitura do ATLAS

A atualização do sistema de leitura melhora o manuseio de dados para o experimento ATLAS.

― 7 min ler


Sistema de Leitura ATLASSistema de Leitura ATLASAprimoradocapacidades de manipulação de dados.Sistema atualizado melhora as
Índice

O Sistema de Leitura (ROS) é uma parte importante do Experimento ATLAS no Grande Colisor de Hádrons do CERN (LHC). Ele coleta e gerencia dados de vários sistemas de detectores. O ROS recebe dados de todas as partes do experimento e os envia para outro sistema chamado Gatilho de Alto Nível (HLT). Esse processo acontece por uma rede de alta velocidade. Durante certas execuções do LHC, o ROS foi completamente atualizado para enfrentar novos desafios esperados de 2015 a 2025.

A estrutura do ROS inclui cerca de cem servidores compactos que rodam no Linux. Esses servidores têm placas especiais e conexões de rede para lidar com o fluxo de dados de forma eficiente. Este documento vai explicar os requisitos para as Execuções 2 e 3 do LHC, descrever as escolhas de design feitas para o ROS, compartilhar resultados de desempenho e discutir como a tecnologia do ROS foi usada em outras áreas dentro do ATLAS.

Conceitos e Sistemas de Aquisição de Dados

O detector ATLAS foi projetado para pesquisar vários processos físicos gerados por colisões de prótons ou íons. Para encontrar eventos físicos raros, o ATLAS usa sistemas eletrônicos rápidos e software inteligente para filtrar dados interessantes para uma análise mais aprofundada. Para isso, o ATLAS precisa registrar e analisar um grande número de colisões de partículas. O LHC produz essas colisões a cada 25 nanosegundos, o que pode levar a muitas interações ao mesmo tempo. O sistema ATLAS é responsável por coletar e examinar dados dessas colisões.

Na Execução 1 do LHC, que durou de 2010 a 2012, o Sistema de Aquisição de Dados funcionou bem. No entanto, as atualizações durante a parada experimental entre 2013 e 2014 tornaram necessário redesenhar partes do sistema. Essas mudanças visavam lidar com processos de dados mais complexos e atender a novas exigências baseadas em experiências anteriores. As atualizações tornaram o sistema mais capaz de lidar com as taxas de dados mais altas esperadas nas Execuções 2 e 3.

Este documento vai detalhar o redesenho do Sistema de Leitura durante a parada de 2013-2014 e como ele funcionou com sucesso na Execução 2 de 2015 a 2018. O sistema continua sendo uma parte essencial da coleta de dados do ATLAS na Execução 3 de 2022 a 2025.

Visão Geral do Sistema de Leitura

O ROS funciona coletando dados de diferentes subdetectores dentro do sistema ATLAS. Cada servidor neste sistema se comunica com hardware especial para transferir dados rapidamente. Quando os dados chegam, eles são processados primeiro por um sistema de gatilho de hardware. Essa fase inicial determina se os dados são interessantes o suficiente para serem mantidos para análise posterior. Se um evento é aceito, mais informações detalhadas são coletadas e enviadas para processamento adicional pelo HLT. Esta fase do HLT trabalha em uma grande fazenda de computadores, processando os dados de forma mais detalhada e tomando mais decisões sobre quais dados vale a pena manter.

Na Execução 1, o sistema HLT usou dois grupos separados de servidores para lidar com dados. A nova abordagem nas Execuções 2 e 3 combinou essas duas operações para tornar o sistema mais eficiente e menos repetitivo. As atualizações no ROS tornaram possível simplificar o processo de coleta de dados.

Atualizando o Sistema de Leitura

Os principais motivos por trás da atualização do Sistema de Leitura foram os avanços em tecnologia e a necessidade de aumentar a capacidade de processamento de dados. O LHC precisava suportar energias de colisão mais altas e mais partículas a partir de 2013. No início da Execução 2, esperava-se que o LHC produzisse mais dados do que na primeira execução. Portanto, o ATLAS teve que melhorar seu sistema para acompanhar essas demandas.

Para atender a esses novos requisitos, foi decidido que o ROS original precisaria de uma atualização completa em vez de apenas adicionar mais hardware. O sistema antigo foi construído de uma maneira que limitava sua capacidade de processar dados nas taxas necessárias. Além disso, muitos componentes dentro do Sistema de Leitura original já não estavam disponíveis ou estavam se tornando obsoletos. O novo design precisava resolver essas questões enquanto era mais compacto para permitir futuras expansões.

Principais Recursos do ROS Atualizado

O ROS atualizado mantém o papel fundamental de seu predecessor, mas integra novas tecnologias para reduzir gargalos conhecidos. Uma mudança chave envolveu melhorar a gestão da Transferência de Dados sobre as conexões utilizadas. Este design permite melhor desempenho usando o que há de mais moderno em tecnologia de processamento de computador.

O novo Sistema de Leitura inclui a placa RobinNP, que é baseada em hardware desenvolvido pela Colaboração ALICE. Essa nova placa permite uma maior densidade de links e capacidade de memória, melhorando as taxas de transferência de dados. O firmware e software atualizados também levam a uma gestão de dados mais suave, permitindo um processamento rápido dos dados recebidos sem sobrecarregar o sistema.

Resultados dos Testes de Desempenho

Os testes em laboratório desempenharam um papel crucial na compreensão das capacidades do ROS atualizado. Era importante determinar as taxas máximas nas quais os dados poderiam ser transferidos e processados. Esses testes mostraram que o novo Sistema de Leitura poderia lidar com taxas muito mais altas do que o esperado inicialmente.

Durante as operações do ATLAS, dados reais foram coletados que validaram ainda mais o desempenho do sistema atualizado. O ROS atendeu e até mesmo superou as expectativas definidas para as taxas de manuseio de dados, mostrando que poderia gerenciar grandes volumes de dados em tempo real. Essa flexibilidade permitiu a aplicação de um número maior de algoritmos sofisticados de análise de dados, melhorando a capacidade de pesquisa geral do ATLAS.

Desafios e Limitações

Apesar das melhorias, vários desafios em relação às taxas de processamento de dados surgiram durante a Execução 2. Esses problemas surgiram principalmente da complexidade dos algoritmos usados no HLT e das altas exigências do ambiente de colisão. Alguns detectores produziram dados em taxas que sobrecarregaram as capacidades do Sistema de Leitura, particularmente durante períodos de altas colisões de partículas.

No final da Execução 2, várias alterações foram feitas para aliviar alguns desses fardos. Essas alterações incluíram modificar algoritmos de gatilho e refinar as formas como os dados eram solicitados ao ROS. No entanto, alguns limites de desempenho foram alcançados, indicando que uma nova estratégia seria necessária para a Execução 3 a fim de otimizar ainda mais o desempenho.

O Caminho para as Preparações da Execução 3

Para a Execução 3, o plano era garantir que o Sistema de Leitura continuasse a operar de forma eficaz sem ser sobrecarregado pelos aumentos esperados nas cargas de dados. Mesmo reconhecendo os desafios de processamento de dados, o design das Execuções 2 e 3 garantiu que a tecnologia pudesse lidar com as demandas previstas de maneira eficiente.

Na preparação para a nova execução, muitos dos servidores anfitriões dentro do ROS foram substituídos por modelos mais novos com melhores métricas de desempenho. Essa atualização foi essencial para garantir a continuidade da confiabilidade e desempenho ao longo de todo o período da execução, assegurando que o sistema pudesse lidar com as taxas ainda mais altas esperadas para a Execução 3.

Conclusão e Perspectivas Futuras

O Sistema de Leitura atualizado demonstrou sua eficácia durante as Execuções 2 e 3, oferecendo capacidades confiáveis de manuseio de dados. Os avanços em tecnologia e design tornaram possível gerenciar volumes de dados maiores, melhorando significativamente a capacidade de pesquisa do ATLAS.

À medida que o experimento ATLAS avança para novas execuções, as lições aprendidas com as atualizações e a experiência operacional guiarão novas melhorias. O foco continuará sendo o aumento da eficiência, redução de gargalos e garantia de que o Sistema de Leitura atenda às necessidades em evolução da pesquisa em física de altas energias. A colaboração entre diferentes grupos experimentais, como o trabalho conjunto em recursos de hardware e software, estabelece uma base sólida para inovações contínuas na área.

Fonte original

Título: The ATLAS Readout System for LHC Runs 2 and 3

Resumo: The ReadOut System (ROS) is a central part of the data acquisition (DAQ) system of the ATLAS Experiment at the CERN Large Hadron Collider (LHC). The system is responsible for receiving and buffering event data from all detector subsystems and serving these to the High Level Trigger (HLT) system via a 10 GbE network, discarding or transporting data onward once the trigger has completed its selection process. The ATLAS ROS was completely replaced during the 2013-2014 experimental shutdown in order to meet the demanding conditions expected during LHC Run 2 and Run 3 (2015-2025). The ROS consists of roughly one hundred Linux-based 2U-high rack-mounted servers equipped with PCIe I/O cards and 10 GbE interfaces. This paper documents the system requirements for LHC Runs 2 and 3 and the design choices taken to meet them. The results of performance measurements and the re-use of ROS technology for the development of data sources, test platforms for other systems, and another ATLAS DAQ system component, namely the Region of Interest Builder (RoIB), are also discussed. Finally performance results for Run 2 operations are presented before looking at the upgrade for Run 3.

Autores: A. Borga, R. Blair, G. J. Crone, B. Green, A. Kugel, M. Joos, J. Love, J. G. Panduro Vazquez, J. Schumacher, P. Teixeira-Dias, L. Tremblet, W. Vandelli, J. C. Vermeulen, O. Rifki, P. Werner, F. J. Wickens

Última atualização: 2023-07-21 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2307.11557

Fonte PDF: https://arxiv.org/pdf/2307.11557

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes