Avaliando o Desempenho do Modelo LFRic em Supercomputadores
Um olhar sobre como o LFRic se sai em diferentes supercomputadores para previsões do tempo.
J. Mark Bull, Andrew Coughtrie, Deva Deeptimahanti, Mark Hedley, Caoimhín Laoide-Kemp, Christopher Maynard, Harry Shepherd, Sebastiaan van de Bund, Michèle Weiland, Benjamin Went
― 6 min ler
Índice
- Visão Geral do Modelo LFRic
- Supercomputadores Utilizados
- Importância da Análise de Performance
- Componentes do Modelo
- Medidas de Performance
- Resultados no ARCHER2 e Setonix
- Tempo de Comunicação e Cálculo
- Ajustando a Performance de I/O
- Testes de Baixa e Alta Resolução
- Configurações e Oportunidades de Melhoria
- Direções Futuras
- Conclusão
- Fonte original
- Ligações de referência
Este artigo discute como o modelo de clima e meteorologia LFRic se sai em diferentes supercomputadores. O objetivo é ver como o modelo consegue lidar com grandes quantidades de trabalho e se consegue aproveitar os supercomputadores de forma eficaz.
Visão Geral do Modelo LFRic
O modelo LFRic foi feito especificamente para previsões de clima e meteorologia. Ele busca melhorar a precisão e eficiência dessas previsões enquanto usa recursos de computação de alto desempenho. O modelo consegue rodar em paralelo, o que significa que pode trabalhar em várias tarefas ao mesmo tempo, tornando tudo mais rápido.
Supercomputadores Utilizados
Neste estudo, olhamos para três supercomputadores diferentes. O primeiro é o ARCHER2, localizado na Universidade de Edimburgo. Ele tem muitos nós e usa potentes processadores AMD EPYC. O segundo supercomputador é o Setonix, que fica no Pawsey Supercomputing Research Centre na Austrália. Ele também tem processadores AMD EPYC. Por último, examinamos o Met Office Cray XC40, que usa processadores Intel Xeon.
Importância da Análise de Performance
Analisar como o modelo LFRic se comporta nesses supercomputadores é fundamental. Essas informações podem ajudar a melhorar modelos de clima e meteorologia e prepará-los para sistemas de supercomputação futuros. A performance e eficiência são especialmente importantes, pois podem fazer a diferença em como esses modelos preveem padrões climáticos e mudanças no clima.
Componentes do Modelo
O modelo LFRic consiste em várias partes principais. Um componente importante é o núcleo dinâmico, chamado GungHo. Essa parte do modelo se concentra em simular como o ar se move e se comporta na atmosfera. Ele trata diferentes direções de movimento separadamente, o que ajuda a gerenciar a comunicação entre várias áreas do modelo de forma eficiente.
O modelo também usa uma linguagem especializada para ajudar a escrever o código e tornar mais fácil gerenciar tarefas complexas. Essa linguagem permite uma melhor manipulação de tarefas em paralelo, o que é essencial para usar supercomputadores de forma eficaz.
Medidas de Performance
Fizemos vários testes para medir quão bem o LFRic se sai em diferentes supercomputadores e compiladores. Olhamos para dois tipos de escalonamento: Escalonamento Forte e Escalonamento Fraco.
Escalonamento Forte: Isso significa que examinamos como a performance do modelo muda conforme adicionamos mais nós computacionais. Idealmente, adicionar mais nós deve diminuir o tempo necessário para completar tarefas.
Escalonamento Fraco: Isso foca em como o modelo se sai quando o tamanho do problema aumenta à medida que mais nós são adicionados. Nesse caso, queremos ver se a performance permanece consistente.
Resultados no ARCHER2 e Setonix
Os testes mostraram que o modelo LFRic se sai bem tanto no escalonamento forte quanto no fraco no ARCHER2 e Setonix. No entanto, a performance foi melhor no Setonix, especialmente quando usaram menos threads. Isso indica que, embora ambos os sistemas consigam rodar o modelo de forma eficaz, algumas configurações funcionam melhor em certos supercomputadores.
Tempo de Comunicação e Cálculo
Outro aspecto importante da performance é quanto tempo é gasto na comunicação entre as diferentes partes do modelo em comparação com o tempo real de computação. As medidas mostraram que no ARCHER2 e Setonix, o tempo de comunicação geralmente permaneceu controlável. Porém, quanto mais threads eram usadas por tarefa, mais tempo o modelo precisava para comunicar os dados necessários entre os nós.
Ajustando a Performance de I/O
A performance de I/O (Entrada/Saída) é outro fator crítico para o modelo. O sistema precisa carregar e salvar grandes quantidades de dados de forma eficiente, o que é essencial já que modelos de clima geram uma quantidade enorme de informações.
O XIOS, o servidor de I/O usado pelo LFRic, ajuda a gerenciar os dados. Ele reduz o impacto de I/O no tempo total de performance permitindo que as tarefas de simulação rodem tranquilamente sem esperar pelos dados. Exploramos como mudar o número de servidores XIOS e seus tamanhos de buffer pode melhorar a performance. Os resultados mostraram que aumentar os tamanhos de buffer ajuda a reduzir significativamente os tempos de espera para o processamento de dados.
Testes de Baixa e Alta Resolução
Para entender melhor como a performance de I/O é afetada, fizemos testes em diferentes resoluções. Por exemplo, em um teste de baixa resolução, examinamos como o modelo lidava com uma configuração básica durante um tempo determinado. Esse teste mostrou que, enquanto o modelo gerava muitos dados, o tempo de espera para os buffers foi reduzido com melhores configurações. Os testes em alta resolução, que envolviam escrever ainda mais dados, também mostraram que o ajuste cuidadoso dos parâmetros do servidor levou a uma performance melhor.
Configurações e Oportunidades de Melhoria
As medições de performance e os esforços de ajuste revelaram várias oportunidades de melhoria. Embora usar mais processadores para lidar com os dados possa parecer eficaz, é essencial equilibrar a configuração. Simplesmente adicionar mais processadores pode não trazer os ganhos de performance desejados a menos que o sistema esteja otimizado desde o início.
Investigar como estruturar os dados e processos dentro do modelo pode levar a uma performance melhor. Por exemplo, ajustar como as tarefas são divididas e como elas se comunicam pode melhorar muito a eficiência do modelo.
Direções Futuras
Olhando para frente, há planos de continuar o trabalho de refinamento do modelo LFRic. Pesquisadores vão explorar a configuração tanto do modelo quanto do servidor de I/O para encontrar as melhores combinações para a performance. Testar novas configurações e, possivelmente, atualizar servidores deve ajudar a lidar com conjuntos de dados maiores de forma ainda mais eficaz.
Avaliações contínuas do modelo em arquiteturas de supercomputadores mais recentes também serão necessárias. Essas avaliações podem ajudar a identificar melhorias adicionais tanto na eficiência computacional do modelo quanto na performance de I/O.
Conclusão
Em resumo, o modelo de clima e meteorologia LFRic demonstrou uma performance respeitável em supercomputadores modernos. Embora o escalonamento forte e fraco tenham sido eficazes, ainda há áreas para melhoria, especialmente na performance de I/O e na configuração geral. Esforços contínuos no ajuste do modelo levarão a melhores capacidades de previsão e uso mais eficiente dos recursos computacionais. O trabalho feito até agora ajuda a preparar o LFRic para futuras aplicações e desafios em meteorologia e ciência climática.
Título: Performance and scaling of the LFRic weather and climate model on different generations of HPE Cray EX supercomputers
Resumo: This study presents scaling results and a performance analysis across different supercomputers and compilers for the Met Office weather and climate model, LFRic. The model is shown to scale to large numbers of nodes which meets the design criteria, that of exploitation of parallelism to achieve good scaling. The model is written in a Domain-Specific Language, embedded in modern Fortran and uses a Domain-Specific Compiler, PSyclone, to generate the parallel code. The performance analysis shows the effect of choice of algorithm, such as redundant computation and scaling with OpenMP threads. The analysis can be used to motivate a discussion of future work to improve the OpenMP performance of other parts of the code. Finally, an analysis of the performance tuning of the I/O server, XIOS is presented.
Autores: J. Mark Bull, Andrew Coughtrie, Deva Deeptimahanti, Mark Hedley, Caoimhín Laoide-Kemp, Christopher Maynard, Harry Shepherd, Sebastiaan van de Bund, Michèle Weiland, Benjamin Went
Última atualização: 2024-09-24 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2409.15859
Fonte PDF: https://arxiv.org/pdf/2409.15859
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.