Simple Science

Ciência de ponta explicada de forma simples

# Informática# Criptografia e segurança# Computação distribuída, paralela e em cluster

Tapis: Um Novo Sistema para Pesquisa Colaborativa

O Tapis permite um compartilhamento de dados seguro e eficiente entre pesquisadores em vários lugares.

― 7 min ler


Tapis Transforma aTapis Transforma aColaboração em Pesquisainovadoras.entre instituições impulsiona pesquisasO compartilhamento seguro de dados
Índice

Questões de pesquisa como mudanças climáticas e a busca por planetas que possam suportar vida costumam usar computadores e recursos espalhados por várias instituições. Isso significa que os pesquisadores não estão trabalhando em um só lugar; eles estão usando máquinas e Dados de múltiplas localizações. Para facilitar e deixar esse processo mais seguro, desenvolvemos um novo sistema que ajuda os pesquisadores a usar esses recursos enquanto mantém seus dados e segredos protegidos.

Nossa abordagem permite que os cientistas colaborem mesmo estando em lugares diferentes. Isso é especialmente importante quando a pesquisa exige muita potência de Computação. Às vezes, os pesquisadores precisam automatizar partes de suas análises para não ter que supervisionar tudo manualmente. Portanto, garantir que os processos automatizados sigam regras de Segurança é essencial quando os dados e recursos vêm de múltiplos locais.

Neste resumo, apresentamos uma estrutura amigável projetada para pesquisadores acessarem e compartilharem recursos em diferentes locais. Destacamos como nosso sistema funciona e compartilhamos exemplos de como ele ajudou em projetos de pesquisa reais.

O que é o Tapis?

Tapis é uma plataforma que ajuda os usuários a gerenciar dados e tarefas de computação. Pense assim: é uma ferramenta prática que permite aos pesquisadores armazenar e compartilhar seus dados e realizar cálculos complexos sem se preocupar com a tecnologia por trás disso. O Tapis controla o que acontece durante esses processos, facilitando para os pesquisadores repetirem suas análises e verificarem suas descobertas.

Começando como parte de um projeto colaborativo, o Tapis evoluiu através de várias versões e agora é usado por milhares de pesquisadores em vários setores para atender suas necessidades de computação e dados.

Gerenciamento de Dados e Execução de Programas

O Tapis oferece uma maneira de gerenciar dados e executar programas em diversos recursos computacionais. Os usuários podem definir seus sistemas, o que significa que eles dizem ao Tapis como conectar a diferentes computadores ou sistemas de armazenamento. Esses sistemas podem incluir computadores de alta performance, servidores em nuvem ou outros tipos de recursos.

Depois que os sistemas estão configurados, os usuários também podem definir aplicações-esses são os programas que realizam as tarefas de pesquisa. O Tapis permite uma transferência fácil de dados entre sistemas e fornece ferramentas para executar jobs, que são tarefas específicas que os usuários querem realizar.

Processamento de Dados em Tempo Real

O Tapis não apenas ajuda na gestão de dados; ele também facilita análises em tempo real. Por exemplo, o Tapis pode pegar dados de streaming de sensores e analisá-los imediatamente, o que é crucial para muitos projetos de pesquisa. Esses serviços em tempo real podem lidar com altos volumes de dados rapidamente, permitindo que os pesquisadores trabalhem com as informações mais atuais disponíveis.

Além disso, o Tapis inclui recursos que permitem aos usuários configurar alertas ou notificações com base em ações específicas, como quando um job é concluído ou quando novos dados ficam disponíveis. Isso facilita manter-se atualizado sem precisar monitorar o sistema o tempo todo.

Segurança e Controle de Acesso

Uma das principais preocupações ao lidar com dados sensíveis é a segurança. O Tapis aborda isso implementando um sistema de autorização robusto. Cada usuário tem papéis e permissões específicas que definem o que eles podem acessar e quais ações podem realizar.

Isso significa que mesmo quando vários pesquisadores estão trabalhando juntos, eles não podem acessar os dados uns dos outros, a menos que tenham permissão explícita. Esse acesso controlado ajuda a manter a privacidade e proteger informações sensíveis.

O sistema também suporta contextos compartilhados, onde os recursos podem ser compartilhados entre usuários temporariamente. Isso permite que os pesquisadores colaborem em tarefas sem conceder acesso permanentemente, mantendo a segurança enquanto promove o trabalho em equipe.

Estrutura de Autenticação

O Tapis usa um sistema de autenticação em duas partes para verificar os usuários. Quando um pesquisador quer acessar o Tapis, ele recebe um token que confirma sua identidade. Esse token contém informações sobre quem eles são e o que eles estão autorizados a fazer dentro do sistema.

A autenticação acontece de uma forma que permite aos pesquisadores usar suas credenciais existentes de outros sistemas, como Google ou GitHub, tornando o processo amigável. Isso significa que os pesquisadores podem integrar suas logins existentes no Tapis sem precisar decorar novas senhas ou criar contas adicionais.

Arquitetura Flexível

O design do Tapis é modular, significando que cada componente funciona de forma independente, mas trabalha em conjunto para fornecer uma solução completa. Essa flexibilidade permite que o Tapis se adapte a diferentes necessidades, seja para um projeto pequeno ou uma iniciativa de pesquisa em grande escala.

Novos recursos e serviços podem ser adicionados ao longo do tempo sem interromper as operações existentes. Isso significa que, conforme a tecnologia evolui ou as necessidades dos pesquisadores mudam, o Tapis pode crescer e se adaptar de acordo.

Colaboração Multi-Site

O Tapis foi criado para suportar a colaboração em múltiplas localizações. Cada instituição participante pode executar sua própria instância do Tapis, conhecida como "site". Há um site principal que supervisiona os outros, chamados de sites associados. Essa estrutura permite que as instituições mantenham controle sobre seus próprios dados enquanto se beneficiam de recursos compartilhados.

Por exemplo, uma instituição pode manter dados sensíveis localmente, enquanto ainda acessa recursos computacionais poderosos de outros locais. Essa configuração otimiza o desempenho e a segurança, especialmente para organizações que têm requisitos rigorosos de privacidade de dados.

Casos de Uso e Aplicações

Pesquisa Climática no Havai

Uma forma de uso do Tapis é pelos pesquisadores climáticos da Universidade do Havai. Eles estão coletando dados de várias estações climáticas pelas ilhas. O Tapis ajuda esses pesquisadores a configurar um sistema que reúne e analisa esses dados automaticamente em tempo real.

A plataforma executa verificações de qualidade enquanto os dados são coletados para garantir precisão. Os pesquisadores podem então visualizar e compartilhar suas descobertas, facilitando para todos entenderem os impactos das mudanças climáticas em sua região.

Busca por Exoplanetas da NASA

Outro exemplo é o trabalho feito pela NASA para descobrir planetas fora do nosso sistema solar usando o espectrômetro NEID. Os dados coletados por essa ferramenta precisam ser processados rapidamente para gerar informações valiosas sobre possíveis exoplanetas.

O Tapis ajuda a agilizar esse pipeline de processamento de dados, transferindo os dados brutos para sistemas computacionais poderosos para análise, enquanto mantém o controle de todas as operações. Usando o Tapis, a NASA garante que a análise funcione de forma eficiente e seja concluída dentro do prazo necessário.

Conclusão

O Tapis é uma estrutura poderosa projetada para ajudar pesquisadores a gerenciar e analisar dados em várias instituições e locais. Seu foco em segurança, flexibilidade e facilidade de uso o torna uma ferramenta ideal para muitos campos de estudo, desde ciências climáticas até astronomia.

Ao fornecer uma abordagem descentralizada para compartilhamento de recursos, o Tapis possibilita a colaboração enquanto garante que dados sensíveis permaneçam protegidos. À medida que continua a evoluir, o Tapis tem o potencial de apoiar ainda mais projetos de pesquisa inovadores, abrindo caminho para futuras descobertas e avanços.

Fonte original

Título: A Decentralized Authorization and Security Framework for Distributed Research Workflows

Resumo: Research challenges such as climate change and the search for habitable planets increasingly use academic and commercial computing resources distributed across different institutions and physical sites. Furthermore, such analyses often require a level of automation that precludes direct human interaction, and securing these workflows involves adherence to security policies across institutions. In this paper, we present a decentralized authorization and security framework that enables researchers to utilize resources across different sites while allowing service providers to maintain autonomy over their secrets and authorization policies. We describe this framework as part of the Tapis platform, a web-based, hosted API used by researchers from multiple institutions, and we measure the performance of various authorization and security queries, including cross-site queries. We conclude with two use case studies -- a project at the University of Hawaii to study climate change and the NASA NEID telescope project that searches the galaxy for exoplanets.

Autores: Richard Cardone, Smruti Padhy, Steven Black, Sean Cleveland, Joe Stubbs

Última atualização: 2023-05-13 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2304.08557

Fonte PDF: https://arxiv.org/pdf/2304.08557

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes