Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Informática# Criptografía y seguridad# Computación distribuida, paralela y en clústeres

Tapis: Un Nuevo Sistema para la Investigación Colaborativa

Tapis permite compartir datos de forma segura y eficiente entre investigadores en diferentes lugares.

― 7 minilectura


Tapis Transforma laTapis Transforma laColaboración enInvestigacióninnovadora.instituciones impulsa la investigaciónCompartir datos de forma segura entre
Tabla de contenidos

Los problemas de investigación como el cambio climático y la búsqueda de planetas que podrían albergar vida a menudo usan computadoras y recursos repartidos en varias instituciones. Esto significa que los investigadores no solo trabajan en un solo lugar; están aprovechando máquinas y Datos de múltiples ubicaciones. Para facilitar y asegurar este proceso, hemos desarrollado un nuevo sistema que ayuda a los investigadores a usar estos recursos mientras mantienen sus datos y secretos seguros.

Nuestro enfoque permite que los científicos colaboren incluso cuando están en diferentes lugares. Esto es especialmente importante cuando la investigación requiere mucha potencia de Computación. A veces, los investigadores necesitan automatizar partes de su análisis para no tener que supervisar todo manualmente. Por lo tanto, asegurar que los procesos automatizados sigan las reglas de Seguridad es esencial cuando los datos y recursos provienen de varios sitios.

En esta visión general, presentamos un marco fácil de usar diseñado para que los investigadores accedan y compartan recursos en diferentes ubicaciones. Destacamos cómo funciona nuestro sistema y compartimos ejemplos de cómo ha ayudado en proyectos de investigación reales.

¿Qué es Tapis?

Tapis es una plataforma que ayuda a los usuarios a gestionar datos y tareas de computación. Piénsalo como una herramienta conveniente que permite a los investigadores almacenar y compartir sus datos y hacer cálculos complejos sin preocuparse por la tecnología subyacente. Tapis realiza un seguimiento de lo que sucede durante estos procesos, facilitando que los investigadores repitan sus análisis y verifiquen sus hallazgos.

Comenzando como parte de un proyecto colaborativo, Tapis ha evolucionado a través de varias versiones y ahora es utilizado por miles de investigadores en múltiples sectores para manejar sus necesidades de computación y datos.

Gestión de Datos y Ejecución de Programas

Tapis ofrece una forma de gestionar datos y ejecutar programas en varios recursos de computación. Los usuarios pueden definir sus sistemas, lo que significa que le dicen a Tapis cómo conectarse a diferentes computadoras o sistemas de almacenamiento. Estos sistemas pueden incluir computadoras de alto rendimiento, servidores en la nube u otros tipos de recursos.

Una vez que los sistemas están configurados, los usuarios también pueden definir aplicaciones; estos son los programas que realizan las tareas de investigación. Tapis permite una fácil transferencia de datos entre sistemas y proporciona herramientas para ejecutar trabajos, que son tareas específicas que los usuarios quieren ejecutar.

Procesamiento de Datos en Tiempo Real

Tapis no solo ayuda a gestionar datos; también facilita el análisis en tiempo real. Por ejemplo, Tapis puede tomar datos en streaming de sensores y analizarlos de inmediato, lo cual es crucial para muchos proyectos de investigación. Estos servicios en tiempo real pueden manejar altos volúmenes de datos rápidamente, permitiendo a los investigadores trabajar con la información más actual disponible.

Además, Tapis incluye características que permiten a los usuarios configurar alertas o notificaciones basadas en acciones específicas, como cuando un trabajo se completa o cuando nuevos datos están disponibles. Esto hace que sea más fácil mantenerse al tanto sin tener que monitorear constantemente el sistema.

Seguridad y Control de Acceso

Una de las principales preocupaciones al tratar con datos sensibles es la seguridad. Tapis aborda esto implementando un sistema de autorización robusto. Cada usuario tiene roles y permisos específicos que definen a qué pueden acceder y qué acciones pueden realizar.

Esto significa que incluso cuando varios investigadores trabajan juntos, no pueden acceder a los datos de los demás a menos que tengan permiso explícito. Este acceso controlado ayuda a mantener la privacidad y asegura la información sensible.

El sistema también admite contextos compartidos, donde los recursos pueden ser compartidos temporalmente entre usuarios. Esto permite a los investigadores colaborar en tareas sin otorgar acceso permanente, manteniendo así la seguridad mientras se fomenta el trabajo en equipo.

Estructura de Autenticación

Tapis utiliza un sistema de autenticación de dos partes para verificar a los usuarios. Cuando un investigador quiere acceder a Tapis, recibe un token que confirma su identidad. Este token contiene información sobre quiénes son y qué se les permite hacer dentro del sistema.

La autenticación se realiza de una manera que permite a los investigadores usar sus credenciales existentes de otros sistemas, como Google o GitHub, haciendo que el proceso sea fácil de usar. Esto significa que los investigadores pueden integrar sin problemas sus inicios de sesión existentes en Tapis sin tener que memorizar nuevas contraseñas o crear cuentas adicionales.

Arquitectura Flexible

El diseño de Tapis es modular, lo que significa que cada componente funciona de manera independiente pero trabaja junto para proporcionar una solución completa. Esta flexibilidad permite a Tapis adaptarse a diferentes necesidades, ya sea un proyecto pequeño o una iniciativa de investigación a gran escala.

Se pueden agregar nuevas características y servicios con el tiempo sin interrumpir las operaciones existentes. Esto significa que, a medida que la tecnología evoluciona o las necesidades de los investigadores cambian, Tapis puede crecer y adaptarse en consecuencia.

Colaboración Multisite

Tapis está diseñado para apoyar la colaboración en múltiples ubicaciones. Cada institución participante puede ejecutar su propia instancia de Tapis, conocida como un "sitio". Hay un sitio principal que supervisa a otros, llamados sitios asociados. Esta estructura permite a las instituciones mantener el control sobre sus propios datos mientras se benefician de recursos compartidos.

Por ejemplo, una institución puede mantener datos sensibles en su sitio, mientras sigue accediendo a potentes recursos informáticos de otras ubicaciones. Esta configuración optimiza el rendimiento y la seguridad, particularmente para organizaciones que tienen requisitos estrictos de privacidad de datos.

Casos de Uso y Aplicaciones

Investigación Climática en Hawái

Una forma en que se está utilizando Tapis es por investigadores climáticos en la Universidad de Hawái. Están recolectando datos de varias estaciones climáticas en las islas. Tapis ayuda a estos investigadores a configurar un sistema que automáticamente recopila y analiza estos datos en tiempo real.

La plataforma ejecuta controles de calidad a medida que se recopilan los datos para asegurar la precisión. Los investigadores pueden luego visualizar y compartir sus hallazgos, facilitando que todos comprendan los impactos del cambio climático en su región.

Búsqueda de Exoplanetas de la NASA

Otro ejemplo es el trabajo que realiza la NASA para descubrir planetas fuera de nuestro sistema solar usando el espectrómetro NEID. Los datos recopilados por esta herramienta necesitan ser procesados rápidamente para obtener información valiosa sobre los posibles exoplanetas.

Tapis ayuda a agilizar esta cadena de procesamiento de datos, transfiriendo los datos en bruto a poderosos sistemas de computación para su análisis mientras hace un seguimiento de todas las operaciones. Al usar Tapis, la NASA asegura que el análisis se ejecute de manera eficiente y se complete dentro del tiempo necesario.

Conclusión

Tapis es un marco potente diseñado para ayudar a los investigadores a gestionar y analizar datos a través de múltiples instituciones y ubicaciones. Su enfoque en la seguridad, flexibilidad y facilidad de uso lo convierte en una herramienta ideal para muchos campos de estudio, desde la ciencia climática hasta la astronomía.

Al proporcionar un enfoque descentralizado para compartir recursos, Tapis permite la colaboración mientras asegura que los datos sensibles permanezcan protegidos. A medida que continúa evolucionando, Tapis tiene el potencial de apoyar proyectos de investigación aún más innovadores, allanando el camino para futuros descubrimientos y avances.

Fuente original

Título: A Decentralized Authorization and Security Framework for Distributed Research Workflows

Resumen: Research challenges such as climate change and the search for habitable planets increasingly use academic and commercial computing resources distributed across different institutions and physical sites. Furthermore, such analyses often require a level of automation that precludes direct human interaction, and securing these workflows involves adherence to security policies across institutions. In this paper, we present a decentralized authorization and security framework that enables researchers to utilize resources across different sites while allowing service providers to maintain autonomy over their secrets and authorization policies. We describe this framework as part of the Tapis platform, a web-based, hosted API used by researchers from multiple institutions, and we measure the performance of various authorization and security queries, including cross-site queries. We conclude with two use case studies -- a project at the University of Hawaii to study climate change and the NASA NEID telescope project that searches the galaxy for exoplanets.

Autores: Richard Cardone, Smruti Padhy, Steven Black, Sean Cleveland, Joe Stubbs

Última actualización: 2023-05-13 00:00:00

Idioma: English

Fuente URL: https://arxiv.org/abs/2304.08557

Fuente PDF: https://arxiv.org/pdf/2304.08557

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares