Avances en Segmentación Celular con CellSAM
CellSAM mejora la precisión y eficiencia de la segmentación celular en imágenes biológicas.
― 9 minilectura
Tabla de contenidos
La Segmentación celular es una tarea clave para estudiar las células a través de varios métodos de imagen. Se refiere al proceso de identificar y marcar los límites de células individuales en una imagen. Esto es importante para analizar cómo se comportan las células en tejidos sanos y enfermos. Los avances recientes en tecnología permiten a los científicos examinar la ubicación y abundancia de múltiples proteínas y ARN dentro de las células al mismo tiempo. Sin embargo, estos nuevos métodos generan grandes cantidades de datos que pueden ser difíciles de interpretar, haciendo que una segmentación celular precisa sea esencial para crear imágenes comprensibles que revelen información sobre el comportamiento celular.
La Importancia de la Segmentación Celular
La segmentación celular ayuda a los científicos a convertir datos de imagen complejos en mapas claros que muestran dónde se encuentran las proteínas y los niveles de diferentes ARN en los tejidos. Además, estudiar células vivas puede proporcionar información sobre procesos dinámicos, como el crecimiento y la comunicación celular. Comprender fenómenos como cómo las bacterias mantienen su estructura celular, cómo se transmiten las señales dentro de las células y cómo se comportan las células inmunitarias durante los tratamientos puede ser mejorado a través de la segmentación y seguimiento precisos de las células a lo largo del tiempo.
Estas tareas de imagen requieren algoritmos que puedan identificar y seguir las células con precisión, lo cual es un gran desafío. Separar y rastrear las células de manera precisa es crucial para crear registros consistentes de su comportamiento, permitiendo a los investigadores obtener información sobre diversos procesos biológicos a gran escala.
Avances en la Segmentación Celular
Los desarrollos recientes en Aprendizaje Profundo han mejorado significativamente las técnicas de segmentación celular. La mayoría de estos avances se pueden categorizar en dos enfoques principales. El primero se centra en diseñar modelos avanzados de aprendizaje profundo que ofrezcan un alto rendimiento en tareas de imagen específicas. Históricamente, estos modelos se han concentrado en ciertos tipos de imagen o objetivos celulares, limitando su capacidad para adaptarse a diferentes situaciones. Por ejemplo, un modelo optimizado para imágenes de tejido mamífero podría tener problemas con imágenes de células bacterianas alargadas. Esta limitación ha llevado a la creación de varios modelos para manejar diferentes situaciones.
El segundo enfoque busca mejorar cómo se etiquetan las imágenes para entrenar estos modelos. Dado que la segmentación celular requiere etiquetas precisas a nivel de píxel para cada objeto individual en una imagen, crear estas etiquetas puede ser bastante costoso y llevar mucho tiempo. Nuevos métodos, como el etiquetado con intervención humana, permiten a los etiquetadores humanos corregir errores cometidos por los modelos en lugar de empezar desde cero, lo que puede ahorrar tiempo y reducir costos.
Modelos Fundamentales en Aprendizaje Automático
Recientemente, ha surgido el concepto de modelos fundamentales en el campo del aprendizaje automático. Estos son grandes redes neuronales entrenadas en conjuntos de datos extensos utilizando técnicas de auto-supervisión antes de ser ajustadas para tareas específicas. Ejemplos exitosos de modelos fundamentales en procesamiento de lenguaje natural han inspirado enfoques similares en visión por computadora, incluyendo modelos que pueden analizar imágenes biológicas.
Un modelo fundamental notable relevante para las imágenes celulares es el Segment Anything Model (SAM). SAM está diseñado para extraer características valiosas de las imágenes y generar máscaras de instancia basadas en las entradas del usuario. La habilidad de este modelo para permitir indicaciones simples para generar máscaras precisas lo convirtió en una herramienta prometedora para clasificar células en imágenes.
Sin embargo, aunque SAM muestra potencial, también enfrenta desafíos cuando se aplica a imágenes biológicas. La transición de imágenes naturales a imágenes médicas puede llevar a problemas de rendimiento, ya que las imágenes celulares a menudo varían mucho en términos de densidad y estructura. El enfoque predeterminado de SAM para las indicaciones no es muy adecuado para las células, lo que puede crear dificultades para identificar eficazmente sus ubicaciones. Por lo tanto, reducir la dependencia de la entrada humana en el proceso de segmentación es crucial para hacer que SAM sea más efectivo en el Análisis de imágenes celulares.
Presentando CellSAM
Para abordar estos desafíos, desarrollamos CellSAM, un modelo avanzado específicamente para la segmentación celular que se basa en la metodología SAM. CellSAM automatiza el proceso de identificar células en imágenes con mayor precisión.
Creamos un conjunto de datos diverso que representa varias imágenes celulares, incluyendo las de tejidos, cultivos celulares y diferentes tipos de células como levaduras y bacterias. Es importante destacar que aseguramos que este conjunto de datos estuviera libre de filtraciones de datos para proporcionar una medida precisa del rendimiento del modelo.
Para mejorar la capacidad de SAM de inferir datos de imágenes celulares, diseñamos un método para indicar de manera más efectiva. Descubrimos que usar cajas delimitadoras daba mejores resultados de segmentación que otros métodos. Para automatizar la generación de estas indicaciones, desarrollamos CellFinder, un modelo que identifica los límites dentro de las imágenes. Al integrar las salidas de la caja delimitadora de CellFinder con las capacidades de SAM, CellSAM puede generar de manera eficiente máscaras de segmentación precisas para las células.
Rendimiento de CellSAM
CellSAM fue probado en una amplia gama de escenarios de imagen celular, y demostró un rendimiento excepcional en múltiples conjuntos de datos. Nuestras evaluaciones mostraron que CellSAM mantiene una alta precisión y puede generalizar su rendimiento sobre diversos tipos de datos. A diferencia de modelos anteriores que luchaban por adaptarse a nuevos conjuntos de datos, CellSAM conserva sus capacidades incluso cuando se le presentan diferentes condiciones de imagen.
Además, al comparar los resultados de CellSAM con los de anotadores humanos, no encontramos diferencias significativas en precisión. Esto significa que CellSAM puede lograr un nivel de rendimiento de segmentación comparable al de investigadores humanos capacitados, convirtiéndolo en una herramienta valiosa en el análisis de imágenes biológicas.
Etiquetado Eficiente con CellSAM
CellSAM también agiliza el proceso de etiquetado para imágenes. Cuando se le proporcionan cajas delimitadoras, puede generar máscaras de células precisas rápidamente sin necesidad de ajuste en nuevos conjuntos de datos. Esta eficiencia significa que el etiquetado se puede hacer mucho más rápido, ya que ingresar cajas delimitadoras toma notablemente menos tiempo que dibujar máscaras manualmente alrededor de las células.
Las capacidades de CellSAM se extienden al aprendizaje cero disparos, lo que le permite realizar tareas de segmentación sin exposición previa a tipos de datos específicos. Cuando se le proporcionan incluso unos pocos ejemplos, puede adaptarse rápidamente y mejorar significativamente su rendimiento. Esto convierte a CellSAM en un activo poderoso para analizar imágenes de tipos de células que no se habían visto antes.
Aplicabilidad en la Investigación
La versatilidad de CellSAM significa que puede adaptarse fácilmente a varios flujos de trabajo de análisis de imágenes biológicas sin necesidad de personalizaciones específicas. Por ejemplo, se puede utilizar en transcriptómica espacial, donde se estudian patrones de expresión génica mientras se mantiene la organización espacial de las células dentro de una muestra. La segmentación precisa es crucial para estos experimentos, ya que permite a los investigadores asignar la expresión génica a células específicas, lo que lleva a una comprensión más profunda de la función celular.
Además, CellSAM es efectivo en la imagenología de células vivas, donde las células individuales deben ser rastreadas a lo largo del tiempo para comprender procesos como la división celular. Puede automatizar la segmentación y el seguimiento de células a través de múltiples cuadros, facilitando a los investigadores cuantificar cambios en el comportamiento celular y la línea celular a lo largo del tiempo.
Conclusión
La segmentación celular es esencial para extraer información biológica útil de estudios de imágenes. Aunque el aprendizaje profundo ha hecho grandes avances en los últimos años, siguen siendo muy demandadas herramientas que puedan generalizar a través de conjuntos de datos diversos y mejorar las técnicas de etiquetado de imágenes.
CellSAM es un modelo fundamental específicamente diseñado para tareas de segmentación celular, combinando capacidades avanzadas de generación de máscaras con detección automatizada de objetos. Nuestros benchmarks demuestran que CellSAM alcanza un rendimiento comparable al de los anotadores humanos, convirtiéndolo en una adición vital al campo del análisis de imágenes biológicas. Al facilitar una segmentación rápida y precisa, CellSAM puede agilizar varios flujos de trabajo de investigación, contribuyendo en última instancia a una mejor comprensión de sistemas biológicos complejos.
Los desarrollos futuros se centrarán en expandir la gama de datos etiquetados, mejorar las capacidades del modelo en el análisis de imágenes en 3D y mejorar los métodos de generación de indicaciones. A medida que se desplieguen estos avances, imaginamos que CellSAM jugará un papel crucial en la evolución continua de la imagenología celular y en la comprensión de las ciencias de la vida a un nivel más profundo.
Título: A Foundation Model for Cell Segmentation
Resumen: Cells are a fundamental unit of biological organization, and identifying them in imaging data - cell segmentation - is a critical task for various cellular imaging experiments. While deep learning methods have led to substantial progress on this problem, most models in use are specialist models that work well for specific domains. Methods that have learned the general notion of "what is a cell" and can identify them across different domains of cellular imaging data have proven elusive. In this work, we present CellSAM, a foundation model for cell segmentation that generalizes across diverse cellular imaging data. CellSAM builds on top of the Segment Anything Model (SAM) by developing a prompt engineering approach for mask generation. We train an object detector, CellFinder, to automatically detect cells and prompt SAM to generate segmentations. We show that this approach allows a single model to achieve human-level performance for segmenting images of mammalian cells (in tissues and cell culture), yeast, and bacteria collected across various imaging modalities. We show that CellSAM has strong zero-shot performance and can be improved with a few examples via few-shot learning. We also show that CellSAM can unify bioimaging analysis workflows such as spatial transcriptomics and cell tracking. A deployed version of CellSAM is available at https://cellsam.deepcell.org/.
Autores: David Ashley Van Valen, U. Israel, M. Marks, R. Dilip, Q. Li, C. Yu, E. Laubscher, S. Li, M. S. Schwartz, E. Pradhan, A. Ates, M. Abt, C. Brown, E. Pao, A. Pearson-Goulart, P. Perona, G. Gkioxari, R. Barnowski, Y. Yue
Última actualización: 2024-03-07 00:00:00
Idioma: English
Fuente URL: https://www.biorxiv.org/content/10.1101/2023.11.17.567630
Fuente PDF: https://www.biorxiv.org/content/10.1101/2023.11.17.567630.full.pdf
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.