A finales de 2023, la Administración Federal de Medicamentos de Estados Unidos aprobó el primer fármaco con potencial para frenar la progresión de la enfermedad de Alzheimer. El Alzheimer es uno de los muchos trastornos neurológicos debilitantes que, en conjunto, afectan a una octava parte de la población mundial y, si bien el nuevo fármaco es un paso en la dirección correcta, todavía queda un largo camino por recorrer para comprenderlo por completo, al igual que otras enfermedades similares.
«Reconstruir las complejidades del funcionamiento del cerebro humano a nivel celular es uno de los mayores desafíos de la neurociencia», afirma Lars Gjesteby, miembro del personal técnico y desarrollador de algoritmos del Grupo de Sistemas de Rendimiento y Salud Humana del Laboratorio Lincoln del MIT. «Los atlas cerebrales en red y de alta resolución pueden ayudar a mejorar nuestra comprensión de los trastornos al señalar las diferencias entre cerebros sanos y enfermos. Sin embargo, el progreso se ha visto obstaculizado por la falta de herramientas para visualizar y procesar conjuntos de datos de imágenes cerebrales muy grandes».
Un atlas cerebral en red es, en esencia, un mapa detallado del cerebro que puede ayudar a vincular la información estructural con la función neuronal. Para construir estos atlas, es necesario procesar y anotar los datos de las imágenes cerebrales. Por ejemplo, es necesario rastrear, medir y etiquetar con información cada axón, o fibra fina que conecta las neuronas. Los métodos actuales de procesamiento de datos de imágenes cerebrales, como el software de escritorio o las herramientas orientadas a los manuales, aún no están diseñados para manejar conjuntos de datos a escala del cerebro humano. Por ello, los investigadores a menudo pasan mucho tiempo trabajando arduamente en un océano de datos sin procesar.
Gjesteby está liderando un proyecto para construir el Neuron Tracing and Active Learning Environment (NeuroTrALE), un software que combina aprendizaje automático, supercomputación y facilidad de uso y acceso para este desafío de mapeo cerebral. NeuroTrALE automatiza gran parte del procesamiento de datos y muestra el resultado en una interfaz interactiva que permite a los investigadores editar y manipular los datos para marcar, filtrar y buscar patrones específicos.
Desenredar una bola de hilo
Una de las características que definen a NeuroTrALE es la técnica de aprendizaje automático que emplea, denominada aprendizaje activo. Los algoritmos de NeuroTrALE están entrenados para etiquetar automáticamente los datos entrantes en función de los datos de imágenes cerebrales existentes, pero los datos desconocidos pueden presentar potencial de errores. El aprendizaje activo permite a los usuarios corregir errores manualmente, enseñando al algoritmo a mejorar la próxima vez que encuentre datos similares. Esta combinación de automatización y etiquetado manual garantiza un procesamiento preciso de los datos con una carga mucho menor para el usuario.
«Imagínese tomar una radiografía de una bola de lana. Vería todas estas líneas entrecruzadas y superpuestas», dice Michael Snyder, del Grupo de Sistemas de Apoyo a la Toma de Decisiones sobre la Patria del laboratorio. «Cuando dos líneas se cruzan, ¿significa que una de las hebras de lana está haciendo una curva de 90 grados, o una va hacia arriba y la otra hacia arriba? Con el aprendizaje activo de NeuroTrALE, los usuarios pueden trazar estas hebras de lana una o dos veces y entrenar al algoritmo para que las siga correctamente mientras avanza. Sin NeuroTrALE, el usuario tendría que trazar la bola de lana, o en este caso los axones del cerebro humano, cada vez». Snyder es un desarrollador de software del equipo de NeuroTrALE junto con el miembro del personal David Chavez.
Como NeuroTrALE le quita al usuario la mayor parte de la carga de etiquetado, permite a los investigadores procesar más datos con mayor rapidez. Además, los algoritmos de rastreo de axones aprovechan la computación paralela para distribuir los cálculos entre varias GPU a la vez, lo que genera un procesamiento aún más rápido y escalable. Con NeuroTrALE, el equipo demostró una reducción del 90 por ciento en el tiempo de procesamiento necesario para procesar 32 gigabytes de datos en comparación con los métodos de IA convencionales.
El equipo también demostró que un aumento sustancial del volumen de datos no se traduce en un aumento equivalente del tiempo de procesamiento. Por ejemplo, en un estudio reciente demostraron que un aumento del 10.000 por ciento en el tamaño del conjunto de datos resultó en un aumento de solo el 9 por ciento y el 22 por ciento en el tiempo total de procesamiento de datos, utilizando dos tipos diferentes de unidades centrales de procesamiento.
«Con los aproximadamente 86 mil millones de neuronas que forman 100 billones de conexiones en el cerebro humano, etiquetar manualmente todos los axones de un solo cerebro llevaría toda una vida», añade Benjamin Roop, uno de los desarrolladores de algoritmos del proyecto. «Esta herramienta tiene el potencial de automatizar la creación de conectomas no solo para un individuo, sino para muchos. Eso abre la puerta al estudio de las enfermedades cerebrales a nivel de población».
El camino del código abierto hacia el descubrimiento
El proyecto NeuroTrALE se formó como una colaboración financiada internamente entre el Laboratorio Lincoln y el laboratorio del profesor Kwanghun Chung en el campus del MIT. El equipo del Laboratorio Lincoln necesitaba construir una forma para que los investigadores del Laboratorio Chung analizaran y extrajeran información útil de su gran cantidad de datos de imágenes cerebrales que fluían hacia la SuperCloud del MIT, una supercomputadora administrada por el Laboratorio Lincoln para respaldar la investigación del MIT. La experiencia del Laboratorio Lincoln en computación de alto rendimiento, procesamiento de imágenes e inteligencia artificial lo hizo excepcionalmente adecuado para abordar este desafío.
En 2020, el equipo subió NeuroTrALE a SuperCloud y en 2022 el Laboratorio Chung estaba produciendo resultados. En un estudio, publicado en CienciaUtilizaron NeuroTrALE para cuantificar la densidad de células de la corteza prefrontal en relación con la enfermedad de Alzheimer, donde los cerebros afectados por la enfermedad tenían una densidad celular menor en ciertas regiones que los que no la padecían. El mismo equipo también localizó en qué parte del cerebro las neurofibras dañinas tienden a enredarse en el tejido cerebral afectado por Alzheimer.
El trabajo en NeuroTrALE ha continuado con la financiación del Laboratorio Lincoln y de los Institutos Nacionales de Salud (NIH) para desarrollar las capacidades de NeuroTrALE. Actualmente, sus herramientas de interfaz de usuario se están integrando con el programa Neuroglancer de Google, una aplicación de visualización de datos de neurociencia basada en la web y de código abierto. NeuroTrALE agrega la capacidad de que los usuarios visualicen y editen sus datos anotados de forma dinámica, y de que varios usuarios trabajen con los mismos datos al mismo tiempo. Los usuarios también pueden crear y editar una serie de formas, como polígonos, puntos y líneas, para facilitar las tareas de anotación, así como personalizar la visualización en color de cada anotación para distinguir las neuronas en regiones densas.
«NeuroTrALE ofrece una solución de extremo a extremo, independiente de la plataforma, que se puede implementar de forma fácil y rápida en entornos autónomos, virtuales, en la nube y de computación de alto rendimiento a través de contenedores», afirma Adam Michaleas, ingeniero de computación de alto rendimiento del Grupo de Tecnología de Inteligencia Artificial del laboratorio. «Además, mejora significativamente la experiencia del usuario final al proporcionar capacidades de colaboración en tiempo real dentro de la comunidad de neurociencia a través de la visualización de datos y la revisión simultánea de contenido».
Para alinearse con la misión del NIH de compartir productos de investigación, el objetivo del equipo es hacer de NeuroTrALE una herramienta de código abierto que pueda ser utilizada por cualquier persona. Y este tipo de herramienta, dice Gjesteby, es lo que se necesita para alcanzar el objetivo final de mapear la totalidad del cerebro humano para la investigación y, eventualmente, el desarrollo de medicamentos. «Es un esfuerzo de base de la comunidad donde los datos y algoritmos están pensados para que todos puedan compartirlos y acceder a ellos».
Las bases de código para el rastreo de axones, Gestión de datosy Interfaz de usuario interactiva de NeuroTrALE están disponibles públicamente a través de licencias de código abierto. Póngase en contacto con Lars Gjesteby para obtener más información sobre el uso de NeuroTrALE.