El primer caso documentado de cáncer de páncreas se remonta al siglo XVIII. Desde entonces, los investigadores han emprendido una odisea prolongada y desafiante para comprender esta enfermedad elusiva y mortal. Hasta la fecha, no existe mejor tratamiento contra el cáncer que la intervención temprana. Desafortunadamente, el páncreas, ubicado en lo profundo del abdomen, es particularmente difícil de alcanzar para una detección temprana.
Los científicos del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL) del MIT, junto con Limor Appelbaum, científico del Departamento de Oncología Radioterápica del Centro Médico Beth Israel Deaconess (BIDMC), estaban ansiosos por identificar mejor a los pacientes potenciales de alto riesgo. Se propusieron desarrollar dos modelos de aprendizaje automático para la detección temprana del adenocarcinoma ductal de páncreas (PDAC), la forma más común de cáncer. Para acceder a una base de datos amplia y diversa, el equipo se sincronizó con una empresa de red federada, utilizando datos de registros médicos electrónicos de varias instituciones en todo Estados Unidos. Este vasto conjunto de datos ayudó a garantizar la confiabilidad y generalización de los modelos, haciéndolos aplicables en una amplia gama de poblaciones, ubicaciones geográficas y grupos demográficos.
Los dos modelos, la red neuronal «PRISM» y el modelo de regresión logística (una técnica estadística para la probabilidad), superaron a los métodos actuales. La comparación del equipo mostró que, si bien los criterios de detección estándar identifican alrededor del 10 por ciento de los casos de PDAC utilizando un umbral de riesgo relativo cinco veces mayor, Prism puede detectar el 35 por ciento de los casos de PDAC en este mismo umbral.
El uso de IA para detectar el riesgo de cáncer no es un fenómeno nuevo: los algoritmos analizan mamografías, tomografías computarizadas para detectar cáncer de pulmón y ayudan en el análisis de pruebas de Papanicolaou y pruebas de VPH, por nombrar algunas aplicaciones. «Los modelos PRISM destacan por su desarrollo y validación en una extensa base de datos de más de 5 millones de pacientes, superando la escala de la mayoría de las investigaciones anteriores en este campo», afirma Kai Jia, estudiante de doctorado en ingeniería eléctrica e informática (EECS) del MIT. , afiliado del MIT CSAIL y primer autor de un artículo de acceso abierto en eBioMedicina delineando el nuevo trabajo. “El modelo utiliza datos clínicos y de laboratorio de rutina para hacer sus predicciones, y la diversidad de la población de EE. UU. es un avance significativo con respecto a otros modelos PDAC, que generalmente se limitan a regiones geográficas específicas, como algunos centros de atención médica en EE. UU. , el uso de una técnica de regularización única en el proceso de capacitación mejoró la generalización e interpretabilidad de los modelos”.
«Este informe describe un enfoque poderoso para utilizar big data y algoritmos de inteligencia artificial para perfeccionar nuestro enfoque para identificar perfiles de riesgo de cáncer», dice David Avigan, profesor de la Facultad de Medicina de Harvard y director del centro oncológico y jefe de hematología y neoplasias hematológicas del BIDMC. , que no participó en el estudio. «Este enfoque puede conducir a estrategias novedosas para identificar pacientes con alto riesgo de malignidad que pueden beneficiarse de una detección enfocada con potencial para una intervención temprana».
Perspectivas prismáticas
El viaje hacia el desarrollo de PRISM comenzó hace más de seis años, impulsado por experiencias de primera mano con las limitaciones de las prácticas de diagnóstico actuales. «Aproximadamente entre el 80 y el 85 por ciento de los pacientes con cáncer de páncreas son diagnosticados en etapas avanzadas, donde la cura ya no es una opción», dice el autor principal Appelbaum, quien también es instructor de la Escuela de Medicina de Harvard y oncólogo radioterapeuta. «Esta frustración clínica generó la idea de profundizar en la gran cantidad de datos disponibles en los registros médicos electrónicos (EHR)».
La estrecha colaboración del grupo CSAIL con Appelbaum hizo posible comprender mejor los aspectos médicos y de aprendizaje automático combinados del problema, lo que finalmente condujo a un modelo mucho más preciso y transparente. «La hipótesis era que estos registros contenían pistas ocultas: signos y síntomas sutiles que podrían actuar como señales de alerta temprana del cáncer de páncreas», añade. «Esto guió nuestro uso de redes EHR federadas en el desarrollo de estos modelos, para un enfoque escalable para implementar herramientas de predicción de riesgos en la atención médica».
Tanto el modelo PrismNN como el PrismLR analizan datos de EHR, incluidos datos demográficos, diagnósticos, medicamentos y resultados de laboratorio de los pacientes, para evaluar el riesgo de PDAC. PrismNN utiliza redes neuronales artificiales para detectar patrones complejos en características de datos como la edad, el historial médico y los resultados de laboratorio, lo que genera una puntuación de riesgo para la probabilidad de PDAC. PrismLR utiliza la regresión logística para un análisis más simple, generando una puntuación de probabilidad de PDAC basada en estas características. Juntos, los modelos ofrecen una evaluación exhaustiva de diferentes enfoques para predecir el riesgo de PDAC a partir de los mismos datos de la HCE.
Un punto fundamental para ganarse la confianza de los médicos, señala el equipo, es comprender mejor cómo funcionan los modelos, lo que en el campo se conoce como interpretabilidad. Los científicos señalaron que, si bien los modelos de regresión logística son inherentemente más fáciles de interpretar, los avances recientes han hecho que las redes neuronales profundas sean algo más transparentes. Esto ayudó al equipo a refinar las miles de características potencialmente predictivas derivadas de la HCE de un solo paciente a aproximadamente 85 indicadores críticos. Estos indicadores, que incluyen la edad del paciente, el diagnóstico de diabetes y una mayor frecuencia de visitas al médico, son descubiertos automáticamente por el modelo, pero coinciden con la comprensión de los médicos sobre los factores de riesgo asociados con el cáncer de páncreas.
El camino a seguir
A pesar de la promesa de los modelos PRISM, como ocurre con todas las investigaciones, algunas partes aún son un trabajo en progreso. Los datos estadounidenses por sí solos son la dieta actual de los modelos, lo que requiere pruebas y adaptación para su uso global. El camino a seguir, señala el equipo, incluye ampliar la aplicabilidad del modelo a conjuntos de datos internacionales e integrar biomarcadores adicionales para una evaluación de riesgos más refinada.
“Un objetivo posterior para nosotros es facilitar la implementación de los modelos en entornos de atención sanitaria habitual. La visión es que estos modelos funcionen sin problemas en el fondo de los sistemas de atención médica, analizando automáticamente los datos de los pacientes y alertando a los médicos sobre casos de alto riesgo sin aumentar su carga de trabajo”, dice Jia. “Un modelo de aprendizaje automático integrado con el sistema EHR podría brindar a los médicos alertas tempranas para pacientes de alto riesgo, lo que podría permitir intervenciones mucho antes de que se manifiesten los síntomas. Estamos ansiosos por implementar nuestras técnicas en el mundo real para ayudar a todas las personas a disfrutar de una vida más larga y saludable”.
Jia escribió el artículo junto con Applebaum y el profesor MIT EECS e investigador principal de CSAIL, Martin Rinard, ambos autores principales del artículo. Los investigadores del artículo contaron con el apoyo durante su estancia en MIT CSAIL, en parte, de la Agencia de Proyectos de Investigación Avanzada de Defensa, Boeing, la Fundación Nacional de Ciencias y Aarno Labs. TriNetX proporcionó recursos para el proyecto y la Prevent Cancer Foundation también apoyó al equipo.