Cautivada desde niña por los videojuegos y los rompecabezas, Marzyeh Ghassemi también quedó fascinada desde temprana edad por la salud. Por suerte, encontró un camino en el que podía combinar ambos intereses.
«Aunque había considerado una carrera en atención médica, la atracción de la informática y la ingeniería era más fuerte», dice Ghassemi, profesor asociado en el Departamento de Ingeniería Eléctrica y Ciencias de la Computación del MIT y el Instituto de Ingeniería y Ciencias Médicas (IMES) y director Investigador del Laboratorio de Sistemas de Información y Decisión (LIDS). «Cuando descubrí que la informática en general, y la IA/ML específicamente, podían aplicarse a la atención sanitaria, se produjo una convergencia de intereses».
Hoy, Ghassemi y su grupo de investigación de ML saludable en LIDS trabajan en un estudio profundo de cómo el aprendizaje automático (ML) puede hacerse más sólido y, posteriormente, aplicarse para mejorar la seguridad y la equidad en la salud.
Al crecer en Texas y Nuevo México en una familia iraní-estadounidense orientada a la ingeniería, Ghassemi tenía modelos a seguir en una carrera STEM. Si bien le encantaban los videojuegos basados en acertijos (“Resolver acertijos para desbloquear otros niveles o progresar más era un desafío muy atractivo”), su madre también la involucró en matemáticas más avanzadas desde el principio, incitándola a ver las matemáticas como algo más que aritmética.
“Sumar o multiplicar son habilidades básicas que se enfatizan por una buena razón, pero el enfoque puede oscurecer la idea de que gran parte de las matemáticas y ciencias de nivel superior tienen más que ver con la lógica y los acertijos”, dice Ghassemi. “Gracias al apoyo de mi madre, supe que me esperaban cosas divertidas”.
Ghassemi dice que además de su madre, muchas otras personas apoyaron su desarrollo intelectual. Mientras obtenía su título universitario en la Universidad Estatal de Nuevo México, el director del Honors College y ex becario Marshall, Jason Ackelson, ahora asesor principal del Departamento de Seguridad Nacional de EE. UU., la ayudó a solicitar una beca Marshall que le permitió a la Universidad de Oxford, donde obtuvo una maestría en 2011 y se interesó por primera vez en el nuevo y en rápida evolución campo del aprendizaje automático. Durante su trabajo de doctorado en el MIT, Ghassemi dice que recibió apoyo “tanto de profesores como de compañeros”, y agrega: “Ese ambiente de apertura y aceptación es algo que trato de replicar para mis estudiantes”.
Mientras trabajaba en su doctorado, Ghassemi también encontró la primera pista de que los sesgos en los datos de salud pueden ocultarse en los modelos de aprendizaje automático.
Había entrenado modelos para predecir resultados utilizando datos de salud, “y la mentalidad en ese momento era utilizar todos los datos disponibles. En las redes neuronales para imágenes, habíamos visto que se aprenderían las características correctas para lograr un buen rendimiento, eliminando la necesidad de diseñar manualmente características específicas”.
Durante una reunión con Leo Celi, científico investigador principal del Laboratorio de Fisiología Computacional del MIT e IMES y miembro del comité de tesis de Ghassemi, Celi le preguntó si Ghassemi había comprobado qué tan bien funcionaban los modelos en pacientes de diferentes géneros, tipos de seguros y autoevaluaciones. carreras reportadas.
Ghassemi lo comprobó y hubo lagunas. “Ahora tenemos casi una década de trabajo que demuestra que estas brechas en los modelos son difíciles de abordar: surgen de sesgos existentes en los datos de salud y de prácticas técnicas predeterminadas. A menos que se piense detenidamente en ellos, los modelos reproducirán y ampliarán ingenuamente los sesgos”, afirma.
Ghassemi ha estado explorando estas cuestiones desde entonces.
Su avance favorito en el trabajo que ha realizado se produjo en varias partes. Primero, ella y su grupo de investigación demostraron que los modelos de aprendizaje podían reconocer la raza de un paciente a partir de imágenes médicas como radiografías de tórax, algo que los radiólogos no pueden hacer. Luego, el grupo descubrió que los modelos optimizados para funcionar bien «en promedio» no funcionaban tan bien para las mujeres y las minorías. El verano pasado, su grupo combinó estos hallazgos para mostrar que cuanto más aprendiera un modelo a predecir la raza o el género de un paciente a partir de una imagen médica, peor sería su brecha de desempeño para los subgrupos de esos grupos demográficos. Ghassemi y su equipo descubrieron que el problema podría mitigarse si se entrenara un modelo para tener en cuenta las diferencias demográficas, en lugar de centrarse en el rendimiento promedio general, pero este proceso debe realizarse en cada sitio donde se implemente un modelo.
“Estamos enfatizando que los modelos entrenados para optimizar el desempeño (equilibrar el desempeño general con la menor brecha de equidad) en un entorno hospitalario no son óptimos en otros entornos. Esto tiene un impacto importante en cómo se desarrollan los modelos para uso humano”, afirma Ghassemi. “Un hospital podría tener los recursos para entrenar un modelo y luego poder demostrar que funciona bien, posiblemente incluso con restricciones específicas de equidad. Sin embargo, nuestra investigación muestra que estas garantías de desempeño no se mantienen en entornos nuevos. Un modelo que está bien equilibrado en un sitio puede no funcionar eficazmente en un entorno diferente. Esto afecta la utilidad de los modelos en la práctica y es esencial que trabajemos para abordar este problema para quienes desarrollan e implementan modelos”.
El trabajo de Ghassemi se basa en su identidad.
“Soy una mujer visiblemente musulmana y madre; ambas me han ayudado a moldear mi forma de ver el mundo, lo que informa mis intereses de investigación”, dice. “Trabajo en la solidez de los modelos de aprendizaje automático y en cómo la falta de solidez puede combinarse con los sesgos existentes. Ese interés no es una coincidencia”.
En cuanto a su proceso de pensamiento, Ghassemi dice que la inspiración a menudo le llega cuando está al aire libre: andar en bicicleta en Nuevo México cuando era estudiante, remar en Oxford, correr como estudiante de doctorado en el MIT y, estos días, caminar por Cambridge Esplanade. También dice que, al abordar un problema complicado, le ha resultado útil pensar en las partes del problema más amplio y tratar de comprender cómo sus suposiciones sobre cada parte podrían ser incorrectas.
«En mi experiencia, el factor más limitante para las nuevas soluciones es lo que crees que sabes», dice. «A veces es difícil superar tu propio conocimiento (parcial) sobre algo hasta que profundizas mucho en un modelo, sistema, etc., y te das cuenta de que no entendiste una subparte correcta o completamente».
A pesar de lo apasionada que es Ghassemi por su trabajo, intencionalmente realiza un seguimiento del panorama más amplio de la vida.
«Cuando amas tu investigación, puede ser difícil evitar que eso se convierta en tu identidad; es algo de lo que creo que muchos académicos deben ser conscientes», dice. “Trato de asegurarme de tener intereses (y conocimientos) más allá de mi propia experiencia técnica.
“Una de las mejores maneras de ayudar a priorizar el equilibrio es con buenas personas. Si tienes familiares, amigos o compañeros que te animan a ser una persona plena, ¡aférrate a ellos!
Habiendo ganado muchos premios y mucho reconocimiento por el trabajo que abarca dos pasiones tempranas (la informática y la salud), Ghassemi profesa la fe en ver la vida como un viaje.
“Hay una cita del poeta persa Rumi que se traduce como ‘Eres lo que estás buscando’”, dice. «En cada etapa de tu vida, tienes que reinvertir en encontrar quién eres y empujarlo hacia quién quieres ser».