Según un nuevo estudio de investigadores del MIT, al diagnosticar enfermedades de la piel basándose únicamente en imágenes de la piel de un paciente, los médicos no funcionan tan bien cuando el paciente tiene la piel más oscura.
El estudio, que incluyó a más de 1,000 dermatólogos y médicos generales, encontró que los dermatólogos caracterizaron con precisión alrededor del 38 por ciento de las imágenes que vieron, pero sólo el 34 por ciento de las que mostraban una piel más oscura. Los médicos generales, que fueron menos precisos en general, mostraron una disminución similar en la precisión con la piel más oscura.
El equipo de investigación también descubrió que la asistencia de un algoritmo de inteligencia artificial podría mejorar la precisión de los médicos, aunque esas mejoras fueron mayores al diagnosticar a pacientes con piel más clara.
Si bien este es el primer estudio que demuestra disparidades en el diagnóstico médico según el tono de piel, otros estudios han encontrado que las imágenes utilizadas en los libros de texto y materiales de capacitación de dermatología presentan predominantemente tonos de piel más claros. Ese puede ser un factor que contribuya a la discrepancia, dice el equipo del MIT, junto con la posibilidad de que algunos médicos tengan menos experiencia en el tratamiento de pacientes con piel más oscura.
«Probablemente ningún médico tiene la intención de hacerlo peor en ningún tipo de persona, pero podría ser el hecho de que no tienes todo el conocimiento y la experiencia y, por lo tanto, en ciertos grupos de personas, podrías hacerlo peor», dice Matt. Groh PhD ’23, profesor asistente en la Escuela de Administración Kellogg de la Universidad Northwestern. «Esta es una de esas situaciones en las que se necesita evidencia empírica para ayudar a las personas a descubrir cómo se podrían cambiar las políticas en torno a la educación en dermatología».
Groh es el autor principal del estudio, que aparece hoy en Medicina de la naturaleza. Rosalind Picard, profesora de artes y ciencias de los medios del MIT, es la autora principal del artículo.
Discrepancias diagnósticas
Hace varios años, un estudio del MIT dirigido por Joy Buolamwini PhD ’22 encontró que los programas de análisis facial tenían tasas de error mucho más altas al predecir el género de las personas de piel más oscura. Ese hallazgo inspiró a Groh, que estudia la colaboración entre humanos e IA, a investigar si los modelos de IA, y posiblemente los propios médicos, podrían tener dificultades para diagnosticar enfermedades de la piel en tonos de piel más oscuros, y si esas capacidades de diagnóstico podrían mejorarse.
«Esto parecía una gran oportunidad para identificar si existe un problema social y cómo podríamos querer solucionarlo, y también identificar cómo integrar mejor la asistencia de IA en la toma de decisiones médicas», dice Groh. “Estoy muy interesado en cómo podemos aplicar el aprendizaje automático a problemas del mundo real, específicamente en cómo ayudar a los expertos a ser mejores en su trabajo. La medicina es un espacio donde las personas toman decisiones realmente importantes y si pudiéramos mejorar su toma de decisiones, podríamos mejorar los resultados de los pacientes”.
Para evaluar la precisión del diagnóstico de los médicos, los investigadores compilaron una serie de 364 imágenes de libros de texto de dermatología y otras fuentes, que representan 46 enfermedades de la piel en muchos tonos de piel.
La mayoría de estas imágenes mostraban una de las ocho enfermedades inflamatorias de la piel, incluida la dermatitis atópica, la enfermedad de Lyme y la sífilis secundaria, así como una forma rara de cáncer llamado linfoma cutáneo de células T (CTCL), que puede parecer similar a una afección inflamatoria de la piel. . Muchas de estas enfermedades, incluida la enfermedad de Lyme, pueden presentarse de manera diferente en pieles oscuras y claras.
El equipo de investigación reclutó sujetos para el estudio a través de Sermo, un sitio de redes sociales para médicos. El grupo total de estudio incluyó 389 dermatólogos certificados, 116 residentes de dermatología, 459 médicos generales y 154 otros tipos de médicos.
A cada uno de los participantes del estudio se le mostraron 10 de las imágenes y se les preguntó sus tres predicciones principales sobre qué enfermedad podría representar cada imagen. También se les preguntó si derivarían al paciente para una biopsia. Además, se preguntó a los médicos generales si derivarían al paciente a un dermatólogo.
«Esto no es tan completo como el triaje en persona, donde el médico puede examinar la piel desde diferentes ángulos y controlar la iluminación», dice Picard. «Sin embargo, las imágenes de la piel son más escalables para la clasificación en línea y son fáciles de ingresar en un algoritmo de aprendizaje automático, que puede estimar diagnósticos probables rápidamente».
Los investigadores encontraron que, como era de esperar, los especialistas en dermatología tenían tasas de precisión más altas: clasificaron correctamente el 38 por ciento de las imágenes, en comparación con el 19 por ciento de los médicos generales.
Ambos grupos perdieron alrededor de cuatro puntos porcentuales en precisión al intentar diagnosticar afecciones de la piel basándose en imágenes de piel más oscura, una caída estadísticamente significativa. Los dermatólogos también tenían menos probabilidades de derivar imágenes de piel más oscura de CTCL para una biopsia, pero era más probable que las derivaran para una biopsia por afecciones cutáneas no cancerosas.
“Este estudio demuestra claramente que existe una disparidad en el diagnóstico de afecciones cutáneas en personas de piel oscura. Esta disparidad no es sorprendente; sin embargo, no lo he visto demostrado en la literatura de una manera tan sólida. Se deben realizar más investigaciones para tratar de determinar con mayor precisión cuáles podrían ser los factores causantes y atenuantes de esta disparidad”, dice Jenna Lester, profesora asociada de dermatología y directora del Programa Piel de Color de la Universidad de California en San Francisco. que no participó en el estudio.
Un impulso de la IA
Después de evaluar el desempeño de los médicos por su cuenta, los investigadores también les dieron imágenes adicionales para analizar con la ayuda de un algoritmo de inteligencia artificial que los investigadores habían desarrollado. Los investigadores entrenaron este algoritmo en alrededor de 30.000 imágenes, pidiéndole que las clasificara como una de las ocho enfermedades que representaban la mayoría de las imágenes, más una novena categoría de «otras».
Este algoritmo tenía una tasa de precisión de alrededor del 47 por ciento. Los investigadores también crearon otra versión del algoritmo con una tasa de éxito inflada artificialmente del 84 por ciento, lo que les permitió evaluar si la precisión del modelo influiría en la probabilidad de que los médicos siguieran sus recomendaciones.
«Esto nos permite evaluar la asistencia de IA con modelos que son los mejores que podemos hacer actualmente, y con asistencia de IA que podría ser más precisa, tal vez dentro de cinco años, con mejores datos y modelos», dice Groh.
Ambos clasificadores son igualmente precisos en pieles claras y oscuras. Los investigadores descubrieron que el uso de cualquiera de estos algoritmos de IA mejoraba la precisión tanto para los dermatólogos (hasta un 60 por ciento) como para los médicos generales (hasta un 47 por ciento).
También descubrieron que era más probable que los médicos aceptaran sugerencias del algoritmo de mayor precisión después de que proporcionara algunas respuestas correctas, pero rara vez incorporaban sugerencias de IA que fueran incorrectas. Esto sugiere que los médicos están muy capacitados para descartar enfermedades y no aceptarán sugerencias de la IA para una enfermedad que ya han descartado, afirma Groh.
“Son bastante buenos para no seguir los consejos de la IA cuando ésta está equivocada y los médicos tienen razón. Es algo que es útil saber”, afirma.
Mientras que los dermatólogos que utilizaron la asistencia de IA mostraron aumentos similares en la precisión al observar imágenes de piel clara u oscura, los médicos generales mostraron una mayor mejora en las imágenes de piel más clara que en las más oscuras.
«Este estudio nos permite ver no sólo cómo influye la asistencia de la IA, sino también cómo influye en todos los niveles de experiencia», dice Groh. “Lo que podría estar pasando allí es que los médicos de cabecera no tienen tanta experiencia, por lo que no saben si deben descartar una enfermedad o no porque no están tan profundizados en los detalles de cómo se pueden desarrollar las diferentes enfermedades de la piel. Mira diferentes tonos de piel”.
Los investigadores esperan que sus hallazgos ayuden a estimular a las escuelas de medicina y a los libros de texto a incorporar más capacitación sobre pacientes con piel más oscura. Los hallazgos también podrían ayudar a guiar el despliegue de programas de asistencia de IA para dermatología, que muchas empresas están desarrollando actualmente.
La investigación fue financiada por el MIT Media Lab Consortium y el Harold Horowitz Student Research Fund.