• Sobre nosotros
  • Política de privacidad
  • Anunciar
  • Contactos
lunes, septiembre 8, 2025
Retail
No Result
View All Result
Anunciar
Contactos
  • Nacional
  • International
  • Política
  • Economía
  • Ciencia y Tecnología
    • SpaceX
    • Inteligencia Artificial
    • Metaverse
  • Deportes
  • Sociedad
    • Cultura
    • Mascotas
    • Construcción y Vivienda
    • Turismo y Viajes
    • Música y películas
    • Psicología
    • Horóscopos
    • Moda y Estilo
    • Familia
    • Belleza
  • Salud
  • Turismo y Viajes
  • Gastronomía
EntreNosotros | Portal de noticias
No Result
View All Result

3 preguntas: sobre la «revolución de datos» de biología y medicina

Escrito por Entrenosotros
03/09/2025
in Inteligencia Artificial
51 3
0
3 preguntas: sobre la «revolución de datos» de biología y medicina

Caroline Uhler es Andrew (1956) y profesora de ingeniería de Erna Viterbi en el MIT; profesor de ingeniería eléctrica e informática en el Instituto de Datos, Ciencia y Sociedad (IDSS); y directora del Centro Eric y Wendy Schmidt en el Broad Institute of MIT y Harvard, donde también es miembro del Instituto Core y del Equipo de Liderazgo Científico.

Uhler está interesado en todos los métodos por los cuales los científicos pueden descubrir la causalidad en los sistemas biológicos, desde el descubrimiento causal en las variables observadas hasta el aprendizaje causal de características y el aprendizaje de representación. En esta entrevista, analiza el aprendizaje automático en biología, áreas maduras para la resolución de problemas e investigación de vanguardia que sale del Centro Schmidt.

YOU MAY ALSO LIKE

AI y aprendizaje automático para el diseño de ingeniería

Una forma más verde de imprimir en 3D cosas más fuertes

P: El Centro Eric y Wendy Schmidt tiene cuatro áreas distintas de enfoque estructuradas en torno a cuatro niveles naturales de organización biológica: proteínas, células, tejidos y organismos. ¿Qué, dentro del panorama actual del aprendizaje automático, hace ahora el momento adecuado para trabajar en estas clases de problemas específicas?

A: La biología y la medicina están actualmente experimentando una «revolución de datos». La disponibilidad de conjuntos de datos a gran escala y diversos, que van desde la genómica y la múltiples múltiples hasta la imagen de alta resolución y los registros de salud electrónicos, lo convierte en un momento oportuno. La secuenciación de ADN económica y precisa es una realidad, las imágenes moleculares avanzadas se han convertido en rutina, y la genómica de células individuales está permitiendo el perfil de millones de células. Estas innovaciones, y los conjuntos de datos masivos que producen, nos han llevado al umbral de una nueva era en biología, una en la que podremos ir más allá de caracterizar las unidades de la vida (como todas las proteínas, genes y los tipos de células) para comprender el «programas de la vida», como la lógica de los circuitos genéticos y la comunicación de células que subyacen a los patrones de los géneros y el género de los géneros.

Al mismo tiempo, en la última década, el aprendizaje automático ha visto un progreso notable con modelos como Bert, GPT-3 y ChatGPT que demuestran capacidades avanzadas en la comprensión y generación de texto, mientras que los transformadores de visión y los modelos multimodales como Clip han logrado el rendimiento a nivel humano en tareas relacionadas con la imagen. Estos avances proporcionan poderosos planos arquitectónicos y estrategias de capacitación que pueden adaptarse a los datos biológicos. Por ejemplo, los transformadores pueden modelar secuencias genómicas similares al lenguaje, y los modelos de visión pueden analizar imágenes médicas y de microscopía.

Es importante destacar que la biología está a punto de ser no solo un beneficiario del aprendizaje automático, sino también una fuente significativa de inspiración para la nueva investigación de ML. Al igual que la agricultura y la reproducción estimularon las estadísticas modernas, la biología tiene el potencial de inspirar nuevas y quizás aún más profundas vías de investigación de ML. A diferencia de los campos como los sistemas de recomendación y la publicidad en Internet, donde no hay leyes naturales para descubrir y la precisión predictiva es la medida final de valor, en biología, los fenómenos son físicamente interpretables, y los mecanismos causales son el objetivo final. Además, la biología cuenta con herramientas genéticas y químicas que permiten pantallas perturbacionales en una escala incomparable en comparación con otros campos. Estas características combinadas hacen que la biología sea única adecuada para beneficiarse enormemente de ML y sirven como una profunda inspiración para ella.

P: Tomando una táctica algo diferente, ¿qué problemas en biología aún son realmente resistentes a nuestro conjunto de herramientas actuales? ¿Hay áreas, quizás desafíos específicos en la enfermedad o en el bienestar, que siente que están maduras para la resolución de problemas?

A: El aprendizaje automático ha demostrado un éxito notable en tareas predictivas en dominios como la clasificación de imágenes, el procesamiento del lenguaje natural y el modelado de riesgos clínicos. Sin embargo, en las ciencias biológicas, la precisión predictiva a menudo es insuficiente. Las preguntas fundamentales en estos campos son inherentemente causales: ¿cómo una perturbación para un gen o vía específica afecta los procesos celulares posteriores? ¿Cuál es el mecanismo por el cual una intervención conduce a un cambio fenotípico? Los modelos tradicionales de aprendizaje automático, que se optimizan principalmente para capturar asociaciones estadísticas en los datos de observación, a menudo no responden tales consultas intervencionistas. Hay una fuerte necesidad de biología y medicina para inspirar también nuevos desarrollos fundamentales en el aprendizaje automático.

El campo ahora está equipado con tecnologías de perturbación de alto rendimiento, como pantallas CRISPR agrupadas, transcriptómica de células individuales y perfiles espaciales, que generan conjuntos de datos ricos bajo intervenciones sistemáticas. Estas modalidades de datos requieren naturalmente el desarrollo de modelos que van más allá del reconocimiento de patrones para respaldar la inferencia causal, el diseño experimental activo y el aprendizaje de representación en entornos con variables latentes complejas y estructuradas. Desde una perspectiva matemática, esto requiere abordar cuestiones centrales de identificabilidad, eficiencia de la muestra y la integración de herramientas combinatorias, geométricas y probabilísticas. Creo que abordar estos desafíos no solo desbloqueará nuevas ideas sobre los mecanismos de los sistemas celulares, sino que también empujará los límites teóricos del aprendizaje automático.

Con respecto a los modelos de base, un consenso en el campo es que todavía estamos lejos de crear un modelo de base holística para la biología a través de escalas, similar a lo que ChatGPT representa en el dominio del lenguaje, una especie de organismo digital capaz de simular todos los fenómenos biológicos. Si bien los nuevos modelos de base emergen casi semanalmente, estos modelos hasta ahora se han especializado para una escala y pregunta específica, y se centran en una o algunas modalidades.

Se han realizado un progreso significativo en la predicción de estructuras de proteínas a partir de sus secuencias. Este éxito ha resaltado la importancia de los desafíos iterativos de aprendizaje automático, como CASP (evaluación crítica de la predicción de la estructura), que han sido fundamentales para la evaluación comparativa de algoritmos de última generación para la predicción de la estructura de proteínas y la mejora.

El Centro Schmidt está organizando desafíos para aumentar la conciencia en el campo ML y avanzar en el desarrollo de métodos para resolver problemas de predicción causales que son tan críticos para las ciencias biomédicas. Con la creciente disponibilidad de datos de perturbación de un solo gen a nivel de células individuales, creo que predecir el efecto de las perturbaciones individuales o combinatorias, y qué perturbaciones podrían impulsar un fenotipo deseado, son problemas solucionables. Con nuestro desafío de predicción de perturbación celular (CPPC), nuestro objetivo es proporcionar los medios para probar y referencia objetivamente algoritmos para predecir el efecto de las nuevas perturbaciones.

Otra área donde el campo ha hecho avances notables es el diagnóstico de la enfermedad y el triaje del paciente. Los algoritmos de aprendizaje automático pueden integrar diferentes fuentes de información del paciente (modalidades de datos), generar modalidades faltantes, identificar patrones que nos pueden ser difíciles de detectar y ayudar a estratificar a los pacientes en función del riesgo de enfermedad. Si bien debemos seguir siendo cautelosos con los posibles sesgos en las predicciones del modelo, el peligro de modelos de aprendizaje de atajos en lugar de correlaciones verdaderas y el riesgo de sesgo de automatización en la toma de decisiones clínicas, creo que esta es un área donde el aprendizaje automático ya está teniendo un impacto significativo.

P: Hablemos de algunos de los titulares que salen del Centro Schmidt recientemente. ¿Qué investigación actual crees que la gente debería estar particularmente entusiasmada y por qué?

A: En colaboración con el Dr. Fei Chen en el Broad Institute, recientemente hemos desarrollado un método para la predicción de la ubicación subcelular de las proteínas invisibles, llamado cachorros. Muchos métodos existentes solo pueden hacer predicciones basadas en los datos específicos de proteínas y células sobre los que fueron entrenados. Sin embargo, los cachorros combinan un modelo de lenguaje de proteína con un modelo de imagen en pintura para utilizar secuencias de proteínas e imágenes celulares. Demostramos que la entrada de la secuencia de proteínas permite que la generalización de las proteínas invisibles, y la entrada de imagen celular captura la variabilidad de una sola célula, permitiendo predicciones específicas de tipo celular. El modelo aprende cuán relevante es cada residuo de aminoácidos para la localización subcelular predicha, y puede predecir cambios en la localización debido a las mutaciones en las secuencias de proteínas. Dado que la función de las proteínas está estrictamente relacionada con su localización subcelular, nuestras predicciones podrían proporcionar información sobre posibles mecanismos de enfermedad. En el futuro, nuestro objetivo es extender este método para predecir la localización de múltiples proteínas en una célula y posiblemente comprender las interacciones proteína-proteína.

Junto con el profesor GV Shivashankar, un colaborador de mucho tiempo en ETH Zürich, hemos mostrado previamente cómo las imágenes simples de las células se tiñen con colorantes fluorescentes que interesan el ADN para etiquetar la cromatina pueden generar mucha información sobre el estado y el destino de una célula en la salud y la enfermedad, cuando se combinan con algoritmos de aprendizaje automático. Recientemente, hemos promovido esta observación y probamos el vínculo profundo entre la organización de la cromatina y la regulación génica mediante el desarrollo de Image2reg, un método que permite la predicción de genes perturbados genética o químicamente de las imágenes de la cromatina. Image2reg utiliza redes neuronales convolucionales para aprender una representación informativa de las imágenes de cromatina de células perturbadas. También emplea una red convolucional gráfica para crear una incrustación de genes que captura los efectos regulatorios de los genes basados ​​en datos de interacción proteína-proteína, integrados con datos transcriptómicos específicos de tipo celular. Finalmente, aprende un mapa entre la representación física y bioquímica resultante de las células, lo que nos permite predecir los módulos de genes perturbados basados ​​en imágenes de cromatina.

Además, recientemente finalizamos el desarrollo de un método para predecir los resultados de perturbaciones genéticas combinatorias invisibles e identificar los tipos de interacciones que ocurren entre los genes perturbados. Morph puede guiar el diseño de las perturbaciones más informativas para los experimentos de bucle de laboratorio. Además, el marco basado en la atención probablemente permite nuestro método identificar relaciones causales entre los genes, proporcionando información sobre los programas regulatorios de genes subyacentes. Finalmente, gracias a su estructura modular, podemos aplicar la transcripción de los datos de perturbación medidos en diversas modalidades, incluidas no solo transcriptómica, sino también imágenes. Estamos muy entusiasmados con el potencial de este método para permitir la exploración eficiente del espacio de perturbación para avanzar en nuestra comprensión de los programas celulares uniendo la teoría causal a aplicaciones importantes, con implicaciones tanto para la investigación básica como para las aplicaciones terapéuticas.

Compartir7Tweet4Compartir1CompartirCompartir

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias recientes

Un acertante de Mijas gana más de seis millones en el sorteo del Gordo de la Primitiva de este domingo

Un acertante de Mijas gana más de seis millones en el sorteo del Gordo de la Primitiva de este domingo

08/09/2025
El Supremo de EEUU autoriza operaciones de Trump contra inmigrantes en Los Ángeles

El Supremo de EEUU autoriza operaciones de Trump contra inmigrantes en Los Ángeles

08/09/2025
Cómo conseguir un trabajo en Disney World en 2025, según un reclutador que trabajó en los parques durante 27 años

Cómo conseguir un trabajo en Disney World en 2025, según un reclutador que trabajó en los parques durante 27 años

08/09/2025

Amigos

Sharklinker, Mobellex.fr, Tiksaviems.lt, 365nachrichten, OnePlaceTwoStories, Mobellex.ch, REXFEL, CBDNutzen, Mobellex.de, CBDTropf

EntreNosotros Logo T

Entrenosotros es un portal de noticias que pretende ofrecer a sus lectores noticias de todo el mundo. Cubrimos desde noticias políticas hasta contenidos sobre estilo de vida.

Un acertante de Mijas gana más de seis millones en el sorteo del Gordo de la Primitiva de este domingo

Un acertante de Mijas gana más de seis millones en el sorteo del Gordo de la Primitiva de este domingo

08/09/2025
El Supremo de EEUU autoriza operaciones de Trump contra inmigrantes en Los Ángeles

El Supremo de EEUU autoriza operaciones de Trump contra inmigrantes en Los Ángeles

08/09/2025

Categorías

  • Belleza
  • Ciencia y Tecnología
  • Construcción y Vivienda
  • Cultura
  • Deportes
  • Economía
  • Familia
  • Gastronomía
  • Inteligencia Artificial
  • International
  • Málaga
  • Mascotas
  • Música y películas
  • Nacional
  • Otros
  • Política
  • Salud
  • Sociedad
  • Turismo y Viajes
  • Sobre nosotros
  • Política de privacidad
  • Anunciar
  • Contactos

© 2023 EntreNosotros. Reservados todos los derechos. $AOGX - Muebles para el hogar - Noticias Alemanas - CBDtropf.DE - Noticias de Lituania - Rexfel.COM

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Nacional
  • International
  • Política
  • Economía
  • Ciencia y Tecnología
    • SpaceX
    • Inteligencia Artificial
    • Metaverse
  • Deportes
  • Sociedad
    • Cultura
    • Mascotas
    • Construcción y Vivienda
    • Turismo y Viajes
    • Música y películas
    • Psicología
    • Horóscopos
    • Moda y Estilo
    • Familia
    • Belleza
  • Salud
  • Turismo y Viajes
  • Gastronomía

© 2023 EntreNosotros. Reservados todos los derechos. $AOGX - Muebles para el hogar - Noticias Alemanas - CBDtropf.DE - Noticias de Lituania - Rexfel.COM