Uno de los objetivos compartidos y fundamentales de la mayoría de los investigadores de química es la necesidad de predecir las propiedades de una molécula, como su punto de ebullición o fusión. Una vez que los investigadores pueden identificar esa predicción, pueden avanzar con su trabajo produciendo descubrimientos que conducen a medicamentos, materiales y más. Históricamente, sin embargo, los métodos tradicionales para presentar estas predicciones están asociados con un costo significativo: gastar el tiempo y el desgaste de los equipos, además de los fondos.
Ingrese una rama de inteligencia artificial conocida como aprendizaje automático (ML). ML ha disminuido la carga de la predicción de la propiedad de la molécula en un grado, pero las herramientas avanzadas que expeden más efectivamente el proceso, al aprender de los datos existentes para hacer predicciones rápidas para nuevas moléculas, requieren que el usuario tenga un nivel significativo de experiencia en programación. Esto crea una barrera de accesibilidad para muchos químicos, que pueden no tener la competencia computacional significativa requerida para navegar por la tubería de predicción.
Para aliviar este desafío, los investigadores del grupo de investigación McGuire en MIT han creado Chemxploreml, una aplicación de escritorio fácil de usar que ayuda a los químicos a hacer estas predicciones críticas sin requerir habilidades de programación avanzadas. Disponible libremente, fácil de descargar y funcional en las plataformas convencionales, esta aplicación también está creada para operar completamente fuera de línea, lo que ayuda a mantener los datos de investigación propietarios. La nueva tecnología emocionante se describe en un artículo publicado recientemente en el Journal of Chemical Information and Modeling.
Un obstáculo específico en el aprendizaje de la máquina química es traducir estructuras moleculares en un lenguaje numérico que las computadoras pueden entender. Chemxploreml automatiza este proceso complejo con poderosos «integrantes moleculares» incorporados que transforman las estructuras químicas en vectores numéricos informativos. A continuación, el software implementa algoritmos de última generación para identificar patrones y predecir con precisión las propiedades moleculares como los puntos de ebullición y fusión, durante una interfaz gráfica intuitiva e interactiva.
«El objetivo de Chemxploreml es democratizar el uso del aprendizaje automático en las ciencias químicas», dice Aravindh Nivas Marimuthu, un postdoc en el Grupo McGuire y autor principal del artículo. «Al crear una aplicación de escritorio intuitiva, potente y con capacidad fuera de línea, estamos poniendo modelado predictivo de última generación directamente en manos de los químicos, independientemente de sus antecedentes de programación. Este trabajo no solo acelera la búsqueda de nuevos medicamentos y materiales al hacer que el proceso de detección sea más rápido y más barato, sino que su diseño flexible también opera para innovaciones futuras».
Chemxploreml está diseñado para evolucionar con el tiempo, por lo que a medida que se desarrollan técnicas y algoritmos futuros, pueden integrarse perfectamente en la aplicación, asegurando que los investigadores siempre puedan acceder e implementar los métodos más actualizados. La aplicación se probó en cinco propiedades moleculares clave de los compuestos orgánicos (punto de fusión, punto de ebullición, presión de vapor, temperatura crítica y presión crítica) y logró puntajes de alta precisión de hasta 93 por ciento para la temperatura crítica. Los investigadores también demostraron que un nuevo método más compacto para representar moléculas (vicgae) era casi tan preciso como los métodos estándar, como Mol2Vec, pero fue hasta 10 veces más rápido.
«Imaginamos un futuro en el que cualquier investigador pueda personalizar y aplicar fácilmente el aprendizaje automático para resolver desafíos únicos, desde el desarrollo de materiales sostenibles hasta explorar la compleja química del espacio interestelar», dice Marimuthu. Unirse a él en el documento está el autor senior y profesor asistente de química de desarrollo de la clase de la clase de 1943 Brett McGuire.