Los sistemas de inteligencia artificial como ChatGPT proporcionan respuestas de sonido plausible a cualquier pregunta que pueda hacer. Pero no siempre revelan las brechas en sus conocimientos o áreas donde están inciertos. Ese problema puede tener enormes consecuencias ya que los sistemas de IA se usan cada vez más para hacer cosas como desarrollar drogas, sintetizar información e impulsar automóviles autónomos.
Ahora, el MIT SpinOut Themis AI está ayudando a cuantificar la incertidumbre del modelo y las salidas correctas antes de que causen mayores problemas. La plataforma CAPSA de la compañía puede funcionar con cualquier modelo de aprendizaje automático para detectar y corregir salidas poco confiables en segundos. Funciona modificando modelos de IA para permitirles detectar patrones en su procesamiento de datos que indican ambigüedad, incompletitud o sesgo.
«La idea es tomar un modelo, envolverlo en CAPSA, identificar las incertidumbres y los modos de falla del modelo, y luego mejorar el modelo», dice la cofundadora y profesora del MIT Daniela Rus, quien también es la directora del Laboratorio de Informática e Inteligencia Artificial del MIT (CSAIL). «Estamos entusiasmados por ofrecer una solución que pueda mejorar los modelos y ofrecer garantías de que el modelo funcione correctamente».
Rus fundó Themis Ai en 2021 con Alexander Amini ’17, SM ’18, PhD ’22 y Elaheh Ahmadi ’20, Meng ’21, dos ex afiliados de investigación en su laboratorio. Desde entonces, han ayudado a las compañías de telecomunicaciones con la planificación y la automatización de las redes, ayudaron a las compañías de petróleo y gas a usar la IA para comprender las imágenes sísmicas y publicaron artículos sobre el desarrollo de chatbots más confiables y confiables.
«Queremos habilitar la IA en las aplicaciones de mayor participación de cada industria», dice Amini. «Todos hemos visto ejemplos de AI alucinando o cometiendo errores. Como AI se implementa más ampliamente, esos errores podrían conducir a consecuencias devastadoras. Nuestro software puede hacer que estos sistemas sean más transparentes».
Ayudar a los modelos a saber lo que no saben
El laboratorio de Rus ha estado investigando la incertidumbre del modelo durante años. En 2018, recibió fondos de Toyota para estudiar la confiabilidad de una solución de conducción autónoma basada en el aprendizaje automático.
«Ese es un contexto crítico de seguridad donde comprender la confiabilidad del modelo es muy importante», dice Rus.
En trabajos separados, Rus, Amini y sus colaboradores construyeron un algoritmo que podría detectar sesgo racial y de género en los sistemas de reconocimiento facial y volver automáticamente los datos de entrenamiento del modelo, mostrando que eliminó el sesgo. El algoritmo funcionó identificando las partes no representativas de los datos de capacitación subyacentes y generando nuevas muestras de datos similares para reequilibrarlo.
En 2021, los cofundadores eventuales mostraron que un enfoque similar podría usarse para ayudar a las compañías farmacéuticas a usar modelos de IA para predecir las propiedades de los candidatos a los medicamentos. Fundaron Themis Ai más tarde ese año.
«Guiar el descubrimiento de drogas podría ahorrar mucho dinero», dice Rus. «Ese fue el caso de uso que nos hizo darnos cuenta de cuán poderosa podría ser esta herramienta».
Hoy Themis está trabajando con empresas en una amplia variedad de industrias, y muchas de esas compañías están construyendo grandes modelos de idiomas. Al usar CAPSA, los modelos pueden cuantificar su propia incertidumbre para cada salida.
«Muchas compañías están interesadas en usar LLM que se basan en sus datos, pero están preocupados por la confiabilidad», observa Stewart Jamieson SM ’20, PhD ’24, jefe de tecnología de Themis AI. «Ayudamos a los LLM a informar su confianza e incertidumbre, lo que permite que la respuesta de preguntas más confiable respondiera y marcara los resultados poco confiables».
Themis AI también está en conversaciones con compañías de semiconductores que construyen soluciones de IA en sus chips que pueden funcionar fuera de los entornos en la nube.
«Normalmente, estos modelos más pequeños que funcionan en teléfonos o sistemas integrados no son muy precisos en comparación con lo que podría ejecutar en un servidor, pero podemos obtener lo mejor de ambos mundos: baja latencia y computación de borde eficiente sin sacrificar la calidad», explica Jamieson. «Vemos un futuro en el que los dispositivos Edge hacen la mayor parte del trabajo, pero cada vez que no están seguros de su producción, pueden reenviar esas tareas a un servidor central».
Las compañías farmacéuticas también pueden usar CAPSA para mejorar los modelos de IA que se utilizan para identificar a los candidatos a los medicamentos y predecir su desempeño en los ensayos clínicos.
«Las predicciones y resultados de estos modelos son muy complejas y difíciles de interpretar: los expertos pasan mucho tiempo y esfuerzo tratando de darles sentido», comenta Amini. «El CAPSA puede dar información desde la puerta para comprender si las predicciones están respaldadas por evidencia en el conjunto de entrenamiento o son solo especulaciones sin mucha base. Eso puede acelerar la identificación de las predicciones más fuertes, y creemos que eso tiene un gran potencial para el bien social».
Investigación para el impacto
El equipo de Themis AI cree que la compañía está bien posicionada para mejorar la vanguardia de la tecnología de IA en constante evolución. Por ejemplo, la compañía está explorando la capacidad de CAPSA para mejorar la precisión en una técnica de IA conocida como razonamiento de la cadena de pensamiento, en el que los LLM explican los pasos que toman para obtener una respuesta.
«Hemos visto Signs Capsa podría ayudar a guiar esos procesos de razonamiento para identificar las cadenas de razonamiento de mayor confianza», dice Amini. «Creemos que tiene enormes implicaciones en términos de mejorar la experiencia de LLM, reducir las latencias y reducir los requisitos de cálculo. Es una oportunidad de gran impacto para nosotros».
Para Rus, quien ha cofundado varias compañías desde que llegó al MIT, Themis AI es una oportunidad para garantizar que su investigación del MIT tenga un impacto.
«Mis alumnos y yo nos apasionamos cada vez más por dar el paso adicional para que nuestro trabajo sea relevante para el mundo», dice Rus. «La IA tiene un enorme potencial para transformar las industrias, pero la IA también plantea preocupaciones. Lo que me emociona es la oportunidad de ayudar a desarrollar soluciones técnicas que aborden estos desafíos y también generen confianza y comprensión entre las personas y las tecnologías que se están convirtiendo en parte de su vida diaria».