A pesar de su enorme tamaño y poder, los sistemas de inteligencia artificial de hoy en día no logran distinguir entre alucinaciones y realidad. Los sistemas de conducción autónomos pueden no percibir a los peatones y vehículos de emergencia justo delante de ellos, con consecuencias fatales. Los sistemas de IA conversacional inventan hechos con confianza y, después del entrenamiento a través del aprendizaje por refuerzo, a menudo no brindan estimaciones precisas de su propia incertidumbre.
Trabajando juntos, investigadores del MIT y la Universidad de California en Berkeley han desarrollado un nuevo método para construir sofisticados algoritmos de inferencia de IA que generan simultáneamente colecciones de explicaciones probables para los datos y estiman con precisión la calidad de estas explicaciones.
El nuevo método se basa en un enfoque matemático llamado Monte Carlo secuencial (SMC). Los algoritmos SMC son un conjunto establecido de algoritmos que se han utilizado ampliamente para la IA calibrada con incertidumbre, al proponer explicaciones probables de los datos y rastrear cuán probables o improbables parecen las explicaciones propuestas cada vez que se proporciona más información. Pero SMC es demasiado simplista para tareas complejas. El problema principal es que uno de los pasos centrales en el algoritmo, el paso de generar conjeturas para explicaciones probables (antes del otro paso de rastrear qué tan probables parecen las diferentes hipótesis entre sí), tenía que ser muy simple. En áreas de aplicación complicadas, observar los datos y generar conjeturas plausibles de lo que está sucediendo puede ser un problema desafiante en sí mismo. En la conducción autónoma, por ejemplo, esto requiere mirar los datos de video de las cámaras de un automóvil autónomo, identificar automóviles y peatones en la carretera y adivinar las probables rutas de movimiento de los peatones actualmente ocultos a la vista. Hacer conjeturas plausibles a partir de datos sin procesar puede requerir algoritmos sofisticados que el SMC normal no puede admitir.
Ahí es donde entra en juego el nuevo método, SMC con propuestas de programas probabilísticos (SMCP3). SMCP3 hace posible usar formas más inteligentes de adivinar explicaciones probables de datos, actualizar esas explicaciones propuestas a la luz de nueva información y estimar la calidad de estas explicaciones que fueron propuestas de formas sofisticadas. SMCP3 hace esto al hacer posible el uso de cualquier programa probabilístico, cualquier programa de computadora que también pueda tomar decisiones aleatorias, como una estrategia para proponer (es decir, adivinar inteligentemente) explicaciones de datos. Las versiones anteriores de SMC solo permitían el uso de estrategias muy simples, tan simples que uno podía calcular la probabilidad exacta de cualquier conjetura. Esta restricción dificultó el uso de procedimientos de adivinación con múltiples etapas.
El artículo SMCP3 de los investigadores muestra que mediante el uso de procedimientos de propuesta más sofisticados, SMCP3 puede mejorar la precisión de los sistemas de inteligencia artificial para rastrear objetos 3D y analizar datos, y también mejorar la precisión de las propias estimaciones de los algoritmos sobre la probabilidad de que los datos sean. Investigaciones anteriores del MIT y otros han demostrado que estas estimaciones se pueden usar para inferir con qué precisión un algoritmo de inferencia explica los datos, en relación con un razonador bayesiano idealizado.
George Matheos, coautor del artículo (y profesor de ingeniería eléctrica e informática del MIT). [EECS] estudiante de doctorado), dice que está muy entusiasmado con el potencial de SMCP3 para que sea práctico usar algoritmos bien entendidos y calibrados con incertidumbre en entornos de problemas complicados donde las versiones anteriores de SMC no funcionaron.
“Hoy tenemos muchos algoritmos nuevos, muchos basados en redes neuronales profundas, que pueden proponer lo que podría estar pasando en el mundo, a la luz de los datos, en todo tipo de áreas problemáticas. Pero a menudo, estos algoritmos no están realmente calibrados para la incertidumbre. Solo dan una idea de lo que podría estar pasando en el mundo, y no está claro si esa es la única explicación plausible o si hay otras, ¡o incluso si esa es una buena explicación en primer lugar! Pero con SMCP3, creo que será posible usar muchos más de estos algoritmos inteligentes pero difíciles de confiar para construir algoritmos calibrados con incertidumbre. A medida que usamos sistemas de ‘inteligencia artificial’ para tomar decisiones en más y más áreas de la vida, tener sistemas en los que podamos confiar, que sean conscientes de su incertidumbre, será crucial para la confiabilidad y la seguridad”.
Vikash Mansinghka, autor principal del artículo, agrega: «Las primeras computadoras electrónicas se construyeron para ejecutar métodos de Monte Carlo, y son algunas de las técnicas más utilizadas en computación e inteligencia artificial. Pero desde el principio, los métodos de Monte Carlo han sido difícil de diseñar e implementar: las matemáticas tenían que derivarse a mano, y había muchas restricciones matemáticas sutiles que los usuarios tenían que tener en cuenta. SMCP3 automatiza simultáneamente las matemáticas difíciles y amplía el espacio de los diseños. Ya hemos lo usé para pensar en nuevos algoritmos de IA que no podríamos haber diseñado antes”.
Otros autores del artículo incluyen al coautor Alex Lew (estudiante de doctorado del MIT EECS); los estudiantes de doctorado del MIT EECS Nishad Gothoskar, Matin Ghavamizadeh y Tan Zhi-Xuan; y Stuart Russell, profesor de UC Berkeley. El trabajo fue presentado en la conferencia AISTATS en Valencia, España, en abril.