Los robots han recorrido un largo camino desde la habitación. Hoy, los drones están comenzando a entregar de puerta en puerta, los autos autónomos están navegando por algunas carreteras, los perros robo están ayudando a los primeros en responder, y aún más bots están haciendo backflips y ayudando en el piso de la fábrica. Aún así, Luca Carlone cree que lo mejor está por venir.
Carlone, quien recientemente recibió la tenencia como profesor asociado en el Departamento de Aeronáutica y Astronáutica del MIT (Aeroastro), dirige el Spark Lab, donde él y sus alumnos están cerrando una brecha clave entre humanos y robots: percepción. El grupo hace una investigación teórica y experimental, todo para expandir la conciencia de un robot sobre su entorno de manera que aborde la percepción humana. Y la percepción, como a menudo dice Carlone, es más que detección.
Si bien los robots han crecido a pasos agigantados en términos de su capacidad para detectar e identificar objetos en su entorno, todavía tienen mucho que aprender cuando se trata de tener un sentido de nivel superior de su entorno. Como humanos, percibimos objetos con un sentido intuitivo no solo de sus formas y etiquetas, sino también de su física, cómo podrían ser manipulados y movidos, y cómo se relacionan entre sí, su entorno más grande y nosotros mismos.
Ese tipo de percepción a nivel humano es lo que Carlone y su grupo esperan impartir a los robots, de manera que les permitan interactuar de manera segura y sin problemas con las personas en sus hogares, lugares de trabajo y otros entornos no estructurados.
Desde que se unió a la facultad del MIT en 2017, Carlone ha liderado a su equipo en el desarrollo y la aplicación de algoritmos de percepción y comprensión de escenas para diversas aplicaciones, incluidos vehículos autónomos de búsqueda y rescate subterráneos, drones que pueden recoger y manipular objetos sobre la mosca y autos autónomos. También pueden ser útiles para los robots nacionales que siguen los comandos del lenguaje natural y potencialmente incluso anticipan las necesidades de los humanos basados en pistas contextuales de nivel superior.
«La percepción es un gran cuello de botella para lograr que los robots nos ayuden en el mundo real», dice Carlone. «Si podemos agregar elementos de cognición y razonamiento a la percepción del robot, creo que pueden hacer mucho bien».
Horizontes en expansión
Carlone nació y creció cerca de Salerno, Italia, cerca de la escénica costa de Amalfi, donde era el más joven de tres niños. Su madre es una maestra de escuela primaria retirada que enseñó matemáticas, y su padre es un profesor y editor de historia retirado, que siempre ha adoptado un enfoque analítico para su investigación histórica. Los hermanos pueden haber adoptado inconscientemente la mentalidad de sus padres, ya que los tres pasaban a ser ingenieros: los dos mayores perseguían electrónica e ingeniería mecánica, mientras que Carlone aterrizó en robótica o mecatrónica, como se le conocía en ese momento.
Sin embargo, no llegó al campo hasta el final de sus estudios de pregrado. Carlone asistió a la Universidad Politécnica de Turín, donde se centró inicialmente en el trabajo teórico, específicamente en la teoría de control, un campo que aplica las matemáticas para desarrollar algoritmos que controlan automáticamente el comportamiento de los sistemas físicos, como las redes eléctricas, los planos, los automóviles y los robots. Luego, en su último año, Carlone se inscribió en un curso de robótica que exploró los avances en la manipulación y cómo los robots se pueden programar para moverse y funcionar.
“Fue amor a primera vista. El uso de algoritmos y matemáticas para desarrollar el cerebro de un robot e hacer que se mueva e interactúe con el medio ambiente es una de las experiencias más satisfactorias «, dice Carlone. «Inmediatamente decidí que esto es lo que quiero hacer en la vida».
Fue a un programa de doble grado en la Universidad Politécnica de Turín y en la Universidad Politécnica de Milán, donde recibió maestrías en Mechatronics and Automation Engineering, respectivamente. Como parte de este programa, llamado Alta Scuola Politecnica, Carlone también tomó cursos de administración, en los que él y los estudiantes de diversos orígenes académicos tuvieron que unirse para conceptualizar, construir y elaborar un campo de marketing para un nuevo diseño de productos. El equipo de Carlone desarrolló una lámpara de mesa sin toque diseñada para seguir los comandos impulsados por la mano de un usuario. El proyecto lo empujó a pensar en la ingeniería desde diferentes perspectivas.
«Fue como tener que hablar diferentes idiomas», dice. «Fue una exposición temprana a la necesidad de mirar más allá de la burbuja de ingeniería y pensar en cómo crear un trabajo técnico que pueda afectar el mundo real».
La próxima generación
Carlone se quedó en Turín para completar su doctorado en Mechatronics. Durante ese tiempo, se le dio libertad para elegir un tema de tesis, que hizo, como recuerda, «un poco ingenuamente».
«Estaba explorando un tema que la comunidad consideraba bien entendida, y para el cual muchos investigadores creían que no había nada más que decir». Carlone dice. «Subestimé cuán establecido estaba el tema, y pensé que aún podría contribuir con algo nuevo, y tuve la suerte de hacer eso».
El tema en cuestión era «localización y mapeo simultáneas», o SLAM: el problema de generar y actualizar un mapa del entorno de un robot mientras realiza un seguimiento simultáneo de dónde está el robot dentro de ese entorno. A Carlone se le ocurrió una forma de replantear el problema, de modo que los algoritmos podrían generar mapas más precisos sin tener que comenzar con una suposición inicial, como lo hicieron la mayoría de los métodos de SLAM en ese momento. Su trabajo ayudó a abrir un campo en el que la mayoría de los robotistas pensaban que uno no podía hacerlo mejor que los algoritmos existentes.
«Slam se trata de descubrir la geometría de las cosas y cómo un robot se mueve entre esas cosas», dice Carlone. «Ahora soy parte de una comunidad que pregunta, ¿cuál es la próxima generación de slam?»
En busca de una respuesta, aceptó una posición postdocc en Georgia Tech, donde se sumergió en la codificación y la visión por computadora, un campo que, en retrospectiva, puede haber sido inspirado en un pincel con ceguera: mientras estaba terminando su doctorado en Italia , sufrió una complicación médica que afectó gravemente su visión.
«Durante un año, podría haber perdido fácilmente», dice Carlone. «Eso fue algo que me hizo pensar en la importancia de la visión y la visión artificial».
Pudo recibir una buena atención médica y la condición se resolvió por completo, de modo que pudiera continuar su trabajo. En Georgia Tech, su asesor, Frank Dellaert, le mostró formas de codificar en la visión por computadora y formular representaciones matemáticas elegantes de problemas tridimensionales complejos. Su asesor también fue uno de los primeros en desarrollar una biblioteca SLAM de código abierto, llamada GTSAM, que Carlone reconoció rápidamente como un recurso invaluable. En términos más generales, vio que hacer que el software estuviera disponible para todos desbloqueaba un gran potencial para el progreso en la robótica en su conjunto.
«Históricamente, el progreso en Slam ha sido muy lento, porque las personas mantuvieron sus códigos propiedad, y cada grupo tuvo que comenzar esencialmente desde cero», dice Carlone. «Luego, las tuberías de código abierto comenzaron a aparecer, y ese fue un cambio de juego, que ha impulsado en gran medida el progreso que hemos visto en los últimos 10 años».
Espacial que tienes
Después de Georgia Tech, Carlone llegó al MIT en 2015 como Postdoc en el Laboratorio de Sistemas de Información y Decisión (LIDS). Durante ese tiempo, colaboró con Sertac Karaman, profesor de aeronáutica y astronáutica, en el desarrollo del software para ayudar a los drones del tamaño de la palma a navegar sus alrededores utilizando muy poca potencia a bordo. Un año después, fue ascendido a científico investigador, y luego, en 2017, Carlone aceptó un puesto de facultad en Aeroastro.
“Una cosa de la que me enamoré en el MIT fue que todas las decisiones están impulsadas por preguntas como: ¿Cuáles son nuestros valores? ¿Cuál es nuestra misión? Nunca se trata de ganancias de bajo nivel. La motivación es realmente sobre cómo mejorar la sociedad ”, dice Carlone. «Como mentalidad, eso ha sido muy refrescante».
Hoy, el grupo de Carlone está desarrollando formas de representar el entorno de un robot, más allá de caracterizar su forma geométrica y su semántica. Está utilizando el aprendizaje profundo y los modelos de idiomas grandes para desarrollar algoritmos que permitan a los robots percibir su entorno a través de una lente de nivel superior, por así decirlo. En los últimos seis años, su laboratorio ha lanzado más de 60 repositorios de código abierto, que son utilizados por miles de investigadores y profesionales en todo el mundo. La mayor parte de su trabajo encaja en un campo emergente más grande conocido como «IA espacial».
«La IA espacial es como un golpe de esteroides», dice Carlone. «En pocas palabras, tiene que ver con permitir que los robots piensen y comprendan el mundo como lo hacen los humanos, de manera que pueda ser útil».
Es una gran tarea que podría tener impactos de gran alcance, en términos de permitir robots más intuitivos e interactivos para ayudar en casa, en el lugar de trabajo, en las carreteras y en áreas remotas y potencialmente peligrosas. Carlone dice que habrá mucho trabajo por delante, para acercarse a cómo los humanos perciben el mundo.
“Tengo hijas gemelas de 2 años, y las veo manipulando objetos, llevando 10 juguetes diferentes a la vez, navegando por las habitaciones desordenadas con facilidad y adaptando rápidamente a nuevos entornos. La percepción del robot aún no puede igualar lo que un niño pequeño puede hacer ”, dice Carlone. “Pero tenemos nuevas herramientas en el Arsenal. Y el futuro es brillante «.