Si hay una cosa que caracteriza la conducción en cualquier ciudad importante, es la constante parada y go a medida que cambian los semáforos y a medida que los automóviles y camiones se fusionan y se separan y giran y se estacionan. Esta parada constante y comienzo es extremadamente ineficiente, lo que aumenta la cantidad de contaminación, incluidos los gases de efecto invernadero, que se emite por milla de conducción.
Un enfoque para contrarrestar esto se conoce como conducción ecológica, que se puede instalar como un sistema de control en vehículos autónomos para mejorar su eficiencia.
¿Cuánta diferencia podría hacer eso? ¿El impacto de tales sistemas en la reducción de las emisiones valdría la pena la inversión en la tecnología? Abordar tales preguntas es una de una categoría amplia de problemas de optimización que han sido difíciles de abordar para los investigadores, y ha sido difícil probar las soluciones que se les ocurre. Estos son problemas que involucran a muchos agentes diferentes, como los diferentes tipos de vehículos en una ciudad, y diferentes factores que influyen en sus emisiones, incluida la velocidad, el clima, las condiciones de la carretera y el tiempo de semáforo.
«Nos interesamos hace unos años en la pregunta: ¿hay algo que los vehículos automatizados puedan hacer aquí en términos de mitigar las emisiones?» Cathy Wu, Thomas D. y Virginia W. Cabot Development Profesor Asociado en el Departamento de Ingeniería Civil y Ambiental y el Instituto de Datos, Sistemas y Sociedad (IDSS) en MIT, e investigador principal en el Laboratorio de Información y Sistemas de Decisión. «¿Es una gota en el balde o es algo en lo que pensar?», Se preguntó.
Para abordar una pregunta de este tipo que involucra tantos componentes, el primer requisito es recopilar todos los datos disponibles sobre el sistema, de muchas fuentes. Uno es el diseño de la topología de la red, dice Wu, en este caso un mapa de todas las intersecciones en cada ciudad. Luego están los datos del Servicio Geológico de los Estados Unidos que muestran las elevaciones, para determinar el grado de las carreteras. También hay datos sobre temperatura y humedad, datos sobre la combinación de tipos de vehículos y edades, y sobre la combinación de tipos de combustible.
La conducción ecológica implica hacer pequeños ajustes para minimizar el consumo innecesario de combustible. Por ejemplo, a medida que los automóviles se acercan a un semáforo que se ha vuelto rojo, «no tiene sentido conducir lo más rápido posible hacia la luz roja», dice ella. Simplemente costando, «Mientras tanto, no estoy quemando gas o electricidad». Si un automóvil, como un vehículo automatizado, se ralentiza en el acercamiento a una intersección, entonces los autos convencionales y no automatizados detrás de él también se verán obligados a reducir la velocidad, por lo que el impacto de la conducción tan eficiente puede extenderse mucho más allá del automóvil que lo está haciendo.
Esa es la idea básica detrás de la conducción ecológica, dice Wu. Pero para descubrir el impacto de tales medidas, «estos son problemas de optimización desafiantes» que involucran muchos factores y parámetros diferentes, «por lo que hay una ola de interés en este momento en cómo resolver problemas de control duro usando IA».
El nuevo sistema de referencia que Wu y sus colaboradores desarrollaron en base a la conducción ecológica urbana, que llaman «intersectionzoo», tiene la intención de ayudar a abordar parte de esa necesidad. El punto de referencia se describió en detalle en un artículo presentado en la Conferencia Internacional de 2025 sobre representación de aprendizaje en Singapur.
Al observar los enfoques que se han utilizado para abordar tales problemas complejos, Wu dice que una categoría importante de métodos es el aprendizaje de refuerzo profundo de múltiples agentes (DRL), pero la falta de puntos de referencia estándar adecuados para evaluar los resultados de tales métodos ha obstaculizado el progreso en el campo.
El nuevo punto de referencia tiene la intención de abordar un tema importante que Wu y su equipo identificaron hace dos años, que es que con la mayoría de los algoritmos de aprendizaje de refuerzo profundo existentes, cuando se capacitan para una situación específica (por ejemplo, una intersección particular), el resultado no sigue siendo relevante cuando se realizan modificaciones pequeñas, como agregar un carril de bicicleta o cambiar la sincronización de una luz de tráfico, incluso cuando se les permite entrenar para el escenario modificado.
De hecho, señala Wu, este problema de no generalizabilidad «no es exclusivo del tráfico», dice ella. «Regresa hasta las tareas canónicas que la comunidad utiliza para evaluar el progreso en el diseño de algoritmos». Pero debido a que la mayoría de estas tareas canónicas no implican hacer modificaciones, «es difícil saber si su algoritmo está progresando en este tipo de problema de robustez, si no evaluamos eso».
Si bien hay muchos puntos de referencia que se utilizan actualmente para evaluar el progreso algorítmico en DRL, dice: «Este problema de conducción ecológica presenta un rico conjunto de características que son importantes para resolver problemas del mundo real, especialmente desde el punto de vista de generalización, y que ningún otro punto de referencia satisface». Esta es la razón por la cual los 1 millón de escenarios de tráfico basados en datos en intersectionzoo lo posicionan de manera única para avanzar en el progreso en la generalización de DRL. Como resultado, «este punto de referencia se suma a la riqueza de las formas de evaluar los algoritmos y el progreso RL profundos».
Y en cuanto a la pregunta inicial sobre el tráfico de la ciudad, un enfoque del trabajo en curso aplicará esta herramienta de evaluación comparativa recientemente desarrollada para abordar el caso particular de cuánto impacto en las emisiones provendrá de la implementación de la conducción ecológica en vehículos automatizados en una ciudad, dependiendo de qué porcentaje de dichos vehículos realmente se despliegan.
Pero Wu agrega que «en lugar de hacer algo que pueda implementar el conducto ecológico a escala de la ciudad, el objetivo principal de este estudio es apoyar el desarrollo de algoritmos de aprendizaje de refuerzo profundo de uso general, que se pueden aplicar a esta aplicación, pero también a todas estas otras aplicaciones, conducción autónoma, videojuegos, problemas de seguridad, problemas de robóticos, problemas de control clásico».
Wu agrega que «el objetivo del proyecto es proporcionar esto como una herramienta para los investigadores, que está abiertamente disponible». Intersectionzoo, y la documentación sobre cómo usarla, están disponibles gratuitamente en GitHub.
A Wu se une al documento por los autores principales Vindula Jayawardana, un estudiante graduado en el Departamento de Ingeniería Eléctrica e Informática del MIT (EECS); Baptiste Freydt, un estudiante graduado de ETH Zurich; y coautores AO Qu, un estudiante graduado en transporte; Cameron Hickert, un estudiante graduado de IDSS; y Zhongxia Yan PhD ’24.