Los artistas que dan vida a héroes y villanos en películas animadas y videojuegos podrían tener más control sobre sus animaciones gracias a una nueva técnica introducida por investigadores del MIT.
Su método genera funciones matemáticas conocidas como coordenadas baricéntricas, que definen cómo las formas 2D y 3D pueden doblarse, estirarse y moverse en el espacio. Por ejemplo, un artista que utilice su herramienta podría elegir funciones que hagan que los movimientos de la cola de un gato en 3D se ajusten a su visión del «aspecto» del felino animado.
Este gif muestra cómo los investigadores utilizaron su técnica para proporcionar un movimiento más suave a la cola de un gato. Imagen: Cortesía de los investigadores.
Muchas otras técnicas para este problema son inflexibles y proporcionan solo una opción para las funciones de coordenadas baricéntricas para un determinado personaje animado. Cada función puede ser o no la mejor para una animación en particular. El artista tendría que empezar desde cero con un nuevo enfoque cada vez que quiera intentar conseguir un aspecto ligeramente diferente.
“Como investigadores, a veces podemos quedar atrapados en un bucle de resolución de problemas artísticos sin consultar con los artistas. Lo que les importa a los artistas es la flexibilidad y el «aspecto» de su producto final. No les importan las ecuaciones diferenciales parciales que su algoritmo resuelve entre bastidores”, afirma Ana Dodik, autora principal de un artículo sobre esta técnica.
Más allá de sus aplicaciones artísticas, esta técnica podría usarse en áreas como la imagen médica, la arquitectura, la realidad virtual e incluso en la visión por computadora como herramienta para ayudar a los robots a descubrir cómo se mueven los objetos en el mundo real.
Dodik, un estudiante de posgrado en ingeniería eléctrica e informática (EECS), escribió el artículo con Oded Stein, profesor asistente de la Escuela de Ingeniería Viterbi de la Universidad del Sur de California; Vincent Sitzmann, profesor asistente de EECS que dirige el Grupo de Representación de Escenas en el Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT (CSAIL); y el autor principal Justin Solomon, profesor asociado de EECS y líder del Grupo de Procesamiento de Datos Geométricos de CSAIL. La investigación se presentó recientemente en SIGGRAPH Asia.
Un enfoque generalizado
Cuando un artista anima un personaje 2D o 3D, una técnica común es rodear la forma compleja del personaje con un conjunto más simple de puntos conectados por segmentos de línea o triángulos, llamado jaula. El animador arrastra estos puntos para mover y deformar al personaje dentro de la jaula. El problema técnico clave es determinar cómo se mueve el personaje cuando se modifica la jaula; este movimiento está determinado por el diseño de una función de coordenadas baricéntrica particular.
Los enfoques tradicionales utilizan ecuaciones complicadas para encontrar movimientos basados en jaulas que sean extremadamente suaves, evitando torceduras que podrían desarrollarse en una forma cuando se estira o dobla al extremo. Pero hay muchas nociones de cómo la idea artística de “suavidad” se traduce en matemáticas, cada una de las cuales conduce a un conjunto diferente de funciones de coordenadas baricéntricas.
Los investigadores del MIT buscaron un enfoque general que permitiera a los artistas tener voz y voto en el diseño o elección de energías de suavidad para cualquier forma. Luego, el artista podría previsualizar la deformación y elegir la energía de suavidad que mejor se vea a su gusto.
Aunque el diseño flexible de coordenadas baricéntricas es una idea moderna, la construcción matemática básica de las coordenadas baricéntricas se remonta a siglos atrás. Introducidas por el matemático alemán August Möbius en 1827, las coordenadas baricéntricas dictan cómo cada esquina de una forma ejerce influencia sobre el interior de la forma.
En un triángulo, que es la forma que Möbius utilizó en sus cálculos, las coordenadas baricéntricas son fáciles de diseñar, pero cuando la jaula no es un triángulo, los cálculos se vuelven confusos. Crear coordenadas baricéntricas para una jaula complicada es especialmente difícil porque, para formas complejas, cada coordenada baricéntrica debe cumplir un conjunto de restricciones y al mismo tiempo ser lo más suave posible.
A diferencia de trabajos anteriores, el equipo utilizó un tipo especial de red neuronal para modelar las funciones de coordenadas baricéntricas desconocidas. Una red neuronal, basada libremente en el cerebro humano, procesa una entrada utilizando muchas capas de nodos interconectados.
Si bien las redes neuronales se utilizan a menudo en aplicaciones de inteligencia artificial que imitan el pensamiento humano, en este proyecto las redes neuronales se utilizan por una razón matemática. La arquitectura de red de los investigadores sabe cómo generar funciones de coordenadas baricéntricas que satisfagan exactamente todas las restricciones. Construyen las restricciones directamente en la red, de modo que cuando genera soluciones, siempre son válidas. Esta construcción ayuda a los artistas a diseñar coordenadas baricéntricas interesantes sin tener que preocuparse por los aspectos matemáticos del problema.
“La parte complicada fue desarrollar las limitaciones. Las herramientas estándar no nos permitieron llegar hasta allí, así que tuvimos que pensar de forma innovadora”, afirma Dodik.
Triángulos virtuales
Los investigadores se basaron en las coordenadas baricéntricas triangulares que Möbius introdujo hace casi 200 años. Estas coordenadas triangulares son sencillas de calcular y satisfacen todas las restricciones necesarias, pero las jaulas modernas son mucho más complejas que los triángulos.
Para cerrar la brecha, el método de los investigadores cubre una forma con triángulos virtuales superpuestos que conectan tripletes de puntos en el exterior de la jaula.
“Cada triángulo virtual define una función de coordenadas baricéntrica válida. Sólo necesitamos una forma de combinarlos”, afirma.
Ahí es donde entra en juego la red neuronal. Predice cómo combinar las coordenadas baricéntricas de los triángulos virtuales para realizar una función más complicada pero fluida.
Usando su método, un artista podría probar una función, observar la animación final y luego modificar las coordenadas para generar diferentes movimientos hasta llegar a una animación que se vea como desea.
«Desde una perspectiva práctica, creo que el mayor impacto es que las redes neuronales te dan mucha flexibilidad que antes no tenías», dice Dodik.
Los investigadores demostraron cómo su método podría generar animaciones de apariencia más natural que otros enfoques, como la cola de un gato que se curva suavemente cuando se mueve en lugar de doblarse rígidamente cerca de los vértices de la jaula.
En el futuro quieren probar diferentes estrategias para acelerar la red neuronal. También quieren integrar este método en una interfaz interactiva que permita a un artista iterar fácilmente animaciones en tiempo real.
Esta investigación fue financiada, en parte, por la Oficina de Investigación del Ejército de EE. UU., la Oficina de Investigación Científica de la Fuerza Aérea de EE. UU., la Fundación Nacional de Ciencias de EE. UU., el Programa CSAIL Systems that Learn, el MIT-IBM Watson AI Lab, el Toyota-CSAIL Joint Research Center, Adobe Systems, un premio de investigación de Google, la Agencia de Ciencia y Tecnología de Defensa de Singapur y Amazon Science Hub.