• Última
  • Tendencias
gpu-ocupadas:-el-metodo-de-muestreo-y-canalizacion-acelera-el-aprendizaje-profundo-en-graficos-grandes

GPU ocupadas: el método de muestreo y canalización acelera el aprendizaje profundo en gráficos grandes

30/11/2022
el-grupo-mas-recibe-el-xxvi-premio-emprendedor-del-ano-de-ey-para-andalucia-y-extremadura

El Grupo MAS recibe el XXVI Premio Emprendedor del Año de EY para Andalucía y Extremadura

27/01/2023
la-justicia-estadounidense-difunde-el-video-de-la-agresion-al-marido-de-nancy-pelosi

La justicia estadounidense difunde el vídeo de la agresión al marido de Nancy Pelosi

27/01/2023
al-menos-ocho-muertos-en-un-tiroteo-en-una-sinagoga-de-jerusalen

Al menos ocho muertos en un tiroteo en una sinagoga de Jerusalén

27/01/2023
la-policia-investiga-a-contrarreloj-si-alguien-alento-al-detenido-en-algeciras-a-atentar-en-las-iglesias

La Policía investiga a contrarreloj si alguien alentó al detenido en Algeciras a atentar en las iglesias

27/01/2023
sanchez-advierte-a-la-derecha-de-que-no-ha-llegado-el-«apocalipsis»-apelando-al-crecimiento-del-5,5%-en-la-economia

Sánchez advierte a la derecha de que no ha llegado el «apocalipsis» apelando al crecimiento del 5,5% en la economía

27/01/2023
maroto-se-agarra-a-carmena-y-buscara-un-acto-conjunto-que-movilice-a-la-izquierda-en-madrid

Maroto se agarra a Carmena y buscará un acto conjunto que movilice a la izquierda en Madrid

27/01/2023
nacho-cano-vuelve-a-defender-a-ayuso:-«ha-sido-la-salvadora-de-este-pais»

Nacho Cano vuelve a defender a Ayuso: «Ha sido la salvadora de este país»

27/01/2023
transformando-ceramicas.-museo-en-movimiento

Transformando cerámicas. Museo en movimiento

27/01/2023
jornada-de-juegos-en-familia-y-escape-room

Jornada de juegos en familia y escape room

27/01/2023

Los CDC insta a las personas con sistemas inmunitarios débiles a tomar precauciones adicionales después de que las subvariantes de Covid eliminen a Evusheld

27/01/2023
el-dolar-estadounidense-puede-ser-la-clave-para-determinar-si-este-repunte-del-mercado-puede-durar.

El dólar estadounidense puede ser la clave para determinar si este repunte del mercado puede durar.

27/01/2023
los-no-competidores-controvertidos-ahora-se-enfrentan-a-una-posible-prohibicion.-pero-un-grupo-nunca-tuvo-que-preocuparse-por-ellos:-los-abogados

Los no competidores controvertidos ahora se enfrentan a una posible prohibición. Pero un grupo nunca tuvo que preocuparse por ellos: los abogados

27/01/2023
  • Sobre nosotros
  • Política de privacidad
  • Anunciar
  • Contactos
Hey.lt - Nemokamas lankytojų skaitliukas
viernes, enero 27, 2023
Retail
Contactos
Anunciar
  • Nuevos
  • Nacional
  • International
  • Economía
  • Deportes
  • Salud
  • Sociedad
    • Cultura
    • Mascotas
    • Construcción y Vivienda
    • Turismo y Viajes
    • Música y películas
    • Psicología
    • Horóscopos
    • Moda y Estilo
    • Religión
    • Familia
    • Belleza
  • Gastronomía
  • Ciencia y Tecnología
    • SpaceX
    • Inteligencia Artificial
  • Regiones
    • Costa del Sol
    • Málaga
    • Andalucía
    • Cataluña
    • Madrid
    • Valenciana
    • País Vasco
    • Galicia
No Result
View All Result
EntreNosotros | Portal de noticias | Recibe noticias de todo el mundo
No Result
View All Result
Hey.lt - Nemokamas lankytojų skaitliukas

GPU ocupadas: el método de muestreo y canalización acelera el aprendizaje profundo en gráficos grandes

Escrito por Entrenosotros
30/11/2022
in Inteligencia Artificial
52 2
0
gpu-ocupadas:-el-metodo-de-muestreo-y-canalizacion-acelera-el-aprendizaje-profundo-en-graficos-grandes

Los gráficos, una red potencialmente extensa de nodos conectados por bordes, se pueden usar para expresar e interrogar relaciones entre datos, como conexiones sociales, transacciones financieras, tráfico, redes de energía y moleculares. interacciones. A medida que los investigadores recopilen más datos y construyan estas imágenes gráficas, necesitarán métodos más rápidos y eficientes, así como más poder computacional, para llevar a cabo un aprendizaje profundo en ellos, en forma de redes neuronales gráficas (GNN).

Ahora, un nuevo método, llamado SALIENT (SAmpling, sLIcing, and data movemeNT), desarrollado por investigadores del MIT e IBM Research, mejora el rendimiento del entrenamiento y la inferencia al abordar tres cuellos de botella clave en cálculo. Esto reduce drásticamente el tiempo de ejecución de GNN en grandes conjuntos de datos que, por ejemplo, contienen en la escala de 100 millones de nodos y mil millones de bordes. Además, el equipo descubrió que la técnica escala bien cuando se agrega potencia computacional de una a 13 unidades de procesamiento gráfico (GPU). El trabajo fue presentado en la Quinta Conferencia sobre Aprendizaje Automático y Sistemas.

YOU MAY ALSO LIKE

Poner límites claros a la incertidumbre

Investigadores del MIT desarrollan un modelo de IA que puede detectar el riesgo futuro de cáncer de pulmón

“Comenzamos a observar los desafíos que experimentan los sistemas actuales al escalar técnicas de aprendizaje automático de última generación para gráficos a conjuntos de datos realmente grandes. Resultó que había mucho trabajo por hacer, porque muchos de los sistemas existentes estaban logrando un buen rendimiento principalmente en conjuntos de datos más pequeños que caben en la memoria de la GPU”, dice Tim Kaler, autor principal y posdoctorado en Ciencias de la Computación del MIT. y el Laboratorio de Inteligencia Artificial (CSAIL).

Por vastos conjuntos de datos, los expertos se refieren a escalas como toda la red de Bitcoin, donde ciertos patrones y relaciones de datos podrían explicar tendencias o juegos sucios. «Hay casi mil millones de transacciones de Bitcoin en la cadena de bloques, y si queremos identificar actividades ilícitas dentro de una red conjunta de este tipo, entonces nos enfrentamos a un gráfico de tal escala», dice el coautor Jie Chen, científico investigador principal y gerente. de IBM Research y el MIT-IBM Watson AI Lab. “Queremos construir un sistema que sea capaz de manejar ese tipo de gráficos y permita que el procesamiento sea lo más eficiente posible, porque todos los días queremos seguir el ritmo de los nuevos datos que se generan”.

Los coautores de Kaler y Chen incluyen a Nickolas Stathas MEng ’21 de Jump Trading, quien desarrolló SALIENT como parte de su trabajo de posgrado; la ex becaria del MIT-IBM Watson AI Lab y estudiante de posgrado del MIT Anne Ouyang; el postdoctorado MIT CSAIL Alexandros-Stavros Iliopoulos; Tao B. Schardl, científico investigador de MIT CSAIL; y Charles E. Leiserson, profesor de ingeniería eléctrica Edwin Sibley Webster en el MIT e investigador del MIT-IBM Watson AI Lab.

Para este problema, el equipo adoptó un enfoque orientado a los sistemas al desarrollar su método: SALIENT, dice Kaler. Para hacer esto, los investigadores implementaron lo que consideraron optimizaciones básicas importantes de los componentes que encajan en los marcos de aprendizaje automático existentes, como PyTorch Geometric y la biblioteca de gráficos profundos (DGL), que son interfaces para construir un modelo de aprendizaje automático. Stathas dice que el proceso es como cambiar motores para construir un auto más rápido. Su método fue diseñado para adaptarse a las arquitecturas GNN existentes, de modo que los expertos de dominio pudieran aplicar fácilmente este trabajo a sus campos específicos para acelerar el entrenamiento del modelo y obtener información durante la inferencia más rápido. El equipo determinó que el truco consistía en mantener ocupado todo el hardware (CPU, enlaces de datos y GPU) en todo momento: mientras la CPU toma muestras del gráfico y prepara minilotes de datos que luego se transferirán a través del enlace de datos. , la GPU más crítica está trabajando para entrenar el modelo de aprendizaje automático o realizar inferencias.

Los investigadores comenzaron analizando el rendimiento de una biblioteca de aprendizaje automático de uso común para GNN (PyTorch Geometric), que mostró una utilización sorprendentemente baja de los recursos GPU disponibles. Aplicando optimizaciones simples, los investigadores mejoraron la utilización de GPU de 10 a 27 por ciento , lo que da como resultado una mejora del rendimiento de 1,4 a dos veces en relación con los códigos de referencia públicos. Este código de referencia rápido podría ejecutar una pasada completa sobre un gran conjunto de datos de entrenamiento a través del algoritmo (una época) en 50.4 segundos.

Buscando mejoras adicionales en el rendimiento, los investigadores se dispusieron a examinar los cuellos de botella que ocurren al comienzo de la canalización de datos: los algoritmos para el muestreo de gráficos y la preparación de mini lotes. A diferencia de otras redes neuronales, las GNN realizan una operación de agregación de vecindario, que calcula información sobre un nodo utilizando información presente en otros nodos cercanos en el gráfico; por ejemplo, en un gráfico de red social, información de amigos de amigos de un usuario. A medida que aumenta la cantidad de capas en la GNN, la cantidad de nodos a los que la red tiene que llegar para obtener información puede explotar, excediendo los límites de una computadora. Los algoritmos de muestreo de vecindario ayudan al seleccionar un subconjunto aleatorio más pequeño de nodos para recopilar; sin embargo, los investigadores descubrieron que las implementaciones actuales de esto eran demasiado lentas para mantenerse al día con la velocidad de procesamiento de las GPU modernas. En respuesta, identificaron una combinación de estructuras de datos, optimizaciones algorítmicas, etc., que mejoraron la velocidad de muestreo y, en última instancia, mejoraron la operación de muestreo solo unas tres veces, tomando el tiempo de ejecución por época de 50.4 a 34.6 segundos. También encontraron que el muestreo, a un ritmo apropiado, se puede realizar durante la inferencia, mejorando la eficiencia y el rendimiento energético general, un punto que se había pasado por alto en la literatura, señala el equipo.

En sistemas anteriores, este paso de muestreo era un enfoque de múltiples procesos, creando datos adicionales y movimientos de datos innecesarios entre los procesos. Los investigadores hicieron que su método SALIENT fuera más ágil al crear un proceso único con subprocesos livianos que mantuvieron los datos en la CPU en la memoria compartida. Además, SALIENT aprovecha un caché de procesadores modernos, dice Stathas, paralelizando el corte de funciones, que extrae información relevante de los nodos de interés y sus vecinos y bordes circundantes, dentro de la memoria compartida del caché central de la CPU. Esto nuevamente redujo el tiempo de ejecución general por época de 34.6 a 27.8 segundos.

El último cuello de botella que abordaron los investigadores fue canalizar transferencias de datos en minilotes entre la CPU y la GPU mediante un paso de obtención previa, que prepararía los datos justo antes de que se necesiten. El equipo calculó que esto maximizaría el uso del ancho de banda en el enlace de datos y llevaría el método a una utilización perfecta; sin embargo, solo vieron alrededor del 50 por ciento. Identificaron y corrigieron un error de rendimiento en una popular biblioteca de PyTorch que provocaba comunicaciones de ida y vuelta innecesarias entre la CPU y la GPU. Con este error solucionado, el equipo logró un tiempo de ejecución de 13 .5 segundos por época con SALIENT.

“Creo que nuestro trabajo mostró que el diablo está en los detalles”, dice Kaler. “Cuando presta mucha atención a los detalles que afectan el rendimiento al entrenar una red neuronal gráfica, puede resolver una gran cantidad de problemas de rendimiento. Con nuestras soluciones, terminamos con un cuello de botella total debido a la computación GPU, que es el objetivo ideal de un sistema de este tipo”.

La velocidad de SALIENT se evaluó en tres conjuntos de datos estándar ogbn-arxiv, ogbn- productos y ogbn-papers100M, así como en configuraciones de varias máquinas, con diferentes niveles de fanout (cantidad de datos que la CPU prepararía para la GPU) y en varias arquitecturas , incluido el más reciente de última generación, GraphSAGE-RI. En cada configuración, SALIENT superó a PyTorch Geometric, sobre todo en el gran conjunto de datos ogbn-papers100M, que contiene 100 millones de nodos y más de mil millones de bordes Aquí, fue tres veces más rápido, ejecutándose en una GPU, que la línea de base optimizada que se creó originalmente para este trabajo; con 13 GPU, SALIENT fue ocho veces más rápido.

Si bien otros sistemas tenían hardware y configuraciones experimentales ligeramente diferentes, por lo que no siempre fue una comparación directa, SALIENT aún los superó. Entre los sistemas que lograron una precisión similar, los números de rendimiento representativos incluyen 99 segundos usando una GPU y 32 CPU, y 16 segundos usando 1,536 CPU. Por el contrario, el tiempo de ejecución de SALIENT con una GPU y 10 CPU fue 13 0,5 segundos y fueron solo dos segundos con 13 GPU y 320 CPU. “Si observa los números finales que informan trabajos anteriores, nuestro tiempo de ejecución de GPU 13 (dos segundos) es un orden de magnitud más rápido que otros números que se han informado anteriormente en este conjunto de datos”, dice Kaler. Los investigadores atribuyeron sus mejoras de rendimiento, en parte, a su enfoque de optimizar su código para una sola máquina antes de pasar a la configuración distribuida. Stathas dice que la lección aquí es que, por su dinero, «tiene más sentido usar el hardware que tiene de manera eficiente y extrema, antes de comenzar a escalar a varias computadoras», lo que puede proporcionar ahorros significativos en costos y emisiones de carbono. eso puede venir con el entrenamiento de modelos.

Esta nueva capacidad ahora permitirá a los investigadores abordar y profundizar en gráficos cada vez más grandes. Por ejemplo, la red Bitcoin que se mencionó anteriormente contenía 100, 000 nodos; el sistema SALIENT puede manejar hábilmente un gráfico 1, veces (o tres órdenes de magnitud) más grande.

“En el futuro, buscaríamos no solo ejecutar este sistema de entrenamiento de redes neuronales gráficas en los algoritmos existentes que implementamos para clasificar o predecir las propiedades de cada nodo, sino que también queremos profundizar tareas, como identificar patrones comunes en un gráfico (patrones de subgráficos), [que] pueden ser realmente interesantes para indicar delitos financieros”, dice Chen. “También queremos identificar nodos en un gráfico que sean similares en el sentido de que posiblemente correspondan al mismo malhechor en un delito financiero. Estas tareas requerirían desarrollar algoritmos adicionales y posiblemente también arquitecturas de redes neuronales”.

Esta investigación fue apoyada por el MIT-IBM Watson AI Lab y en parte por el Laboratorio de Investigación de la Fuerza Aérea de EE. el Acelerador de Inteligencia Artificial de la Fuerza Aérea de EE. UU.

Compartir7Tweet4Compartir1CompartirCompartir

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias recientes

el-grupo-mas-recibe-el-xxvi-premio-emprendedor-del-ano-de-ey-para-andalucia-y-extremadura

El Grupo MAS recibe el XXVI Premio Emprendedor del Año de EY para Andalucía y Extremadura

27/01/2023
la-justicia-estadounidense-difunde-el-video-de-la-agresion-al-marido-de-nancy-pelosi

La justicia estadounidense difunde el vídeo de la agresión al marido de Nancy Pelosi

27/01/2023
al-menos-ocho-muertos-en-un-tiroteo-en-una-sinagoga-de-jerusalen

Al menos ocho muertos en un tiroteo en una sinagoga de Jerusalén

27/01/2023

Entrenosotros es un portal de noticias que pretende ofrecer a sus lectores noticias de todo el mundo. Cubrimos desde noticias políticas hasta contenidos sobre estilo de vida.

Noticias recientes

  • El Grupo MAS recibe el XXVI Premio Emprendedor del Año de EY para Andalucía y Extremadura
  • La justicia estadounidense difunde el vídeo de la agresión al marido de Nancy Pelosi
  • Al menos ocho muertos en un tiroteo en una sinagoga de Jerusalén

Comentarios recientes

  • Greco en 1 mil millones Por la economía de Lituania: la incubadora de empresas de la Agencia Espacial Europea comienza a operar
  • Adrian en Rusia está lista para reducir su producción de petróleo en un 7% a principios del próximo año para devolver el golpe al límite de precios liderado por la UE, dice Moscú
  • Sobre nosotros
  • Política de privacidad
  • Anunciar
  • Contactos
  • English
  • Deutsch
  • Français
  • Português
  • Italiano
  • Lietuvių kalba
  • Polski
  • Українська
  • Español
  • Türkçe
  • Русский

© 2019-2022 EntreNosotros. Reservados todos los derechos.

No Result
View All Result
  • Nuevos
  • Nacional
  • International
  • Economía
  • Deportes
  • Salud
  • Sociedad
    • Cultura
    • Mascotas
    • Construcción y Vivienda
    • Turismo y Viajes
    • Música y películas
    • Psicología
    • Horóscopos
    • Moda y Estilo
    • Religión
    • Familia
    • Belleza
  • Gastronomía
  • Ciencia y Tecnología
    • SpaceX
    • Inteligencia Artificial
  • Regiones
    • Costa del Sol
    • Málaga
    • Andalucía
    • Cataluña
    • Madrid
    • Valenciana
    • País Vasco
    • Galicia

© 2019-2022 EntreNosotros. Reservados todos los derechos.

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In