Tim Zaman, gerente de ingeniería de la plataforma AI Infra & AI de Tesla, ha declarado recientemente que el fabricante de vehículos eléctricos cuenta con la séptima supercomputadora más grande del mundo por recuento de GPU. Que esta herramienta esté a disposición de un fabricante de automóviles demuestra la importancia de la adquisición de datos, las comunicaciones y cálculo en la nueva industria eléctrica del automóvil. Pero Tesla no se va a quedar aquí, puesto que su intención es implementar la nueva computadora Dojo personalizada. Un súper ordenador desarrollado para la gestión gráfica de manera masiva que está enfocado al desarrollo intensivo de los proyectos del Autopilot y la conducción completamente automática Full Self-Driving.
Tesla será uno de los patrocinadores de la Conferencia MLSys que se celebrará entre el 29 de agosto y el 1 de septiembre en Santa Clara. En ella debatirán y presentarán los últimos avances sobre el Machine Learning (aprendizaje automático). Esta comunidad se creó para resolver los problemas y reconocer las necesidades de escalar la colaboración interdisciplinaria entre la academia y la industria. Tesla demuestra así que en la era del coche eléctrico el hardware y el software han de ir de la mano y son igual de importantes, un hecho que también ha subrayado Bosch hace unos días a través de su CEO Stephan Hartung.
Zaman ha aprovechado esta ocasión para presentar a través de sus redes sociales (Twitter y Linkedn) la actualización del hardware de Tesla y la próxima implementación de una computadora gráfica dedicada todavía más potente. Tesla ha actualizado recientemente su supercomputadora gráfica a 7360 GPU A-100 (80 GB), lo que la convierte en la séptima más grande del mundo por número de GPU. El GPU es un procesador formado por muchos núcleos pequeños y muy especializados. Trabajando conjuntamente, los núcleos ofrecen un alto rendimiento en tareas de procesamiento que se pueden dividir y ser procesada por muchos núcleos.
Las GPU A100 son producidas por Nvidia, la empresa donde trabajaba Zaman antes de ser reclutado por Tesla. Cada procesador tiene 80 GB de memoria gráfica y cuenta con un ancho de banda de memoria de 2 TB por segundo. Se trata de un hardware muy potente, aunque Tesla necesitará más para llevar a cabo sus ambiciosos proyectos.
Tesla is sponsoring the @MLSysConf, come visit our booth for opportunities on the AI team and see our hardware.
— Tim Zaman (@tim_zaman) August 12, 2022
We have recently upgraded our GPU supercomputer (photo) to 7360 A-100(80GB) GPUs, making it Top-7 by gpu-count. Reach out to build #1: https://t.co/mPiOOb8CJg pic.twitter.com/VN5orhbtLy
Los datos que suministran la flota de coches eléctricos de Tesla son recopilados de forma anónima por la compañía. La red neuronal que la compañía emplea para poder perfeccionar su sistema de conducción autónoma requiere procesar dicha información. Detrás de todo este sistema está un hardware capaz de optimizar todo el proceso, ordenando los datos de forma ágil y precisa.
Tesla lleva dos años desarrollando su propia solución interna que no dependa de terceras empresas para el suministro y funcionamiento de los chips, puesto que lo que ofrece el mercado actualmente no es lo suficientemente rápido y potente para sus requerimientos. La computadora actual de Tesla es un equipo precursor de Dojo, con chips Nvidia, que fue presentada en agosto del año pasado en el primer IA Day. Tesla señaló en ese evento que esta supercomputadora, anterior a Dojo, ya era la quinta más poderosa del mundo con sus 5760 chips Nvidia A100. La compañía parece haber agregado alrededor de 1600 GPU al sistema desde entonces, alrededor del 27% más.
La supercomputadora Dojo de Tesla lleva diseñándose internamente desde hace dos años. Es una máquina independiente de los chips Nvidia A100 ya que en su lugar, utilizaría el chip D1 desarrollado por Tesla y que utiliza arquitectura de 7 nanómetros. Es capaz de procesar más de un exaflop de operaciones de coma flotante por segundo (1.000 petaFLOPS/s). Dojo estará optimizada para cargas de trabajo de aprendizaje automático, y especializada en los proyectos Autopilot y Full Self-Driving de Tesla. Cuando comience a funcionar, las mejoras en Autopilot y FSD se acelerarán.
Una de las particularidades de Dojo es el hecho de que sus especificaciones están diseñadas para una sola cosa: hacer posibles los vehículos autónomos. Durante IA Day del año pasado, Tesla destacó que Dojo es una máquina de aprendizaje puro con más de 500.000 nodos de entrenamiento integrados. Tiene una capacidad de 9 PetaFlops con 36 TB por segundo de ancho de banda en un espacio ocupando tan solo un volumen aproximado de 28 litros (1 pie cúbico). Tesla también destacó que Dojo es un trabajo en progreso, por lo que incluso las impresionantes especificaciones y características que la compañía presentó en ese momento mejorarán cuando se implemente realmente.