• la semana pasada
At CES 2025, Nvidia CEO Jensen Huang kicks off CES, the world's largest consumer electronics show, with a new RTX gaming chip, updates on its AI chip Grace Blackwell and its future plans to dig deeper into robotics and autonomous cars.
Transcripción
00:00Aquí está, nuestra nueva GPU GeForce RTX 50 Series con arquitectura Blackwell.
00:11La GPU es una bestia. 92 billones de transistores, 4000 tops, 4 petaflops de AI.
00:22Tres veces más alto que la última generación AIDA.
00:25Y necesitamos todo eso para generar esos píxeles que les mostré.
00:29380 pétalos de rayos para que podamos, para los píxeles que tenemos que computar,
00:36computar la imagen más hermosa posible.
00:39Y, por supuesto, 125 pétalos de shader.
00:42Hay un concurrente de pétalos de shader,
00:45así como una unidad de energía de igual performance.
00:48Entonces, dos pétalos duales. Uno es para el punto flotante, otro es para la energía.
00:54Memoria G7 de Micron, 1.8 TB por segundo,
00:59dos veces la performance de nuestra última generación.
01:02Y ahora tenemos la capacidad de intercambiar los descargos de AI con descargos de gráficos de computador.
01:08Y una de las cosas increíbles de esta generación es que el shader programable también es capaz de procesar las redes neuronales.
01:17Entonces, el shader es capaz de llevar estas redes neuronales,
01:20y como resultado, inventamos la compresión de textura neurónica y el shader material neurónico
01:27con la familia Blackwell RTX 5070.
01:30La performance de 4090 en 549.
01:43Imposible sin la inteligencia artificial.
01:46Imposible sin los cuatro tops, los cuatro teraops de las redes tensores de inteligencia artificial.
01:53Imposible sin las memorias G7.
01:56Entonces, 5070, la performance de 4090, 549 dólares, y aquí está la familia.
02:02Empezando con 5070, hasta 5090.
02:055090, dos veces la performance de una 4090.
02:10Empezando...
02:12Por supuesto, estamos produciendo disponibilidad a gran escala a partir de enero.
02:17Bueno, es increíble, pero conseguimos poner estos GPUs de performance gigantesco en un computador.
02:27Este es un computador 5070.
02:30Para 1299, este computador 5070 tiene una performance de 4090.
02:38Entonces, el 5090 se encajará en un computador.
02:43Un computador fino.
02:44El último computador era de 14.9 milímetros.
02:47Tenemos un 5080, un 5070 Ti y un 5070.
02:51Pero lo que tenemos aquí básicamente son 72 GPUs Blackwell o 144 dies.
02:56Este chip es de 1.4 exaflops.
03:00El supercomputador más grande del mundo, el más rápido.
03:03Este supercomputador, solo recientemente, este supercomputador de toda la habitación, solo recientemente logró un exaflops.
03:10Este es de 1.4 exaflops de AI floating point performance.
03:14Tiene 14 terabytes de memoria, pero aquí es lo increíble.
03:18La banda de memoria es de 1.2 petabytes por segundo.
03:22Es básicamente todo el tráfico de Internet que está sucediendo en este momento.
03:30El tráfico de Internet de todo el mundo está siendo procesado a través de estos chips.
03:36Y tenemos 130 trillones de transistores en total, 2.592 cores de CPU, un montón de networking.
03:48Y así, estos, me gustaría poder hacer esto.
03:51No creo que pueda.
03:52Estos son los Blackwells.
03:53Estos son nuestros chips de networking ConnectX.
03:58Estos son los NVLink.
04:00Y estamos tratando de bromear sobre la espalda de los NVLink, pero eso no es posible.
04:06Y estos son todos los memorios de HBM.
04:0912, 14 terabytes de memoria de HBM.
04:12Esto es lo que estamos tratando de hacer.
04:14Y este es el milagro, este es el milagro del sistema Blackwell.
04:17Así que lo finestramos usando nuestra experiencia y nuestras capacidades,
04:20y lo convertimos en el suite de modelos abiertos de Lama-Nemotron.
04:26Hay modelos pequeños que interaccionan a muy rápida velocidad de respuesta, extremadamente pequeños.
04:33Son lo que llamamos supers, supers de Lama-Nemotron.
04:37Básicamente son las versiones principales de vuestros modelos.
04:40O vuestro modelo Ultra.
04:42El modelo Ultra puede ser usado.
04:44Para ser un modelo de profesor para un montón de otros modelos.
04:47Puede ser un modelo de recompensa, evaluador,
04:50un juzgado para otros modelos para crear respuestas y decidir si es una buena respuesta o no.
04:56Básicamente dar respuesta a otros modelos.
04:58Puede ser distilado en muchas formas diferentes.
05:00Básicamente un modelo de profesor, un modelo de distilación de conocimientos.
05:04Muy grande, muy capaz.
05:06Y todo esto ahora está disponible en línea.
05:09Envidia Cosmos, el primer modelo de fundación mundial.
05:13Está entrenado en 20 millones de horas de video.
05:18Los 20 millones de horas de video se enfocan en cosas físicas y dinámicas.
05:24Cosas dinámicas, temas de la naturaleza,
05:28humanos caminando, manos moviendo, manipulando cosas.
05:34Cosas que son movimientos de cámara rápida.
05:36Es realmente sobre enseñar a la AI.
05:39No sobre generar contenido creativo,
05:41pero enseñar a la AI a entender el mundo físico.
05:44Y con esta AI física,
05:47hay muchas cosas de abajo que podríamos hacer como resultado.
05:51Podríamos hacer generación de datos sintéticos para entrenar modelos.
05:55Podríamos distilarlo y convertirlo en efectivo.
06:00Podríamos generar múltiples escenarios físicamente plazables
06:04en el futuro.
06:06Básicamente, hacer un Doctor Strange.
06:08Porque este modelo entiende el mundo físico,
06:11por supuesto, viste un montón de imágenes generadas.
06:13Este modelo entiende el mundo físico.
06:15También podría hacer, por supuesto, captación.
06:18Y así podría tomar datos sintéticos.
06:21Podría hacer captación.
06:23Podría hacer captación.
06:25Podría hacer captación.
06:27Y así podría tomar videos.
06:29Capturarlo increíblemente bien.
06:32Y esa captación y el video
06:34podrían ser usados para entrenar modelos de lenguaje grande.
06:38Modelos de lenguaje grande multimodal.
06:41Y así podrías usar esta tecnología
06:43para usar este modelo de fundación
06:45para entrenar robots,
06:47así como modelos de lenguaje grande.
06:49Y así, este es el NVIDIA Cosmos.
06:51La plataforma tiene un modelo autoregresivo
06:53para aplicaciones en tiempo real.
06:55Tiene un modelo de difusión
06:57para generar imágenes de calidad muy alta.
06:59Es un tokenizador increíble,
07:01básicamente aprendiendo el vocabulario del mundo real.
07:04Y una red de datos,
07:06así que si te gustaría tomar todo esto
07:08y luego entrenarlo en tu propia data,
07:10esta red de datos,
07:12porque hay tanta data involucrada,
07:14hemos acelerado todo para ti.
07:16Y así, este es el primer modelo de procesamiento de datos del mundo
07:19que es CUDA acelerado,
07:21así como AI acelerado.
07:23Y esto es parte de la plataforma de Cosmos.
07:25Y hoy estamos anunciando
07:27que Cosmos es licenciado abierto.
07:29Está abierto y disponible en Github.
07:31Bueno, hoy estamos anunciando
07:33que nuestro procesador de próxima generación
07:35para el coche,
07:37nuestro computador de próxima generación
07:39para el coche se llama Thor.
07:41Tengo uno aquí, espera un segundo.
07:43Bien, este es Thor.
07:45Este es Thor.
07:47Este es...
07:49Este es un computador de robótica
07:51Este es un computador de robótica
07:53que toma sensores
07:55y una cantidad de sensores
07:57de una madre
07:59de información.
08:01Procesa
08:03cámaras,
08:05resolución alta,
08:07radars, lidars,
08:09todos vienen a este chip
08:11y este chip tiene que procesar todo ese sensor,
08:13convertirlo en tokens,
08:15ponerlo en un transformador
08:17y predicar el siguiente camino.
08:19Y este computador de AV
08:21ahora está en producción completa.
08:23Thor es 20 veces
08:25la capacidad de procesamiento
08:27de nuestro último generador, Oren,
08:29que es realmente el estándar
08:31de vehículos autónomos hoy.
08:33Esto es realmente increíble.
08:35Thor está en producción completa.
08:37Este procesador de robótica, por cierto,
08:39también se convierte en un robot completo.
08:41Puede ser un AMR,
08:43un robot humano,
08:45el cerebro, el manipulador.
08:47Este procesador, básicamente,
08:49es un computador de robótica universal.
08:51El momento de chat GPT
08:53para la robótica general
08:55está justo alrededor.
08:57Y, de hecho, todas las tecnologías
08:59que he estado hablando de
09:01van a hacer posible
09:03para nosotros
09:05en los próximos años
09:07ver desastres rápidos,
09:09desastres sorprendentes en la robótica general.
09:11La razón por la que la robótica general es tan importante
09:13es porque los robots
09:15con ruedas y ruedas
09:17necesitan espacios especiales
09:19para acompañarlos.
09:21Hay tres robots,
09:23tres robots en el mundo que podemos hacer
09:25que necesitan
09:27ningún campo verde.
09:29La adaptación del campo rojo es perfecta.
09:31Si pudiéramos posiblemente
09:33construir estos increíbles robots,
09:35podríamos desplegarlos
09:37en exactamente el mundo que hemos construido por nosotros mismos.
09:39Estos tres robots son,
09:41uno, robots agentes
09:43porque
09:45son trabajadores de información.
09:47Por lo tanto, si pudieran acompañar
09:49los computadores que tenemos en nuestras oficinas,
09:51sería genial.
09:53Dos, automóviles automáticos.
09:55Y la razón por la que lo hacemos es que hemos pasado
09:57más de 100 años construyendo carreteras y ciudades.
09:59Y, tres,
10:01humanos o robots.
10:03Si tenemos la tecnología para resolver estos tres,
10:05esta será la industria de tecnología
10:07más grande que el mundo haya visto.
10:09Esta es
10:11la nueva supercomputadora de inteligencia artificial de NVIDIA.
10:15Y
10:17se llama
10:19Proyecto Dígitos
10:21en este momento.
10:23Y si tienes un buen nombre para ello,
10:25háznoslo saber.
10:27Aquí es lo increíble.
10:29Esta es una supercomputadora de inteligencia artificial.
10:31Ruena toda la caja de inteligencia artificial de NVIDIA.
10:35Todo el software de NVIDIA runa en esto.
10:37DGX Cloud
10:39runa en esto.
10:41Esto se siente
10:43en algún lugar y es
10:45wireless o conectado a tu computadora.
10:47Incluso es una instalación de trabajo, si te gusta.
10:49Y puedes acceder a esto.
10:51Puedes alcanzarlo como
10:53una supercomputadora de cloud.
10:55Y la inteligencia artificial de NVIDIA
10:57funciona en esto.
10:59Y es basado en un chip supersecreto
11:01que hemos estado trabajando en,
11:03llamado GB110,
11:05la pequeña caja de inteligencia artificial de Grace que hacemos.
11:07Y este es el chip que está adentro.
11:11Está en producción.
11:13Este chip supersecreto
11:15que hicimos en colaboración
11:17con la CPU, la CPU de Grace,
11:19fue construido
11:21para NVIDIA en colaboración
11:23con MediaTek.
11:25Son la compañía de S.O.C. líder del mundo
11:27y trabajaron con nosotros para construir
11:29esta CPU, la S.O.C. de la CPU
11:31y la conectamos con el chip-to-chip
11:33NVLink a la GPU de Blackwell.
11:35Y esta pequeña caja
11:37está en plena producción.
11:39Esperamos que
11:41este computador
11:43sea disponible
11:45a finales de mayo.

Recomendada