Jueves, 18 de diciembre de 2025 Jue 18/12/2025
RSS Contacto
MERCADOS
Cargando datos de mercados...
Economía

Nvidia entra a la carrera de los modelos de IA abiertos con Nemotron 3

Nvidia entra a la carrera de los modelos de IA abiertos con Nemotron 3
Artículo Completo 813 palabras
La principal fabricante de chips del mundo quiere que la IA de código abierto triunfe, quizá porque los modelos cerrados funcionan cada vez más con el silicio de sus rivales.
Will KnightStartup y Cultura Tecnológica15 de diciembre de 2025OpenAI, Google y Anthropic están desarrollando sus propios chips cada vez más capaces, podría servir para evitar que estas empresas se alejen de la tecnología de Nvidia con el tiempo.

Los modelos abiertos son ya una parte crucial del ecosistema de la IA, y muchos investigadores y empresas de nueva creación los utilizan para experimentar, crear prototipos y construir. Aunque OpenAI y Google ofrecen pequeños modelos abiertos, no los actualizan con tanta frecuencia como sus rivales en China. Por esta y otras razones, los modelos abiertos de las empresas chinas son actualmente mucho más populares, según datos de Hugging Face, una plataforma de alojamiento de proyectos de código abierto.

Los nuevos modelos Nemotron 3 de Nvidia se encuentran entre los mejores que pueden descargarse, modificarse y ejecutarse en el propio hardware, según las puntuaciones de referencia compartidas por la empresa antes de su lanzamiento.

"La innovación abierta es la base del progreso de la inteligencia artificial", declaró Jensen Huang, CEO de la compañía, en un comunicado previo a la noticia. "Con Nemotron, estamos transformando la IA avanzada en una plataforma abierta que ofrece a los desarrolladores la transparencia y la eficiencia que necesitan para construir agentes de IA a escala".

Nvidia está adoptando un enfoque más transparente que muchos de sus rivales estadounidenses al publicar los datos utilizados para entrenar a Nemotron, un hecho que debería ayudar a los ingenieros a modificar los modelos más fácilmente. La empresa también está publicando herramientas que facilitan la personalización y el ajuste. Entre ellas se incluye una nueva arquitectura híbrida de modelos de mezcla latente de expertos que, según Nvidia, es especialmente adecuada para crear agentes de IA que puedan realizar acciones en computadoras o en la web. La empresa también está lanzando bibliotecas que permiten a los usuarios entrenar a los agentes para que hagan cosas utilizando el aprendizaje por refuerzo, que consiste en dar a los modelos recompensas y castigos simulados.

Los modelos Nemotron 3 vienen en tres tamaños: Nano, con 30,000 millones de parámetros; Super, con 100,000 millones; y Ultra, con 500,000 millones. Los parámetros de un modelo se corresponden con su capacidad y con lo difícil que es de manejar. Los modelos más grandes son tan engorrosos que tienen que funcionar en bastidores de hardware caro.

Las mentes maestras detrás de la revolución tecnológica de estos tiempos se enteran de las noticias gracias a nuestro newsletter.

¡Suscríbete ya y dile adiós al algoritmo!

Arrow

Fundamentos de los modelos

Kari Ann Briski, vicepresidenta de software de IA generativa para empresas de Nvidia, afirma que los modelos abiertos son importantes para los creadores de IA por tres razones: los creadores necesitan cada vez más personalizar los modelos para tareas concretas; a menudo resulta útil transferir consultas a diferentes modelos; y es más fácil exprimir respuestas más inteligentes de estos modelos después del entrenamiento haciéndoles realizar una especie de razonamiento simulado. "Creemos que el código abierto es la base de la innovación en IA, que seguirá acelerando la economía mundial", opina Briski.

El gigante de las redes sociales Meta lanzó los primeros modelos abiertos avanzados bajo el nombre de Llama en febrero de 2023. Sin embargo, a medida que se ha intensificado la competencia, Meta ha señalado que sus futuras versiones podrían no ser de código abierto.

Un informe reciente de OpenRouter, una empresa que permite acceder a diferentes modelos a través de una única interfaz de usuario, muestra que los modelos abiertos representaron alrededor de un tercio de todos los tokens (unidades de texto y otros datos) enviados a través de sus sistemas en 2025. Empresas chinas como DeepSeek, Alibaba, Moonshot AI, Z.ai y MiniMax lanzan regularmente potentes modelos abiertos y publican detalles sobre sus avances en investigación que hacen que sus ofertas sean más atractivas para que los ingenieros experimenten con ellas.

Esto podría resultar problemático para Nvidia. El hardware de la compañía se ha vuelto tan importante en el mundo de la IA que su silicio se ha convertido en moneda de cambio en las negociaciones comerciales de Trump con China. El gobierno estadounidense anunció recientemente que permitiría a Nvidia exportar chips H200, losmejores de su generación anterior, a China, pero el gobierno chino está deseoso de lograr una mayor independencia tecnológica y ha tomado medidas para empujar a las empresas chinas a utilizar chips de producción propia. Esto podría significar que los modelos chinos de IA se alineen más estrechamente con el silicio chino, lo que podría socavar la posición de Nvidia.

Artículo originalmente publicado enWIRED. Adaptado por Mauricio Serfatty Godoy.

Fuente original: Leer en Wired - Negocios
Compartir