La escasez de chips de IA continúa, pero puede haber un final a la vista

Aunque las GPU tienen una gran demanda, todavía necesitan chips de memoria de alto rendimiento para las aplicaciones de IA

Por qué las GPU necesitan memoria de gran ancho de banda

Según Lee, sin los chips HBM, el sistema de memoria del servidor de un centro de datos no podría seguir el ritmo de un procesador de alto rendimiento, como una GPU. Los HBM son los que suministran a las GPU los datos que procesan. "Cualquiera que compre una GPU para computación de IA también necesitará una memoria de gran ancho de banda".

“En otras palabras, las GPU de alto rendimiento se utilizarían mal y, a menudo, permanecerían inactivas esperando transferencias de datos. En resumen, la alta demanda de chips de memoria SK Hynix se debe a la alta demanda de chips GPU de Nvidia y, en menor medida, a la demanda de chips de IA alternativos, como los de AMD, Intel y otros”, expresa.

"HBM es relativamente nuevo y está ganando un fuerte impulso debido a lo que ofrece HBM: más ancho de banda y capacidad", dice Gaurav Gupta, analista de Gartner. “Es diferente a lo que venden Nvidia e Intel. Con excepción de SK Hynix, la situación para HBM es similar para otros reproductores de memoria. Para Nvidia, creo que existen limitaciones, pero más asociadas con la capacidad de empaquetar sus chips con las fundiciones”.

Mientras SK Hynix está alcanzando sus límites de suministro, Samsung y Micron están aumentando la producción de HBM y deberían poder satisfacer la demanda a medida que el mercado se vuelve más distribuido, según Lee. La escasez actual de HBM se produce principalmente en los envases de TSMC (es decir, chip-on-wafer-on-substrate o CoWoS), que es el proveedor exclusivo de la tecnología. Según Lee, TSMC está duplicando con creces su capacidad SOIC y aumentando la capacidad para CoWoS en más del 60%. "Espero que la escasez disminuya a finales de este año".

Al mismo tiempo, más proveedores de embalaje y fundición se están conectando y calificando su tecnología para admitir NVIDIA, AMD, Broadcom, Amazon y otros que utilizan la tecnología de embalaje de chips de TSMC, según Lee.

Se espera que Nvidia, cuya producción representa alrededor del 70% del suministro global de chips para servidores de IA , genere 40.000 millones de dólares en ingresos por las ventas de GPU este año, según analistas de Bloomberg. En comparación, se espera que los competidores Intel y AMD generen 500 millones de dólares y 3.500 millones de dólares, respectivamente. Pero los tres están aumentando la producción lo más rápido posible.

Según TrendForce, Nvidia está abordando la escasez de suministro de GPU aumentando sus capacidades de producción de CoWoS y HBM. “Se espera que este enfoque proactivo reduzca a la mitad el tiempo de entrega promedio actual de 40 semanas para el segundo trimestre [de 2024], a medida que nuevas capacidades comiencen a estar en línea”, dice el informe TrendForce en su informe. "Esta expansión tiene como objetivo aliviar los cuellos de botella de la cadena de suministro que han obstaculizado la disponibilidad de los servidores de IA debido a la escasez de GPU".

Shane Rau, vicepresidente de investigación de semiconductores informáticos de IDC, dijo que si bien la demanda de capacidad de chips de IA es muy alta, los mercados se están adaptando. “En el caso de las GPU de tipo servidor, están aumentando la oferta de obleas, embalajes y memorias. El aumento de la oferta es clave porque, debido a su rendimiento y programabilidad, las GPU de clase servidor seguirán siendo la plataforma elegida para entrenar y ejecutar grandes modelos de IA”.

Los fabricantes de chips luchan por satisfacer la demanda de IA

Se espera que el gasto mundial en chips centrados en IA alcance los 53.000 millones de dólares este año y que se duplique con creces en los próximos cuatro años, según Gartner. Por eso no sorprende que los fabricantes de chips estén lanzando nuevos procesadores tan rápido como pueden.

Intel ha anunciado sus planes para chips destinados a potenciar funciones de IA con sus procesadores Gaudi 3, y ha dicho que sus procesadores Xeon 6, que pueden ejecutar procesos de generación aumentada de recuperación (RAG), también serán clave. La GPU Gaudi 3 fue diseñada específicamente para entrenar y ejecutar modelos de lenguaje grandes (LLM) masivos que sustentan genAI en centros de datos.

Mientras tanto, AMD en su llamada de resultados más reciente promocionó su GPU MI300 para cargas de trabajo de centros de datos de IA, que también tiene una buena tracción en el mercado, según el vicepresidente del grupo IDC, Mario Morales, y añade que la firma de investigación está rastreando a más de 80 proveedores de semiconductores que desarrollan chips especializados. para IA.

En el lado del software de la ecuación, los creadores de LLM también están desarrollando modelos más pequeños diseñados para tareas específicas; requieren menos recursos de procesamiento y dependen de datos propietarios locales, a diferencia de los algoritmos masivos y amorfos que cuentan con cientos de miles de millones o incluso más de un billón de parámetros.

La estrategia de Intel en el futuro es similar: quiere habilitar la IA generativa en todo tipo de dispositivo informático, desde computadoras portátiles hasta teléfonos inteligentes. Los procesadores Intel Xeon 6 incluirán algunas versiones con unidades de procesamiento neuronal integradas (NPU o “aceleradores de IA”) para su uso en estaciones de trabajo, PC y dispositivos periféricos. Intel también afirma que sus procesadores Xeon 6 serán lo suficientemente buenos para ejecutar LLM más pequeños y personalizados.

Aun así, sin los HBM, esos procesadores probablemente tendrían dificultades para mantenerse al día con las demandas de alto rendimiento de IA generativa.

Imprimir Subir

TE PUEDE INTERESAR...

TECNOLOGÍA

SQL a los 50: ¿Qué le espera al lenguaje de consulta estructurada?

TECNOLOGÍA

¿Se puede hablar de un regreso de la IA generativa a las nubes privadas?

TENDENCIAS

La industria del centro de datos de Barcelona alcanzará una inversión de más de 1.000 millones para 2025

TECNOLOGÍA

El Cloud & Infrastructure Forum analizará el rol de la nube para aprovechar las ventajas de la IA

EMPRESAS

La salida de Hasso Platner marca un punto de inflexión en SAP

EMPRESAS

Anthropic lanza su 'chatbot' en Europa

EMPRESAS

Ilya Sutskever, cofundador de OpenAI, deja la compañía

ENTREVISTAS

"El 'know-how' de Sygnia va entre dos semanas y seis meses por delante del mercado"

EMPRESAS

Adam Selipsky abandona AWS y Matt Garman toma el relevo

Leonardo Freitas, gerente de Investigación en IDC Londres

ENTREVISTAS

"La IA, aunque potencialmente revolucionaria, pondrá una enorme presión sobre la infraestructura actual de TI"

TECNOLOGÍA

La industria de los chips podría no estar preparada para 2030

EMPRESAS

OpenAI lanza un nuevo GPT de escritorio multimodal y nuevas capacidades de voz

EMPRESAS

ARM planea lanzar chips de inteligencia artificial en 2025

EMPRESAS

OpenAI crea un marco para dar forma a la inteligencia artificial responsable

TECNOLOGÍA

La mejora del modelo 'cloud' ante la irrupción de la IA generativa, a debate

EMPRESAS

Kyndryl reduce sus pérdidas en más de un 75%

Webinar ondemand

Actualizar la transferencia de ficheros: seguridad, flexibilidad y cumplimiento regulatorio

Las empresas han aumentado sus presupuestos para proteger la información que tienen almacenada en la nube, pero ¿qué pasa con los archivos en tránsito? Los ficheros se mueven y, en esa transferencia, suele haber una puerta de entrada para los ciberdelincuentes. En este webinar te contamos cómo proteger tus datos sea cual sea su estado: en reposo o en movimiento.

Contenido Patrocinado

"El 'know-how' de Sygnia va entre dos semanas y seis meses por delante del mercado"

16 MAY 2024

El proveedor de soluciones tecnológicas Uniway ha anunciado un acuerdo de colaboración con la compañía israelí de ciberseguridad Sygnia, con la que buscan ofrecen al mercado español un servicio integral en su viaje de prevención, detección, respuesta y recuperación ante amenazas.

Forma parte de nuestra comunidad

¿Te interesan nuestras conferencias?

Especial Administraciones Públicas

No te pierdas...

La escasez de chips de IA continúa, pero puede haber un final a la vista

Por qué las GPU necesitan memoria de gran ancho de banda

Los fabricantes de chips luchan por satisfacer la demanda de IA

TE PUEDE INTERESAR...

Actualizar la transferencia de ficheros: seguridad, flexibilidad y cumplimiento regulatorio

"El 'know-how' de Sygnia va entre dos semanas y seis meses por delante del mercado"

Radiografía de la Administración pública local y regional en clave tecnológica

El Viejo Continente se abre camino hacia la Década Digital 2030

Angelines Turón (SEPE): "La digitalización pasa por muchos proyectos que, cuando confluyen, forman un auténtico tsunami"

La transformación digital en España como motor hacia una economía próspera y sostenible

Geografía y copilotos, aliados para los CIO de la Administración

Asegurando la integridad de los datos en la Administración pública: el papel crucial de la tecnología

La IA y los datos se alzan como protagonistas del 'Digital Government Forum' 2024

España debe acelerar la Administración digital a pesar de la complejidad de los desafíos

32 años de Linux y su comunidad

MareNostrum 5 conquista los 314.000 billones de cálculos por segundo

El gasto global en nube soberana llegará a 258.000 millones de dólares en 2027

Los 'CIO 100 Awards Spain 2023' distinguen los proyectos de innovación tecnológica del año

Gemini, de Google, a la conquista de las últimas capacidades de IA generativa

Por qué la mitad de los desarrolladores adoptarán software mejorado con inteligencia artificial

ChatGPT: 365 días después, el mundo parece otro

'Superapps': ¿La próxima gran novedad de las TI empresariales?

Las mujeres se hacen su camino en el ecosistema 'startupero' español

Grandes modelos lingüísticos: los cimientos de la IA generativa

Infraestructura como servicio: cómo implementar el 'cloud' sin caer en una gestión compleja

Redes modernas y fiables: lo que la Fórmula 1 y los negocios tienen en común

'SAP S/4HANA Cloud, public edition', la solución impulsora de la eficiencia y la innovación

Líderes de futuro: ingeniería de telecomunicación

Guía esencial de Microsoft 365