Skip to content
ANALYSE : La mémoire DRAM, nouveau pétrole de l’IA — pourquoi la pénurie mondiale va durer
Crédit: Adobe Stock

Un serveur IA consomme 8 fois plus de mémoire qu’un serveur classique

Pour comprendre pourquoi la pénurie de DRAM est structurelle, il faut appréhender l’échelle de la consommation mémoire des infrastructures d’IA. Un serveur de data center classique typique contient environ 256 à 512 gigaoctets de DRAM. Un serveur d’IA spécialisé — comme ceux qui font tourner des modèles de langage à grande échelle — peut nécessiter jusqu’à 4 à 8 téraoctets de DRAM haute bande passante (HBM, High Bandwidth Memory). Multipliez cela par les centaines de milliers de serveurs que Microsoft, Google, Amazon et Meta déploient chaque année pour leurs infrastructures d’IA, et vous obtenez une demande qui dépasse les capacités de production mondiales.

ChatGPT seul — le service d’OpenAI hébergé par Microsoft — nécessite l’équivalent de plusieurs centaines de milliers de puces GPU NVIDIA, chacune accompagnée de quantités massives de mémoire DRAM. En 2026, les estimations industrielles suggèrent que les data centers d’IA consomment environ 40 % de la production mondiale de DRAM — une part qui était inférieure à 10 % en 2020. Cette accélération est sans précédent dans l’histoire de l’industrie des semi-conducteurs.

Le HBM — la mémoire premium que tout le monde veut

Au cœur de la pénurie se trouve un type spécifique de DRAM : la HBM (High Bandwidth Memory), une mémoire haute performance conçue pour être empilée directement sur les puces GPU et NPU utilisées dans les accélérateurs d’IA. La HBM3e — la génération actuelle — offre une bande passante de plusieurs téraoctets par seconde, indispensable pour alimenter les calculs matriciels massifs des modèles d’IA. SK Hynix est aujourd’hui le principal fournisseur de HBM à NVIDIA, le fabricant de GPU dominant dans l’écosystème IA. Samsung tente de rattraper son retard, mais peine encore à qualifier ses puces HBM4 chez les grands clients.

La capacité mondiale de production de HBM est physiquement contrainte par le processus de fabrication extrêmement complexe — l’empilement de dizaines de couches de DRAM avec des connexions à travers le silicium. SK Hynix et Samsung ne peuvent pas simplement « ouvrir un robinet » de production supplémentaire — la construction d’une nouvelle ligne de production HBM prend de 3 à 5 ans et coûte des milliards de dollars. La pénurie actuelle est donc structurellement irréversible à court terme.


La HBM est l’un de ces composants dont presque personne dans le grand public n’a entendu parler mais qui conditionne absolument tout dans l’économie de l’IA. Sans HBM, pas de GPU d’IA performants. Sans GPU d’IA, pas de ChatGPT, pas de Gemini, pas de Copilot. La chaîne de dépendance est vertigineuse — et elle remonte jusqu’à deux ou trois usines en Corée du Sud. C’est un niveau de concentration des risques technologiques qui devrait tenir nos dirigeants éveillés la nuit.

Ce contenu a été créé avec l'aide de l'IA.

facebook icon twitter icon linkedin icon
Copié!
Plus de contenu