Rack IA alta densidad

Refrigeración para clústeres GPU: aire vs líquido vs inmersión — cifras reales

En 2026, los clústeres de GPU se han convertido en la base del entrenamiento de IA, la modelización científica y el análisis masivo de datos. Un solo rack equipado con ocho NVIDIA H100 o aceleradores equivalentes puede superar con facilidad los 10–12 kW, mientras que los racks densos para IA alcanzan ya los 80–120 kW. Con estos niveles de potencia, la refrigeración deja de ser un detalle secundario y pasa a ser un factor crítico de diseño. La elección entre aire avanzado, refrigeración líquida directa al chip o sistemas de inmersión influye directamente en la inversión inicial, los costes operativos, la eficiencia energética y la fiabilidad a largo plazo. A continuación se analizan los tres enfoques principales con datos reales y actuales.

Refrigeración por aire avanzada: límites del diseño tradicional

La refrigeración por aire sigue siendo la solución más extendida en centros de datos existentes. Las instalaciones modernas emplean contención de pasillos fríos y calientes, ventiladores de alta presión estática y puertas traseras con intercambiadores de calor. En 2026, un rack bien optimizado con aire suele soportar entre 20 y 30 kW sin rediseños profundos. Con gestión agresiva del flujo de aire y sistemas en fila, algunos operadores alcanzan los 40–50 kW, pero este rango representa prácticamente el límite técnico en entornos convencionales.

En términos de eficiencia, los centros enfocados en IA que utilizan aire suelen presentar un PUE entre 1,3 y 1,6, dependiendo del clima y del uso de free cooling. El consumo energético de los ventiladores puede representar entre un 5% y un 10% de la carga total de TI en despliegues densos de GPU. Cuando la densidad supera los 40 kW por rack, el volumen de aire necesario crece de forma desproporcionada, aumentando el ruido, el desgaste mecánico y el riesgo de puntos calientes.

Aunque la inversión inicial parece menor, especialmente si se reutiliza infraestructura existente, adaptar un centro para racks de más de 40 kW suele requerir refuerzos eléctricos, nuevas unidades CRAC y sistemas de contención adicionales. Además, la menor densidad implica más racks para la misma capacidad de cálculo, lo que incrementa el coste por kW efectivo en proyectos de IA a gran escala.

Cuándo la refrigeración por aire sigue siendo adecuada

La refrigeración por aire continúa siendo válida para clústeres de IA en el borde, laboratorios de investigación y entornos de tamaño medio donde la densidad no supera los 25–30 kW por rack. En estos casos, la rapidez de implementación y la compatibilidad con infraestructuras existentes pueden pesar más que la eficiencia máxima.

En climas fríos, el uso de aire exterior reduce de forma significativa los costes energéticos. En regiones del norte de Europa, por ejemplo, es posible operar gran parte del año con economización por aire, reduciendo el consumo destinado a refrigeración en un 20–30% frente a ubicaciones más cálidas.

Otro punto a favor es la familiaridad operativa. La mayoría de los técnicos están formados en sistemas HVAC y optimización del flujo de aire, lo que simplifica el mantenimiento y evita la necesidad de gestionar líquidos o sistemas de detección de fugas.

Refrigeración líquida directa al chip: eficiencia en alta densidad

La refrigeración líquida directa al chip se ha consolidado como la solución predominante para clústeres de IA de alta densidad en 2026. En este modelo, placas frías se instalan directamente sobre GPUs y CPUs, extrayendo el calor mediante un circuito cerrado de agua o mezcla agua-glicol. Estos sistemas soportan con comodidad entre 60 y 100 kW por rack, y en diseños específicos pueden superar los 120 kW.

El líquido posee una capacidad térmica muy superior al aire, lo que permite transportar grandes cantidades de calor con menor volumen. Como resultado, los centros con refrigeración líquida suelen alcanzar valores de PUE entre 1,1 y 1,25 en entornos optimizados. El uso de ventiladores disminuye notablemente y el consumo energético destinado a refrigeración puede situarse por debajo del 5% de la carga de TI.

La inversión inicial es mayor debido a las placas frías, las unidades de distribución de refrigerante y la infraestructura hidráulica. En 2026, el coste adicional estimado oscila entre 700 y 1.200 libras por kW respecto a soluciones tradicionales. Sin embargo, la mayor densidad y el ahorro energético compensan esta diferencia en un horizonte de tres a cinco años en cargas de trabajo intensivas.

Aspectos operativos de la refrigeración líquida

Los datos de grandes operadores muestran que los sistemas modernos con conexiones selladas presentan tasas de fuga inferiores al 0,1% anual cuando se instalan y prueban correctamente. La puesta en marcha y las pruebas de presión son fundamentales para mantener este nivel de fiabilidad.

Las temperaturas de suministro suelen situarse entre 25 y 35 °C, con retornos que pueden alcanzar 45–50 °C. Este diferencial facilita la reutilización del calor residual en redes de calefacción urbana o procesos industriales, mejorando la eficiencia global del emplazamiento.

El mantenimiento exige control de calidad del refrigerante, prevención de corrosión y gestión de bombas redundantes. Aun así, el equilibrio entre rendimiento, densidad y eficiencia ha convertido a esta tecnología en la opción preferida para nuevos centros de datos orientados a IA.

Rack IA alta densidad

Refrigeración por inmersión: máxima densidad y estabilidad térmica

La refrigeración por inmersión consiste en sumergir completamente los servidores en un fluido dieléctrico no conductor. En 2026, los sistemas monofásicos superan con frecuencia los 100 kW equivalentes por rack, mientras que las configuraciones bifásicas pueden rebasar los 150 kW en proyectos especializados. La distribución térmica es más uniforme, lo que reduce la aparición de puntos calientes.

Desde el punto de vista energético, las instalaciones bien diseñadas alcanzan valores de PUE entre 1,05 y 1,15. Al eliminar ventiladores internos, el ahorro eléctrico en el propio servidor puede situarse entre un 10% y un 15%. Además, la estabilidad térmica disminuye el riesgo de throttling en cargas de entrenamiento intensivas.

La principal barrera es la inversión inicial y la adaptación operativa. Los fluidos dieléctricos tienen un coste elevado y la disposición en tanques modifica por completo la arquitectura tradicional de racks. No obstante, el soporte de fabricantes ha crecido de forma notable en los últimos años.

Retos prácticos de los sistemas de inmersión

La gestión del fluido es clave para la estabilidad a largo plazo. Es necesario controlar la contaminación, filtrar periódicamente y seguir protocolos estrictos de manipulación para mantener el rendimiento.

El mantenimiento difiere del enfoque convencional. Extraer un servidor implica procedimientos específicos y equipamiento adecuado. Con formación apropiada, estos procesos se integran en la operación diaria, aunque requieren adaptación inicial.

La inmersión muestra su mayor ventaja económica en clústeres de densidad extrema donde el espacio es limitado y el coste eléctrico elevado. En entornos de colocation o modernizaciones parciales, las restricciones físicas pueden reducir su viabilidad pese a su elevada eficiencia.