Negocios

Red Hat lanza su nuevo servidor de inferencia para IA

Red Hat presenta su AI Inference Server y nuevos modelos validados, integrando Llama Stack y MCP para optimizar agentes y apps de IA empresarial.
Domingo, Mayo 25, 2025

Red Hat sigue avanzando en su estrategia de inteligencia artificial con el lanzamiento del nuevo Red Hat AI Inference Server, una solución diseñada para facilitar implementaciones más eficientes, uniformes y escalables de modelos de IA en entornos de nube híbrida. 

El anuncio se complementa con la integración de modelos validados, el soporte para Llama Stack y el Protocolo de Contexto de Modelo (MCP), y actualizaciones clave en Red Hat OpenShift AI y Red Hat Enterprise Linux AI.

IA generativa con infraestructura abierta y validada

De acuerdo con Forrester, el software de código abierto será la clave para escalar la inteligencia artificial en las empresas. En ese contexto, Red Hat busca consolidar un ecosistema que brinde mayor control, variedad y eficiencia en las implementaciones de IA generativa (gen AI).

El Red Hat AI Inference Server, incluido en Red Hat OpenShift AI y RHEL AI, también puede usarse como solución autónoma. Su objetivo es brindar una plataforma de inferencia veloz y de bajo costo a escala, compatible con múltiples entornos de nube híbrida, eliminando silos tecnológicos y habilitando flujos de trabajo más ágiles.

Modelos optimizados y validados para despliegues empresariales

A través de una colaboración con Hugging Face, Red Hat AI ofrece una colección de modelos validados con guías de implementación, compresión de modelos y mejoras en velocidad de inferencia. Esta validación continua busca aumentar la confianza de los usuarios empresariales en cuanto a rendimiento, reproducibilidad y eficiencia de sus modelos.

Además, Red Hat continúa integrando funcionalidades que permiten adaptar estos modelos a cargas de trabajo específicas, optimizando su uso en GPU, reduciendo costos operativos y facilitando la adopción en entornos reales.

Llama Stack y MCP: APIs estandarizadas para agentes de IA

La integración de Llama Stack (desarrollado por Meta) y el Protocolo de Contexto de Modelo (MCP) de Anthropic, representa un avance significativo para el desarrollo de agentes inteligentes. Estas APIs estandarizadas permiten conectar modelos de IA con plugins, herramientas externas y fuentes de datos, facilitando la construcción de agentes con funcionalidades como generación aumentada por recuperación (RAG), seguridad, evaluación y soporte multilingüe.

Llama Stack estará disponible como versión preliminar para desarrolladores, reforzando el enfoque de Red Hat hacia una IA abierta, personalizable y escalable.

Red Hat OpenShift AI y RHEL AI: nuevas capacidades

La nueva versión Red Hat OpenShift AI 2.20 incluye:

  • Catálogo de modelos optimizados, con acceso simplificado y despliegue automatizado.

  • Entrenamiento distribuido con KubeFlow, compatible con InstructLab y PyTorch.

  • Tienda de características basada en Feast, para gestionar datos de entrenamiento e inferencia.

Por su parte, Red Hat Enterprise Linux AI 1.5 suma:

  • Disponibilidad en Google Cloud Marketplace, además de AWS y Azure.

  • Soporte multilingüe mejorado (español, francés, alemán, italiano) con personalización vía InstructLab.

  • Capacidades extendidas para crear modelos adaptados a contextos regionales, casos de uso específicos e idiomas como japonés, hindi y coreano en el futuro.

Además, el servicio InstructLab en IBM Cloud alcanza disponibilidad general, permitiendo personalizar modelos con datos propios de manera más sencilla, segura y escalable.

Una visión abierta y universal para la IA

Red Hat plantea una visión en la que las empresas puedan implementar cualquier modelo, en cualquier acelerador y en cualquier nube, rompiendo barreras entre plataformas. Esta apuesta por la apertura y la interoperabilidad busca maximizar el retorno de las inversiones en IA generativa y reducir los costos derivados de soluciones fragmentadas.

Con estas actualizaciones, Red Hat refuerza su propuesta como habilitador de IA empresarial de alto rendimiento, integrando lo mejor del ecosistema open source con funcionalidades prácticas para equipos de TI, científicos de datos y desarrolladores.