Red Hat lanza llm-d, una plataforma basada en Kubernetes para la inferencia escalable de IA

watch 1m, 15s
views 2

15:21, 22.05.2025

Contenido del artículo
arrow

  • Características principales de llm-d
  • Cooperación con los principales actores de la industria de la IA
  • Tecnología y arquitectura de llm-d

Red Hat ha presentado llm-d, un nuevo proyecto de código abierto diseñado para la inferencia distribuida de alto rendimiento de grandes modelos de lenguaje (LLM). La plataforma se desarrolla sobre Kubernetes y se centra en simplificar el escalado de la IA generativa. El código fuente está disponible en GitHub bajo la licencia Apache 2.0.

Características principales de llm-d

Las principales características de la plataforma incluyen

  • Programador de inferencias optimizado para vLLM;
  • Arquitectura de servicios desagregada;
  • Reutilización de cachés de prefijos;
  • Escalado flexible en función del tráfico, las tareas y los recursos disponibles.

Cooperación con los principales actores de la industria de la IA

El desarrollo se lleva a cabo en colaboración con empresas como Nvidia, AMD, Intel, IBM Research, Google Cloud, CoreWeave y Hugging Face, entre otras. Esta cooperación subraya la seriedad del enfoque de llm-d y el potencial de la plataforma como estándar de la industria.

Tecnología y arquitectura de llm-d

El proyecto utiliza la biblioteca vLLM para la inferencia distribuida, así como componentes como LMCache para la descarga de caché KV, enrutamiento inteligente del tráfico habilitado por IA, API de comunicación altamente eficientes y escalado automático a la carga y la infraestructura.

Todo ello permite adaptar el sistema a diferentes escenarios de uso y requisitos de rendimiento. Y el lanzamiento de llm-d puede suponer un paso importante hacia la democratización de los potentes sistemas de IA y hacerlos accesibles a un amplio público de desarrolladores e investigadores.

Compartir

¿Te ha resultado útil este artículo?

Ofertas populares de VPS

-20.4%

CPU
CPU
2 Xeon Cores
RAM
RAM
2 GB
Space
Space
30 GB SSD
Bandwidth
Bandwidth
300 GB
KVM-SSD 2048 HK Linux

18 /mes

/mes

Facturado cada 12 meses

-10%

CPU
CPU
8 Epyc Cores
RAM
RAM
32 GB
Space
Space
200 GB NVMe
Bandwidth
Bandwidth
Unlimited
Keitaro KVM 32768
OS
CentOS
Software
Software
Keitaro

77.54 /mes

/mes

Facturado cada 12 meses

-10%

CPU
CPU
6 Epyc Cores
RAM
RAM
8 GB
Space
Space
100 GB NVMe
Bandwidth
Bandwidth
Unlimited
KVM-NVMe 8192 Linux

26.35 /mes

/mes

Facturado cada 12 meses

-16.3%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
30 GB SSD
Bandwidth
Bandwidth
40 Mbps
DDoS Protected SSD-KVM 2048 Linux

48 /mes

/mes

Facturado cada 12 meses

-15.3%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
75 GB SSD
Bandwidth
Bandwidth
40 Mbps
DDoS Protected SSD-wKVM 2048 Windows

54 /mes

/mes

Facturado cada 12 meses

-10%

CPU
CPU
4 Epyc Cores
RAM
RAM
4 GB
Space
Space
50 GB NVMe
Bandwidth
Bandwidth
Unlimited
Keitaro KVM 4096
OS
CentOS
Software
Software
Keitaro

18.1 /mes

/mes

Facturado cada 12 meses

-12.3%

CPU
CPU
6 Xeon Cores
RAM
RAM
16 GB
Space
Space
150 GB SSD
Bandwidth
Bandwidth
Unlimited
10Ge-wKVM-SSD 16384 Windows

237 /mes

/mes

Facturado cada 12 meses

-18.6%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
4 TB
wKVM-SSD 4096 Metered Windows

38 /mes

/mes

Facturado cada 12 meses

-5.4%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
60 GB HDD
Bandwidth
Bandwidth
300 Gb
wKVM-HDD HK 2048 Windows

11.64 /mes

/mes

Facturado cada 12 meses

-10%

CPU
CPU
3 Epyc Cores
RAM
RAM
2 GB
Space
Space
20 GB NVMe
Bandwidth
Bandwidth
Unlimited
KVM-NVMe 2048 Linux

8.8 /mes

/mes

Facturado cada 12 meses

Otros artículos sobre este tema

cookie

¿Acepta las cookies y la política de privacidad?

Utilizamos cookies para asegurar que damos la mejor experiencia en nuestro sitio web. Si continúa sin cambiar la configuración, asumiremos que acepta recibir todas las cookies del sitio web HostZealot.