El nuevo Qwen2.5-Max supera las capacidades de DeepSeek

watch 1m, 20s
views 2

13:20, 31.01.2025

Tras los lanzamientos de Qwen2.5, Qwen2.5-VL, está disponible una nueva versión de Qwen2.5-Max. La nueva versión de Qwen muestra un rendimiento superior detrás de DeepSeek V3 en los siguientes benchmarks - GPQA-Diamond, Arena-Hard, LiveCodeBench y LiveBench.

Arquitectura y características del modelo

La versión Max es un proyecto a gran escala del modelo de Mezcla de Expertos. La singularidad de este modelo en particular fue el entrenamiento en feedback de usuarios reales (RLHF), usando Supervised-Fine-Tuning, y por supuesto el entrenamiento en 20 trillones de tokens.

Por el momento, los datos de la nueva versión aún no están publicados en GitHub, sólo está disponible por ahora el acceso a la API y al chat de Qwen. Es muy probable que la falta de datos en HuggingFace y GitHub indique una prisa por desvelar el nuevo proyecto o una promoción planeada por la empresa para incentivar la adopción de su plataforma en la nube.

Qwen ha publicado resultados sobre el nuevo modelo. Según la tabla de datos abiertos de la nueva versión de Qwen comparada con LLaMA3.1 y DeepSeek-V3, la versión Max supera a sus competidores en la mayoría de las características. Si se compara con Claude Sonnet y GPT, la versión Max pierde frente a GPT.

La empresa ha invertido un presupuesto importante en datos de entrenamiento, y la superioridad con los competidores existe, pero es relativamente insignificante. Por ello, algunos expertos opinan que es posible ampliar las capacidades de los modelos lingüísticos utilizando la potencia de cálculo durante las pruebas. 

Compartir

¿Te ha resultado útil este artículo?

Ofertas populares de VPS

-18.6%

CPU
CPU
4 Xeon Cores
RAM
RAM
4 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
4 TB
wKVM-SSD 4096 Metered Windows

38 /mes

/mes

Facturado cada 12 meses

-9.5%

CPU
CPU
8 Epyc Cores
RAM
RAM
32 GB
Space
Space
200 GB NVMe
Bandwidth
Bandwidth
Unlimited
wKVM-NVMe 32768 Windows

74.49 /mes

/mes

Facturado cada 12 meses

-8.8%

CPU
CPU
6 Xeon Cores
RAM
RAM
16 GB
Space
Space
400 GB HDD
Bandwidth
Bandwidth
300 Gb
wKVM-HDD HK 16384 Windows

46.26 /mes

/mes

Facturado cada 12 meses

-20.2%

CPU
CPU
1 Xeon Core
RAM
RAM
1 GB
Space
Space
50 GB SSD
Bandwidth
Bandwidth
300 GB
wKVM-SSD 1024 HK Windows

19 /mes

/mes

Facturado cada 12 meses

-15.3%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
75 GB SSD
Bandwidth
Bandwidth
40 Mbps
DDoS Protected SSD-wKVM 2048 Windows

54 /mes

/mes

Facturado cada 12 meses

-10%

CPU
CPU
4 Epyc Cores
RAM
RAM
4 GB
Space
Space
50 GB NVMe
Bandwidth
Bandwidth
Unlimited
KVM-NVMe 4096 Linux

16.45 /mes

/mes

Facturado cada 12 meses

-10%

CPU
CPU
6 Xeon Cores
RAM
RAM
8 GB
Space
Space
100 GB SSD
Bandwidth
Bandwidth
Unlimited
wKVM-SSD 8192 Windows

28.44 /mes

/mes

Facturado cada 12 meses

-18.4%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
75 GB SSD
Bandwidth
Bandwidth
2 TB
wKVM-SSD 2048 Metered Windows

24 /mes

/mes

Facturado cada 12 meses

-20.5%

CPU
CPU
6 Xeon Cores
RAM
RAM
16 GB
Space
Space
150 GB SSD
Bandwidth
Bandwidth
10 TB
KVM-SSD 16384 Metered Linux

95 /mes

/mes

Facturado cada 12 meses

-8.4%

CPU
CPU
4 Xeon Cores
RAM
RAM
2 GB
Space
Space
75 GB SSD
Bandwidth
Bandwidth
Unlimited
10Ge-wKVM-SSD 2048 Windows

37.4 /mes

/mes

Facturado cada 12 meses

Otros artículos sobre este tema

cookie

¿Acepta las cookies y la política de privacidad?

Utilizamos cookies para asegurar que damos la mejor experiencia en nuestro sitio web. Si continúa sin cambiar la configuración, asumiremos que acepta recibir todas las cookies del sitio web HostZealot.