Resultados de las pruebas comparativas de Grok 4.1 Fast y detalles sobre la API de Agent Tools
16:34, 24.11.2025
El equipo de xAI ha compartido los resultados de las pruebas comparativas, en las que Grok 4.1 Fast se sitúa a la cabeza de sus competidores. Además, los desarrolladores han dado más detalles sobre la infraestructura de la API de Agent Tools.
Grok 4.1 Fast ocupa una posición de liderazgo
Según la información actualizada de las pruebas comparativas de xAI, Grok 4.1 Fast ocupa una posición de liderazgo en las siguientes categorías:
- τ²-bench Telecom: en esta categoría, el nuevo modelo muestra el resultado máximo posible del 100 % y supera significativamente a Claude Sonnet 4.5, GPT-5.1 y Grok 4.
- Berkeley Function Calling v4: el nuevo modelo obtiene un 72 % en la categoría de precisión con un bajo coste y también se convierte en líder.
- Contexto largo: el modelo mantiene una calidad estable hasta una ventana contextual de 2 millones. Por ejemplo, en esta categoría, el nuevo modelo obtiene un resultado del 67 %, mientras que Grok 4 solo alcanza el 22 %.
Agent Tools API: herramientas para agentes autónomos
Agent Tools API es un conjunto de herramientas de servidor que proporcionan acceso a operaciones externas y datos reales.
Con la ayuda de la API, el agente puede:
- Combinar varias herramientas en la cadena automáticamente.
- Utilizar la búsqueda inteligente en el documento cargado.
- Conectarse a servidores MCP externos.
- Buscar datos en X en tiempo real.
- Ejecutar código Python en un entorno seguro.
Una característica especial de estas herramientas es que funcionan completamente en la infraestructura xAI. Por lo tanto, no es necesario gestionar entornos, claves o límites, ya que Grok determina por sí mismo los pasos necesarios y activa la herramienta requerida, pudiendo también realizar llamadas paralelas.
Actualmente hay dos modelos disponibles: reasoning, para tareas que requieren un razonamiento profundo, y non-reasoning, para respuestas instantáneas. La herramienta Agent Tools API es de acceso gratuito para los usuarios de xAI, y el modelo será gratuito hasta el 3 de diciembre.