Audio Flamingo 3 de NVIDIA escucha como nunca antes

1m, 22s

18:54, 28.10.2025

Contenido del artículo

De la música al significado
Su próximo asistente de audio

Si alguna vez deseó que su asistente de IA realmente entendiera lo que dice y no solo repitiera palabras, NVIDIA tiene algo emocionante para usted. La compañía ha presentado Audio Flamingo 3, un potente modelo multimodal que escucha el habla, la música y los sonidos del entorno y realmente los comprende.

Piense en él como un oyente con intuición. Audio Flamingo 3 combina varios sistemas avanzados: el codificador de audio AF Whisper, un módulo de procesamiento adaptativo, el modelo de lenguaje Qwen 2.5 7B y un motor de generación de voz. Esta combinación le permite procesar grabaciones de hasta diez minutos manteniendo el sentido, el tono y el flujo de la conversación. Puede seguir su diálogo de manera natural y responder en contexto, como si formara parte de la charla.

De la música al significado

Con Audio Flamingo 3 puede explorar el sonido de formas totalmente nuevas. El modelo analiza piezas musicales, capta emociones en su voz y describe lo que ocurre en un entorno ruidoso. En las pruebas, obtuvo resultados sobresalientes en comprensión y razonamiento de audio, marcando un nuevo estándar en cómo las máquinas perciben el sonido.

Su próximo asistente de audio

Imagine un asistente que reconoce su voz, entiende su estado de ánimo y responde de forma natural. Esa es la dirección que sigue NVIDIA. Audio Flamingo 3 ya forma parte del ecosistema de NVIDIA y está disponible para usted a través de PyTorch y Hugging Face. Es más que una herramienta: es una invitación a descubrir cómo la IA por fin puede escuchar, pensar y responder como usted.