Traducción de voz en tiempo real para que la conversación no se detenga.
Voxlingo traduce de voz a voz en tiempo real en más de 40 idiomas. Pensado para empresas europeas que operan a través de fronteras, n.º 2 mundial en benchmarks de pares de traducción centrados en el francés, y desplegable allí donde tus conversaciones deben quedarse.
La brecha que crece en silencio
Tus clientes no hablan todos el idioma de tus agentes
Una aseguradora española gestiona siniestros en rumano, árabe y francés. Un contact center alemán dirige cada día llamadas en inglés, italiano y turco. Una eléctrica belga atiende en francés, neerlandés y árabe. Contratar perfiles multilingües es caro. Los servicios de intérprete cuestan 0,80–2,00 € por minuto. El abandono de llamadas sube cuando cliente y agente no comparten idioma.
Tu API de traducción es genérica. Tus conversaciones no
La mayoría de las API de traducción se entrenaron con datos emparejados con el inglés y se ajustaron para traducir pivotando por el inglés. Francés → inglés → polaco funciona pasablemente. Francés → polaco en directo, con el vocabulario, el acento y el ritmo de una conversación en tiempo real, no. Los modelos genéricos traducen de forma aceptable. No traducen de forma excepcional en los pares que tus usuarios hablan de verdad.
Voz a voz es difícil. Pocos proveedores lo hacen bien
La traducción es una parte del problema. El ASR es otra. El TTS, una tercera. El streaming en tiempo real, con latencia percibida inferior al segundo, una cuarta. Coser cuatro sistemas de IA en una experiencia conversacional única que no parezca un menú telefónico es lo que separa a Voxlingo de un producto que promete «traducción en vivo» pero se rompe en cuanto quien llama deja de hablar con frases de manual.
De voz a voz, en un solo pipeline de streaming
Capturar
La voz de quien llama se captura en tiempo real por SIP, WebRTC o el SDK de Voxlingo. El ASR de Voxist identifica el idioma en menos de 100 ms y empieza a transcribir en menos de 200 ms, con una salida en streaming que muestra las palabras según se reconocen, no al final de la frase.
Traducir
La transcripción en streaming fluye hacia VoxTranslate, nuestro motor de traducción propio, n.º 2 mundial en COMET sobre 20 pares lingüísticos europeos centrados en el francés en benchmarks independientes. El motor gestiona vacilaciones, acentos, terminología técnica y cambios de idioma a mitad de frase — lo que hacen las conversaciones reales.
Hablar
Una voz neural natural pronuncia la traducción en el idioma de destino, con una prosodia y un ritmo que acompañan al hablante original. La preservación de la voz (traducir con la propia voz del hablante) está en la hoja de ruta para finales de 2026. Latencia percibida de extremo a extremo: menos de un segundo.
Desplegar
Voxlingo funciona en tres configuraciones: como API SaaS para desarrolladores, como despliegue gestionado dentro de un contact center Voxlive, o como stack totalmente on-premise, incluidos los modelos de traducción. Cloud, soberano o air-gapped — tú eliges, tus datos, tu perímetro.
Hecho para las tareas realmente difíciles
Traducción de voz a voz en tiempo real
ASR, MT y TTS en streaming, integrados en un único pipeline con latencia percibida inferior al segundo.
40+ idiomas, 1.600+ pares
profundidad de producción en los idiomas europeos, cobertura creciente en idiomas asiáticos y africanos. Cada par está medido y publicado en el leaderboard de Voxist.
N.º 2 mundial en COMET en pares centrados en el francés
por delante de DeepL en 17 de 20 pares, por delante de GPT-4o en 18 de 20, a solo 0,0025 puntos COMET del n.º 1 global. Benchmark independiente, metodología pública.
Funciones de modo conversación
gestión de vacilaciones, detección de cambio de idioma, vocabularios de dominio (jurídico, médico, financiero, técnico), preservación del contexto entre turnos.
Modo subtítulos en directo
cuando la salida de audio no es apropiada (reuniones, eventos, retransmisiones), la traducción se muestra como transcripción sincronizada en directo.
Hoja de ruta de preservación de la voz
para finales de 2026, Voxlingo traducirá con la voz del hablante original usando la investigación de clonación de voz del TTS de Voxist. Hoy se usa una voz neutra y natural en el idioma de destino.
Desplegable on-premise
incluidos los modelos de traducción. Uno de los muy pocos productos de traducción de voz en tiempo real que no exige un viaje de ida y vuelta a la nube.
N.º 2 mundial en COMET en pares europeos centrados en el francés
En benchmarks COMET independientes sobre 20 pares lingüísticos europeos centrados en el francés, el motor de traducción de Voxlingo es n.º 2 mundial — por delante de DeepL, GPT-4o, Claude y las variantes de EuroLLM. Voxlingo supera a DeepL en 17 de 20 pares y a GPT-4o en 18 de 20, a solo 0,0025 puntos COMET del n.º 1 global.
| Pair | Voxlingo | DeepL | Margin |
|---|---|---|---|
| French → German | 4th | 7th | +0.0038 |
| German → French | 4th | 7th | +0.0038 |
| French → Polish | 3rd | 7th | +0.0036 |
| French → Spanish | 3rd | 8th | +0.0036 |
| French → Hungarian | 4th | 7th | +0.0040 |
Cuatro fortalezas, en cada conversación
Latencia percibida inferior al segundo, de extremo a extremo
El pipeline de streaming de Voxlingo — ASR, MT, TTS — funciona con menos de un segundo de latencia percibida de extremo a extremo, en conversaciones reales con acentos reales y vacilaciones reales. El pipeline es Voxist de principio a fin: sin viajes a terceros, sin saltos de API, sin caída de calidad cuando una frase queda a medias.
Especializado, no genérico
Voxlingo está construido para los idiomas europeos, con el francés en el centro. La mayoría de las API de traducción se entrenaron con datos emparejados con el inglés y traducen pivotando por el inglés. Voxlingo se entrena con pares directos — francés ↔ alemán, francés ↔ polaco, francés ↔ húngaro — y por eso la diferencia COMET sobre DeepL es más visible precisamente en esos pares.
Soberano por defecto
Voxlingo es uno de los muy pocos productos de traducción de voz en tiempo real con opción de despliegue totalmente on-premise, incluidos los modelos de traducción. Cloud, soberano (OVHcloud, Scaleway) o air-gapped. RGPD-nativo. Listo para el Reglamento de IA de la UE. Para sectores regulados — sanidad, defensa, administración pública, finanzas — esta es la combinación que no existe en ningún otro sitio.
Resultados que puedes medir
Los despliegues de Voxlingo dentro de contact centers Voxlive reportan latencia percibida inferior al segundo, inteligibilidad a la par de un intérprete humano y una reducción del 60–80 % del gasto en intérpretes en el primer trimestre. Cada afirmación procede de un cliente real o de un benchmark público.
Una comparación corta y honesta
| Voxlingo | DeepL Voice | KUDO | Wordly | |
|---|---|---|---|---|
| Voz a voz en tiempo real | ✅ (con intérprete) | |||
| N.º 2 mundial en COMET en pares centrados en el francés | Sin benchmark | N/A | N/A | |
| Despliegue on-premise | — | — | — | |
| Creado en Europa | — | |||
| 40+ idiomas, en crecimiento | 40+ | 200+ (human) | 60+ | |
| Preservación de la voz (hoja de ruta) | Finales de 2026 | Finales de 2026 | Solo humano | — |
Una plataforma, seis productos, un flywheel
Voxlingo se integra como capacidad nativa dentro del contact center Voxlive, funcionando en el auricular del agente o como canal agente-cliente totalmente traducido.
captura una entrevista a un experto en francés; consulta el grafo de conocimiento resultante en polaco o en árabe. Voxlingo se encarga de la recuperación entre idiomas dentro de Voxcept.
graba una reunión en entornos con varios idiomas; Voxlingo traduce la transcripción bajo demanda, a cualquiera de los idiomas soportados.
Voxlingo está expuesto como API de traducción para desarrolladores en voxist.com/api. Misma autenticación, mismos SDK, precios transparentes en euros.
Tus preguntas, respondidas
¿Qué precisión tiene Voxlingo en los idiomas europeos?
¿Cuál es la latencia de extremo a extremo?
¿Voxlingo puede funcionar on-premise?
¿La voz traducida sonará como el hablante original?
¿Qué idiomas soporta Voxlingo?
¿Cómo se compara Voxlingo con DeepL Voice?
¿Cómo se compara Voxlingo con KUDO o Wordly?
¿Voxlingo funciona con nuestra plataforma SIP / WebRTC / de llamadas?
¿Voxlingo gestiona acentos, cambios de idioma y vocabulario técnico?
¿La app móvil de voxlingo.com es el mismo producto?
¿Voxlingo puede traducir lengua de signos?
Lleva tus operaciones multilingües sobre IA europea.
Inglés y francés · Alojado en la UE · ningún audio se usa para entrenar modelos