IA de voz europea, disponible en una línea de código.
La API de Voxist expone ASR, traducción y síntesis de voz vía REST y gRPC. Alojada en la UE, facturada en euros, RGPD-nativa por arquitectura. Sin viajes a un hiperescalador estadounidense.
POST /v1/asr/stream
Authorization: Bearer <api-key>
Content-Type: audio/webm
→ {
"transcript": "Pouvez-vous confirmer le délai ?",
"lang": "fr",
"confidence": 0.97,
"latency_ms": 186
}Tres problemas que otras API de voz no resuelven
Tu API de voz se entrenó con inglés — y se nota en francés
La mayoría de las grandes API de ASR tienen un 8–15 % de WER en francés general, y peor con acentos o terminología técnica. La API de Voxist alcanza un 4,2 % de WER en francés — lo mejor de su clase para los idiomas europeos.
Tu API de traducción pivota por el inglés — y eso aplana los matices
Francés → inglés → alemán pierde el 30 % de los matices de formalidad en el pivote por el inglés. La API de Voxist traduce directamente entre pares europeos — n.º 2 mundial en COMET en pares europeos centrados en el francés, sin pivote.
Tu DPO pregunta adónde va el audio de tus usuarios
Las aplicaciones que procesan voz de residentes de la UE deben responder a requisitos estrictos del RGPD sobre la ubicación de los datos. La API de Voxist está alojada en OVHcloud y Scaleway, en la UE, con cero tránsito por Estados Unidos.
Todo lo que tu aplicación puede hacer con la voz
Reconocimiento del habla (ASR)
Streaming y batch. 40+ idiomas. Detección automática de idioma. 4,2 % de WER en francés. Vocabulario técnico disponible.
Traducción (MT)
Traducción en streaming y bajo demanda. 1.600+ pares de idiomas. N.º 2 mundial en COMET en pares europeos centrados en el francés. Cambio de idioma detectado automáticamente.
Síntesis de voz neural (TTS)
Voces neurales naturales en 40+ idiomas. Streaming en tiempo real. Control de la prosodia. Clonación de voz bajo petición (contrato enterprise).
Pipeline de voz a voz (VTT)
ASR + MT + TTS en un único endpoint. Latencia percibida inferior al segundo. Ideal para aplicaciones de traducción en tiempo real.
SDK multilenguaje
Python, Node.js, Go, Rust, Java y .NET. Clientes WebSocket para streaming. Especificación OpenAPI para generar tu propio cliente.
Opción on-premise
Para aplicaciones que no pueden enviar audio a la nube. Los modelos se despliegan en tu infraestructura. Misma API, mismo SDK.
Tus preguntas, respondidas
¿Dónde está alojada la API de Voxist?
¿Mi audio se usa para entrenar modelos?
¿Qué formatos de audio soporta la API?
¿La API tiene límites de uso?
¿Puedo usar la API en producción antes de pasar a un plan de pago?
Construye sobre una IA de voz que se quedará donde tus datos lo necesiten.
Clave API gratuita · Alojado en la UE · ningún audio se usa para entrenar modelos