Soluciones para desarrolladores

IA de voz europea, disponible en una línea de código.

La API de Voxist expone ASR, traducción y síntesis de voz vía REST y gRPC. Alojada en la UE, facturada en euros, RGPD-nativa por arquitectura. Sin viajes a un hiperescalador estadounidense.

Ver la documentación Empieza gratis

Integrada enOVHcloudScalewayVoxlive CCaaSELLIOT (Horizon Europe)

Ejemplo rápidoREST

POST /v1/asr/stream
Authorization: Bearer <api-key>
Content-Type: audio/webm

→ {
  "transcript": "Pouvez-vous confirmer le délai ?",
  "lang": "fr",
  "confidence": 0.97,
  "latency_ms": 186
}

REST + gRPCEU-hosted<200ms

El problema

Tres problemas que otras API de voz no resuelven

Problema 1

Tu API de voz se entrenó con inglés — y se nota en francés

La mayoría de las grandes API de ASR tienen un 8–15 % de WER en francés general, y peor con acentos o terminología técnica. La API de Voxist alcanza un 4,2 % de WER en francés — lo mejor de su clase para los idiomas europeos.

Problema 2

Tu API de traducción pivota por el inglés — y eso aplana los matices

Francés → inglés → alemán pierde el 30 % de los matices de formalidad en el pivote por el inglés. La API de Voxist traduce directamente entre pares europeos — n.º 2 mundial en COMET en pares europeos centrados en el francés, sin pivote.

Problema 3

Tu DPO pregunta adónde va el audio de tus usuarios

Las aplicaciones que procesan voz de residentes de la UE deben responder a requisitos estrictos del RGPD sobre la ubicación de los datos. La API de Voxist está alojada en OVHcloud y Scaleway, en la UE, con cero tránsito por Estados Unidos.

Lo que puedes construir

Todo lo que tu aplicación puede hacer con la voz

Reconocimiento del habla (ASR)

Streaming y batch. 40+ idiomas. Detección automática de idioma. 4,2 % de WER en francés. Vocabulario técnico disponible.

Traducción (MT)

Traducción en streaming y bajo demanda. 1.600+ pares de idiomas. N.º 2 mundial en COMET en pares europeos centrados en el francés. Cambio de idioma detectado automáticamente.

Síntesis de voz neural (TTS)

Voces neurales naturales en 40+ idiomas. Streaming en tiempo real. Control de la prosodia. Clonación de voz bajo petición (contrato enterprise).

Pipeline de voz a voz (VTT)

ASR + MT + TTS en un único endpoint. Latencia percibida inferior al segundo. Ideal para aplicaciones de traducción en tiempo real.

SDK multilenguaje

Python, Node.js, Go, Rust, Java y .NET. Clientes WebSocket para streaming. Especificación OpenAPI para generar tu propio cliente.

Opción on-premise

Para aplicaciones que no pueden enviar audio a la nube. Los modelos se despliegan en tu infraestructura. Misma API, mismo SDK.

Cumplimiento y confianza

GDPR-nativeEU AI Act readyEU-hosted (OVHcloud · Scaleway)SOC 2 Type II (in progress)ISO 27001 (in progress)Sin audio para entrenamiento de modelosOpción local

FAQ

Tus preguntas, respondidas

¿Dónde está alojada la API de Voxist?

La API de Voxist está alojada en OVHcloud y Scaleway, exclusivamente en centros de datos de la UE. Ningún audio ni metadato transita por Estados Unidos ni por ningún otro tercer país.

¿Mi audio se usa para entrenar modelos?

No. Ningún audio enviado a través de la API se usa para entrenar o mejorar los modelos de Voxist. Los datos se procesan al vuelo y no se persisten, salvo que configures explícitamente la retención (para tus propias transcripciones).

¿Qué formatos de audio soporta la API?

WebM/Opus, WAV PCM de 16 bits, MP3, FLAC, OGG. Para streaming en tiempo real se recomiendan WebM/Opus y WAV PCM. La frecuencia de muestreo mínima es 16 kHz; se recomiendan 48 kHz para traducción.

¿La API tiene límites de uso?

El plan gratuito está limitado a 5 peticiones/s y 5 h de audio/mes. El plan de pago por uso soporta 50 peticiones/s por defecto, ampliable bajo petición. El plan enterprise no tiene límite.

¿Puedo usar la API en producción antes de pasar a un plan de pago?

Sí. El plan gratuito incluye un SLA del 99,5 % y es adecuado para cargas de producción moderadas. Pasa a pago por uso o enterprise cuando tus necesidades superen las 5 h/mes o las 5 peticiones/s.

Construye sobre una IA de voz que se quedará donde tus datos lo necesiten.

Empieza a construir gratis

Clave API gratuita · Alojado en la UE · ningún audio se usa para entrenar modelos