Solutions Développeurs

L'IA vocale européenne, disponible en une seule ligne de code.

L'API Voxist expose l'ASR, la traduction et la synthèse vocale via REST et gRPC. Hébergé en UE, facturation en euros, RGPD-natif par architecture. Sans round-trip vers un hyperscaler américain.

Voir la documentation Commencer gratuitement

Intégré dansOVHcloudScalewayVoxlive CCaaSELLIOT (Horizon Europe)

Exemple rapideREST

POST /v1/asr/stream
Authorization: Bearer <api-key>
Content-Type: audio/webm

→ {
  "transcript": "Pouvez-vous confirmer le délai ?",
  "lang": "fr",
  "confidence": 0.97,
  "latency_ms": 186
}

REST + gRPCEU-hosted<200ms

Le problème

Trois problèmes que les autres APIs vocales ne résolvent pas

Problème 1

Votre API vocale est entraînée sur de l'anglais — et ça se voit sur le français

La plupart des APIs ASR majeures ont un WER de 8–15 % sur le français général, et bien plus sur le français avec accent ou sur la terminologie technique. L'API Voxist atteint 4,2 % WER sur le français — le meilleur de sa catégorie pour les langues européennes.

Problème 2

Votre API de traduction pivot via l'anglais — et ça aplatit les nuances

Français → anglais → allemand perd 30 % des nuances formelles au passage par l'anglais. L'API Voxist traduit directement entre les paires européennes — COMET #2 mondial sur les paires franco-européennes, sans pivot.

Problème 3

Votre DPO vous demande où va l'audio de vos utilisateurs

Les applications traitant de la voix de résidents européens doivent répondre à des exigences RGPD strictes sur la localisation des données. L'API Voxist est hébergée sur OVHcloud et Scaleway, en UE, avec zéro transit vers les États-Unis.

Ce que vous pouvez construire

Tout ce que votre application peut faire avec la voix

Reconnaissance vocale (ASR)

Streaming et batch. 40+ langues. Détection automatique de langue. 4,2 % WER sur le français. Vocabulaires techniques disponibles.

Traduction (MT)

Traduction streaming et à la demande. 1600+ paires de langues. COMET #2 mondial sur les paires franco-européennes. Code-switching détecté automatiquement.

Synthèse vocale neurale (TTS)

Voix neurales naturelles en 40+ langues. Streaming temps réel. Contrôle de la prosodie. Clonage de voix sur demande (contrat enterprise).

Pipeline voix-à-voix (VTT)

ASR + MT + TTS comme un endpoint unique. Latence perçue sous une seconde. Idéal pour les applications de traduction en temps réel.

SDK multi-langages

Python, Node.js, Go, Rust, Java et .NET. Clients WebSocket pour le streaming. OpenAPI spec pour votre propre génération de client.

Option on-premise

Pour les applications qui ne peuvent pas envoyer d'audio vers le cloud. Les modèles se déploient dans votre infrastructure. Même API, même SDK.

Conformité & confiance

GDPR-nativeEU AI Act readyEU-hosted (OVHcloud · Scaleway)SOC 2 Type II (in progress)ISO 27001 (in progress)Aucun audio pour l'entraînement des modèlesOption sur site

FAQ

Questions, réponses

Où est hébergée l'API Voxist ?

L'API Voxist est hébergée sur OVHcloud et Scaleway, exclusivement dans des datacenters en Union Européenne. Aucun audio ni métadonnée ne transite par les États-Unis ou tout autre pays tiers.

Mon audio est-il utilisé pour entraîner des modèles ?

Non. Aucun audio soumis via l'API n'est utilisé pour entraîner ou améliorer les modèles Voxist. Les données sont traitées à la volée et ne sont pas persistées sauf configuration explicite de la rétention (pour vos propres transcriptions).

Quels formats audio l'API supporte-t-elle ?

WebM/Opus, WAV PCM 16-bit, MP3, FLAC, OGG. Pour le streaming temps réel, WebM/Opus et WAV PCM sont recommandés. Le taux d'échantillonnage minimum est 16 kHz ; 48 kHz recommandé pour la traduction.

L'API a-t-elle une limite de débit ?

Le plan gratuit est limité à 5 requêtes/seconde et 5h audio/mois. Le plan pay-as-you-go supporte 50 requêtes/seconde par défaut, augmentable sur demande. Le plan enterprise n'a pas de limite de débit.

Puis-je utiliser l'API en production avant de passer à un plan payant ?

Oui. Le plan gratuit inclut un SLA de 99,5 % et convient à une charge de production modérée. Passez au pay-as-you-go ou à l'enterprise quand vos besoins dépassent 5h/mois ou 5 req/s.

Construisez sur de l'IA vocale qui restera là où vos données doivent être.

Commencer gratuitement

Clé API gratuite · Hébergé en UE · Aucun audio utilisé pour l'entraînement des modèles