Europäische Sprach-KI, verfügbar in einer Zeile Code.
Die Voxist API stellt ASR, Übersetzung und Sprachsynthese über REST und gRPC bereit. In der EU gehostet, in Euro abgerechnet, DSGVO-nativ per Architektur. Kein Umweg über einen US-Hyperscaler.
POST /v1/asr/stream
Authorization: Bearer <api-key>
Content-Type: audio/webm
→ {
"transcript": "Pouvez-vous confirmer le délai ?",
"lang": "fr",
"confidence": 0.97,
"latency_ms": 186
}Drei Probleme, die andere Speech-APIs nicht lösen
Ihre Speech-API wurde auf Englisch trainiert — und bei europäischen Sprachen merkt man das
Die meisten großen ASR-APIs liegen bei 8–15 % WER auf allgemeinem Französisch — bei Akzenten oder Fachterminologie noch darüber. Die Voxist API erreicht 4,2 % WER auf Französisch: Bestwert für europäische Sprachen.
Ihre Übersetzungs-API pivotiert über Englisch — und das glättet die Nuancen weg
Französisch → Englisch → Deutsch verliert im Englisch-Pivot 30 % der formellen Nuancen. Die Voxist API übersetzt direkt zwischen europäischen Paaren — COMET-Platz 2 weltweit auf französisch-zentrierten EU-Paaren, ohne Pivot.
Ihr Datenschutzbeauftragter fragt, wohin das Audio Ihrer Nutzer geht
Anwendungen, die Stimmen von EU-Bürgern verarbeiten, müssen strikte DSGVO-Anforderungen an den Datenstandort erfüllen. Die Voxist API wird auf OVHcloud und Scaleway gehostet — in der EU, ohne Transit über die USA.
Alles, was Ihre Anwendung mit Stimme machen kann
Spracherkennung (ASR)
Streaming und Batch. 40+ Sprachen. Erkennt die gesprochene Sprache automatisch. 4,2 % WER auf Französisch. Fachvokabular verfügbar.
Übersetzung (MT)
Streaming- und On-Demand-Übersetzung. 1.600+ Sprachpaare. COMET-Platz 2 weltweit auf französisch-zentrierten EU-Paaren. Code-Switching wird automatisch erkannt.
Neuronale Sprachsynthese (TTS)
Natürliche neuronale Stimmen in 40+ Sprachen. Echtzeit-Streaming. Prosodie-Steuerung. Voice Cloning auf Anfrage (Enterprise-Vertrag).
Voice-to-Voice-Pipeline (VTT)
ASR + MT + TTS als ein einziger Endpoint. Wahrgenommene Latenz unter einer Sekunde. Ideal für Echtzeit-Übersetzungsanwendungen.
Multi-Language-SDKs
Python, Node.js, Go, Rust, Java und .NET. WebSocket-Clients für Streaming. OpenAPI-Spezifikation für eigene Client-Generierung.
On-Premise-Option
Für Anwendungen, die kein Audio in die Cloud senden dürfen. Die Modelle laufen in Ihrer Infrastruktur. Gleiche API, gleiche SDKs.
Fragen & Antworten
Wo wird die Voxist API gehostet?
Wird mein Audio für Modelltraining verwendet?
Welche Audioformate unterstützt die API?
Hat die API Rate-Limits?
Kann ich die API in Produktion nutzen, bevor ich auf einen Bezahlplan wechsle?
Bauen Sie auf Sprach-KI, die dort bleibt, wo Ihre Daten sein müssen.
Kostenloser API-Key · In der EU gehostet · kein Audio wird für Modelltraining verwendet