Lösungen für Entwickler

Europäische Sprach-KI, verfügbar in einer Zeile Code.

Die Voxist API stellt ASR, Übersetzung und Sprachsynthese über REST und gRPC bereit. In der EU gehostet, in Euro abgerechnet, DSGVO-nativ per Architektur. Kein Umweg über einen US-Hyperscaler.

Integriert inOVHcloudScalewayVoxlive CCaaSELLIOT (Horizon Europe)
Kurzes BeispielREST
POST /v1/asr/stream
Authorization: Bearer <api-key>
Content-Type: audio/webm

→ {
  "transcript": "Pouvez-vous confirmer le délai ?",
  "lang": "fr",
  "confidence": 0.97,
  "latency_ms": 186
}
REST + gRPCEU-hosted<200ms
Das Problem

Drei Probleme, die andere Speech-APIs nicht lösen

Problem 1

Ihre Speech-API wurde auf Englisch trainiert — und bei europäischen Sprachen merkt man das

Die meisten großen ASR-APIs liegen bei 8–15 % WER auf allgemeinem Französisch — bei Akzenten oder Fachterminologie noch darüber. Die Voxist API erreicht 4,2 % WER auf Französisch: Bestwert für europäische Sprachen.

Problem 2

Ihre Übersetzungs-API pivotiert über Englisch — und das glättet die Nuancen weg

Französisch → Englisch → Deutsch verliert im Englisch-Pivot 30 % der formellen Nuancen. Die Voxist API übersetzt direkt zwischen europäischen Paaren — COMET-Platz 2 weltweit auf französisch-zentrierten EU-Paaren, ohne Pivot.

Problem 3

Ihr Datenschutzbeauftragter fragt, wohin das Audio Ihrer Nutzer geht

Anwendungen, die Stimmen von EU-Bürgern verarbeiten, müssen strikte DSGVO-Anforderungen an den Datenstandort erfüllen. Die Voxist API wird auf OVHcloud und Scaleway gehostet — in der EU, ohne Transit über die USA.

Was Sie bauen können

Alles, was Ihre Anwendung mit Stimme machen kann

Spracherkennung (ASR)

Streaming und Batch. 40+ Sprachen. Erkennt die gesprochene Sprache automatisch. 4,2 % WER auf Französisch. Fachvokabular verfügbar.

Übersetzung (MT)

Streaming- und On-Demand-Übersetzung. 1.600+ Sprachpaare. COMET-Platz 2 weltweit auf französisch-zentrierten EU-Paaren. Code-Switching wird automatisch erkannt.

Neuronale Sprachsynthese (TTS)

Natürliche neuronale Stimmen in 40+ Sprachen. Echtzeit-Streaming. Prosodie-Steuerung. Voice Cloning auf Anfrage (Enterprise-Vertrag).

Voice-to-Voice-Pipeline (VTT)

ASR + MT + TTS als ein einziger Endpoint. Wahrgenommene Latenz unter einer Sekunde. Ideal für Echtzeit-Übersetzungsanwendungen.

Multi-Language-SDKs

Python, Node.js, Go, Rust, Java und .NET. WebSocket-Clients für Streaming. OpenAPI-Spezifikation für eigene Client-Generierung.

On-Premise-Option

Für Anwendungen, die kein Audio in die Cloud senden dürfen. Die Modelle laufen in Ihrer Infrastruktur. Gleiche API, gleiche SDKs.

Compliance & Vertrauen
GDPR-nativeEU AI Act readyEU-hosted (OVHcloud · Scaleway)SOC 2 Type II (in progress)ISO 27001 (in progress)Kein Audio für ModelltrainingOn-Premises-Option
FAQ

Fragen & Antworten

Wo wird die Voxist API gehostet?
Die Voxist API wird auf OVHcloud und Scaleway gehostet, ausschließlich in EU-Rechenzentren. Weder Audio noch Metadaten transitieren über die USA oder ein anderes Drittland.
Wird mein Audio für Modelltraining verwendet?
Nein. Kein über die API übermitteltes Audio wird zum Training oder zur Verbesserung von Voxist-Modellen verwendet. Daten werden im Durchlauf verarbeitet und nicht gespeichert — es sei denn, Sie konfigurieren explizit eine Aufbewahrung (für Ihre eigenen Transkripte).
Welche Audioformate unterstützt die API?
WebM/Opus, WAV PCM 16-bit, MP3, FLAC, OGG. Für Echtzeit-Streaming empfehlen wir WebM/Opus und WAV PCM. Minimale Samplerate 16 kHz; für Übersetzung empfehlen wir 48 kHz.
Hat die API Rate-Limits?
Der Free-Plan ist auf 5 req/s und 5 h Audio/Monat begrenzt. Der Pay-as-you-go-Plan unterstützt standardmäßig 50 req/s, auf Anfrage erweiterbar. Der Enterprise-Plan hat kein Rate-Limit.
Kann ich die API in Produktion nutzen, bevor ich auf einen Bezahlplan wechsle?
Ja. Der Free-Plan beinhaltet ein SLA von 99,5 % und eignet sich für moderate Produktionslast. Wechseln Sie zu Pay-as-you-go oder Enterprise, wenn Ihr Bedarf 5 h/Monat oder 5 req/s übersteigt.

Bauen Sie auf Sprach-KI, die dort bleibt, wo Ihre Daten sein müssen.

Jetzt kostenlos entwickeln

Kostenloser API-Key · In der EU gehostet · kein Audio wird für Modelltraining verwendet