Soluzioni per sviluppatori

IA vocale europea, disponibile in una riga di codice.

L'API Voxist espone ASR, traduzione e sintesi vocale via REST e gRPC. Ospitata nella UE, fatturata in euro, GDPR-nativa per architettura. Nessun passaggio da un hyperscaler americano.

Vedi la documentazione Inizia gratis

Integrata inOVHcloudScalewayVoxlive CCaaSELLIOT (Horizon Europe)

Esempio rapidoREST

POST /v1/asr/stream
Authorization: Bearer <api-key>
Content-Type: audio/webm

→ {
  "transcript": "Pouvez-vous confirmer le délai ?",
  "lang": "fr",
  "confidence": 0.97,
  "latency_ms": 186
}

REST + gRPCEU-hosted<200ms

Il problema

Tre problemi che le altre API vocali non risolvono

Problema 1

La tua API vocale è stata addestrata sull'inglese — e sul francese si vede

La maggior parte delle grandi API di ASR ha un WER dell'8–15% sul francese generico, e peggio con accenti o terminologia tecnica. L'API Voxist arriva al 4,2% di WER sul francese — il migliore della categoria per le lingue europee.

Problema 2

La tua API di traduzione passa dall'inglese — e questo appiattisce le sfumature

Francese → inglese → tedesco perde il 30% delle sfumature di registro nel passaggio dall'inglese. L'API Voxist traduce direttamente tra coppie europee — n. 2 al mondo in COMET sulle coppie europee incentrate sul francese, senza pivot.

Problema 3

Il tuo DPO chiede dove finisce l'audio dei tuoi utenti

Le applicazioni che elaborano la voce di residenti UE devono rispondere a requisiti GDPR rigidi sulla localizzazione dei dati. L'API Voxist è ospitata su OVHcloud e Scaleway, nella UE, con zero transito verso gli Stati Uniti.

Cosa puoi costruire

Tutto quello che la tua applicazione può fare con la voce

Riconoscimento del parlato (ASR)

Streaming e batch. 40+ lingue. Rilevamento automatico della lingua. 4,2% di WER sul francese. Vocabolario tecnico disponibile.

Traduzione (MT)

Traduzione in streaming e on-demand. 1.600+ coppie di lingue. N. 2 al mondo in COMET sulle coppie europee incentrate sul francese. Cambio di lingua rilevato automaticamente.

Sintesi vocale neurale (TTS)

Voci neurali naturali in 40+ lingue. Streaming in tempo reale. Controllo della prosodia. Voice cloning su richiesta (contratto enterprise).

Pipeline da voce a voce (VTT)

ASR + MT + TTS in un unico endpoint. Latenza percepita sotto il secondo. Ideale per le applicazioni di traduzione in tempo reale.

SDK multilinguaggio

Python, Node.js, Go, Rust, Java e .NET. Client WebSocket per lo streaming. Specifica OpenAPI per generare il tuo client.

Opzione on-premise

Per le applicazioni che non possono inviare audio al cloud. I modelli si distribuiscono sulla tua infrastruttura. Stessa API, stesso SDK.

Conformità e fiducia

GDPR-nativeEU AI Act readyEU-hosted (OVHcloud · Scaleway)SOC 2 Type II (in progress)ISO 27001 (in progress)Nessun audio per il training dei modelliOpzione on-premise

FAQ

Domande e risposte

Dove è ospitata l'API Voxist?

L'API Voxist è ospitata su OVHcloud e Scaleway, esclusivamente in data center UE. Nessun audio o metadato transita per gli Stati Uniti o per qualsiasi altro paese terzo.

Il mio audio viene usato per addestrare i modelli?

No. Nessun audio inviato tramite l'API viene usato per addestrare o migliorare i modelli Voxist. I dati vengono elaborati al volo e non vengono conservati, a meno che tu non configuri esplicitamente la conservazione (per le tue trascrizioni).

Quali formati audio supporta l'API?

WebM/Opus, WAV PCM a 16 bit, MP3, FLAC, OGG. Per lo streaming in tempo reale si consigliano WebM/Opus e WAV PCM. La frequenza di campionamento minima è 16 kHz; per la traduzione si consigliano 48 kHz.

L'API ha limiti di utilizzo?

Il piano gratuito è limitato a 5 richieste/s e 5 ore di audio/mese. Il piano a consumo supporta 50 richieste/s di default, aumentabili su richiesta. Il piano enterprise non ha limiti.

Posso usare l'API in produzione prima di passare a un piano a pagamento?

Sì. Il piano gratuito include un SLA del 99,5% ed è adatto a carichi di produzione moderati. Passa al piano a consumo o enterprise quando le tue esigenze superano le 5 ore/mese o le 5 richieste/s.

Costruisci su un'IA vocale che resterà dove i tuoi dati devono stare.

Inizia a costruire gratis

API key gratuita · Hosting nella UE · nessun audio viene usato per addestrare i modelli