KugelAudio
Real-time text-to-speech model you can self-host
4.5(10,000 avaliações)
Freemium· a partir de US$20.00/mês
Lançado em 2026
Sobre
Most natural real-time TTS with voice cloning and sub-60ms latency, on-prem or via API. Grammar-aware normalization reads phone numbers, IBANs, addresses, and medications naturally across 25+ languages, with word-level timestamps and IPA support. Adapters for LiveKit, Pipecat, and Vapi. Built by 4 in Berlin.
Pontos positivos
- +Real-time TTS com voz clonada
- +Latência sub-60ms
- +Suporte a 25+ idiomas
Pontos negativos
- −Limitado a uso on-prem ou via API
- −Requer adaptação para integração com outros serviços