Tutti i progetti
Pipeline real-time · STT → LLM → TTS
Voice Agent — Outbound vocale
Agente telefonico outbound che conduce una conversazione naturale in italiano e prenota appuntamenti: Whisper per l’ascolto, LLM on-prem per il ragionamento, ElevenLabs per la voce.
Un agente vocale che chiama, parla in italiano in modo naturale e porta a casa un risultato concreto: la prenotazione di un appuntamento. Mette insieme tre modelli in una pipeline real-time a bassa latenza — riconoscimento vocale, ragionamento e sintesi vocale — sopra una telefonia tradizionale. Il cuore del lavoro è stato l’orchestrazione e il tuning della conversazione, non un singolo modello.
Funzionalità
- Conduce in autonomia una conversazione telefonica: si presenta, qualifica l’interlocutore, propone uno slot e conferma.
- Prenota su Google Calendar verificando in tempo reale gli slot liberi su tre giorni, oggi incluso, con filtro delle ore già passate.
- Rispetta il nome scelto dall’interlocutore e raccoglie l’email in una sola richiesta, senza loop frustranti.
- Console web per configurare campagne e script e per monitorare le chiamate.
Aspetti tecnici
- Pipeline real-time STT → LLM → TTS innestata sulla telefonia Asterisk via AudioSocket (PCM 8 kHz), con TTS a 0,35–0,41 s per frase.
- STT: faster-whisper large-v3 su GPU; LLM: Qwen3 35B-A3B servito on-prem da llama-server (nessun dato conversazionale in cloud); TTS: ElevenLabs (voce italiana, modello flash) con fallback locale XTTS/Piper.
- Output già in PCM 8 kHz pronto per AudioSocket e normalizzazione del testo dedicata alla resa vocale (numeri, sigle).
- Reasoning del modello disattivato esplicitamente per evitare risposte mute; le chiavi (ElevenLabs) sono iniettate dalla pipeline CI da variabili protette, mai nel repository.
Stack tecnologico
PythonAsterisk / AudioSocketfaster-whisperllama-server (Qwen)ElevenLabsGoogle Calendar APINext.js
Competenze chiave
Orchestrazione LLMPipeline real-timePrompt engineeringTool integration
Collegamenti
I link contrassegnati come interno puntano a servizi e repository sulla rete privata di Elite Software House (accesso via SSO / VPN aziendale). Sono inclusi come riferimento tecnico; posso mostrarli in diretta durante un colloquio.