Tutti i progetti
Pipeline real-time · STT → LLM → TTS

Voice Agent — Outbound vocale

Ruolo: Architetto e sviluppatorePeriodo: 2025 — oggi

Agente telefonico outbound che conduce una conversazione naturale in italiano e prenota appuntamenti: Whisper per l’ascolto, LLM on-prem per il ragionamento, ElevenLabs per la voce.

Un agente vocale che chiama, parla in italiano in modo naturale e porta a casa un risultato concreto: la prenotazione di un appuntamento. Mette insieme tre modelli in una pipeline real-time a bassa latenza — riconoscimento vocale, ragionamento e sintesi vocale — sopra una telefonia tradizionale. Il cuore del lavoro è stato l’orchestrazione e il tuning della conversazione, non un singolo modello.

Funzionalità

  • Conduce in autonomia una conversazione telefonica: si presenta, qualifica l’interlocutore, propone uno slot e conferma.
  • Prenota su Google Calendar verificando in tempo reale gli slot liberi su tre giorni, oggi incluso, con filtro delle ore già passate.
  • Rispetta il nome scelto dall’interlocutore e raccoglie l’email in una sola richiesta, senza loop frustranti.
  • Console web per configurare campagne e script e per monitorare le chiamate.

Aspetti tecnici

  • Pipeline real-time STT → LLM → TTS innestata sulla telefonia Asterisk via AudioSocket (PCM 8 kHz), con TTS a 0,35–0,41 s per frase.
  • STT: faster-whisper large-v3 su GPU; LLM: Qwen3 35B-A3B servito on-prem da llama-server (nessun dato conversazionale in cloud); TTS: ElevenLabs (voce italiana, modello flash) con fallback locale XTTS/Piper.
  • Output già in PCM 8 kHz pronto per AudioSocket e normalizzazione del testo dedicata alla resa vocale (numeri, sigle).
  • Reasoning del modello disattivato esplicitamente per evitare risposte mute; le chiavi (ElevenLabs) sono iniettate dalla pipeline CI da variabili protette, mai nel repository.

Stack tecnologico

PythonAsterisk / AudioSocketfaster-whisperllama-server (Qwen)ElevenLabsGoogle Calendar APINext.js

Competenze chiave

Orchestrazione LLMPipeline real-timePrompt engineeringTool integration

Collegamenti

I link contrassegnati come interno puntano a servizi e repository sulla rete privata di Elite Software House (accesso via SSO / VPN aziendale). Sono inclusi come riferimento tecnico; posso mostrarli in diretta durante un colloquio.