KI-Telefonie

Voice Agent — Praxis Dr. Müller

KI-Telefonagent für Arztpraxen — nimmt Anrufe auf Deutsch entgegen, bucht Termine mit Verfügbarkeitsprüfung, erkennt Notfälle und leitet Anrufe weiter. Multi-Praxis-Support via YAML-Konfiguration, kontextabhängige Begrüßungen (Feiertage, Sprechzeiten), Analytics-Dashboard. 5/5 Live-Szenarien bestanden.

156 Tests
5/5 Live-Szenarien
~$0.03 Kosten/Anruf
3 Praxis-Configs

Architektur

Pipeline

Anruf eingehend

Vapi nimmt den Anruf entgegen, STT wandelt Sprache in Text um.

KI-Verarbeitung

Claude Sonnet 4 erkennt das Anliegen und wählt die passende Aktion.

Tool-Ausführung

FastAPI-Webhook führt Terminbuchung, Weiterleitung oder Benachrichtigung aus.

Antwort & Logging

ElevenLabs TTS antwortet auf Deutsch, Anruf wird in JSONL protokolliert.

Tech Stack

Technologien

Voice & AI
Vapi.aiClaude Sonnet 4ElevenLabs TTS
Backend
Python 3.12FastAPIHMAC-SHA256
Deployment
DockerFly.io (Frankfurt)Chart.js Dashboard

Qualitätssicherung

Test-Ergebnisse

156
Tests Gesamt
156
Bestanden
0
Fehlgeschlagen
100%
Coverage

Engineering Decisions

Architektur-Entscheidungen

Entscheidung

Vapi.ai statt Twilio

Vapi bietet integriertes Voice-AI-Orchestration mit STT + LLM + TTS in einer Plattform. Free Tier mit $10 Credits ermöglicht kosteneffizientes Prototyping ohne komplexe Twilio-Integration.

Entscheidung

YAML-basierte Multi-Praxis-Konfiguration

Jede Praxis wird über eine YAML-Datei definiert statt Hardcoding. Das ermöglicht Skalierung auf beliebig viele Praxen ohne Code-Änderungen.

Entscheidung

HMAC-SHA256 Webhook-Auth

Webhook-Sicherheit durch kryptografische Signaturprüfung statt API-Keys. Verhindert unautorisierte Tool-Calls von außen.