In komplexen Enterprise-Szenarien reicht eine einzige Stimme nicht aus. Multi-Voice-Systeme setzen mehrere distinkte Stimmen ein — für verschiedene Abteilungen, Charaktere oder Sprachen. Die Herausforderung: Konsistenz, Routing und nahtlose Übergänge.
| Agent | Abteilung | Stimme | Eigenschaften |
|---|---|---|---|
| Sophia | Vertrieb | Weiblich, 30er | Warm, enthusiastisch, überzeugend |
| Max | Technik-Support | Männlich, 40er | Ruhig, geduldig, technisch kompetent |
| Elena | Buchhaltung | Weiblich, 50er | Professionell, präzise, vertrauenswürdig |
| Kai | Onboarding | Männlich, 20er | Freundlich, locker, zugänglich |
| System | IVR/Routing | Neutral | Klar, sachlich, keine Emotion |
const voiceAgents = {
sales: {
voiceId: 'sophia-voice-id',
systemPrompt: 'Du bist Sophia, unsere Vertriebsberaterin...',
tools: ['check_pricing', 'schedule_demo', 'send_proposal'],
},
support: {
voiceId: 'max-voice-id',
systemPrompt: 'Du bist Max, unser technischer Support...',
tools: ['check_ticket', 'remote_diagnostics', 'escalate'],
},
billing: {
voiceId: 'elena-voice-id',
systemPrompt: 'Du bist Elena, unsere Buchhaltungs-Spezialistin...',
tools: ['check_invoice', 'process_refund', 'update_payment'],
},
}
Voice Routing bestimmt, welche Stimme der Nutzer hört — basierend auf Kontext:
Eingehender Anruf
↓
Begrüßung (System-Stimme)
↓
Intent-Erkennung: "Was kann ich für Sie tun?"
↓
├── "Ich möchte etwas kaufen" → Sophia (Vertrieb)
├── "Mein Internet geht nicht" → Max (Support)
├── "Ich habe eine Frage zur Rechnung" → Elena (Buchhaltung)
└── "Ich bin neu bei Ihnen" → Kai (Onboarding)
| Kriterium | Beispiel | Voice Agent |
|---|---|---|
| Intent | Kaufinteresse | Sophia (Vertrieb) |
| Sprache | Englisch erkannt | English-Voice Agent |
| Kundenstatus | Enterprise-Kunde | Senior Agent (Premium-Stimme) |
| Tageszeit | Nach 18 Uhr | After-Hours Agent |
| Eskalation | Wiederholter Anruf | Erfahrener Agent |
Ein Kunde sollte immer die gleiche Stimme hören, wenn er mit der gleichen Abteilung spricht:
async function getVoiceForCustomer(customerId: string, department: string) {
// Prüfe, ob Kunde bereits einen zugewiesenen Agent hat
const assignment = await db.voiceAssignments.findOne({
customerId,
department,
})
if (assignment) {
return assignment.voiceId // Bekannte Stimme
}
// Neuzuweisung basierend auf Verfügbarkeit und Kundenprofil
const voiceId = await selectBestVoice(customerId, department)
await db.voiceAssignments.create({ customerId, department, voiceId })
return voiceId
}
ElevenLabs-Stimmen können bei verschiedenen Texten leicht unterschiedlich klingen. Für Enterprise-Einsatz muss die Konsistenz garantiert werden:
1. Voice Settings standardisieren:
{
"stability": 0.65,
"similarity_boost": 0.80,
"style": 0.20,
"use_speaker_boost": true
}
2. Prompt-Konsistenz:
3. Audio-Postprocessing:
| Metrik | Zielwert | Tool |
|---|---|---|
| Speaker Similarity | > 0.90 | Resemblyzer |
| MOS (Mean Opinion Score) | > 4.0/5 | Stichproben-Tests |
| Latenz TTS | < 400 ms | API-Monitoring |
| Audio-Qualität | > 3.5 PESQ | Automatisierte Tests |
Praxis-Tipp: Erstellen Sie ein "Voice Style Guide" — ähnlich einem Brand Style Guide, aber für Stimmen. Definieren Sie für jeden Agent: Stimme, Settings, Tonalität, Do's und Don'ts. Teilen Sie es mit allen Entwicklern und Stakeholdern.