Lektion 1 von 5·10 Min Lesezeit

ElevenLabs-Plattform verstehen

ElevenLabs hat sich seit 2023 als führender Anbieter für generative Voice AI etabliert. Die Plattform bietet weit mehr als Text-to-Speech — von Voice Cloning über Voice Agents bis hin zu Audio-Intelligence. Dieser Überblick zeigt, was die Plattform kann und wie Sie den Einstieg schaffen.

Die drei Säulen von ElevenLabs

1. Speech Synthesis (Text-to-Speech)

Das Kernprodukt: Text wird in menschlich klingende Sprache umgewandelt.

  • 29+ Sprachen mit natürlicher Prosodie
  • Emotionale Kontrolle: Ton, Tempo, Betonung steuerbar
  • Streaming: Echtzeit-Audio mit < 300 ms Latenz
  • SSML-Support: Feinsteuerung über Speech Synthesis Markup Language

2. Voice Cloning

Erstellen Sie eine digitale Kopie einer echten Stimme:

  • Instant Voice Cloning: 30 Sekunden Audio reichen
  • Professional Voice Cloning: 30+ Minuten für maximale Qualität
  • Voice Design: Stimme aus Beschreibung generieren (Alter, Geschlecht, Akzent)

3. Conversational AI (Voice Agents)

Vollständige Voice Agents, die Gespräche führen:

  • Turn-Taking und Interruption Handling
  • LLM-Integration (GPT-4o, Claude, Gemini)
  • Tool-Use: Agenten können APIs aufrufen
  • Telefonie-Integration (Twilio, SIP)

Pricing Tiers

PlanPreisZeichen/MonatVoice CloningAPI-Zugang
Free0 €10.000NeinBegrenzt
Starter5 €/Monat30.000InstantJa
Creator22 €/Monat100.000InstantJa
Pro99 €/Monat500.000ProfessionalJa
Scale330 €/Monat2.000.000ProfessionalJa
EnterpriseIndividuellIndividuellAllesJa + SLA

Für Unternehmen relevant

  • Scale oder Enterprise Plan für Produktionsworkloads
  • Usage-based Pricing bei hohem Volumen oft günstiger
  • Enterprise: SLA, dedizierter Support, Custom-Modelle, SSO

API Key Setup

Schritt-für-Schritt

  1. Account erstellen auf elevenlabs.io
  2. Plan wählen — mindestens Starter für API-Zugang
  3. API Key generieren unter Profile → API Keys
  4. Key sicher speichern — niemals im Code, immer als Environment Variable
# .env Datei
ELEVENLABS_API_KEY=sk_xxxxxxxxxxxxxxxxxxxxxxxx

# Erster Test
curl -X POST "https://api.elevenlabs.io/v1/text-to-speech/21m00Tcm4TlvDq8ikWAM" \
  -H "xi-api-key: $ELEVENLABS_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"text": "Hallo Welt!", "model_id": "eleven_multilingual_v2"}' \
  --output test.mp3

Rate Limits beachten

PlanRequests/SekundeConcurrent Requests
Starter22
Pro1010
Scale2525
EnterpriseCustomCustom

Das ElevenLabs-Ökosystem

Über die API hinaus bietet ElevenLabs:

  • Voice Library: 1.000+ vorgefertigte Stimmen der Community
  • Projects: Langtext-zu-Audio-Konvertierung (Bücher, Artikel)
  • Dubbing: Automatische Video-Übersetzung mit Lippensynchronisation
  • Sound Effects: AI-generierte Soundeffekte aus Textbeschreibung
  • Audio Native: Embedded Audio-Player für Websites

Praxis-Tipp: Starten Sie mit dem kostenlosen Plan, um die Plattform kennenzulernen. Für den produktiven API-Einsatz wählen Sie mindestens den Pro-Plan — die höheren Rate Limits und Professional Voice Cloning machen den Unterschied.

📝

Quiz

Frage 1 von 3

Welche drei Säulen bilden die ElevenLabs-Plattform?