Einzelne Agents zu überwachen ist eine Sache — aber was passiert, wenn 10, 20 oder 50 Agents zusammenarbeiten? Multi-Agent-Systeme erzeugen emergentes Verhalten, das aus der Beobachtung einzelner Agents nicht vorhersagbar ist. OpenClaw wurde genau für diese Herausforderung gebaut.
| Herausforderung | Single Agent | Multi-Agent |
|---|---|---|
| Tracing | Linear, ein Thread | Verzweigt, parallele Threads |
| Kausalität | Direkt nachvollziehbar | Indirekte Kausalketten über Agents |
| Fehler | Lokalisierbar | Kaskadierende Fehler über System |
| Performance | Einzelmessung | Systemweite Latenz-Ketten |
| Kosten | Pro Agent | Interaktionskosten zwischen Agents |
| Compliance | Pro Agent | Systemweite Compliance-Bewertung |
Kernproblem: In einem Multi-Agent-System kann ein Agent A eine Entscheidung treffen, die Agent B zu einer Aktion veranlasst, die Agent C in eine Fehlerstate bringt. Ohne systemweites Tracing finden Sie die Ursache nie.
OpenClaw erweitert das OpenTelemetry-Modell um Agent-spezifische Konzepte:
# Orchestrator Agent
with oc.trace("orchestrator") as parent_trace:
# Delegation an Research Agent
research_result = await research_agent.run(
query=user_query,
trace_context=parent_trace.context # Trace wird propagiert
)
# Delegation an Writing Agent
draft = await writing_agent.run(
input=research_result,
trace_context=parent_trace.context
)
# Delegation an Review Agent
final = await review_agent.run(
draft=draft,
trace_context=parent_trace.context
)
Trace: content-pipeline (tr_multi_001)
├── Span: orchestrator (total: 8,240ms)
│ ├── Span: research-agent (3,120ms)
│ │ ├── Span: web-search (1,800ms)
│ │ ├── Span: summarization (980ms)
│ │ └── Span: fact-check (340ms)
│ ├── Span: writing-agent (3,450ms)
│ │ ├── Span: outline-generation (450ms)
│ │ ├── Span: draft-writing (2,600ms)
│ │ └── Span: formatting (400ms)
│ └── Span: review-agent (1,670ms)
│ ├── Span: quality-check (890ms)
│ ├── Span: tone-check (380ms)
│ └── Span: compliance-check (400ms)
OpenClaw visualisiert die Kommunikationsstruktur zwischen Agents:
┌──────────────┐ query ┌──────────────┐
│ Orchestrator ├────────────→│ Research Agent│
│ │←────────────┤ │
└──────┬───────┘ results └──────────────┘
│
│ research + instructions
▼
┌──────────────┐ draft ┌──────────────┐
│ Writing Agent ├────────────→│ Review Agent │
│ │←────────────┤ │
└──────────────┘ feedback └──────┬───────┘
│
┌──────▼───────┐
│ Compliance │
│ Agent │
└──────────────┘
Das Interaction-Graph-Dashboard zeigt:
OpenClaw erkennt automatisch Engpässe im Multi-Agent-System:
Bottleneck erkannt: writing-agent
──────────────────────────────────
Typ: Latenz-Bottleneck
Impact: Erhöht End-to-End-Latenz um 42%
Ursache: GPT-4o mit 2.600ms avg. Response-Time
Empfehlung: Parallelisierung der Outline- und Draft-Phasen
oder Wechsel zu schnellerem Modell für Outline
Ersparnis: ~1.200ms End-to-End (-15%)
Merke: Multi-Agent-Monitoring ist nicht optional — es ist die Grundvoraussetzung für zuverlässige Multi-Agent-Systeme. Ohne systemweite Observability operieren Sie blind in einem komplexen System.
Was ist die größte Herausforderung beim Monitoring von Multi-Agent-Systemen im Vergleich zu einzelnen Agents?