Pattern-Kern
Reflection Agent ist ein Pattern, bei dem der Agent nach einem Entwurf eine schnelle Qualitätsprüfung macht: Er findet offensichtliche Probleme (unklare Formulierungen, Widersprüche, zu sichere Aussagen) und korrigiert sie einmal vor der finalen Antwort.
Wichtig: Reflection ist ein leichter Check vor dem Senden. Es ist keine vollständige Prüfung nach Regeln oder Policies.
Wann einsetzen: wenn vor dem Senden eine kurze kontrollierte Selbstprüfung und genau eine Revision nötig ist.
Reflection ersetzt den eigentlichen Arbeitsprozess des Agenten nicht.
Es ergänzt eine kurze Kontrollstufe:
- schnell prüfen, ob die Antwort klar ist, sich nicht widerspricht und keine wichtigen Hinweise auslässt
- offensichtliche Risiken finden
- nur das korrigieren, was nötig ist
- abschließen, ohne einen neuen Endlos-Loop zu erzeugen

Problem
Stell dir vor, ein Agent schreibt eine Antwort für einen High-Risk-Request.
Der Entwurf ist grundsätzlich richtig, hat aber kleine Risiken:
- zu kategorische Formulierung ohne Grundlage
- Widerspruch zwischen Absätzen
- fehlender Hinweis/Caveat
- unklare Gültigkeitsgrenzen
Ohne Kontroll-Durchlauf geht dieser Entwurf direkt an den Nutzer.
Die gefährlichsten Fehler sind oft nicht grob, sondern "fast unsichtbar" in normal wirkendem Text.
Folgen:
- Vertrauen in die Antwort sinkt
- falsche Sicherheit entsteht
- Risiko für Fehlentscheidungen steigt
Genau das ist das Problem: selbst ein guter Entwurf kann ohne Prüfung mit kritischen Ungenauigkeiten nach außen gehen.
Lösung
Reflection ergänzt eine Reflection-Policy vor der finalen Auslieferung.
Analogie: wie ein Schneider vor der Ausgabe eines Anzugs. Er prüft zuerst den Sitz und macht dann eine präzise Anpassung. Das verbessert das Ergebnis, macht den Prozess aber nicht zu endlosen Anproben.
Kernprinzip: Eine kurze Qualitätsprüfung und eine Korrektur, ohne endloses "noch besser machen".
Der Agent darf Änderungen vorschlagen, aber die Policy definiert:
- ob eine Revision nötig ist
- was genau geändert werden darf
- wann
Stop/Eskalationgilt
Gesteuerter Ablauf:
- Entwurf: erste Version erzeugen
- Review: eine strukturierte Prüfung ausführen
- Entscheidung:
ok/revidieren/eskalieren - Revision: eine
patch-only-Änderung nachfix_plan - Finalisieren: finales Ergebnis ohne neuen Loop zurückgeben
Das bringt:
- Entfernung offensichtlicher Risiken vor dem Senden
- spürbare Qualitätssteigerung mit kleinem Overhead
- Revisionskontrolle innerhalb von
fix_plan - Schutz vor endlosem Self-Edit
Funktioniert gut, wenn:
no_new_factserzwungen wird- Änderungen nur als
patch-onlyerlaubt sind - High-Risk-Fälle eskaliert statt endlos umgeschrieben werden
Das Modell "will" oft immer weiter editieren, aber genau die reflection-policy beendet den Prozess in vorhersagbaren Grenzen.
Wie Es Funktioniert
Zentrale Regel: Reflection muss begrenzt sein.
Das heißt:
- maximal 1 Review-Pass
- maximal 1 Revisions-Pass
- keine neuen Fakten hinzufügen
- Revision muss
patch-onlysein und nur innerhalb vonfix_plan - bei High-Risk-Problemen eskalieren
Voller Ablauf: Draft → Review → Revise → Finalize
Entwurf
Der Agent erstellt die erste Antwort aus verfügbarem Kontext.
Review
Ein separater Prompt prüft den Entwurf über einfache Punkte: Klarheit, Logik, Widerspruchsfreiheit und zu starke Behauptungen.
Revision
Wenn Probleme gefunden werden, macht der Agent genau eine Revision anhand eines strukturierten fix_plan.
Finalisierung
Das System gibt das Ergebnis zurück oder stoppt, wenn das Risiko zu hoch ist.
Im Code Sieht Das So Aus
draft = writer.generate(goal, context)
review = reflector.review_once(
draft=draft,
rubric=[
"no_new_facts",
"preserve_uncertainty",
"consistency_check",
],
)
if review.high_risk:
return escalate_to_human(review.reason)
if review.ok:
return draft
revised = writer.revise_once(
draft=draft,
fix_plan=review.fix_plan,
rules=["no_new_facts", "keep_scope"],
)
# optional: prüfen, dass Revision innerhalb von `fix_plan` blieb
approved = supervisor.review_output_patch(
original=draft,
revised=revised,
allowed_changes=review.fix_plan,
)
return approved
Reflection sollte nicht "bis perfekt" laufen. Ein Review-Pass, eine Überarbeitung via revise, und eine Prüfung, dass die Revision innerhalb von fix_plan blieb.
So Sieht Es Zur Laufzeit Aus
Goal: eine präzise Antwort mit korrekter SLA-Formulierung vorbereiten
Draft:
"SLA für alle Kunden beträgt 99.99%."
Review:
- Problem: zu kategorische Aussage
- Problem: Tarifstufe fehlt
- Fix: Bedingung und Quelle ergänzen
Revised:
"SLA hängt von der Tarifstufe ab. Für Enterprise beträgt sie 99.99% gemäß Support-Policy."
Vollständiges Reflection-Agent-Beispiel
Wann Es Passt - Und Wann Nicht
Passt
| Situation | Warum Reflection Passt | |
|---|---|---|
| ✅ | Antwort geht nach außen und braucht Zusatzprüfung | Reflection fängt offensichtliche Probleme vor dem Senden an Nutzer ab. |
| ✅ | Qualitätsgewinn ohne großen Latenz-Impact nötig | Ein begrenzter Pass bringt oft spürbare Qualitätsverbesserung. |
| ✅ | Klare Qualitätsrubrik und Stop-Rules vorhanden | Formalisierte Kriterien machen Self-Review stabil und vorhersehbar. |
| ✅ | Zuverlässigere finale Antwort ohne Rewrite-Loop | Reflection ergänzt einen Kontrollschritt ohne endlose Überarbeitungen. |
Passt Nicht
| Situation | Warum Reflection Nicht Passt | |
|---|---|---|
| ❌ | Kritisch niedrige Latenz | Schon ein zusätzlicher Pass kann die Antwort zu spät machen. |
| ❌ | Keine klare Qualitätsrubrik | Ohne Kriterien wird Reflection chaotisch und verbessert nicht stabil. |
| ❌ | Externe Faktvalidierung via Tools oder Menschen nötig | Reflection ersetzt kein Fact-Checking mit externen Quellen oder manueller Prüfung. |
Denn Reflection fügt einen weiteren Generierungs-Pass hinzu und erhöht Zeit und Kosten der Antwort.
Unterschied Zu Self-Critique
| Reflection | Self-Critique | |
|---|---|---|
| Ziel | Offensichtliche Probleme vor dem Senden finden | Antwort nach strengen Regeln prüfen und bei Bedarf umschreiben |
| Tiefe | Schneller Qualitätscheck: klar, logisch, ohne offensichtliche Fehler | Meist strengere Kritik und Revision |
| Ergebnistyp | ok/Probleme/Fix-Plan | detaillierte Risiken + Pflichtänderungen + diff-Orientierung |
| Risiko | Kann ohne Limits zum zweiten Loop werden | Übermäßiges Umschreiben und höhere Kosten |
Reflection ist ein schneller begrenzter Kontrolllauf. Self-Critique ist ein tieferer Durchlauf mit Umschreiben.
Wann Reflection Unter Anderen Patterns Nutzen
Nutze Reflection, wenn eine Antwort vor dem Senden schnell geprüft werden muss: klar, logisch und ohne offensichtliche Fehler.
Kurzer Test:
- wenn du "kurz prüfen und vor dem Final korrigieren" musst -> Reflection
- wenn du "tief per Checkliste kritisieren und umschreiben" musst -> Self-Critique Agent
Vergleich mit anderen Patterns und Beispiele
Schneller Spickzettel:
| Wenn die Aufgabe so aussieht... | Nutze |
|---|---|
| Kurze Prüfung vor finaler Antwort nötig | Reflection Agent |
| Tiefe Kritik nach Kriterien und Umschreiben der Antwort nötig | Self-Critique Agent |
| Prozess nach timeout, exception oder Tool-Ausfall wiederherstellen | Fallback-Recovery Agent |
| Strenge Policy-Checks vor riskanter Aktion nötig | Guarded-Policy Agent |
Beispiele:
Reflection: "Vor finaler Antwort kurz Logik, Vollständigkeit und offensichtliche Fehler prüfen".
Self-Critique: "Antwort per Checkliste bewerten (Genauigkeit, Vollständigkeit, Risiken), dann umschreiben".
Fallback-Recovery: "Wenn API nicht antwortet, retry -> fallback-Quelle -> Eskalation".
Guarded-Policy: "Vor externer Datenweitergabe policy prüfen: ob das erlaubt ist".
Wie Mit Anderen Patterns Kombinieren
- Reflection + RAG: Reflection prüft, dass Schlussfolgerungen wirklich zu den gefundenen Quellen passen.
- Reflection + Supervisor: High-Risk-Schlussfolgerungen werden nicht automatisch gefixt, sondern zur menschlichen Freigabe gesendet.
- Reflection + ReAct: nach einer Reihe von ReAct-Schritten macht der Agent einen finalen Check vor der Antwort.
Kurz
Reflection Agent:
- Führt eine Kontroll-Selbstprüfung aus
- Überarbeitet die Antwort einmal
- Fügt keine neuen Fakten hinzu
- Reduziert Risiko offensichtlicher Produktionsfehler
Vorteile Und Nachteile
Vorteile
prüft Antwort vor dem Senden
korrigiert offensichtliche Fehler
verbessert Klarheit und Struktur
hilft, gewünschtes Format einzuhalten
Nachteile
fügt einen zusätzlichen Schritt und Latenz hinzu
verbraucht mehr Tokens
kann ohne Grenzen die Antwort unnötig verkomplizieren
FAQ
Q: Kann Reflection Fact-Checking und Tests ersetzen?
A: Nein. Das ist eine zusätzliche Qualitätsstufe. Fact-Checking, Validierung und Policy-Kontrollen bleiben separat nötig.
Q: Warum ist ein Pass-Limit wichtig?
A: Sonst wird Reflection zum zweiten Loop: Latenz, Kosten und Risiko neuer Fehler steigen.
Q: Was tun, wenn Reflection ein High-Risk-Problem findet?
A: Nicht automatisch weitermachen. Prozess stoppen oder zu menschlicher Prüfung / Supervisor-Policy eskalieren.
Was Danach
Reflection ergänzt eine begrenzte Qualitätskontrolle vor der finalen Antwort.
Was tun, wenn eine strengere Kritik und ein Revisionsprozess mit strukturierten Änderungsregeln nötig sind?