Reflection-Agent-Pattern: Qualitätskontrolle in einem Durchlauf

Füge einen kurzen Prüf-Durchlauf hinzu, um offensichtliche Fehler vor der Antwort zu finden, ohne endlose Überarbeitungen.
Auf dieser Seite
  1. Pattern-Kern
  2. Problem
  3. Lösung
  4. Wie Es Funktioniert
  5. Im Code Sieht Das So Aus
  6. So Sieht Es Zur Laufzeit Aus
  7. Wann Es Passt - Und Wann Nicht
  8. Passt
  9. Passt Nicht
  10. Unterschied Zu Self-Critique
  11. Wann Reflection Unter Anderen Patterns Nutzen
  12. Wie Mit Anderen Patterns Kombinieren
  13. Kurz
  14. Vorteile Und Nachteile
  15. FAQ
  16. Was Danach

Pattern-Kern

Reflection Agent ist ein Pattern, bei dem der Agent nach einem Entwurf eine schnelle Qualitätsprüfung macht: Er findet offensichtliche Probleme (unklare Formulierungen, Widersprüche, zu sichere Aussagen) und korrigiert sie einmal vor der finalen Antwort.

Wichtig: Reflection ist ein leichter Check vor dem Senden. Es ist keine vollständige Prüfung nach Regeln oder Policies.

Wann einsetzen: wenn vor dem Senden eine kurze kontrollierte Selbstprüfung und genau eine Revision nötig ist.


Reflection ersetzt den eigentlichen Arbeitsprozess des Agenten nicht.

Es ergänzt eine kurze Kontrollstufe:

  • schnell prüfen, ob die Antwort klar ist, sich nicht widerspricht und keine wichtigen Hinweise auslässt
  • offensichtliche Risiken finden
  • nur das korrigieren, was nötig ist
  • abschließen, ohne einen neuen Endlos-Loop zu erzeugen

Reflection-Agent-Pattern: Qualitätskontrolle in einem Durchlauf

Problem

Stell dir vor, ein Agent schreibt eine Antwort für einen High-Risk-Request.

Der Entwurf ist grundsätzlich richtig, hat aber kleine Risiken:

  • zu kategorische Formulierung ohne Grundlage
  • Widerspruch zwischen Absätzen
  • fehlender Hinweis/Caveat
  • unklare Gültigkeitsgrenzen

Ohne Kontroll-Durchlauf geht dieser Entwurf direkt an den Nutzer.

Die gefährlichsten Fehler sind oft nicht grob, sondern "fast unsichtbar" in normal wirkendem Text.

Folgen:

  • Vertrauen in die Antwort sinkt
  • falsche Sicherheit entsteht
  • Risiko für Fehlentscheidungen steigt

Genau das ist das Problem: selbst ein guter Entwurf kann ohne Prüfung mit kritischen Ungenauigkeiten nach außen gehen.

Lösung

Reflection ergänzt eine Reflection-Policy vor der finalen Auslieferung.

Analogie: wie ein Schneider vor der Ausgabe eines Anzugs. Er prüft zuerst den Sitz und macht dann eine präzise Anpassung. Das verbessert das Ergebnis, macht den Prozess aber nicht zu endlosen Anproben.

Kernprinzip: Eine kurze Qualitätsprüfung und eine Korrektur, ohne endloses "noch besser machen".

Der Agent darf Änderungen vorschlagen, aber die Policy definiert:

  • ob eine Revision nötig ist
  • was genau geändert werden darf
  • wann Stop/Eskalation gilt

Gesteuerter Ablauf:

  1. Entwurf: erste Version erzeugen
  2. Review: eine strukturierte Prüfung ausführen
  3. Entscheidung: ok/revidieren/eskalieren
  4. Revision: eine patch-only-Änderung nach fix_plan
  5. Finalisieren: finales Ergebnis ohne neuen Loop zurückgeben

Das bringt:

  • Entfernung offensichtlicher Risiken vor dem Senden
  • spürbare Qualitätssteigerung mit kleinem Overhead
  • Revisionskontrolle innerhalb von fix_plan
  • Schutz vor endlosem Self-Edit

Funktioniert gut, wenn:

  • no_new_facts erzwungen wird
  • Änderungen nur als patch-only erlaubt sind
  • High-Risk-Fälle eskaliert statt endlos umgeschrieben werden

Das Modell "will" oft immer weiter editieren, aber genau die reflection-policy beendet den Prozess in vorhersagbaren Grenzen.

Wie Es Funktioniert

Diagram

Zentrale Regel: Reflection muss begrenzt sein.

Das heißt:

  • maximal 1 Review-Pass
  • maximal 1 Revisions-Pass
  • keine neuen Fakten hinzufügen
  • Revision muss patch-only sein und nur innerhalb von fix_plan
  • bei High-Risk-Problemen eskalieren
Voller Ablauf: Draft → Review → Revise → Finalize

Entwurf
Der Agent erstellt die erste Antwort aus verfügbarem Kontext.

Review
Ein separater Prompt prüft den Entwurf über einfache Punkte: Klarheit, Logik, Widerspruchsfreiheit und zu starke Behauptungen.

Revision
Wenn Probleme gefunden werden, macht der Agent genau eine Revision anhand eines strukturierten fix_plan.

Finalisierung
Das System gibt das Ergebnis zurück oder stoppt, wenn das Risiko zu hoch ist.

Im Code Sieht Das So Aus

PYTHON
draft = writer.generate(goal, context)

review = reflector.review_once(
    draft=draft,
    rubric=[
        "no_new_facts",
        "preserve_uncertainty",
        "consistency_check",
    ],
)

if review.high_risk:
    return escalate_to_human(review.reason)

if review.ok:
    return draft

revised = writer.revise_once(
    draft=draft,
    fix_plan=review.fix_plan,
    rules=["no_new_facts", "keep_scope"],
)

# optional: prüfen, dass Revision innerhalb von `fix_plan` blieb
approved = supervisor.review_output_patch(
    original=draft,
    revised=revised,
    allowed_changes=review.fix_plan,
)

return approved

Reflection sollte nicht "bis perfekt" laufen. Ein Review-Pass, eine Überarbeitung via revise, und eine Prüfung, dass die Revision innerhalb von fix_plan blieb.

So Sieht Es Zur Laufzeit Aus

TEXT
Goal: eine präzise Antwort mit korrekter SLA-Formulierung vorbereiten

Draft:
"SLA für alle Kunden beträgt 99.99%."

Review:
- Problem: zu kategorische Aussage
- Problem: Tarifstufe fehlt
- Fix: Bedingung und Quelle ergänzen

Revised:
"SLA hängt von der Tarifstufe ab. Für Enterprise beträgt sie 99.99% gemäß Support-Policy."

Vollständiges Reflection-Agent-Beispiel

PYPython
TSTypeScript · bald

Wann Es Passt - Und Wann Nicht

Passt

SituationWarum Reflection Passt
Antwort geht nach außen und braucht ZusatzprüfungReflection fängt offensichtliche Probleme vor dem Senden an Nutzer ab.
Qualitätsgewinn ohne großen Latenz-Impact nötigEin begrenzter Pass bringt oft spürbare Qualitätsverbesserung.
Klare Qualitätsrubrik und Stop-Rules vorhandenFormalisierte Kriterien machen Self-Review stabil und vorhersehbar.
Zuverlässigere finale Antwort ohne Rewrite-LoopReflection ergänzt einen Kontrollschritt ohne endlose Überarbeitungen.

Passt Nicht

SituationWarum Reflection Nicht Passt
Kritisch niedrige LatenzSchon ein zusätzlicher Pass kann die Antwort zu spät machen.
Keine klare QualitätsrubrikOhne Kriterien wird Reflection chaotisch und verbessert nicht stabil.
Externe Faktvalidierung via Tools oder Menschen nötigReflection ersetzt kein Fact-Checking mit externen Quellen oder manueller Prüfung.

Denn Reflection fügt einen weiteren Generierungs-Pass hinzu und erhöht Zeit und Kosten der Antwort.

Unterschied Zu Self-Critique

ReflectionSelf-Critique
ZielOffensichtliche Probleme vor dem Senden findenAntwort nach strengen Regeln prüfen und bei Bedarf umschreiben
TiefeSchneller Qualitätscheck: klar, logisch, ohne offensichtliche FehlerMeist strengere Kritik und Revision
Ergebnistypok/Probleme/Fix-Plandetaillierte Risiken + Pflichtänderungen + diff-Orientierung
RisikoKann ohne Limits zum zweiten Loop werdenÜbermäßiges Umschreiben und höhere Kosten

Reflection ist ein schneller begrenzter Kontrolllauf. Self-Critique ist ein tieferer Durchlauf mit Umschreiben.

Wann Reflection Unter Anderen Patterns Nutzen

Nutze Reflection, wenn eine Antwort vor dem Senden schnell geprüft werden muss: klar, logisch und ohne offensichtliche Fehler.

Kurzer Test:

  • wenn du "kurz prüfen und vor dem Final korrigieren" musst -> Reflection
  • wenn du "tief per Checkliste kritisieren und umschreiben" musst -> Self-Critique Agent
Vergleich mit anderen Patterns und Beispiele

Schneller Spickzettel:

Wenn die Aufgabe so aussieht...Nutze
Kurze Prüfung vor finaler Antwort nötigReflection Agent
Tiefe Kritik nach Kriterien und Umschreiben der Antwort nötigSelf-Critique Agent
Prozess nach timeout, exception oder Tool-Ausfall wiederherstellenFallback-Recovery Agent
Strenge Policy-Checks vor riskanter Aktion nötigGuarded-Policy Agent

Beispiele:

Reflection: "Vor finaler Antwort kurz Logik, Vollständigkeit und offensichtliche Fehler prüfen".

Self-Critique: "Antwort per Checkliste bewerten (Genauigkeit, Vollständigkeit, Risiken), dann umschreiben".

Fallback-Recovery: "Wenn API nicht antwortet, retry -> fallback-Quelle -> Eskalation".

Guarded-Policy: "Vor externer Datenweitergabe policy prüfen: ob das erlaubt ist".

Wie Mit Anderen Patterns Kombinieren

  • Reflection + RAG: Reflection prüft, dass Schlussfolgerungen wirklich zu den gefundenen Quellen passen.
  • Reflection + Supervisor: High-Risk-Schlussfolgerungen werden nicht automatisch gefixt, sondern zur menschlichen Freigabe gesendet.
  • Reflection + ReAct: nach einer Reihe von ReAct-Schritten macht der Agent einen finalen Check vor der Antwort.

Kurz

Kurzfazit

Reflection Agent:

  • Führt eine Kontroll-Selbstprüfung aus
  • Überarbeitet die Antwort einmal
  • Fügt keine neuen Fakten hinzu
  • Reduziert Risiko offensichtlicher Produktionsfehler

Vorteile Und Nachteile

Vorteile

prüft Antwort vor dem Senden

korrigiert offensichtliche Fehler

verbessert Klarheit und Struktur

hilft, gewünschtes Format einzuhalten

Nachteile

fügt einen zusätzlichen Schritt und Latenz hinzu

verbraucht mehr Tokens

kann ohne Grenzen die Antwort unnötig verkomplizieren

FAQ

Q: Kann Reflection Fact-Checking und Tests ersetzen?
A: Nein. Das ist eine zusätzliche Qualitätsstufe. Fact-Checking, Validierung und Policy-Kontrollen bleiben separat nötig.

Q: Warum ist ein Pass-Limit wichtig?
A: Sonst wird Reflection zum zweiten Loop: Latenz, Kosten und Risiko neuer Fehler steigen.

Q: Was tun, wenn Reflection ein High-Risk-Problem findet?
A: Nicht automatisch weitermachen. Prozess stoppen oder zu menschlicher Prüfung / Supervisor-Policy eskalieren.

Was Danach

Reflection ergänzt eine begrenzte Qualitätskontrolle vor der finalen Antwort.

Was tun, wenn eine strengere Kritik und ein Revisionsprozess mit strukturierten Änderungsregeln nötig sind?

⏱️ 10 Min. LesezeitAktualisiert Mär, 2026Schwierigkeit: ★★★
Praktische Fortsetzung

Beispiele zur Musterimplementierung

Setze das Thema direkt mit Beispielprojekten um.

Integriert: Production ControlOnceOnly
Guardrails für Tool-Calling-Agents
Shippe dieses Pattern mit Governance:
  • Budgets (Steps / Spend Caps)
  • Tool-Permissions (Allowlist / Blocklist)
  • Kill switch & Incident Stop
  • Idempotenz & Dedupe
  • Audit logs & Nachvollziehbarkeit
Integrierter Hinweis: OnceOnly ist eine Control-Layer für Production-Agent-Systeme.
Autor

Diese Dokumentation wird von Engineers kuratiert und gepflegt, die AI-Agenten in der Produktion betreiben.

Die Inhalte sind KI-gestützt, mit menschlicher redaktioneller Verantwortung für Genauigkeit, Klarheit und Produktionsrelevanz.

Patterns und Empfehlungen basieren auf Post-Mortems, Failure-Modes und operativen Incidents in produktiven Systemen, auch bei der Entwicklung und dem Betrieb von Governance-Infrastruktur für Agenten bei OnceOnly.