Reflection-Agent-Pattern: Qualitätskontrolle in einem Durchgang

Füge einen kurzen Prüf-Durchlauf hinzu, um offensichtliche Fehler vor der Antwort zu finden, ohne endlose Überarbeitungen.

Auf dieser Seite

Pattern-Kern
Problem
Lösung
Wie Es Funktioniert
Im Code Sieht Das So Aus
So Sieht Es Zur Laufzeit Aus
Wann Es Passt - Und Wann Nicht
Passt
Passt Nicht
Unterschied Zu Self-Critique
Wann Reflection Unter Anderen Patterns Nutzen
Wie Mit Anderen Patterns Kombinieren
Kurz
Vorteile Und Nachteile
FAQ
Was Danach

Pattern-Kern

Reflection Agent ist ein Pattern, bei dem der Agent nach einem Entwurf eine schnelle Qualitätsprüfung macht: Er findet offensichtliche Probleme (unklare Formulierungen, Widersprüche, zu sichere Aussagen) und korrigiert sie einmal vor der finalen Antwort.

Wichtig: Reflection ist ein leichter Check vor dem Senden. Es ist keine vollständige Prüfung nach Regeln oder Policies.

Wann einsetzen: wenn vor dem Senden eine kurze kontrollierte Selbstprüfung und genau eine Revision nötig ist.

Reflection ersetzt den eigentlichen Arbeitsprozess des Agenten nicht.

Es ergänzt eine kurze Kontrollstufe:

schnell prüfen, ob die Antwort klar ist, sich nicht widerspricht und keine wichtigen Hinweise auslässt
offensichtliche Risiken finden
nur das korrigieren, was nötig ist
abschließen, ohne einen neuen Endlos-Loop zu erzeugen

Reflection-Agent-Pattern: Qualitätskontrolle in einem Durchlauf

Problem

Stell dir vor, ein Agent schreibt eine Antwort für einen High-Risk-Request.

Der Entwurf ist grundsätzlich richtig, hat aber kleine Risiken:

zu kategorische Formulierung ohne Grundlage
Widerspruch zwischen Absätzen
fehlender Hinweis/Caveat
unklare Gültigkeitsgrenzen

Ohne Kontroll-Durchlauf geht dieser Entwurf direkt an den Nutzer.

Die gefährlichsten Fehler sind oft nicht grob, sondern "fast unsichtbar" in normal wirkendem Text.

Folgen:

Vertrauen in die Antwort sinkt
falsche Sicherheit entsteht
Risiko für Fehlentscheidungen steigt

Genau das ist das Problem: selbst ein guter Entwurf kann ohne Prüfung mit kritischen Ungenauigkeiten nach außen gehen.

Lösung

Reflection ergänzt eine Reflection-Policy vor der finalen Auslieferung.

Analogie: wie ein Schneider vor der Ausgabe eines Anzugs. Er prüft zuerst den Sitz und macht dann eine präzise Anpassung. Das verbessert das Ergebnis, macht den Prozess aber nicht zu endlosen Anproben.

Kernprinzip: Eine kurze Qualitätsprüfung und eine Korrektur, ohne endloses "noch besser machen".

Der Agent darf Änderungen vorschlagen, aber die Policy definiert:

ob eine Revision nötig ist
was genau geändert werden darf
wann Stop/Eskalation gilt

Gesteuerter Ablauf:

Entwurf: erste Version erzeugen
Review: eine strukturierte Prüfung ausführen
Entscheidung: ok/revidieren/eskalieren
Revision: eine patch-only-Änderung nach fix_plan
Finalisieren: finales Ergebnis ohne neuen Loop zurückgeben

Das bringt:

Entfernung offensichtlicher Risiken vor dem Senden
spürbare Qualitätssteigerung mit kleinem Overhead
Revisionskontrolle innerhalb von fix_plan
Schutz vor endlosem Self-Edit

Funktioniert gut, wenn:

no_new_facts erzwungen wird
Änderungen nur als patch-only erlaubt sind
High-Risk-Fälle eskaliert statt endlos umgeschrieben werden

Das Modell "will" oft immer weiter editieren, aber genau die reflection-policy beendet den Prozess in vorhersagbaren Grenzen.

Wie Es Funktioniert

Diagram

Zentrale Regel: Reflection muss begrenzt sein.

Das heißt:

maximal 1 Review-Pass
maximal 1 Revisions-Pass
keine neuen Fakten hinzufügen
Revision muss patch-only sein und nur innerhalb von fix_plan
bei High-Risk-Problemen eskalieren

Voller Ablauf: Draft → Review → Revise → Finalize

Entwurf
Der Agent erstellt die erste Antwort aus verfügbarem Kontext.

Review
Ein separater Prompt prüft den Entwurf über einfache Punkte: Klarheit, Logik, Widerspruchsfreiheit und zu starke Behauptungen.

Revision
Wenn Probleme gefunden werden, macht der Agent genau eine Revision anhand eines strukturierten fix_plan.

Finalisierung
Das System gibt das Ergebnis zurück oder stoppt, wenn das Risiko zu hoch ist.

Im Code Sieht Das So Aus

PYTHON

draft = writer.generate(goal, context)

review = reflector.review_once(
    draft=draft,
    rubric=[
        "no_new_facts",
        "preserve_uncertainty",
        "consistency_check",
    ],
)

if review.high_risk:
    return escalate_to_human(review.reason)

if review.ok:
    return draft

revised = writer.revise_once(
    draft=draft,
    fix_plan=review.fix_plan,
    rules=["no_new_facts", "keep_scope"],
)

# optional: prüfen, dass Revision innerhalb von `fix_plan` blieb
approved = supervisor.review_output_patch(
    original=draft,
    revised=revised,
    allowed_changes=review.fix_plan,
)

return approved

Reflection sollte nicht "bis perfekt" laufen. Ein Review-Pass, eine Überarbeitung via revise, und eine Prüfung, dass die Revision innerhalb von fix_plan blieb.

So Sieht Es Zur Laufzeit Aus

TEXT

Goal: eine präzise Antwort mit korrekter SLA-Formulierung vorbereiten

Draft:
"SLA für alle Kunden beträgt 99.99%."

Review:
- Problem: zu kategorische Aussage
- Problem: Tarifstufe fehlt
- Fix: Bedingung und Quelle ergänzen

Revised:
"SLA hängt von der Tarifstufe ab. Für Enterprise beträgt sie 99.99% gemäß Support-Policy."

Vollständiges Reflection-Agent-Beispiel

PYPython

TSTypeScript · bald

Wann Es Passt - Und Wann Nicht

Passt

	Situation	Warum Reflection Passt
✅	Antwort geht nach außen und braucht Zusatzprüfung	Reflection fängt offensichtliche Probleme vor dem Senden an Nutzer ab.
✅	Qualitätsgewinn ohne großen Latenz-Impact nötig	Ein begrenzter Pass bringt oft spürbare Qualitätsverbesserung.
✅	Klare Qualitätsrubrik und Stop-Rules vorhanden	Formalisierte Kriterien machen Self-Review stabil und vorhersehbar.
✅	Zuverlässigere finale Antwort ohne Rewrite-Loop	Reflection ergänzt einen Kontrollschritt ohne endlose Überarbeitungen.

Passt Nicht

	Situation	Warum Reflection Nicht Passt
❌	Kritisch niedrige Latenz	Schon ein zusätzlicher Pass kann die Antwort zu spät machen.
❌	Keine klare Qualitätsrubrik	Ohne Kriterien wird Reflection chaotisch und verbessert nicht stabil.
❌	Externe Faktvalidierung via Tools oder Menschen nötig	Reflection ersetzt kein Fact-Checking mit externen Quellen oder manueller Prüfung.

Denn Reflection fügt einen weiteren Generierungs-Pass hinzu und erhöht Zeit und Kosten der Antwort.

Unterschied Zu Self-Critique

	Reflection	Self-Critique
Ziel	Offensichtliche Probleme vor dem Senden finden	Antwort nach strengen Regeln prüfen und bei Bedarf umschreiben
Tiefe	Schneller Qualitätscheck: klar, logisch, ohne offensichtliche Fehler	Meist strengere Kritik und Revision
Ergebnistyp	ok/Probleme/Fix-Plan	detaillierte Risiken + Pflichtänderungen + diff-Orientierung
Risiko	Kann ohne Limits zum zweiten Loop werden	Übermäßiges Umschreiben und höhere Kosten

Reflection ist ein schneller begrenzter Kontrolllauf. Self-Critique ist ein tieferer Durchlauf mit Umschreiben.

Wann Reflection Unter Anderen Patterns Nutzen

Nutze Reflection, wenn eine Antwort vor dem Senden schnell geprüft werden muss: klar, logisch und ohne offensichtliche Fehler.

Kurzer Test:

wenn du "kurz prüfen und vor dem Final korrigieren" musst -> Reflection
wenn du "tief per Checkliste kritisieren und umschreiben" musst -> Self-Critique Agent

Vergleich mit anderen Patterns und Beispiele

Schneller Spickzettel:

Wenn die Aufgabe so aussieht...	Nutze
Kurze Prüfung vor finaler Antwort nötig	Reflection Agent
Tiefe Kritik nach Kriterien und Umschreiben der Antwort nötig	Self-Critique Agent
Prozess nach timeout, exception oder Tool-Ausfall wiederherstellen	Fallback-Recovery Agent
Strenge Policy-Checks vor riskanter Aktion nötig	Guarded-Policy Agent

Beispiele:

Reflection: "Vor finaler Antwort kurz Logik, Vollständigkeit und offensichtliche Fehler prüfen".

Self-Critique: "Antwort per Checkliste bewerten (Genauigkeit, Vollständigkeit, Risiken), dann umschreiben".

Fallback-Recovery: "Wenn API nicht antwortet, retry -> fallback-Quelle -> Eskalation".

Guarded-Policy: "Vor externer Datenweitergabe policy prüfen: ob das erlaubt ist".

Unsicher, ob ein einzelner Reflection-Schritt vor der Antwort ausreicht? Agent gestalten →

Wie Mit Anderen Patterns Kombinieren

Reflection + RAG: Reflection prüft, dass Schlussfolgerungen wirklich zu den gefundenen Quellen passen.
Reflection + Supervisor: High-Risk-Schlussfolgerungen werden nicht automatisch gefixt, sondern zur menschlichen Freigabe gesendet.
Reflection + ReAct: nach einer Reihe von ReAct-Schritten macht der Agent einen finalen Check vor der Antwort.

Kurz

Kurzfazit

Reflection Agent:

Führt eine Kontroll-Selbstprüfung aus
Überarbeitet die Antwort einmal
Fügt keine neuen Fakten hinzu
Reduziert Risiko offensichtlicher Produktionsfehler

Vorteile Und Nachteile

Vorteile

prüft Antwort vor dem Senden

korrigiert offensichtliche Fehler

verbessert Klarheit und Struktur

hilft, gewünschtes Format einzuhalten

Nachteile

fügt einen zusätzlichen Schritt und Latenz hinzu

verbraucht mehr Tokens

kann ohne Grenzen die Antwort unnötig verkomplizieren

FAQ

Q: Kann Reflection Fact-Checking und Tests ersetzen?
A: Nein. Das ist eine zusätzliche Qualitätsstufe. Fact-Checking, Validierung und Policy-Kontrollen bleiben separat nötig.

Q: Warum ist ein Pass-Limit wichtig?
A: Sonst wird Reflection zum zweiten Loop: Latenz, Kosten und Risiko neuer Fehler steigen.

Q: Was tun, wenn Reflection ein High-Risk-Problem findet?
A: Nicht automatisch weitermachen. Prozess stoppen oder zu menschlicher Prüfung / Supervisor-Policy eskalieren.