Agent versioning pour les agents IA : comment déployer prompt, tools et policy en sécurité

Agent versioning pratique en production : version manifest, contract checks, canary rollout, rollback et reproductibilité des runs.

Sur cette page

L’idée en 30 secondes
Le problème
La solution
Agent versioning ≠ rollback
Composants du contrôle de versioning
À quoi ça ressemble dans l’architecture
Exemple
En code, ça ressemble à ça
À quoi ça ressemble pendant l’exécution
Scénario 1 : blocage à cause d’un contract mismatch
Scénario 2 : canary rollout
Scénario 3 : rollback required
Erreurs typiques
Auto-vérification
FAQ
Où Agent Versioning se place dans le système
Pages liées

L’idée en 30 secondes

Agent versioning est un contrôle runtime qui fixe exactement quelle version d’agent chaque run utilise : prompt, tools, policy et modèle.

Quand c’est nécessaire : quand un agent est mis à jour régulièrement et que la production exige des déploiements sûrs sans perdre la reproductibilité.

Le problème

Sans versioning, les changements de prompt, tools et policy se mélangent dans un seul "état courant". En démo, cela se voit peu. En production, on ne comprend plus pourquoi un run a réussi et un autre non.

Conséquences typiques :

impossible de reproduire précisément un incident
difficile d’identifier le changement qui a cassé le comportement
rollback devient une opération manuelle et risquée

Et chaque minute sans version claire augmente le temps d’investigation d’incident.

Analogie : c’est comme un déploiement sans numéro de version. Tant que tout marche, le problème est invisible. Quand ça casse, on ne sait pas vers quoi revenir.

La solution

La solution est de stocker l’agent comme package versionné (version manifest) et de démarrer les runs uniquement avec un version_id pin. Chaque release passe des vérifications de compatibilité des contrats et un rollout gate avant de recevoir du trafic.

Version policy layer renvoie une décision technique : allow ou stop avec raison explicite :

contract_mismatch
gate_failed
rollback_required

C’est une couche système séparée, pas une partie du prompt ni de la logique du modèle.

Agent versioning ≠ rollback

Ce sont des rôles différents dans le système :

Versioning contrôle les changements avant et pendant le rollout.
Rollback ramène une version stable quand la nouvelle a déjà introduit une régression.

L’un sans l’autre ne suffit pas :

sans versioning, rollback ciblé est difficile
sans rollback, même un bon versioning ne protège pas d’un incident production

Exemple :

versioning : support-agent@2.4.0 va en canary 5%
rollback : retour à support-agent@2.3.3 si le taux d’erreur augmente

Composants du contrôle de versioning

Ces composants travaillent ensemble à chaque démarrage de run.

Composant	Ce qu’il contrôle	Mécaniques clés	Pourquoi
Version manifest	Composition d’une version d’agent	`version_id` prompt/tools/policy hashes	Donne exactement ce qui a été exécuté dans le run
Contract checks	Compatibilité des tools et de la policy	schema validation tool contract check	Bloque les déploiements avec changements incompatibles
Rollout gating	Phases du release	canary stage traffic percentage	Réduit le blast radius d’une nouvelle version
Runtime pinning	Quelle version exécute le run	pinned `version_id` immutable run metadata	Permet la reproduction des runs et l’analyse d’incident
Version observability	Visibilité des décisions de rollout	audit logs alerts sur gate failures	Ne pilote pas directement le déploiement, mais montre vite pourquoi une version est bloquée

Exemple d’alerte :

Slack: 🛑 Agent support@2.4.0 blocked: gate_failed on canary stage (error_rate > threshold).

À quoi ça ressemble dans l’architecture

Version policy layer se place entre runtime et le démarrage d’une nouvelle version d’agent, et bloque le démarrage avant le début du run. Chaque décision (allow ou stop) est écrite dans l’audit log.

Chaque démarrage de run passe par ce flow avant exécution : runtime ne démarre pas une nouvelle version directement, il demande d’abord une décision à la policy layer.

Résumé du flow :

Runtime prépare le démarrage du run
Policy vérifie version_manifest, tool_contracts, rollout_stage, policy_version
allow -> la agent_version pin démarre
stop -> release bloqué, la version stable active reste en place
les deux décisions sont écrites dans l’audit log

Exemple

L’équipe release support-agent@2.4.0 avec un nouvel adaptateur tool refund.create. Le contract check détecte une incompatibilité de schéma.

Résultat :

policy renvoie stop (reason=contract_mismatch)
canary ne démarre pas
support-agent@2.3.3 continue de tourner

Versioning arrête le release risqué avant l’incident, pas après.

En code, ça ressemble à ça

Le schéma simplifié ci-dessus montre le flow principal. Point critique : runtime doit démarrer les runs uniquement avec un version_id pin, pas récupérer "latest" pendant l’exécution.

Exemple de config versioning :

YAML

agent_release:
  stable_version: support-agent@2.3.3
  candidate_version: support-agent@2.4.0
  canary_percent: 5
  rollback_on:
    error_rate_p95: 0.05
    tool_failure_p95: 0.03

PYTHON

release_cfg = load_release_config("support-agent")
candidate = registry.get(release_cfg.candidate_version)
decision = versioning.check(candidate, runtime_context)

if decision.outcome == "stop":
    audit.log(
        run_id,
        decision=decision.outcome,
        reason=decision.reason,
        version_id=candidate.version_id,
        rollout_stage=decision.rollout_stage,
    )
    alerts.notify_if_needed(candidate.version_id, decision.reason)
    return stop(decision.reason)

selected = versioning.select(candidate, stable=release_cfg.stable_version)
run = runtime.start(
    version_id=selected.version_id,
    prompt_hash=selected.prompt_hash,
    policy_version=selected.policy_version,
)
# Decision.allow — helper conditionnel pour garder un modèle unique outcome/reason.
allow_decision = Decision.allow(reason=None)

audit.log(
    run.id,
    decision=allow_decision.outcome,
    reason=allow_decision.reason,
    version_id=selected.version_id,
    rollout_stage=selected.rollout_stage,
)

return run

À quoi ça ressemble pendant l’exécution

Scénario 1 : blocage à cause d’un contract mismatch

Runtime prépare le démarrage de support-agent@2.4.0.
Policy vérifie les tool contracts.
Décision : stop (reason=contract_mismatch).
La nouvelle version ne démarre pas.
L’événement est écrit dans l’audit log.

Scénario 2 : canary rollout

Policy autorise le candidate avec canary_percent=5.
Une partie des runs passe sur 2.4.0, le reste reste sur stable.
Les métriques sont suivies par version_id.
Si les seuils ne sont pas dépassés, la stage augmente.
La version passe en rollout plus large.

Scénario 3 : rollback required

Après le rollout, tool_failure_rate augmente.
Policy renvoie stop (reason=rollback_required).
Le trafic revient à la version stable.
Les runs avec la nouvelle version ne démarrent plus.
L’équipe analyse l’incident via version_id et audit trail.

Erreurs typiques

démarrer les runs depuis "latest" au lieu d’un version_id pin
versionner seulement le prompt et ignorer les contracts tools/policy
faire un full rollout sans canary gate
ne pas logger version_id et rollout_stage dans l’audit
mélanger rollback et nouveau release dans une seule étape sans stable fallback
ne pas définir de seuils explicites qui déclenchent rollback

Résultat : les déploiements semblent maîtrisés, mais sous charge deviennent imprévisibles.

Auto-vérification

Vérification rapide d’agent versioning avant lancement en production :

Chaque run démarre avec version_id pin, pas latest
Version manifest inclut prompt/tools/policy et leurs hash
Il y a des contract checks avant rollout
Les nouvelles versions passent une canary stage avant full rollout
Il y a des stop reasons explicites : contract_mismatch, gate_failed, rollback_required
Toutes les décisions de rollout sont écrites dans l’audit log
Il y a un stable fallback clair pour rollback rapide
Les métriques et alertes sont segmentées par version_id

Progression: 0/8

⚠ Les contrôles de governance de base manquent

Avant la production, il faut au minimum le contrôle d'accès, des limites, des audit logs et un arrêt d'urgence.

FAQ

Q : Pourquoi ne pas simplement mettre à jour la version "courante" de l’agent ?
A : Parce que sans version_id pin, tu perds la reproductibilité des runs et tu ne peux pas localiser précisément les régressions.

Q : Qu’est-ce qu’il faut versionner exactement : seulement le prompt ?
A : Non. Minimum : prompt, tool contracts, policy/config et compatibilité runtime. Sinon la version est incomplète.

Q : Canary est-il obligatoire pour chaque changement ?
A : Pour les changements high-risk, oui. Pour low-risk, on peut raccourcir les étapes, mais avec métriques explicites et seuils de stop.

Q : Quand lancer rollback ?
A : Quand les seuils convenus sont dépassés (error/tool failure/latency/cost). Cela doit être une décision policy, pas une improvisation manuelle.

Q : Versioning remplace rollback ?
A : Non. Versioning évite le chaos des déploiements, rollback reste le mécanisme d’urgence de retour au stable.

Où Agent Versioning se place dans le système

Agent versioning est une des couches d’Agent Governance. Avec RBAC, limites, budgets, approval et audit, il forme un système unifié de changements contrôlés en production.

Pages liées

Suite du sujet :

Vue d’ensemble Agent Governance — modèle global de contrôle des agents en production.
Stratégies de rollback — comment revenir en sécurité vers une version stable.
Access Control (RBAC) — comment limiter qui peut exécuter quoi.
Budget Controls — comment garder la dépense sous contrôle pendant rollout.
Audit logs pour agents — comment reconstruire la chaîne de décisions par version_id.

Stratégies de rollback pour les agents IA : comment rollback un release en sécurité

Retour

Rate limiting pour les agents IA : comment contenir les pics de requêtes et les tempêtes de retries

Stratégies de rollback pour les agents IA : comment rollback un release en sécurité

⏱️ 7 min de lecture • Mis à jour 27 mars 2026Difficulté: ★★★

Utilisé par les patterns

Pannes associées

Gouvernance requise

Implémenter dans OnceOnly

Budgets + permissions you can enforce at the boundary.

Utiliser dans OnceOnly

# onceonly guardrails (concept)
version: 1
budgets:
  max_steps: 25
  max_tool_calls: 12
  max_seconds: 60
  max_usd: 1.00
policy:
  tool_allowlist:
    - search.read
    - http.get
writes:
  require_approval: true
  idempotency: true
controls:
  kill_switch: { enabled: true }

Intégré : contrôle en productionOnceOnly

Ajoutez des garde-fous aux agents tool-calling

Livrez ce pattern avec de la gouvernance :

Budgets (steps / plafonds de coût)
Permissions outils (allowlist / blocklist)
Kill switch & arrêt incident
Idempotence & déduplication
Audit logs & traçabilité

Essayer OnceOnly Docs & exemples

Mention intégrée : OnceOnly est une couche de contrôle pour des systèmes d’agents en prod.

Auteur

Nick — ingénieur qui construit une infrastructure pour des agents IA en production.

Focus : patterns d’agents, modes de défaillance, contrôle du runtime et fiabilité des systèmes.

🔗 GitHub: https://github.com/mykolademyanov

Note éditoriale

Cette documentation est assistée par l’IA, avec une responsabilité éditoriale humaine pour l’exactitude, la clarté et la pertinence en production.

Le contenu s’appuie sur des défaillances réelles, des post-mortems et des incidents opérationnels dans des systèmes d’agents IA déployés.