UK
Фейли та фікси
Реальні failure modes і як зупиняти їх у продакшені.
- Тихий drift агента (регресія якості) + детекція + код★★☆Агенти не ламаються одним махом. Вони дрейфують через зміни моделі/tools/prompts, доки ти не зашипиш регресію в прод. Canary, golden tasks, replay і метрики ловлять drift рано.
- Budget explosion (коли агент спалює гроші) + фікси + код★★☆Бюджети рідко падають одним багом. Вони течуть через ретраї, prompt bloat і tool spam. Як budget explosion стається в проді й як капнути spend per run.
- Cascading tool failures (як агенти підсилюють аутеджі) + код★★☆Коли tools деградують, наївні ретраї й агент-лупи підсилюють аутедж. Circuit breakers, bulkheads і safe-mode не дають агенту DDoS’ити власні залежності.
- Deadlocks у multi-agent системах (failure mode + фікси + код)★★☆Агенти, які чекають агентів — це distributed deadlock із красивішими логами. Як deadlocks стаються в проді й як leases, timeouts і orchestration не дають системі зависати.
- Галюциновані джерела в AI-агентах (failure mode + fixes + код)★★☆Агенти впевнено цитують URL, які ніколи не фетчили. Чому це стається в проді й як змусити цитати спиратись на реальну evidence.
- Нескінченний цикл AI‑агента (як виявити й зупинити, з кодом)★★☆Твій агент зациклився. О 03:00. Рахунок росте. Ось чому це стається, що ламається, і які kill‑switches реально працюють.
- Partial outage (agent failure + degrade mode + код)★★☆Частина tools лежить, частина працює. Агенти, які “дотискають”, починають thrash і палять бюджети. Як деградувати безпечно з partial results і stop reasons.
- Prompt injection атаки на агентів (failure + захисти + код)★★☆Prompt injection — це не джейлбрейк. Це не довірений текст, який приходить через tools. Як агенти ламаються в проді й як винести policy в код.
- Корупція відповіді tool (schema drift + truncation) + код★★☆Корумпований або ‘попливший’ output tool’а перетворюється на неправильні дії. Валідуй outputs, обмежуй розмір і fail-closed, щоб агент не діяв по сміттю.
- Token overuse incidents (prompt bloat) + фікси + код★★☆Prompt bloat — це інцидент у проді: росте лейтенсі, росте cost, і truncation з’їдає policy. Як token overuse стається і як бюджетувати контекст безпечно.
- Tool spam loops (failure mode + фікси + код)★★☆Коли агент викликає той самий tool знов і знов, ти за це платиш. Як tool spam з’являється в проді й як зупинити його бюджетами та дедупом.
- Чому агенти ламаються в продакшені (і як це зупинити)★★☆Більшість фейлів агентів — не містика. Це відсутні бюджети, відсутнє enforcement політик, flaky інструменти й нуль спостережуваності. Ось таксономія, якою ми користуємось у продакшені.