OpenClaw Agent 超时无响应排查实录
概述
6 个 Agent 跑了 251 条 session,cron 全线报 error。逐条排查发现根因是一个 7 字符的配置错误。
问题现象
- 6 个 Agent 的 Cron 任务全部报 error
- 看似「超时无响应」
- 共运行 251 条 session
排查过程
1. 确认 Agent 实际状态
- 检查发现 Agent 实际完成了任务
- 问题出在通知环节,不是执行环节
2. 定位通知配置
- 飞书通知的 target 缺少
user:前缀 - 导致 delivery 返回 400 错误
- 触发指数退避重试机制
3. 连锁反应
缺少 user: 前缀 → delivery 400 → 指数退避 → 重试仍 400 → 标记为 error根因
7 个字符的配置错误(缺少
user:前缀),制造了 6 个 Agent 全线「超时」的假象。
教训
- 错误信息可能具有误导性——「超时」不一定是真的超时
- 检查完整调用链,而不仅仅是最终状态
- 配置项应做 Schema 验证,避免低级错误