架构全景
一、部署拓扑
Scene Think ReAct Agent

二、单个 Agent 内部结构

三、决策三层模型
决策层次
层级 | 时间 | 范围 | 引擎 | 示例 |
|---|---|---|---|---|
策略层 | 分钟级 | 整船/全场 | TOS + 优化算法 | 整船卸箱顺序、泊位分配 |
战术层 | 秒级 | 单箱/Bay | 规则引擎 + LLM | 加急箱插队判断、翻箱选位 |
执行层 | 毫秒级 | 原子动作 | 纯规则/硬编码 | 吊具锁孔、小车移动、道闸抬杆 |
四、三大 Agent 差异对照
Agent 差异化设计
维度 | 桥吊 | 堆场 | 道口 |
|---|---|---|---|
感知 | 连续高频(激光雷达、编码器) | 事件驱动(箱位移入/移出) | 确定性(OCR、RFID、地磅) |
决策复杂度 | 中——位置约束强、序列优化 | 高——翻箱预测、空间最大化 | 低——匹配校验、通行判定 |
LLM 依赖 | 可选(序列优化时) | 有价值(翻箱策略、空间推理) | 几乎不需要(规则够用) |
行动空间 | 吊具六自由度 + 锁孔 + 防撞 | 堆高机/龙门吊定位 + 翻箱 | 道闸、LED、语音对讲 |
安全关键度 | 极高——悬吊 30 吨 | 高——堆垛倒塌风险 | 中——集卡碰撞风险 |
记忆需求 | 工作记忆为主(当前作业序列) | 短时+长期(箱位历史、翻箱规律) | 最小(当前通行记录) |
五、通信架构
Pub/Sub 主题设计
Topic | 发布方 | 订阅方 | QoS |
|---|---|---|---|
qc/status/bay-progress | 桥吊 | 堆场、TOS、对账 | 至少一次 + 幂等 |
yard/event/position-freed | 堆场 | 调度、TOS、对账 | 至少一次 + 幂等 |
gate/event/truck-in | 道口 | 调度、堆场 | 至少一次 + 幂等 |
tos/cmd/priority | TOS | 桥吊 | 精确一次 |
equipment/alarm | 各 Agent | 维修调度、TOS | 至少一次 |
heartbeat/* | 各 Agent | 对账服务 | 尽力而为 |
六、异常与容错五原则
分级处理
执行层异常(锁孔偏差)毫秒级重试;战术层异常(箱号冲突)秒级冻结+校验;策略层异常(设备停机)分钟级全局重规划。
物理/信息异常分离
传感器断连(物理)→ 安全停机,不猜;箱号不匹配(信息)→ 冻结+人工/规则仲裁,不能当物理故障处理。
安全动作零延迟
防撞、急停、超限——PLC 硬线逻辑,不经过 Agent 软件栈,不经过 LLM,微秒级切断。
超时兜底
LLM 超时 → 冻结局部 → 规则引擎降级(Earliest Accessible First)→ 事后对账。不盲动。
最终一致性对账
心跳超时 + 回执超时两级兜底;定时比对 Agent 世界模型 vs TOS 状态,偏差告警不自动回滚。
七、技术选型六条原则
库优于框架——你的代码调用 LiteLLM/OpenAI SDK,不用 Agent 框架控制你的循环
Agent 循环自研——感知→思考→行动→记忆主循环自己写,三个 Agent 架构同构、策略异构
通信走消息队列——Kafka/MQTT 按业务 Topic 路由,不用框架内置的 GroupChat 或内存通信
记忆分级存储——Redis(工作记忆,秒级TTL)+ PostgreSQL(短时,分钟/小时TTL)+ pgvector(长期,天级语义检索)
安全逻辑本地闭环——PLC→边缘→云端三层物理分离,LLM 只参与战术推理,从不发控制信号
独立部署——三个 Agent 各自独立服务/进程,故障隔离,按物理位置部署到工控机/边缘服务器
八、指令执行完整链路
消息总线接收
Kafka Topic 送达,带幂等 ID 防重投
感知部件写入世界模型
事件入库:PRIORITY_UNLOAD / containerId / bay / timestamp
战术层计划展开
读世界模型 → 当前序列 vs 加急箱位置 → 判断插队安全性 → 输出新抓取序列(规则+可选LLM)
执行层原子化
序列拆为 MOVE_TO → LOWER_SPREADER → LOCK_TWISTLOCKS → HOIST
行动部件逐条下发
每步等 PLC ACK + 传感器回执,异常立即中断
PLC 执行 + 安全硬限位
电机动作,防撞硬线逻辑微秒级独立于 Agent
感知部件回写结果
动作完成事件 → 更新世界模型 → 广播状态事件到消息总线
一句话总结
三个独立 Agent 通过消息总线松耦合通信,每个 Agent 内部分感知→思考→行动→记忆四部件闭环。决策分层(策略/战术/执行),LLM 只在战术层做推理不碰控制,安全逻辑硬线微秒级。异常分级处理、超时冻结降级、最终一致性兜底。
总结
节点 | 核心 |
|---|---|
智能体的解剖结构 | 掌握了感知→思考→行动→记忆四部件模型,能区分物理层动作与信息层动作,理解了三种记忆生命周期 |
单智能体的决策模型 | 掌握了策略/战术/执行三层决策架构,能准确判断规则 vs LLM 的适用边界,理解了执行层为什么只用规则 |
状态管理与世界模型 | 掌握了自我vs外部、实时vs语义、自治边界三条核心原则,能追踪完整的事件→感知→思考→行动→记忆链路 |
多智能体通信模式 | 理解了三种通信模式的演进逻辑和适用场景,能按业务职责设计 Topic 路由,掌握了可靠投递的必要性 |
任务分解与分配 | 掌握了按信息拥有权决定拆细/委托分界的原则,能区分细拆指令、高维目标、带约束委托三种粒度 |
异常与容错设计 | 掌握了五大设计原则:分级处理、物理/信息分离、安全动作零延迟、超时兜底、最终一致性对账 |
框架与技术选型 | 掌握了六条选型原则:库优于框架、循环自研、消息队列通信、记忆分级、安全闭环、独立部署 |
整体架构与集成方案 | 完整掌握了从部署拓扑到指令执行全链路,能将前七个节点的所有设计决策串联成统一架构方案 |
这套架构可以直接作为方案基础的五个理由
①每个设计决策都有明确的原则做支撑,不是拍脑袋。
②三个 Agent 的差异化设计表可以直接用作需求文档的骨架。
③通信 Topic 设计覆盖了正常作业、异常告警、心跳对账三条线。
④异常处理五原则覆盖了从毫秒到分钟、从物理到信息的全频谱。
⑤技术选型给出了明确的组件替代关系——Kafka、Redis、PostgreSQL、pgvector、LiteLLM 都是可替换的成熟方案。
