# ZCLAW 协作与实现规则 > 目标:把 ZCLAW 做成**真实可交付**的 OpenFang 桌面客户端,而不是"看起来能用"的演示 UI。 ## 1. 项目目标 ZCLAW 是基于 **OpenFang** (Rust Agent OS) 的 AI Agent 桌面端,核心价值不是单纯聊天,而是: - 真实连接 OpenFang Kernel - 真实驱动 Agents / Skills / Hands / Workflows - 真实读写 TOML 配置与工作区 - 真实反映运行时状态与审计日志 判断标准: > 一个页面或按钮如果**没有改变 OpenFang Runtime 的真实行为 / 真实配置 / 真实路由 / 真实工作区上下文**,那它大概率还只是演示态,不算交付完成。 --- ## 2. 项目结构 ```text ZClaw/ ├── desktop/ # Tauri 桌面应用 │ ├── src/ │ │ ├── components/ # React UI │ │ ├── store/ # Zustand stores │ │ └── lib/ # OpenFang client / helpers │ └── src-tauri/ # Tauri Rust backend ├── skills/ # SKILL.md 技能定义 ├── hands/ # HAND.toml 自主能力包 ├── config/ # OpenFang TOML 配置 ├── docs/ # 架构、排障、知识库 └── tests/ # Vitest 回归测试 ``` 核心数据流: ```text React UI → Zustand Store → OpenFangClient → OpenFang Kernel → Skills / Hands / Channels ``` **OpenFang vs OpenClaw 关键差异**: | 方面 | OpenClaw | OpenFang | |------|----------|----------| | 语言 | TypeScript/Node.js | Rust | | 端口 | 18789 | 4200 | | 配置 | YAML/JSON | TOML | | 插件 | TypeScript | SKILL.md + WASM | | 安全 | 3 层 | 16 层纵深防御 | --- ## 3. 工作风格 ### 3.1 交付导向 - 先做**最高杠杆**问题 - 优先恢复真实能力,再考虑局部美化 - 不保留"假数据看起来正常"的占位实现 ### 3.2 根因优先 - 先确认问题属于: - 协议错配 (WebSocket vs REST) - 状态管理错误 - UI 没接真实能力 - 配置解析 / 持久化错误 (TOML 格式) - 运行时 / 环境问题 - 不在根因未明时盲目堆补丁 ### 3.3 闭环工作法 每次改动尽量形成完整闭环: 1. 定位问题 2. 建立最小可信心智模型 3. 实现最小有效修复 4. 跑自动化验证 5. 记录知识沉淀 --- ## 4. 解决问题的标准流程 ### 4.1 先看真实协议和真实运行时 当桌面端与 OpenFang 行为不一致时: - 先检查当前 REST API schema / WebSocket 事件格式 - 不要只相信旧前端封装或历史调用方式 - 如果源码与实际运行行为冲突,以**当前 OpenFang Kernel**为准 尤其是以下能力必须以真实 OpenFang 为准: - `/api/chat` (聊天) - `/api/agents` (Agent 管理) - `/api/hands/*` (Hands 触发) - `/api/workflows/*` (工作流) - `/api/config` (TOML 配置) - `/api/audit/logs` (审计日志) - WebSocket 事件 (`stream`, `hand`, `workflow`) ### 4.2 先打通读,再打通写 任何配置类页面都按这个顺序推进: 1. 先确认页面能读取真实配置 2. 再确认页面能显示真实当前值 3. 最后再接保存 禁止直接做"本地 state 假切换"冒充已完成。 ### 4.3 区分"前端概念"和"运行时概念" 如果前端有自己的本地实体,例如: - agent / clone - conversation / session - temporary model selection 必须明确它是否真的对应 OpenFang 中的: - `agent_id` - `session_id` - `default_model` 不要把本地 UI 标识直接当成 OpenFang runtime 标识发送。 ### 4.4 调试优先顺序 遇到问题时,优先按这个顺序排查: 1. 是否连到了正确的 OpenFang (端口 4200) 2. 是否握手/认证成功 3. 请求方法名是否正确 (REST endpoint / WebSocket message type) 4. 请求参数是否符合当前 schema 5. 返回结构是否与前端解析一致 6. 页面是否只是改了本地 state,没有写回 runtime 7. 是否存在旧 fallback / placeholder 掩盖真实错误 --- ## 5. 实现规则 ### 5.1 Gateway 通信 IMPORTANT: 所有与 OpenFang 的通信必须通过: - `desktop/src/lib/openfang-client.ts` (OpenFang) - `desktop/src/lib/gateway-client.ts` (OpenClaw 兼容层) 禁止在组件内直接创建 WebSocket 或拼装协议帧。 ### 5.2 后端切换 通过环境变量或 localStorage 切换后端: ```typescript // 环境变量 const USE_OPENFANG = import.meta.env.VITE_USE_OPENFANG === 'true'; // localStorage const backendType = localStorage.getItem('zclaw-backend') || 'openclaw'; ``` ### 5.3 状态管理 - UI 负责展示和交互 - Store 负责状态组织、流程编排 - OpenFangClient 负责 REST / WebSocket 通信 - 配置读写和协议适配逻辑放在 `lib/` 助手层 避免把协议细节散落在多个组件里。 ### 5.4 React 组件 - 使用函数组件与 hooks - 复杂副作用收敛到 store 或 helper - 组件尽量保持"展示层"职责 - 一个组件里如果同时出现协议拼装、复杂状态机、配置改写逻辑,优先拆分 ### 5.5 TypeScript - 避免 `any` - 优先 `unknown + 类型守卫` - 外部返回结构必须做容错解析 - 不要假设 OpenFang 响应永远只有一种 shape ### 5.6 配置处理 (TOML) OpenFang 使用 **TOML** 配置格式: ```toml # ~/.openfang/config.toml [server] host = "127.0.0.1" port = 4200 [agent] default_model = "gpt-4" [[llm.providers]] name = "openai" api_key = "${OPENAI_API_KEY}" ``` 对配置的处理: - 使用 TOML 解析器,不要手动解析 - 写回时保持 TOML 格式 - 支持环境变量插值 `${VAR_NAME}` --- ## 6. UI 完成度规则 ### 6.1 允许存在的 UI - 已接真实能力的 UI - 明确标注"未实现 / 只读 / 待接入"的 UI ### 6.2 不允许存在的 UI - 看似可编辑但不会生效的设置项 - 展示假状态却不对应真实运行时的面板 - 用 mock 数据掩盖未完成能力但不做说明 ### 6.3 OpenFang 新特性 UI 以下 OpenFang 特有功能需要新增 UI: - **Hands 面板**: 触发和管理 7 个自主能力包 - **Workflow 编辑器**: 多步骤工作流编排 - **Trigger 管理器**: 事件触发器配置 - **审计日志**: Merkle 哈希链审计查看 --- ## 7. 测试与验证规则 ### 7.1 改动后必须验证 修改以下内容后,必须至少运行相关测试: - chat / stream - openfang client / gateway store - settings / config - protocol helpers 优先命令: ```bash pnpm vitest run tests/desktop/chatStore.test.ts tests/desktop/gatewayStore.test.ts tests/desktop/general-settings.test.tsx pnpm tsc --noEmit ``` 如果新增了独立 helper,应补最小回归测试。 ### 7.2 测试设计原则 - 测根因,不只测表象 - 测协议参数是否正确 (REST endpoint / WebSocket type) - 测状态是否在失败时保持一致 - 测真实边界条件: - agent_id 生命周期 - session_id 作用域 - TOML 配置语法容错 - Hand 触发与审批 ### 7.3 人工验证 自动化通过后,关键链路仍应做手工 smoke: - 能否连接 OpenFang (端口 4200) - 能否发送消息并正常流式返回 - 模型切换是否真实生效 - Hand 触发是否正常执行 - 保存配置后是否真正影响新会话/运行时 --- ## 8. 文档沉淀规则 凡是出现以下情况,应更新 `docs/openfang-knowledge-base.md` 或相关文档: - 新的协议坑 (REST/WebSocket) - 新的握手/配置/模型排障结论 - 真实 runtime 与旧实现不一致 - OpenFang 特有问题 (Hands, Workflows, 安全层) - 某个问题的最短排障路径已经明确 原则:**修完就记,避免二次踩坑。** --- ## 9. 常见高风险点 - 把前端本地 id 当作 OpenFang `agent_id` - 只改 Zustand,不改 OpenFang 配置 - 把 OpenClaw 协议字段发给 OpenFang - fallback 逻辑覆盖真实错误 - 直接手动解析 TOML,忽略格式容错 - 让 UI 显示"已完成",实际只是 placeholder - 混淆 OpenClaw 端口 (18789) 和 OpenFang 端口 (4200) --- ## 10. OpenFang 特有注意事项 ### 10.1 Hands 系统 OpenFang 提供 7 个自主能力包: | Hand | 功能 | 触发方式 | |------|------|----------| | Clip | 视频处理、竖屏生成 | 手动/自动 | | Lead | 销售线索发现 | 定时 | | Collector | 数据收集聚合 | 定时/事件 | | Predictor | 预测分析 | 手动 | | Researcher | 深度研究 | 手动 | | Twitter | Twitter 自动化 | 定时/事件 | | Browser | 浏览器自动化 | 手动/工作流 | 触发 Hand 时必须: - 检查 RBAC 权限 - 处理 `needs_approval` 状态 - 记录审计日志 ### 10.2 安全层 OpenFang 有 16 层安全防护,前端需要: - 正确处理认证失败 (Ed25519 + JWT) - 尊重 RBAC 能力门控 - 显示审计日志入口 - 处理速率限制错误 ``` --- ## 11. 常用命令 ```bash pnpm install pnpm dev pnpm tauri:dev pnpm build pnpm setup pnpm vitest run tests/desktop/chatStore.test.ts tests/desktop/gatewayStore.test.ts tests/desktop/general-settings.test.tsx pnpm tsc --noEmit ``` --- ## 12. 参考文档 - `docs/openfang-technical-reference.md` - OpenFang 技术参考 - `docs/openclaw-to-openfang-migration-brainstorm.md` - 迁移分析 - `docs/DEVELOPMENT.md` - 开发指南 - `skills/` - SKILL.md 技能示例 - `hands/` - HAND.toml 配置示例 --- ## 13. 提交信息建议 ```text (): ``` 示例: ```text feat(openfang): add OpenFangClient with WebSocket support feat(hands): add researcher hand trigger UI fix(chat): align stream events with OpenFang protocol fix(config): handle TOML format correctly perf(gateway): optimize connection pooling docs(knowledge-base): capture OpenFang RBAC permission issues ``` 推荐类型: - `feat` - `fix` - `refactor` - `test` - `docs` - `chore` - `perf` --- ## 14. 迁移检查清单 从 OpenClaw 迁移到 OpenFang 时,确保: - [ ] 端口从 18789 改为 4200 - [ ] 配置格式从 YAML/JSON 改为 TOML - [ ] WebSocket URL 添加 `/ws` 路径 - [ ] RPC 方法改为 REST API 或新 WebSocket 协议 - [ ] 插件从 TypeScript 改为 SKILL.md - [ ] 添加 Hands/Workflow 相关 UI - [ ] 处理 16 层安全防护的交互