feat: integrate DevQALoop into TeamOrchestrator and add integration test checklist

- Add Review tab to TeamOrchestrator with DevQALoopPanel integration
- Create comprehensive integration test checklist (22 test cases)
- Document component integration status analysis
- Update progress documentation

Key findings:
- Most "low integration" components were actually integrated via indirect paths
- DevQALoop was the only truly unintegrated component, now fixed

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
This commit is contained in:
iven
2026-03-20 23:27:16 +08:00
parent 1cf3f585d3
commit ce522de7e9
6 changed files with 1151 additions and 5 deletions

View File

@@ -0,0 +1,336 @@
# ZCLAW 真实集成测试清单
> 版本1.0
> 更新日期2026-03-20
> 状态:待验证
---
## 测试环境准备
### 前置条件
- [ ] OpenFang Kernel 已安装并配置
- [ ] 至少一个中文模型 API Key 已配置GLM/Qwen/Kimi/MiniMax
- [ ] Tauri 桌面应用已构建
- [ ] 测试账号已准备
### 环境变量检查
```bash
# 检查 OpenFang 配置
cat config/config.toml
# 检查中文模型配置
cat config/chinese-providers.toml
```
---
## 一、Gateway 连接测试
### TEST-GW-01: OpenFang Kernel 启动
| 项目 | 内容 |
|------|------|
| **前置条件** | OpenFang 已安装 |
| **测试步骤** | 1. 启动 Tauri 应用<br>2. 检查连接状态指示器<br>3. 确认显示"已连接" |
| **预期结果** | 连接状态为 `connected`,无错误提示 |
| **验证方法** | 检查 ConnectionStatus 组件状态 |
| **当前状态** | ⏳ 待验证 |
### TEST-GW-02: WebSocket 握手
| 项目 | 内容 |
|------|------|
| **前置条件** | TEST-GW-01 通过 |
| **测试步骤** | 1. 打开浏览器开发者工具<br>2. 检查 Network 标签<br>3. 确认 WebSocket 连接建立 |
| **预期结果** | WebSocket 状态为 101 Switching Protocols |
| **验证方法** | DevTools Network 面板 |
| **当前状态** | ⏳ 待验证 |
### TEST-GW-03: 心跳保活
| 项目 | 内容 |
|------|------|
| **前置条件** | TEST-GW-02 通过 |
| **测试步骤** | 1. 保持应用空闲 5 分钟<br>2. 检查连接状态<br>3. 发送一条测试消息 |
| **预期结果** | 连接保持活跃,消息正常发送 |
| **验证方法** | 检查 ping/pong 日志 |
| **当前状态** | ⏳ 待验证 |
### TEST-GW-04: 断线重连
| 项目 | 内容 |
|------|------|
| **前置条件** | TEST-GW-02 通过 |
| **测试步骤** | 1. 手动停止 OpenFang 进程<br>2. 等待 10 秒<br>3. 重启 OpenFang<br>4. 观察应用行为 |
| **预期结果** | 应用自动重连,状态正确更新 |
| **验证方法** | 检查重连日志和 UI 状态变化 |
| **当前状态** | ⏳ 待验证 |
---
## 二、真实模型对话测试
### TEST-MODEL-01: 流式响应
| 项目 | 内容 |
|------|------|
| **前置条件** | API Key 已配置,连接正常 |
| **测试步骤** | 1. 选择一个模型<br>2. 发送"请写一首关于春天的短诗"<br>3. 观察响应过程 |
| **预期结果** | 文字逐字/逐句显示,有流式效果 |
| **验证方法** | 观察 ChatArea 组件的渲染 |
| **当前状态** | ⏳ 待验证 |
### TEST-MODEL-02: 模型切换
| 项目 | 内容 |
|------|------|
| **前置条件** | 配置了多个模型 |
| **测试步骤** | 1. 用模型 A 发送消息<br>2. 切换到模型 B<br>3. 再次发送消息 |
| **预期结果** | 两次响应来自不同模型 |
| **验证方法** | 检查消息元数据中的 model 字段 |
| **当前状态** | ⏳ 待验证 |
### TEST-MODEL-03: 上下文管理
| 项目 | 内容 |
|------|------|
| **前置条件** | TEST-MODEL-01 通过 |
| **测试步骤** | 1. 发送"我叫张三"<br>2. 等待响应<br>3. 发送"我叫什么名字?" |
| **预期结果** | 模型正确回答"张三" |
| **验证方法** | 检查对话历史和响应内容 |
| **当前状态** | ⏳ 待验证 |
### TEST-MODEL-04: 长对话处理
| 项目 | 内容 |
|------|------|
| **前置条件** | TEST-MODEL-03 通过 |
| **测试步骤** | 1. 连续发送 20+ 条消息<br>2. 观察响应时间<br>3. 检查最早消息是否被正确压缩 |
| **预期结果** | 对话流畅,无内存溢出 |
| **验证方法** | 检查 context-compactor 日志 |
| **当前状态** | ⏳ 待验证 |
### TEST-MODEL-05: 错误处理
| 项目 | 内容 |
|------|------|
| **前置条件** | API Key 配置正确 |
| **测试步骤** | 1. 临时使用无效 API Key<br>2. 发送消息<br>3. 观察错误处理 |
| **预期结果** | 显示友好错误提示,不崩溃 |
| **验证方法** | 检查错误 toast 和日志 |
| **当前状态** | ⏳ 待验证 |
---
## 三、飞书 Channel 测试
### TEST-FEISHU-01: OAuth 授权
| 项目 | 内容 |
|------|------|
| **前置条件** | 飞书应用已创建 |
| **测试步骤** | 1. 进入设置 → IM Channels<br>2. 点击"连接飞书"<br>3. 完成授权流程 |
| **预期结果** | 授权成功,显示已连接状态 |
| **验证方法** | 检查 configStore 中的 token |
| **当前状态** | ⏳ 待验证 |
### TEST-FEISHU-02: 消息接收
| 项目 | 内容 |
|------|------|
| **前置条件** | TEST-FEISHU-01 通过 |
| **测试步骤** | 1. 在飞书中 @机器人<br>2. 发送测试消息<br>3. 观察 ZCLAW 应用 |
| **预期结果** | 消息出现在对应 Channel |
| **验证方法** | 检查 ChannelList 和消息列表 |
| **当前状态** | ⏳ 待验证 |
### TEST-FEISHU-03: Agent 处理与回复
| 项目 | 内容 |
|------|------|
| **前置条件** | TEST-FEISHU-02 通过 |
| **测试步骤** | 1. 在飞书发送问题<br>2. 等待 Agent 响应<br>3. 检查飞书收到的回复 |
| **预期结果** | 飞书收到 Agent 的回复 |
| **验证方法** | 飞书客户端验证 |
| **当前状态** | ⏳ 待验证 |
---
## 四、Hands 触发测试
### TEST-HAND-01: 意图识别
| 项目 | 内容 |
|------|------|
| **前置条件** | Hands 已启用 |
| **测试步骤** | 1. 发送"帮我打开百度搜索一下天气"<br>2. 观察是否触发 Browser Hand |
| **预期结果** | 系统识别意图并建议触发 Browser Hand |
| **验证方法** | 检查 HandApprovalModal 是否弹出 |
| **当前状态** | ⏳ 待验证 |
### TEST-HAND-02: 参数收集
| 项目 | 内容 |
|------|------|
| **前置条件** | TEST-HAND-01 通过 |
| **测试步骤** | 1. 触发一个需要参数的 Hand<br>2. 检查参数收集界面 |
| **预期结果** | 显示参数表单,可编辑参数 |
| **验证方法** | 检查参数输入 UI |
| **当前状态** | ⏳ 待验证 |
### TEST-HAND-03: 审批流程
| 项目 | 内容 |
|------|------|
| **前置条件** | TEST-HAND-02 通过 |
| **测试步骤** | 1. 点击"批准"<br>2. 观察执行状态 |
| **预期结果** | 状态变为"执行中",然后"完成" |
| **验证方法** | 检查 handStore 中的 run 状态 |
| **当前状态** | ⏳ 待验证 |
### TEST-HAND-04: 执行结果
| 项目 | 内容 |
|------|------|
| **前置条件** | TEST-HAND-03 通过 |
| **测试步骤** | 1. 等待执行完成<br>2. 检查执行日志<br>3. 查看结果输出 |
| **预期结果** | 显示完整的执行日志和结果 |
| **验证方法** | 检查 AutomationPanel 日志 |
| **当前状态** | ⏳ 待验证 |
### TEST-HAND-05: 取消执行
| 项目 | 内容 |
|------|------|
| **前置条件** | 有正在执行的 Hand |
| **测试步骤** | 1. 触发一个长时间运行的 Hand<br>2. 点击"取消" |
| **预期结果** | 执行被中止,状态变为"已取消" |
| **验证方法** | 检查状态变化 |
| **当前状态** | ⏳ 待验证 |
---
## 五、记忆持久化测试
### TEST-MEM-01: 重启后记忆保留
| 项目 | 内容 |
|------|------|
| **前置条件** | 有对话历史 |
| **测试步骤** | 1. 进行一些对话<br>2. 关闭应用<br>3. 重新启动<br>4. 检查对话历史 |
| **预期结果** | 对话历史完整保留 |
| **验证方法** | 检查 chatStore 中的 messages |
| **当前状态** | ⏳ 待验证 |
### TEST-MEM-02: 跨会话记忆命中
| 项目 | 内容 |
|------|------|
| **前置条件** | TEST-MEM-01 通过 |
| **测试步骤** | 1. 在之前的对话中提及"我喜欢蓝色"<br>2. 重启应用<br>3. 问"我喜欢什么颜色?" |
| **预期结果** | Agent 引用之前的记忆回答 |
| **验证方法** | 检查响应内容和记忆检索日志 |
| **当前状态** | ⏳ 待验证 |
### TEST-MEM-03: 向量记忆搜索OpenViking
| 项目 | 内容 |
|------|------|
| **前置条件** | OpenViking 已配置 |
| **测试步骤** | 1. 添加一些文档到知识库<br>2. 问相关问题时 |
| **预期结果** | 系统检索到相关内容并引用 |
| **验证方法** | 检查 Viking 检索日志 |
| **当前状态** | ⏳ 待验证 |
---
## 六、端到端综合测试
### TEST-E2E-01: 完整工作流
| 项目 | 内容 |
|------|------|
| **前置条件** | 所有前置测试通过 |
| **测试步骤** | 1. 启动应用并连接<br>2. 进行多轮对话<br>3. 触发一个 Hand<br>4. 检查记忆是否保存 |
| **预期结果** | 所有功能正常协作 |
| **验证方法** | 全流程验证 |
| **当前状态** | ⏳ 待验证 |
### TEST-E2E-02: 多 Agent 协作
| 项目 | 内容 |
|------|------|
| **前置条件** | TeamOrchestrator 可用 |
| **测试步骤** | 1. 创建团队<br>2. 添加多个 Agent<br>3. 分配任务<br>4. 观察协作过程 |
| **预期结果** | Agents 协作完成任务 |
| **验证方法** | 检查 teamStore 和协作日志 |
| **当前状态** | ⏳ 待验证 |
---
## 测试结果汇总
| 类别 | 总数 | 通过 | 失败 | 待验证 |
|------|------|------|------|--------|
| Gateway 连接 | 4 | 0 | 0 | 4 |
| 模型对话 | 5 | 0 | 0 | 5 |
| 飞书 Channel | 3 | 0 | 0 | 3 |
| Hands 触发 | 5 | 0 | 0 | 5 |
| 记忆持久化 | 3 | 0 | 0 | 3 |
| 端到端 | 2 | 0 | 0 | 2 |
| **总计** | **22** | **0** | **0** | **22** |
---
## 测试脚本模板
```bash
#!/bin/bash
# integration-test.sh - ZCLAW 集成测试脚本
set -e
echo "=== ZCLAW Integration Test Suite ==="
echo "Started at: $(date)"
# 1. 检查环境
echo "[1/5] Checking environment..."
command -v openfang >/dev/null 2>&1 || { echo "ERROR: openfang not found"; exit 1; }
command -v pnpm >/dev/null 2>&1 || { echo "ERROR: pnpm not found"; exit 1; }
# 2. 检查配置
echo "[2/5] Checking configuration..."
test -f config/config.toml || { echo "ERROR: config.toml not found"; exit 1; }
test -f config/chinese-providers.toml || { echo "ERROR: chinese-providers.toml not found"; exit 1; }
# 3. 启动 OpenFang
echo "[3/5] Starting OpenFang..."
openfang start || { echo "ERROR: Failed to start OpenFang"; exit 1; }
sleep 5
# 4. 运行 E2E 测试
echo "[4/5] Running E2E tests..."
cd desktop
pnpm test:e2e || { echo "WARNING: Some E2E tests failed"; }
# 5. 清理
echo "[5/5] Cleanup..."
openfang stop
echo "=== Test completed at: $(date) ==="
```
---
## 附录:测试账号和凭证管理
**重要:** 所有测试凭证应存储在安全的位置,不要提交到代码库。
| 凭证类型 | 存储位置 | 负责人 |
|----------|----------|--------|
| 飞书 App ID/Secret | 1Password | 开发团队 |
| 模型 API Keys | config/chinese-providers.toml (加密) | 开发团队 |
| 测试账号 | 1Password | QA 团队 |