iven/zclaw_openfang

Fork 0

Files

iven 7e56b40972

CI / Lint & TypeCheck (push) Has been cancelled

Details

CI / Unit Tests (push) Has been cancelled

Details

CI / Build Frontend (push) Has been cancelled

Details

CI / Rust Check (push) Has been cancelled

Details

CI / Security Scan (push) Has been cancelled

Details

CI / E2E Tests (push) Has been cancelled

Details

docs: add functional verification plan and report

Comprehensive 15-module verification of ZCLAW desktop app via tauri-mcp.
Found 8 issues (1 CRITICAL fixed, 3 MAJOR, 4 MINOR). Key findings:
- Skills system shows 0 loaded (should be 75)
- Automation/Skills/Workflow views have no UI navigation entry
- Rate limiting triggered by rapid page switching

2026-04-05 15:49:19 +08:00

12 KiB

Raw Blame History

ZCLAW 系统功能验证方案

验证目标: 通过模拟真实用户操作流程，对所有功能模块进行深度验证，确保功能实现与设计初衷完全一致。 验证方式: tauri-mcp + Chrome DevTools 协议，直接操控运行中的应用 验证日期: 2026-04-05 当前状态: 稳定化已完成，功能冻结已解除

1. 功能模块清单及优先级划分

优先级定义

P0 致命: 用户无法完成核心操作（登录、聊天、模型切换）
P1 关键: 主要功能不可用或结果不正确（Agent管理、技能执行、Hands触发）
P2 重要: 辅助功能异常（自动化面板、Pipeline、课堂、设置）
P3 一般: 边缘场景或体验优化（记忆图谱、智能层细节）

模块矩阵

#	模块	优先级	涉及组件	验证页面/路径
M01	登录与认证	P0	LoginPage, SaaS登录	登录页
M02	聊天核心	P0	ChatArea, StreamingText	主聊天界面
M03	模型选择与切换	P0	ModelSelector	聊天顶部
M04	Agent/分身管理	P1	CloneManager, AgentStore	侧边栏
M05	技能系统	P1	SkillMarket, SkillCard	技能市场
M06	Hands 自主能力	P1	HandsPanel, HandApprovalModal	自动化面板
M07	自动化面板	P2	AutomationPanel, TriggersPanel	自动化页签
M08	Pipeline 工作流	P2	WorkflowBuilder, IntentInput	工作流编辑器
M09	课堂系统	P2	ClassroomPlayer, SceneRenderer	课堂播放器
M10	设置系统	P2	12个设置页面	设置页签
M11	记忆系统	P2	MemoryPanel, MemoryGraph	右侧面板
M12	智能层	P3	HeartbeatConfig, ReflectionLog	右侧面板/设置
M13	浏览器自动化	P1	BrowserHandCard, TaskTemplateModal	Browser Hand
M14	展示系统	P2	SlideshowRenderer, QuizRenderer	展示播放器
M15	Admin V2	P2	15个管理页面	admin-v2 Web应用

2. 各功能模块设计目标与预期效果

M01: 登录与认证

设计目标: 用户通过 SaaS 账户登录后才能使用桌面端功能。 预期效果:

登录页展示品牌标识、用户名/密码输入框
登录成功后自动跳转到主界面
支持 TOTP 两步验证
登录失败显示明确错误信息
会话恢复：重启应用后自动恢复登录状态（OS keyring）

M02: 聊天核心

设计目标: 用户与 AI Agent 进行多轮对话，获取流式响应。 预期效果:

输入框在底部，消息流式显示
支持普通文本、代码块、Markdown 渲染
消息气泡区分用户/AI
流式响应有打字机效果
支持取消正在进行的响应
历史对话在侧边栏可切换
新建对话功能正常
建议提示词（SuggestionChips）展示

M03: 模型选择与切换

设计目标: 用户可在多个 LLM Provider 之间切换模型。 预期效果:

模型选择器显示可用模型列表
切换模型后后续对话使用新模型
已连接 SaaS 时显示 SaaS 可用模型
未连接时显示本地配置的模型

M04: Agent/分身管理

设计目标: 用户可创建、配置、切换不同的 AI Agent（分身）。 预期效果:

侧边栏显示 Agent 列表
可创建新 Agent（设置名称、人设、模型偏好）
可切换当前活跃 Agent
可编辑/删除 Agent
Agent 配置持久化

M05: 技能系统

设计目标: 用户可浏览、搜索、执行 75 个预定义技能。 预期效果:

技能市场展示技能卡片
技能按类别分组
支持搜索技能
点击技能可查看详情
可直接触发技能执行
技能执行结果在聊天中显示

M06: Hands 自主能力

设计目标: 9 个 Hands 提供浏览器自动化、数据收集、研究等能力。 预期效果:

Hands 面板展示所有可用 Hands
每个 Hand 显示状态、描述
可触发 Hand 执行（带参数配置）
需要审批的 Hand 弹出审批弹窗
执行状态实时更新
执行结果可查看

M07: 自动化面板

设计目标: 用户可创建自动化触发器、查看审批队列、管理定时任务。 预期效果:

自动化面板展示触发器列表
可创建新触发器（选择类型、配置条件）
审批队列显示待审批操作
定时任务管理

M08: Pipeline 工作流

设计目标: 用户可通过意图路由触发 Pipeline 工作流，或可视化编辑工作流。 预期效果:

意图输入可路由到匹配的 Pipeline
工作流编辑器支持拖拽节点
节点类型：LLM、Skill、Hand、HTTP、并行、条件
可保存和运行工作流
执行结果可查看

M09: 课堂系统

设计目标: AI 生成多 Agent 互动的教学场景。 预期效果:

可输入主题生成课堂
生成进度实时显示
课堂播放器展示多 Agent 对话
场景切换流畅
支持学生笔记
白板绘制功能
TTS 语音播放

M10: 设置系统

设计目标: 12 个设置页面覆盖所有配置需求。 预期效果:

通用设置：语言、主题、代理
使用统计：用量图表
积分/计费：余额、充值
模型与 API：Provider 配置、API Key
MCP 服务：外部工具连接
技能管理：技能列表
IM 通道：飞书等集成
工作区：文件路径配置
隐私：数据收集选项
安全存储：敏感信息
关于：版本信息

M11: 记忆系统

设计目标: AI 记住用户偏好和历史对话要点。 预期效果:

记忆面板展示已存储的记忆
记忆图谱可视化
可搜索记忆
可删除单条记忆
Viking 存储功能正常

M12: 智能层

设计目标: Heartbeat（心跳）、Reflection（反思）、Identity（身份进化）协同工作。 预期效果:

心跳配置可查看/修改
反思日志可查看
身份变化提案通知可响应
压缩器自动管理上下文窗口

M13: 浏览器自动化

设计目标: 通过 Chromium 自动化浏览器操作。 预期效果:

可创建浏览器会话
任务模板可选择
截图预览可查看
表单填写自动化
数据抓取功能

M14: 展示系统

设计目标: 生成幻灯片、测验、文档等展示内容。 预期效果:

幻灯片播放器正常
测验渲染和交互
文档渲染
图表渲染

M15: Admin V2 管理后台

设计目标: 管理员通过 Web 界面管理 SaaS 平台。 预期效果:

仪表盘展示关键指标
账户管理 CRUD
模型服务配置
角色权限管理
计费管理
中继任务管理
知识库管理
定时任务管理
Prompt 模板管理
操作日志查看
配置同步管理

3. 详细用户操作场景模拟方案

Phase 1: 核心交互（P0）

场景 S1.1: 首次登录

启动应用，观察加载过程
检查登录页 UI 元素完整性
输入错误凭证，验证错误提示
输入正确凭证，验证登录流程
检查登录后状态持久化

场景 S1.2: 基础聊天

在聊天框输入 "你好，请介绍一下你自己"
观察流式响应是否正常
验证 Markdown 渲染（代码块、列表、标题）
输入 "请用 Python 写一个快排" → 验证代码块渲染
点击取消按钮中断响应
创建新对话，验证历史对话保留

场景 S1.3: 模型切换

打开模型选择器
列出所有可用模型
切换到不同模型
发送消息验证新模型响应
验证模型标识在 UI 中正确显示

Phase 2: Agent 管理与技能（P1）

场景 S2.1: Agent CRUD

打开 Agent 管理面板
创建新 Agent（名称、人设描述）
切换到新 Agent
验证人设在对话中体现
编辑 Agent 属性
删除 Agent

场景 S2.2: 技能浏览与执行

进入技能市场
浏览技能分类
搜索特定技能（如 "翻译"）
查看技能详情
执行一个简单技能
验证结果在聊天中展示

场景 S2.3: Hands 触发

进入 Hands 面板
查看 9 个可用 Hands 状态
触发一个无需审批的 Hand（如 Researcher）
验证执行状态和结果
触发需审批的 Hand（如 Browser）
验证审批弹窗和审批流程

Phase 3: 自动化与工作流（P2）

场景 S3.1: 自动化面板

切换到自动化页签
查看触发器列表
创建新触发器
查看审批队列
查看执行历史

场景 S3.2: Pipeline 工作流

进入工作流编辑器
拖拽节点创建简单工作流
保存工作流
运行工作流
查看执行结果

场景 S3.3: 课堂生成

触发课堂生成
观察生成进度
播放课堂内容
测试场景交互（白板、笔记、TTS）

Phase 4: 设置与智能层（P2-P3）

场景 S4.1: 设置页面遍历

逐一打开 12 个设置页面
验证每个页面的数据加载
修改设置并保存
验证设置持久化

场景 S4.2: 记忆系统

打开右侧面板记忆页签
查看已存储记忆
搜索记忆
查看记忆图谱
删除单条记忆

场景 S4.3: 智能层

查看心跳配置
查看反思日志
查看身份状态
响应身份变化提案

Phase 5: Admin V2 管理后台

场景 S5.1: Admin 登录与仪表盘

打开 Admin V2 Web 界面
管理员登录
查看仪表盘关键指标

场景 S5.2: 账户与角色管理

账户列表查看
创建/编辑/禁用账户
角色权限配置

场景 S5.3: 模型与中继管理

Provider 配置
模型管理
API Key 轮换
中继任务查看

场景 S5.4: 知识库与定时任务

知识库分类管理
知识条目 CRUD
定时任务配置

4. 功能验证点及判断标准

验证等级定义

等级	标识	含义
PASS	✅	功能完全符合设计预期
PARTIAL	⚠️	功能部分实现或存在非关键问题
FAIL	❌	功能不可用或严重偏离设计
N/A	➖	前置条件不满足，无法验证

每个验证点的检查维度

UI 完整性: 页面元素是否完整渲染，无空白/缺失
交互响应: 用户操作是否得到预期反馈
数据正确性: 显示数据是否与后端一致
状态一致性: 操作后 UI 状态是否正确更新
错误处理: 异常操作是否有合理提示
持久化: 修改是否被正确保存

通用判断标准

PASS: 6 个维度全部满足
PARTIAL: 1-2 个维度不满足但不影响核心功能
FAIL: 3 个以上维度不满足或核心功能不可用

5. 问题记录与跟踪机制

问题严重性分级

级别	定义	示例
BLOCKER	系统无法启动或核心功能完全不可用	应用崩溃、登录失败
CRITICAL	主要功能不可用	聊天无法发送、模型无法切换
MAJOR	功能部分失效或结果不正确	技能执行无结果、设置无法保存
MINOR	UI 问题或体验不佳	样式错乱、文案错误
TRIVIAL	极小问题，不影响使用	拼写错误、间距不均

问题记录模板

### ISS-XXX: [简短标题]
- **模块**: M01-M15
- **严重性**: BLOCKER/CRITICAL/MAJOR/MINOR/TRIVIAL
- **验证点**: 对应的验证点编号
- **现象描述**: 详细描述观察到的行为
- **预期行为**: 应该发生什么
- **复现步骤**:
  1. 步骤一
  2. 步骤二
  3. ...
- **实际截图/日志**: 附件
- **影响范围**: 影响哪些用户/场景
- **根因分析**: 初步判断的原因
- **修复建议**: 建议的修复方向

6. 验证结果汇总报告模板

# ZCLAW 功能验证报告

**验证日期**: YYYY-MM-DD
**验证人**: Claude Code (tauri-mcp)
**应用版本**: 从 package.json 获取
**测试环境**: Windows 11 + Tauri 2.x

## 执行摘要

| 指标 | 数值 |
|------|------|
| 总验证点数 | N |
| PASS | N (X%) |
| PARTIAL | N (X%) |
| FAIL | N (X%) |
| N/A | N (X%) |
| BLOCKER | N |
| CRITICAL | N |
| MAJOR | N |
| MINOR | N |
| TRIVIAL | N |

## 模块验证矩阵

| 模块 | 验证点数 | PASS | PARTIAL | FAIL | N/A | 备注 |
|------|---------|------|---------|------|-----|------|
| M01 登录 | | | | | | |
| M02 聊天 | | | | | | |
| ... | | | | | | |

## 问题清单

### BLOCKER
[列表]

### CRITICAL
[列表]

### MAJOR
[列表]

### MINOR
[列表]

### TRIVIAL
[列表]

## 关键发现

### 功能亮点
1. ...
2. ...

### 需要关注的问题
1. ...
2. ...

## 修复优先级建议

1. **立即修复** (BLOCKER + CRITICAL)
2. **本迭代修复** (MAJOR)
3. **后续迭代** (MINOR + TRIVIAL)

12 KiB Raw Blame History Unescape Escape

ZCLAW 系统功能验证方案

1. 功能模块清单及优先级划分

优先级定义

模块矩阵

2. 各功能模块设计目标与预期效果

M01: 登录与认证

M02: 聊天核心

M03: 模型选择与切换

M04: Agent/分身管理

M05: 技能系统

M06: Hands 自主能力

M07: 自动化面板

M08: Pipeline 工作流

M09: 课堂系统

M10: 设置系统

M11: 记忆系统

M12: 智能层

M13: 浏览器自动化

M14: 展示系统

M15: Admin V2 管理后台

3. 详细用户操作场景模拟方案

Phase 1: 核心交互（P0）

场景 S1.1: 首次登录

场景 S1.2: 基础聊天

场景 S1.3: 模型切换

Phase 2: Agent 管理与技能（P1）

场景 S2.1: Agent CRUD

场景 S2.2: 技能浏览与执行

场景 S2.3: Hands 触发

Phase 3: 自动化与工作流（P2）

场景 S3.1: 自动化面板

场景 S3.2: Pipeline 工作流

场景 S3.3: 课堂生成

Phase 4: 设置与智能层（P2-P3）

场景 S4.1: 设置页面遍历

场景 S4.2: 记忆系统

场景 S4.3: 智能层

Phase 5: Admin V2 管理后台

场景 S5.1: Admin 登录与仪表盘

场景 S5.2: 账户与角色管理

场景 S5.3: 模型与中继管理

场景 S5.4: 知识库与定时任务

4. 功能验证点及判断标准

验证等级定义

每个验证点的检查维度

通用判断标准

5. 问题记录与跟踪机制

问题严重性分级

问题记录模板

6. 验证结果汇总报告模板

12 KiB

Raw Blame History