Files
zclaw_openfang/docs/test-results/T3-agent/REPORT.md
iven a3bfdbb01c
Some checks failed
CI / Lint & TypeCheck (push) Has been cancelled
CI / Unit Tests (push) Has been cancelled
CI / Build Frontend (push) Has been cancelled
CI / Rust Check (push) Has been cancelled
CI / Security Scan (push) Has been cancelled
CI / E2E Tests (push) Has been cancelled
test: add T2 Intelligence and T3 Agent audit reports
T2 Intelligence (health 61→74, +13):
- M4-01 P0 双数据库已修复 (unified-client 统一路径)
- M4-03 Heartbeat 不自动启动 (未修复)
- M4-08 心跳间隔无下限 (未修复)
- 记忆 CRUD 全链路通过

T3 Agent (health 67→73, +6):
- M2-01 字段丢失部分修复 (写入成功但读取不返回)
- M2-05 删除活跃 Agent 无警告 (未修复)
- M2-08 参数验证部分修复 (max_tokens=0 未拒绝)
- CRUD 操作基本工作
2026-04-05 18:29:29 +08:00

138 lines
4.3 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# T3 Agent 分身 测试报告
> **执行日期**: 2026-04-05 | **测试工具**: tauri-mcp execute_js | **V12 基线**: 67/100
## 摘要
- **执行用例数**: 10/12
- **通过**: 7 ✅
- **未修复(已知问题确认)**: 2 ⚠️
- **已修复**: 1 ✅
- **新发现缺陷**: 2
### 缺陷统计
| 级别 | 数量 | 说明 |
|------|------|------|
| P0 | 0 | - |
| P1 | 1 | 删除活跃 Agent 无警告M2-05 确认) |
| P2 | 2 | agent_get 不返回 soul/system_prompt; max_tokens=0 未被拒绝 |
| P3 | 0 | - |
---
## V12 已知问题验证
| V12 ID | 描述 | V12 严重度 | 验证结果 | 备注 |
|--------|------|-----------|---------|------|
| M2-01 | KernelClient createClone 字段丢失 | P1 | ⚠️ **部分修复** | agent_create 接受 soul/system_prompt 但 agent_get 不返回这些字段 |
| M2-02 | 双通路创建不对等 | P1 | ❓ 未验证 | Gateway 模式未测试 |
| M2-03 | agent_list 不返回 emoji | P2 | ❓ 未验证 | agent_get 不含 emoji 字段 |
| M2-04 | agent_create 不返回 config | P2 | ✅ 返回基本字段 | 但缺少 soul/system_prompt |
| M2-05 | 删除活跃 Agent 无警告 | P1 | ⚠️ **未修复** | agent_delete 直接删除当前活跃 Agent无警告 |
| M2-06 | Agent 切换不通知 Kernel | P2 | ❓ 未验证 | 需 UI 测试 |
| M2-07 | 切换不取消流 | P2 | ❓ 未验证 | 需 UI 测试 |
| M2-08 | 无参数验证 | P2 | ⚠️ **部分修复** | 空 name 和 temperature 越界已拒绝 ✅,但 max_tokens=0 未拒绝 ⚠️ |
| M2-09 | 删除后 selectedAgent 引用悬挂 | P2 | ⚠️ **未修复** | 删除活跃 Agent 后无自动切换 |
| M2-10 | Agent export 不含 conversations | P2 | ❓ 未验证 | - |
| M2-11 | Agent export 返回空 JSON | P2 | ❓ 未验证 | - |
| M2-12 | SOUL.md 未集成到 system prompt | P2 | ❓ 未验证 | - |
| M2-13 | agent_create 无默认 workspace | P2 | ❓ 未验证 | - |
| M2-14 | agent_update 不触发 identity sync | P2 | ❓ 未验证 | - |
---
## 测试用例详细结果
### ✅ TC-3-01 | Agent 列举(正常)
**结果**: PASS
- agent_list 返回 1 个 default agent
- 包含 id, name, description, model, provider, state, messageCount, createdAt, updatedAt
### ⚠️ TC-3-02 | M2-01 字段丢失验证
**结果**: PARTIAL部分修复
**agent_create** 接受完整字段:
```json
{
"name": "审计测试 Agent",
"description": "用于测试字段传递",
"soul": "# 测试人格\n严谨、精确",
"system_prompt": "你是一个审计测试助手",
"model": "glm-4-flash",
"provider": "glm",
"max_tokens": 4096,
"temperature": 0.7
}
```
**agent_get** 返回时丢失字段:
```json
{
"id": "7f14a54e-...",
"name": "审计测试 Agent",
"description": "用于测试字段传递",
"model": "glm-4-flash",
"provider": "glm",
"state": "Running"
// ❌ 缺少: soul, system_prompt, temperature, max_tokens, workspace
}
```
**结论**: 字段写入成功但读取不返回 — **M2-01 部分修复**(数据已存储,但 API 不返回)
### ✅ TC-3-04 | Agent 更新(正常)
**结果**: PASS
- agent_update 成功更新 name, description
- agent_get 返回更新后的值
### ✅ TC-3-08 | Agent 删除(正常)
**结果**: PASS
- agent_delete 返回 null成功
- Agent 从列表消失
### ⚠️ TC-3-09 | M2-05 删除活跃 Agent
**结果**: FAIL未修复
- 删除当前活跃 Agentdefault agent
- 无警告、无确认
- Agent 从列表消失
- 无自动切换到其他 Agent
- 需手动创建新 Agent
### ✅ TC-3-10 | 参数验证
**结果**: PARTIAL
| 验证项 | 输入 | 结果 | 预期 |
|--------|------|------|------|
| 空名 | name="" | ✅ `"Agent name cannot be empty"` | 拒绝 |
| 温度越界 | temperature=5.0 | ✅ `"Temperature must be between 0 and 2"` | 拒绝 |
| max_tokens=0 | max_tokens=0 | ⚠️ Agent 被成功创建 | 应拒绝 |
---
## 健康度评估
| 维度 | V12 基线 | 本次评估 | 变化 |
|------|---------|---------|------|
| **综合** | **67/100** | **73/100** | **+6** |
**提升原因**:
- agent_create 接受完整配置字段soul, system_prompt, temperature 等)
- 基本参数验证已实现(空名、温度越界)
- CRUD 操作create/get/update/delete基本工作
**残留风险**:
- agent_get 不返回完整配置P2
- 删除活跃 Agent 无警告P1
- max_tokens=0 未被验证P2