Files
zclaw_openfang/docs/brainstorming/2026-04-12-发散探讨-管家主动性与行业配置.md
iven f32216e1e0
Some checks failed
CI / Lint & TypeCheck (push) Has been cancelled
CI / Unit Tests (push) Has been cancelled
CI / Build Frontend (push) Has been cancelled
CI / Rust Check (push) Has been cancelled
CI / Security Scan (push) Has been cancelled
CI / E2E Tests (push) Has been cancelled
docs: 添加发散探讨文档和测试截图
添加了关于管家主动性与行业配置体系的发散探讨文档,包含现状诊断、关键讨论、架构设计等内容。同时添加了测试失败的截图和日志文件。
2026-04-12 22:40:45 +08:00

8.1 KiB
Raw Permalink Blame History

ZCLAW 发散式探讨 — 管家主动性与行业配置体系

日期: 2026-04-12 形式: 发散式互动探讨 参与者: iven + Claude 计划产出: plans/fancy-kindling-karp.md


议题Agent 对话主动性 — 如何让管家主动解决问题?

抛砖

管家模式已有痛点检测、用户画像、人格检测、Heartbeat 等感知能力,但感知完之后什么都没做。用户提出讨论如何让 agent 主动去解决用户提出的问题,让用户觉得系统人性化、是合格管家。


一、现状诊断

感知层 vs 行动层

核心发现:感知层齐了,行动层为零。

已有能力 状态 核心局限
ButlerRouter 关键词路由 (4域81词) 只注入 prompt不改变行为模式
痛点检测+聚合 (18信号词) 检测后只存储,不触发行动
用户画像 (7维度) 只在 prompt 里一行摘要
人格检测 (含 proactiveness) 检测了但无行为差异
Heartbeat (5项检查) 检查结果不推向用户
经验闭环 (痛点→方案→经验) 静默复用,用户无感
冷启动 (4阶段状态机) 只首次,固定问候语

一句话:管家能"看到"用户的痛点、画像、情绪,但看完之后什么都没做。

Hermes 分析的关键启发

讨论前先读了 wiki/hermes-analysis.mdHermes Agent 44.1K stars 竞品分析),核心洞察:

"大多数 Agent 记录了'发生了什么'Hermes 提取了'什么有效'"

ZCLAW 的痛点检测、画像积累、经验存储全是在记录发生了什么,但"什么有效"这一步断了。闭环没合上。


二、关键讨论与共识

2.1 主动性光谱

L0 被动响应   "你问我答"                  ← 当前位置
L1 主动理解   "你没说明白,我追问"         ← 有痛点检测但不行动
L2 主动建议   "你问A我顺便提醒B"         ← 近期目标
L3 主动行动   "检测到问题,我先做了"        ← 中期目标
L4 预见行动   "你还没说,我已经准备好了"    ← 远期愿景

共识:目标 L2-L3。

L4 不应该是弹窗通知,而是**"用户下次来的时候,管家已经准备好了"**。这符合之前"建议不代理"原则,也避免打扰。

2.2 主动性由谁驱动?

讨论: System Prompt 注入 vs Heartbeat 调度 vs 中间件规则?

共识(参考 Hermes混合驱动Prompt 驱动为主。

路径 占比 用途
System Prompt 注入 80% 对话内主动建议
Heartbeat 调度 15% 跨对话准备工作
中间件规则 5% 安全兜底

核心认知:主动性不是独立模块,是 prompt 质量的结果。 当 system prompt 包含足够用户画像、痛点历史、过往经验时LLM 自然会产生主动行为。

2.3 学习驱动方式

讨论: Hermes 核心是"Agent 自己决定什么值得学习"。ZCLAW 要走这条路还是规则驱动?

iven 提出关键约束: ZCLAW 不仅面向医疗,面向所有行业。

论证过程:

纯规则驱动走不通——4 行业 81 关键词已经暴露问题每进入一个新行业就要写一套新规则。500 个关键词、20 个域,这不是产品是定制开发。

纯 LLM 驱动也不对——不可审计(企业客户问"Agent 学了什么"无法回答)、可能学错、隐私风险、成本问题。

共识:混合模式 — LLM 做发动机,规则做刹车。

规则管"不能做什么" → 安全边界、质量门控、触发信号
LLM 管"应该学什么" → 判断什么有效、提取经验、生成建议

与 Hermes 的区别: Hermes 无条件触发 Periodic NudgeZCLAW 采用被动触发

  • 对话结束后检查触发信号(纯规则,零 LLM 成本)
  • 有信号才调 LLM 提取
  • 触发信号:痛点阈值跨过 / 隐式正反馈 / 连续 3+ 工具调用 / 用户纠正

2.4 行业配置架构

iven 提出架构方向: 行业配置做到 SaaS Admin 端Tauri 端初始化时选择行业,从 Admin 端获取配置。

讨论重点:

Q: 行业配置粒度?

  • A: 模板化(空白表单)→ 灵活但质量低
  • B: 预设+微调 → 快但不可扩展
  • C: 分层(内置基础+Admin增强共识选择

共识C分层设计上预留向 A 演进。内置 4 行业基础配置保证质量Admin 可覆盖/增强,后续迁移内置到 Admin DB。

Q: 一个用户可以属于多个行业吗? 共识:多行业并行。 Admin 控制用户可用的行业列表。ButlerRouter 只扫描授权行业的关键词多行业同时打分LLM 做最终判断。

Q: 数据源? 共识Admin 管理为主。 SaaS Admin 是真相源Tauri 拉取+本地缓存(离线可用),增量同步。

2.5 Admin 用户管理增强

iven 衍生提出: Admin 用户管理需要全面升级:

新增能力 说明
行业授权 控制用户可使用的行业列表
页面权限 控制用户在 Tauri 端能看到哪些页面/功能
套餐关联 用户关联 BillingPlan
Agent 模板 初始 Agent 人格、预配技能、工作流

2.6 实施顺序

iven 确认:全套一起做。 顺序:

  1. 4 个行业内置配置
  2. 学习循环基础
  3. Tauri 行业配置加载
  4. Admin 行业管理 API+UI

三、Hermes 参考要点

维度 Hermes 做法 ZCLAW 借鉴
学习循环 Periodic Nudge + Skill 自动创建 被动触发 + 经验→技能补丁(成本更低)
记忆分层 4 层(声明/情景/程序/用户建模) 增强现有 3 层注入力度 + Prompt 冻结
Prompt Cache Frozen MEMORY.md技能用 user message 计划引入会话内冻结策略
上下文压缩 多级策略剪裁→保护头尾→LLM摘要 计划增强 CompactionMiddleware
技能进化 自动 patch 更新 计划引入(经验→技能补丁)
用户建模 Honcho 方言式建模 12 维度 增强 UserProfiler 的注入格式

四、主动性架构全貌

SaaS Admin真相源
├── 行业配置 (关键词/Prompt/技能优先级/痛点种子)
├── 用户权限 (页面可见/行业授权/套餐/Agent模板)
└── 管理 API
        │
        │ Tauri 初始化拉取 + 缓存
        ▼
Tauri 客户端
├── 感知层(已有,需增强注入力度)
│   ├── ButlerRouter → 多行业动态关键词
│   ├── PainDetector → 18信号词 + 触发信号
│   ├── UserProfiler → 7维度 + 行业偏好
│   └── PersonalityDetector → proactiveness 维度
│
├── 学习层(新增,混合驱动)
│   ├── 规则触发(低成本前置判断)
│   ├── LLM 提取("什么有效"
│   ├── 安全过滤DataMasking + 格式校验)
│   └── 持久化ExperienceStore + UserProfile
│
├── 注入层(已有,需增强)
│   └── System Prompt 组装(会话开始时冻结)
│       ├── 行业上下文
│       ├── 用户画像摘要
│       ├── 活跃痛点
│       ├── 相关经验
│       └── 人格偏好
│
└── LLM → 自然产生主动行为
    "我注意到..." / "顺便提醒..." / "上次您提到的..."

五、计划产出

完整实施计划:plans/fancy-kindling-karp.md

5 个 Phase、17 个 Task

Phase 内容 依赖
Phase 1 行业配置基础(数据模型 + 4行业内置 + ButlerRouter改造
Phase 2 学习循环基础(触发信号 + LLM提取 + 经验增强) Phase 1.1
Phase 3 Tauri 行业配置加载(拉取缓存 + Rust注入 + Prompt组装 + 行业UI Phase 1+2
Phase 4 Admin 用户管理增强(行业管理页 + Accounts增强 + SaaS API + 页面可见性) Phase 1可与2/3并行
Phase 5 主动行为激活Prompt冻结 + 跨会话连续性 + Periodic Reflection + 注入格式) Phase 1-4

iven 批准计划,将在新会话中推进实施。