# AI 功能战略方向发散式探讨 > 日期: 2026-05-18 | 参与者: 用户 + Claude ## 背景 HMS 健康管理平台综合评分 6.8/10,功能完整度 87%,但六维度分析评价 AI 为"有弹药没上膛"——底层能力完整(3 Provider + SSE 分析 + Copilot 引擎 + Agent Phase 0),用户触达断裂(4 个 SSE 端点无 UI 入口、客服"小华"仅为简单问答)。 在 AI Agent Phase 0 刚完成之际,对 AI 功能的五个维度进行全面发散式探讨,确定战略方向。 ## 讨论维度与决策 ### 维度 1:产品定位 — 统一入口"AI 健康管家" **结论:统一入口"AI 健康管家"+ 分级沙箱隔离** - 前端统一为一个入口——用户感知是"问小华" - 后端按角色创建隔离沙箱:患者沙箱、医护沙箱、管理沙箱 - 每个沙箱有独立的 Tool 白名单、数据范围、Prompt 策略 - 统一体验 ≠ 统一权限 **数据安全机制(5 层防护):** | 风险层 | 防护措施 | |--------|----------| | 跨患者 | Tool 自动注入当前用户 patient_id,LLM 无法伪造 | | 跨租户 | session_id + tenant_id 双过滤,沿用现有中间件 | | 跨角色 | ToolRegistry.get_allowed_tools(role) 硬过滤,非 Prompt 约束 | | 越权 Tool | 后端按 role 限定可用 Tool 集合 | | Prompt 注入 | 输出层关键词检测 + 输入层 sanitize | **三个角色沙箱定义:** - **患者沙箱**:查自己体征/化验、科普知识、预约挂号。数据范围仅自己、输出脱敏。 - **医护沙箱**:查所管患者、AI 分析、风险评分、文书辅助。数据范围本科室患者、含诊断信息。 - **管理沙箱**:成本统计、用量趋势、效果分析、功能开关。数据范围本机构汇总、无个体数据。 ### 维度 2:数据智能闭环 — 先打通最短路径 **结论:先 A(AI→用户可见),同步设计 B 数据结构,C 远期愿景** - **A(1-2 周)**:Web 化验报告页"AI 解读"按钮 + 小程序体征页"AI 趋势分析"按钮。复用现有 SSE 端点,前端 3-5 天。 - **B(2-4 周)**:Copilot 每日扫描高风险患者 → 生成洞察 → 消息中心推送 → 患者"采纳/忽略/咨询医生"反馈 → 数据写入 `ai_suggestion` 度量。 - **C(3-6 个月)**:洞察 → 行动 → 效果追踪 → 模型优化的完整飞轮。 ### 维度 3:多角色 AI 体验 — 角色 Prompt 为基础设施 **结论:A 必做,B 医护端最有价值,C 管理看板纳入第一阶段** - **A(2-3 周)**:system_prompt 根据 user_role 动态组装。患者版温和通俗带情绪安抚、医护版专业简洁引用数据来源、管理版汇总对比。Tool Registry 按角色过滤。 - **B(3-5 周)**:Web 后台右侧常驻 AI 侧边栏。查看患者档案时 AI 自动总结、随访页 AI 辅助生成小结。上下文感知的智能摘要,非对话模式。 - **C**:合并到 AI 管理看板(见维度 5 + 跨维度决策)。 ### 维度 4:技术架构 — 云端部署 + pgvector RAG + 在线/本地语音 **结论:纯云端部署,不调本地 LLM** | 能力 | 技术选型 | |------|----------| | LLM 推理 | Claude / OpenAI(云端),Ollama 仅开发测试 | | RAG 知识库 | pgvector 扩展 PostgreSQL + 在线 Embedding API(text-embedding-3-small) | | 语音识别 | 在线:Whisper API / 讯飞;降级:Whisper.cpp (CPU) | | 语音合成 | 在线:OpenAI TTS / 讯飞;降级:edge-tts (免费) | RAG 架构:知识文档 → 在线 Embedding API → pgvector 存储 → 用户提问 → 同款 Embedding → pgvector 语义检索 → Top-K 注入 Agent 上下文。 语音方案:默认在线 API(质量好、延迟低),降级时 CPU 本地(零成本、可接受延迟)。 ### 维度 5 + 跨维度:AI 用量付费 + 综合管理看板 **结论:按机构(租户)颗粒度用量付费,管理看板与 AI 能力同步搭建** **计费模式:** - 按机构月度 Token 用量阶梯计价 - 基础 AI(本地规则引擎、Copilot 风险评分)不消耗 Token - 高级 AI(LLM 对话、化验解读、趋势分析)消耗 Token - 机构管理员可设预算上限和预警线 **管理看板模块:** | 模块 | 内容 | |------|------| | 用量总览 | 调用量趋势、按角色/功能分布、峰值均值 | | 成本分析 | Token 消耗、按 Provider/功能类型、日/周/月、预算预警 | | 效果追踪 | 分析完成率、建议采纳率、异常检出率、人工干预率 | | 功能开关 | AI 分析(全局+按类型)、AI 聊天(全局+按角色)、AI 预警推送、RAG 知识检索、语音交互、Copilot 辅助 | | 配置管理 | Provider 配置、配额管理、Prompt 模板管理、知识库管理、告警阈值 | **功能开关粒度:** 全局开关 + 按子功能开关,支持关闭单个功能而保留其他。 ## 实施优先级共识 | 阶段 | 内容 | 工期 | |------|------|------| | **Phase 1A** | 打通 AI→用户可见(Web 化验 AI 解读按钮 + 小程序体征趋势分析按钮) | 1-2 周 | | **Phase 1B** | 角色分级 Prompt 策略 + Tool 权限沙箱 | 2-3 周 | | **Phase 1C** | AI 管理看板(用量/成本/效果/开关) | 2-3 周 | | Phase 1A/1B/1C 同步推进,1C 与 1A/1B 并行开发 | | **Phase 2A** | 医护端 AI 助手面板(侧边栏 + 患者摘要 + 随访辅助) | 3-5 周 | | **Phase 2B** | 洞察→推送→反馈闭环(Copilot 每日扫描 + 消息推送 + 采纳反馈) | 2-4 周 | | **Phase 3A** | RAG 知识库(pgvector + Embedding API + 语义检索 Tool) | 3-5 周 | | **Phase 3B** | 语音交互(在线为主 + CPU 降级) | 3-4 周 | | **远期** | 主动关怀引擎飞轮、多 Agent 协作、领域微调 | 6-12 个月 | ## 与现有 Agent 计划的关系 本次讨论的方向在已有 AI Agent 突破口设计(`docs/superpowers/specs/2026-05-18-ai-agent-breakthrough-design.md`)基础上扩展: - Agent Phase 1-3 的 Tool 扩展、会话持久化、行动类 Tool **按原计划推进** - 新增:角色沙箱机制、管理看板、AI→UI 触点打通、RAG 知识库 - 新增管理看板需要:`ai_feature_flags` 表(功能开关)、`ai_usage_daily` 聚合表(用量统计) - 计费相关:`ai_billing_records` 表(Token 消耗记录)、`ai_tenant_quotas` 扩展(月度预算) ## 待定事项 1. Embedding API 选型(OpenAI text-embedding-3-small vs 国内智谱/阿里) 2. 语音服务商选型(讯飞 vs 阿里 Paraformer vs Whisper API) 3. 管理看板是独立页面还是嵌入现有设置中心 4. AI 用量付费的阶梯定价具体方案