docs(wiki): PP-04 可观测性修复 — DevOps 行更新 + 告警盲飞症状条目

- 关键数字 DevOps 行:加 Alertmanager 告警出口 + Grafana dashboard
  provisioning + postgres/redis exporter
- 症状导航新增「告警触发无人知晓(生产盲飞)」条目(部分修复)
This commit is contained in:
iven
2026-06-26 10:06:00 +08:00
parent ffbe5a797f
commit 1945ef3f78

View File

@@ -35,7 +35,7 @@
| Design Token | 11 级字号 + 12 结构 token + 5 动画时序 tokenduration/easing75 SCSS 页面全量接入 `var(--tk-*)``.doctor-mode` / `.elder-mode` CSS 变量级联覆盖,构建时生成 `token-values.ts` 供 Canvas/JS 运行时ContentCard 支持 padding+margin prop | | Design Token | 11 级字号 + 12 结构 token + 5 动画时序 tokenduration/easing75 SCSS 页面全量接入 `var(--tk-*)``.doctor-mode` / `.elder-mode` CSS 变量级联覆盖,构建时生成 `token-values.ts` 供 Canvas/JS 运行时ContentCard 支持 padding+margin prop |
| 长者模式 | 58/58 页面 100% 覆盖 | | 长者模式 | 58/58 页面 100% 覆盖 |
| UI 合规审计 | T40: 60 页面全覆盖PASS 24 / PASS_WITH_ISSUES 36 / NEEDS_WORK 0HIGH×2 + MEDIUM×6 + LOW×67 全部修复,评分 95/100 | | UI 合规审计 | T40: 60 页面全覆盖PASS 24 / PASS_WITH_ISSUES 36 / NEEDS_WORK 0HIGH×2 + MEDIUM×6 + LOW×67 全部修复,评分 95/100 |
| DevOps 基础设施 | Nginx TLS 1.2/1.3 + HSTS/CSP 安全头 + AES-256-CBC 备份加密 + Prometheus 4 组告警规则 + Redis AOF 持久化 + Grafana Dashboard + uploads 定时备份 | | DevOps 基础设施 | Nginx TLS 1.2/1.3 + HSTS/CSP 安全头 + AES-256-CBC 备份加密 + Prometheus 4 组告警规则 + **Alertmanager 告警出口expand-env渠道上线前填** + Redis AOF 持久化 + **Grafana dashboard 自动 provisioningHMS 概览)** + **postgres/redis exporter** + uploads 定时备份 |
| 项目阶段 | **V1 CONDITIONAL GO** — DevOps P0 阻塞项已加固TLS + 备份加密 + 监控),剩余 P1 约 3 天ICD 校验 + 药品编码 + 运维完善) | | 项目阶段 | **V1 CONDITIONAL GO** — DevOps P0 阻塞项已加固TLS + 备份加密 + 监控),剩余 P1 约 3 天ICD 校验 + 药品编码 + 运维完善) |
## 症状导航 ## 症状导航
@@ -162,6 +162,7 @@
| Redis 凭据泄露(明文密码进 git | [[infrastructure]] 凭据管理 | wiki 历史版本明文写 Redis 密码+公网 IP已进 main 主干+origin/main最早 2026-04-18 | **核实降级**:泄露旧密码已失效(当前 requirepass 为另一弱密码未泄露入仓库HMS 当前连 localhost 本地 Redisdev.ps1云端实例闲置无数据无入侵**已处理**:明文 redact 4 处 + 公网访问已关闭2026-06-25**待办(上线前)**:云端换强密码 + compose 配置对齐;**不重写主干历史**(轮换后历史密码无效);**真问题**doc-code driftwiki 说云端实际本地) | | Redis 凭据泄露(明文密码进 git | [[infrastructure]] 凭据管理 | wiki 历史版本明文写 Redis 密码+公网 IP已进 main 主干+origin/main最早 2026-04-18 | **核实降级**:泄露旧密码已失效(当前 requirepass 为另一弱密码未泄露入仓库HMS 当前连 localhost 本地 Redisdev.ps1云端实例闲置无数据无入侵**已处理**:明文 redact 4 处 + 公网访问已关闭2026-06-25**待办(上线前)**:云端换强密码 + compose 配置对齐;**不重写主干历史**(轮换后历史密码无效);**真问题**doc-code driftwiki 说云端实际本地) |
| device_readings 分区硬截止 2026-09 | [[database]] 分区维护 | m000073 只静态建到 2026_08 分区,无 pg_partman/cron 创建未来分区2026-09-01 起 INSERT 抛错 | **已修复:** m20260626_000170 补建 2026_09~2027_06 共 10 个月分区2026-06-26中期需 pg_partman 自动维护 | | device_readings 分区硬截止 2026-09 | [[database]] 分区维护 | m000073 只静态建到 2026_08 分区,无 pg_partman/cron 创建未来分区2026-09-01 起 INSERT 抛错 | **已修复:** m20260626_000170 补建 2026_09~2027_06 共 10 个月分区2026-06-26中期需 pg_partman 自动维护 |
| AI 分析队列 claim_next SQL 注入 | [[erp-ai]] analysis_queue | `claim_next``format!` 拼 tenant_id + SELECT/UPDATE 不在事务内无 SKIP LOCKED | **已修复:** 参数化 `$1` + 事务内 `FOR UPDATE SKIP LOCKED` 原子 claim2026-06-26 | | AI 分析队列 claim_next SQL 注入 | [[erp-ai]] analysis_queue | `claim_next``format!` 拼 tenant_id + SELECT/UPDATE 不在事务内无 SKIP LOCKED | **已修复:** 参数化 `$1` + 事务内 `FOR UPDATE SKIP LOCKED` 原子 claim2026-06-26 |
| 告警触发无人知晓(生产盲飞) | [[infrastructure]] 可观测性 | 11 条 Prometheus 规则无 Alertmanager 通知出口 + Grafana provisioning 空 + exporter 未部署("配置齐全运行为零" | **部分修复:** Alertmanager 服务 + prometheus alerting + Grafana dashboard provisioningHMS 概览)+ postgres/redis exporter通知渠道待上线前填2026-06-26 |
## 模块导航 ## 模块导航