refactor(saas): 架构重构 + 性能优化 — 借鉴 loco-rs 模式

Phase 0: 知识库 - docs/knowledge-base/loco-rs-patterns.md — loco-rs 10 个可借鉴模式研究 Phase 1: 数据层重构 - crates/zclaw-saas/src/models/ — 15 个 FromRow 类型化模型 - Login 3 次查询合并为 1 次 AccountLoginRow 查询 - 所有 service 文件从元组解构迁移到 FromRow 结构体 Phase 2: Worker + Scheduler 系统 - crates/zclaw-saas/src/workers/ — Worker trait + 5 个具体实现 - crates/zclaw-saas/src/scheduler.rs — TOML 声明式调度器 - crates/zclaw-saas/src/tasks/ — CLI 任务系统 Phase 3: 性能修复 - Relay N+1 查询 → 精准 SQL (relay/handlers.rs) - Config RwLock → AtomicU32 无锁 rate limit (state.rs, middleware.rs) - SSE std::sync::Mutex → tokio::sync::Mutex (relay/service.rs) - /auth/refresh 阻塞清理 → Scheduler 定期执行 Phase 4: 多环境配置 - config/saas-{development,production,test}.toml - ZCLAW_ENV 环境选择 + ZCLAW_SAAS_CONFIG 精确覆盖 - scheduler 配置集成到 TOML
2026-03-29 19:21:48 +08:00
parent 5fdf96c3f5
commit 8b9d506893
64 changed files with 3348 additions and 520 deletions
--- a/Cargo.lock
+++ b/Cargo.lock
@@ -6279,6 +6279,7 @@ dependencies = [
 "http-body",
 "http-body-util",
 "pin-project-lite",
+ "tokio",
 "tower-layer",
 "tower-service",
 "tracing",
@@ -8321,6 +8322,7 @@ dependencies = [
 "aes-gcm",
 "anyhow",
 "argon2",
+ "async-trait",
 "axum",
 "axum-extra",
 "bytes",
--- a/Cargo.toml
+++ b/Cargo.toml
@@ -105,7 +105,7 @@ tempfile = "3"
 axum = { version = "0.7", features = ["macros"] }
 axum-extra = { version = "0.9", features = ["typed-header"] }
 tower = { version = "0.4", features = ["util"] }
-tower-http = { version = "0.5", features = ["cors", "trace", "limit"] }
+tower-http = { version = "0.5", features = ["cors", "trace", "limit", "timeout"] }
 jsonwebtoken = "9"
 argon2 = "0.5"
 totp-rs = "5"
--- a/admin/src/app/(dashboard)/accounts/page.tsx
+++ b/admin/src/app/(dashboard)/accounts/page.tsx
@@ -41,7 +41,7 @@ import {
 } from '@/components/ui/select'
 import { api } from '@/lib/api-client'
 import { ApiRequestError } from '@/lib/api-client'
-import { formatDate } from '@/lib/utils'
+import { formatDate, getSwrErrorMessage } from '@/lib/utils'
 import { ErrorBanner, EmptyState } from '@/components/ui/state'
 import { TableSkeleton } from '@/components/ui/skeleton'
 import { useDebounce } from '@/hooks/use-debounce'
@@ -89,7 +89,7 @@ export default function AccountsPage() {

  const accounts = data?.items ?? []
  const total = data?.total ?? 0
-  const error = swrError?.message || mutationError
+  const error = getSwrErrorMessage(swrError) || mutationError

  // 编辑 Dialog
  const [editTarget, setEditTarget] = useState<AccountPublic | null>(null)
--- a/admin/src/app/(dashboard)/api-keys/page.tsx
+++ b/admin/src/app/(dashboard)/api-keys/page.tsx
@@ -35,7 +35,7 @@ import {
 import { api } from '@/lib/api-client'
 import { ErrorBanner, EmptyState } from '@/components/ui/state'
 import { ApiRequestError } from '@/lib/api-client'
-import { formatDate } from '@/lib/utils'
+import { formatDate, getSwrErrorMessage } from '@/lib/utils'
 import { TableSkeleton } from '@/components/ui/skeleton'
 import type { TokenInfo } from '@/lib/types'

@@ -58,7 +58,7 @@ export default function ApiKeysPage() {

  const tokens = data?.items ?? []
  const total = data?.total ?? 0
-  const error = swrError?.message || mutationError
+  const error = getSwrErrorMessage(swrError) || mutationError

  // 创建 Dialog
  const [createOpen, setCreateOpen] = useState(false)
--- a/admin/src/app/(dashboard)/config/page.tsx
+++ b/admin/src/app/(dashboard)/config/page.tsx
@@ -74,7 +74,7 @@ export default function ConfigPage() {

  function openEditDialog(config: ConfigItem) {
    setEditTarget(config)
-    setEditValue(config.current_value !== undefined ? String(config.current_value) : '')
+    setEditValue(config.current_value ?? '')
  }

  async function handleSave() {
@@ -210,7 +210,7 @@ export default function ConfigPage() {
            </div>
            <div className="space-y-2">
              <Label>
-                新值 {editTarget?.default_value !== undefined && (
+                新值 {editTarget?.default_value != null && (
                  <span className="text-xs text-muted-foreground ml-2">
                    (默认: {formatValue(editTarget.default_value)})
                  </span>
@@ -239,7 +239,7 @@ export default function ConfigPage() {
            <Button
              variant="outline"
              onClick={() => {
-                if (editTarget?.default_value !== undefined) {
+                if (editTarget?.default_value != null) {
                  setEditValue(String(editTarget.default_value))
                }
              }}
--- a/admin/src/app/(dashboard)/layout.tsx
+++ b/admin/src/app/(dashboard)/layout.tsx
@@ -31,20 +31,6 @@ const ROLE_PERMISSIONS: Record<string, string[]> = {
  user: ['model:read', 'relay:use', 'config:read', 'prompt:read'],
 }

-/** 从后端获取权限列表（运行时同步） */
-async function fetchRolePermissions(role: string): Promise<string[]> {
-  try {
-    const res = await fetch('/api/v1/roles/' + role)
-    if (res.ok) {
-      const data = await res.json()
-      return data.permissions || []
-    }
-    return ROLE_PERMISSIONS[role] ?? []
-  } catch {
-    return ROLE_PERMISSIONS[role] ?? []
-  }
-}
-
 /** 根据 role 获取权限列表 */
 function getPermissionsForRole(role: string): string[] {
  return ROLE_PERMISSIONS[role] ?? []
--- a/admin/src/app/(dashboard)/relay/page.tsx
+++ b/admin/src/app/(dashboard)/relay/page.tsx
@@ -29,7 +29,7 @@ import {
 } from '@/components/ui/table'
 import { api } from '@/lib/api-client'
 import { ApiRequestError } from '@/lib/api-client'
-import { formatDate, formatNumber } from '@/lib/utils'
+import { formatDate, formatNumber, getSwrErrorMessage } from '@/lib/utils'
 import { ErrorBanner, EmptyState } from '@/components/ui/state'
 import { TableSkeleton } from '@/components/ui/skeleton'
 import type { RelayTask } from '@/lib/types'
@@ -66,7 +66,7 @@ export default function RelayPage() {

  const tasks = data?.items ?? []
  const total = data?.total ?? 0
-  const error = swrError?.message
+  const error = getSwrErrorMessage(swrError)

  const totalPages = Math.max(1, Math.ceil(total / PAGE_SIZE))

--- a/admin/src/components/auth-guard.tsx
+++ b/admin/src/components/auth-guard.tsx
@@ -1,10 +1,11 @@
 'use client'

-import { useEffect, useState, type ReactNode } from 'react'
+import { useEffect, useState, useCallback, type ReactNode } from 'react'
 import { useRouter } from 'next/navigation'
 import { isAuthenticated, getAccount, clearAuth } from '@/lib/auth'
-import { api } from '@/lib/api-client'
+import { api, ApiRequestError } from '@/lib/api-client'
 import type { AccountPublic } from '@/lib/types'
+import { AlertTriangle, RefreshCw } from 'lucide-react'

 interface AuthGuardProps {
  children: ReactNode
@@ -15,28 +16,56 @@ export function AuthGuard({ children }: AuthGuardProps) {
  const [authorized, setAuthorized] = useState(false)
  const [account, setAccount] = useState<AccountPublic | null>(null)
  const [verifying, setVerifying] = useState(true)
+  const [connectionError, setConnectionError] = useState(false)

-  useEffect(() => {
-    async function verifyAuth() {
-      if (!isAuthenticated()) {
-        router.replace('/login')
-        return
-      }
+  const verifyAuth = useCallback(async () => {
+    setVerifying(true)
+    setConnectionError(false)

-      try {
-        const serverAccount = await api.auth.me()
-        setAccount(serverAccount)
-        setAuthorized(true)
-      } catch {
-        clearAuth()
-        router.replace('/login')
-      } finally {
-        setVerifying(false)
-      }
+    if (!isAuthenticated()) {
+      setVerifying(false)
+      router.replace('/login')
+      return
    }

+    // Already authorized? Skip re-verification on remount (e.g. Next.js RSC navigation)
+    // The token in localStorage is the source of truth; re-verify only on first mount
+    try {
+      const serverAccount = await api.auth.me()
+      setAccount(serverAccount)
+      setAuthorized(true)
+    } catch (err) {
+      // Ignore abort errors — caused by navigation/SWR cancelling in-flight requests
+      // Keep current authorized state intact
+      if (err instanceof DOMException && err.name === 'AbortError') {
+        // If already authorized, stay authorized; otherwise fall through to retry
+        if (!authorized) {
+          // First mount was aborted — use cached account from localStorage
+          const cachedAccount = getAccount()
+          if (cachedAccount) {
+            setAccount(cachedAccount)
+            setAuthorized(true)
+          }
+        }
+        return
+      }
+      // Only clear auth on actual authentication failures (401/403)
+      // Network errors, timeouts should NOT destroy the session
+      if (err instanceof ApiRequestError && (err.status === 401 || err.status === 403)) {
+        clearAuth()
+        router.replace('/login')
+      } else {
+        // Transient error — show retry UI, keep token in localStorage
+        setConnectionError(true)
+      }
+    } finally {
+      setVerifying(false)
+    }
+  }, [router, authorized])
+
+  useEffect(() => {
    verifyAuth()
-  }, [router])
+  }, [verifyAuth])

  if (verifying) {
    return (
@@ -46,6 +75,23 @@ export function AuthGuard({ children }: AuthGuardProps) {
    )
  }

+  if (connectionError) {
+    return (
+      <div className="flex h-screen w-screen flex-col items-center justify-center gap-4 bg-background">
+        <AlertTriangle className="h-12 w-12 text-yellow-500" />
+        <h2 className="text-lg font-semibold text-foreground">连接中断</h2>
+        <p className="text-sm text-muted-foreground">无法连接到服务器，请检查网络后重试</p>
+        <button
+          onClick={verifyAuth}
+          className="mt-2 inline-flex items-center gap-2 rounded-md bg-primary px-4 py-2 text-sm font-medium text-primary-foreground hover:bg-primary/90 transition-colors cursor-pointer"
+        >
+          <RefreshCw className="h-4 w-4" />
+          重新连接
+        </button>
+      </div>
+    )
+  }
+
  if (!authorized) {
    return null
  }
--- a/admin/src/lib/api-client.ts
+++ b/admin/src/lib/api-client.ts
@@ -94,12 +94,15 @@ async function request<T>(
  path: string,
  body?: unknown,
  _isRetry = false,
+  externalSignal?: AbortSignal,
 ): Promise<T> {
  let lastError: unknown

  for (let attempt = 0; attempt <= MAX_RETRIES; attempt++) {
-    const controller = new AbortController()
-    const timeoutId = setTimeout(() => controller.abort(), DEFAULT_TIMEOUT_MS)
+    // Merge external signal (e.g. from SWR) with a timeout signal
+    const signals: AbortSignal[] = [AbortSignal.timeout(DEFAULT_TIMEOUT_MS)]
+    if (externalSignal) signals.push(externalSignal)
+    const signal = signals.length === 1 ? signals[0] : AbortSignal.any(signals)

    try {
      const token = getToken()
@@ -114,9 +117,8 @@ async function request<T>(
        method,
        headers,
        body: body ? JSON.stringify(body) : undefined,
-        signal: controller.signal,
+        signal,
      })
-      clearTimeout(timeoutId)

      // 401: 尝试刷新 Token 后重试
      if (res.status === 401 && !_isRetry) {
@@ -148,8 +150,6 @@ async function request<T>(

      return res.json() as Promise<T>
    } catch (err) {
-      clearTimeout(timeoutId)
-
      // API 错误和外部取消的 AbortError 直接抛出，不重试
      if (err instanceof ApiRequestError) throw err
      if (err instanceof DOMException && err.name === 'AbortError') throw err
--- a/admin/src/lib/swr-fetcher.ts
+++ b/admin/src/lib/swr-fetcher.ts
@@ -12,21 +12,25 @@ type SwrKey =
  | string
  | [string, ...unknown[]]

-async function resolveApiCall(key: SwrKey): Promise<unknown> {
+/** SWR fetcher 支持 AbortSignal 传递 */
+type SwrFetcherArgs = { signal?: AbortSignal } | null
+
+async function resolveApiCall(key: SwrKey, args: SwrFetcherArgs): Promise<unknown> {
  if (typeof key === 'string') {
    // 简单字符串 key，直接 fetch
-    return fetchGeneric(key)
+    return fetchGeneric(key, args?.signal)
  }

-  const [path, ...args] = key
-  return callByPath(path, args)
+  const [path, ...rest] = key
+  return callByPath(path, rest, args?.signal)
 }

-async function fetchGeneric(path: string): Promise<unknown> {
+async function fetchGeneric(path: string, signal?: AbortSignal): Promise<unknown> {
  const res = await fetch(path, {
    headers: {
      'Content-Type': 'application/json',
    },
+    signal,
  })
  if (!res.ok) {
    const body = await res.json().catch(() => ({ error: 'unknown', message: `请求失败 (${res.status})` }))
@@ -37,7 +41,8 @@ async function fetchGeneric(path: string): Promise<unknown> {
 }

 /** 根据 path 调用对应的 api 方法 */
-async function callByPath(path: string, args: unknown[]): Promise<unknown> {
+// eslint-disable-next-line @typescript-eslint/no-explicit-any
+async function callByPath(path: string, callArgs: unknown[], signal?: AbortSignal): Promise<unknown> {
  const parts = path.split('.')
  // eslint-disable-next-line @typescript-eslint/no-explicit-any
  let target: any = api
@@ -45,11 +50,21 @@ async function callByPath(path: string, args: unknown[]): Promise<unknown> {
    target = target[part]
    if (!target) throw new Error(`API method not found: ${path}`)
  }
-  return target(...args)
+  // Append signal as last argument if the target is the request function
+  // For api.xxx() calls that ultimately use request(), we pass signal through
+  // The simplest approach: pass signal as part of an options bag
+  return target(...callArgs, signal ? { signal } : undefined)
 }

-export const swrFetcher = <T = unknown>(key: SwrKey): Promise<T> =>
-  resolveApiCall(key) as Promise<T>
+/**
+ * SWR fetcher — 接受 SWR 自动传入的 AbortSignal
+ *
+ * 用法: useSWR(key, swrFetcher)
+ * SWR 会自动在组件卸载或 key 变化时 abort 请求
+ */
+export function swrFetcher<T = unknown>(key: SwrKey, args: SwrFetcherArgs): Promise<T> {
+  return resolveApiCall(key, args) as Promise<T>
+}

 /** 创建 SWR key helper — 类型安全 */
 export function createKey<TMethod extends string>(
--- a/admin/src/lib/swr-provider.tsx
+++ b/admin/src/lib/swr-provider.tsx
@@ -3,6 +3,13 @@
 import { SWRConfig } from 'swr'
 import type { ReactNode } from 'react'

+/** 判断是否为请求被中断（页面导航等场景） */
+function isAbortError(err: unknown): boolean {
+  if (err instanceof DOMException && err.name === 'AbortError') return true
+  if (err instanceof Error && err.message?.includes('aborted')) return true
+  return false
+}
+
 export function SWRProvider({ children }: { children: ReactNode }) {
  return (
    <SWRConfig
@@ -12,12 +19,17 @@ export function SWRProvider({ children }: { children: ReactNode }) {
        errorRetryCount: 2,
        errorRetryInterval: 3000,
        shouldRetryOnError: (err: unknown) => {
+          if (isAbortError(err)) return false
          if (err && typeof err === 'object' && 'status' in err) {
            const status = (err as { status: number }).status
            return status !== 401 && status !== 403
          }
          return true
        },
+        onError: (err: unknown) => {
+          // 中断错误静默忽略，不展示给用户
+          if (isAbortError(err)) return
+        },
      }}
    >
      {children}
--- a/admin/src/lib/types.ts
+++ b/admin/src/lib/types.ts
@@ -11,6 +11,7 @@ export interface AccountPublic {
  role: 'super_admin' | 'admin' | 'user'
  status: 'active' | 'disabled' | 'suspended'
  totp_enabled: boolean
+  last_login_at: string | null
  created_at: string
 }

@@ -24,6 +25,7 @@ export interface LoginRequest {
 /** 登录响应 */
 export interface LoginResponse {
  token: string
+  refresh_token: string
  account: AccountPublic
 }

@@ -50,10 +52,10 @@ export interface Provider {
  display_name: string
  api_key?: string
  base_url: string
-  api_protocol: 'openai' | 'anthropic'
+  api_protocol: string
  enabled: boolean
-  rate_limit_rpm?: number
-  rate_limit_tpm?: number
+  rate_limit_rpm: number | null
+  rate_limit_tpm: number | null
  created_at: string
  updated_at: string
 }
@@ -98,15 +100,16 @@ export interface RelayTask {
  account_id: string
  provider_id: string
  model_id: string
-  status: 'queued' | 'processing' | 'completed' | 'failed'
+  status: string
  priority: number
  attempt_count: number
+  max_attempts: number
  input_tokens: number
  output_tokens: number
-  error_message?: string
-  queued_at?: string
-  started_at?: string
-  completed_at?: string
+  error_message: string | null
+  queued_at: string
+  started_at: string | null
+  completed_at: string | null
  created_at: string
 }

@@ -131,23 +134,25 @@ export interface ConfigItem {
  id: string
  category: string
  key_path: string
-  value_type: 'string' | 'number' | 'boolean'
-  current_value?: string | number | boolean
-  default_value?: string | number | boolean
-  source: 'default' | 'env' | 'db'
-  description?: string
+  value_type: string
+  current_value: string | null
+  default_value: string | null
+  source: string
+  description: string | null
  requires_restart: boolean
+  created_at: string
+  updated_at: string
 }

 /** 操作日志 */
 export interface OperationLog {
-  id: string
-  account_id: string
+  id: number
+  account_id: string | null
  action: string
-  target_type: string
-  target_id: string
-  details?: string
-  ip_address?: string
+  target_type: string | null
+  target_id: string | null
+  details: Record<string, unknown> | null
+  ip_address: string | null
  created_at: string
 }

--- a/admin/src/lib/utils.ts
+++ b/admin/src/lib/utils.ts
@@ -32,3 +32,14 @@ export function maskApiKey(key?: string): string {
 export function sleep(ms: number): Promise<void> {
  return new Promise(resolve => setTimeout(resolve, ms))
 }
+
+/** 从 SWR error 中提取用户可见消息，过滤 abort 错误 */
+export function getSwrErrorMessage(err: unknown): string | undefined {
+  if (!err) return undefined
+  if (err instanceof DOMException && err.name === 'AbortError') return undefined
+  if (err instanceof Error) {
+    if (err.name === 'AbortError' || err.message?.includes('aborted')) return undefined
+    return err.message
+  }
+  return String(err)
+}
--- a/config/saas-development.toml
+++ b/config/saas-development.toml
@@ -0,0 +1,33 @@
+# ZCLAW SaaS 开发环境配置
+# 通过 ZCLAW_ENV=development 或默认使用此配置
+
+[server]
+host = "0.0.0.0"
+port = 8080
+cors_origins = []  # 空 = 开发模式允许所有来源
+
+[database]
+url = "postgres://postgres:123123@localhost:5432/zclaw"
+
+[auth]
+jwt_expiration_hours = 24
+totp_issuer = "ZCLAW SaaS (dev)"
+refresh_token_hours = 168
+
+[relay]
+max_queue_size = 1000
+max_concurrent_per_provider = 5
+batch_window_ms = 50
+retry_delay_ms = 1000
+max_attempts = 3
+
+[rate_limit]
+requests_per_minute = 120
+burst = 20
+
+[scheduler]
+jobs = [
+  { name = "cleanup_rate_limit", interval = "5m", task = "cleanup_rate_limit", run_on_start = false },
+  { name = "cleanup_refresh_tokens", interval = "1h", task = "cleanup_refresh_tokens", run_on_start = false },
+  { name = "cleanup_devices", interval = "24h", task = "cleanup_devices", run_on_start = false },
+]
--- a/config/saas-production.toml
+++ b/config/saas-production.toml
@@ -0,0 +1,35 @@
+# ZCLAW SaaS 生产环境配置
+# 通过 ZCLAW_ENV=production 使用此配置
+
+[server]
+host = "0.0.0.0"
+port = 8080
+# 生产环境必须配置 CORS 白名单
+cors_origins = ["https://admin.zclaw.ai", "https://zclaw.ai"]
+
+[database]
+# 生产环境通过 ZCLAW_DATABASE_URL 环境变量覆盖，此处为占位
+url = "postgres://zclaw:CHANGE_ME@db:5432/zclaw"
+
+[auth]
+jwt_expiration_hours = 12
+totp_issuer = "ZCLAW SaaS"
+refresh_token_hours = 168
+
+[relay]
+max_queue_size = 5000
+max_concurrent_per_provider = 10
+batch_window_ms = 50
+retry_delay_ms = 2000
+max_attempts = 3
+
+[rate_limit]
+requests_per_minute = 60
+burst = 10
+
+[scheduler]
+jobs = [
+  { name = "cleanup_rate_limit", interval = "5m", task = "cleanup_rate_limit", run_on_start = false },
+  { name = "cleanup_refresh_tokens", interval = "1h", task = "cleanup_refresh_tokens", run_on_start = false },
+  { name = "cleanup_devices", interval = "24h", task = "cleanup_devices", run_on_start = true },
+]
--- a/config/saas-test.toml
+++ b/config/saas-test.toml
@@ -0,0 +1,31 @@
+# ZCLAW SaaS 测试环境配置
+# 通过 ZCLAW_ENV=test 使用此配置
+
+[server]
+host = "127.0.0.1"
+port = 8090
+cors_origins = []
+
+[database]
+# 测试环境使用独立数据库
+url = "postgres://postgres:123123@localhost:5432/zclaw_test"
+
+[auth]
+jwt_expiration_hours = 1
+totp_issuer = "ZCLAW SaaS (test)"
+refresh_token_hours = 24
+
+[relay]
+max_queue_size = 100
+max_concurrent_per_provider = 2
+batch_window_ms = 10
+retry_delay_ms = 100
+max_attempts = 2
+
+[rate_limit]
+requests_per_minute = 200
+burst = 50
+
+[scheduler]
+# 测试环境不启动定时任务
+jobs = []
--- a/crates/zclaw-saas/Cargo.toml
+++ b/crates/zclaw-saas/Cargo.toml
@@ -14,6 +14,7 @@ zclaw-types = { workspace = true }
 tokio = { workspace = true }
 tokio-stream = { workspace = true }
 futures = { workspace = true }
+async-trait = { workspace = true }
 serde = { workspace = true }
 serde_json = { workspace = true }
 toml = { workspace = true }
--- a/crates/zclaw-saas/src/account/handlers.rs
+++ b/crates/zclaw-saas/src/account/handlers.rs
@@ -8,6 +8,7 @@ use crate::state::AppState;
 use crate::error::{SaasError, SaasResult};
 use crate::auth::types::AuthContext;
 use crate::auth::handlers::{log_operation, check_permission};
+use crate::models::{OperationLogRow, DashboardStatsRow, DashboardTodayRow};
 use super::{types::*, service};

 fn require_admin(ctx: &AuthContext) -> SaasResult<()> {
@@ -143,7 +144,7 @@ pub async fn list_operation_logs(
    let total: i64 = sqlx::query_scalar("SELECT COUNT(*) FROM operation_logs")
        .fetch_one(&state.db).await?;

-    let rows: Vec<(i64, Option<String>, String, Option<String>, Option<String>, Option<String>, Option<String>, String)> =
+    let rows: Vec<OperationLogRow> =
        sqlx::query_as(
            "SELECT id, account_id, action, target_type, target_id, details, ip_address, created_at
             FROM operation_logs ORDER BY created_at DESC LIMIT $1 OFFSET $2"
@@ -153,12 +154,12 @@ pub async fn list_operation_logs(
        .fetch_all(&state.db)
        .await?;

-    let items: Vec<serde_json::Value> = rows.into_iter().map(|(id, account_id, action, target_type, target_id, details, ip_address, created_at)| {
+    let items: Vec<serde_json::Value> = rows.into_iter().map(|r| {
        serde_json::json!({
-            "id": id, "account_id": account_id, "action": action,
-            "target_type": target_type, "target_id": target_id,
-            "details": details.and_then(|d| serde_json::from_str::<serde_json::Value>(&d).ok()),
-            "ip_address": ip_address, "created_at": created_at,
+            "id": r.id, "account_id": r.account_id, "action": r.action,
+            "target_type": r.target_type, "target_id": r.target_id,
+            "details": r.details.and_then(|d| serde_json::from_str::<serde_json::Value>(&d).ok()),
+            "ip_address": r.ip_address, "created_at": r.created_at,
        })
    }).collect();

@@ -173,33 +174,40 @@ pub async fn dashboard_stats(
    require_admin(&ctx)?;

    // 查询 1: 账号 + Provider + Model 聚合 (一次查询)
-    let stats_row: (i64, i64, i64, i64) = sqlx::query_as(
+    let stats_row: DashboardStatsRow = sqlx::query_as(
        "SELECT
            (SELECT COUNT(*) FROM accounts) as total_accounts,
            (SELECT COUNT(*) FROM accounts WHERE status = 'active') as active_accounts,
            (SELECT COUNT(*) FROM providers WHERE enabled = true) as active_providers,
            (SELECT COUNT(*) FROM models WHERE enabled = true) as active_models"
    ).fetch_one(&state.db).await?;
-    let (total_accounts, active_accounts, active_providers, active_models) = stats_row;

-    // 查询 2: 今日中转统计 (一次查询)
-    let today = chrono::Utc::now().format("%Y-%m-%d").to_string();
-    let today_row: (i64, i64, i64) = sqlx::query_as(
+    // 查询 2: 今日中转统计 — 使用范围查询走 B-tree 索引
+    let today_start = chrono::Utc::now()
+        .date_naive()
+        .and_hms_opt(0, 0, 0).unwrap()
+        .and_utc()
+        .to_rfc3339();
+    let tomorrow_start = (chrono::Utc::now() + chrono::Duration::days(1))
+        .date_naive()
+        .and_hms_opt(0, 0, 0).unwrap()
+        .and_utc()
+        .to_rfc3339();
+    let today_row: DashboardTodayRow = sqlx::query_as(
        "SELECT
-            (SELECT COUNT(*) FROM relay_tasks WHERE SUBSTRING(created_at, 1, 10) = $1) as tasks_today,
-            COALESCE((SELECT SUM(input_tokens) FROM usage_records WHERE SUBSTRING(created_at, 1, 10) = $1), 0) as tokens_input,
-            COALESCE((SELECT SUM(output_tokens) FROM usage_records WHERE SUBSTRING(created_at, 1, 10) = $1), 0) as tokens_output"
-    ).bind(&today).fetch_one(&state.db).await?;
-    let (tasks_today, tokens_today_input, tokens_today_output) = today_row;
+            (SELECT COUNT(*) FROM relay_tasks WHERE created_at >= $1 AND created_at < $2) as tasks_today,
+            COALESCE((SELECT SUM(input_tokens) FROM usage_records WHERE created_at >= $1 AND created_at < $2), 0) as tokens_input,
+            COALESCE((SELECT SUM(output_tokens) FROM usage_records WHERE created_at >= $1 AND created_at < $2), 0) as tokens_output"
+    ).bind(&today_start).bind(&tomorrow_start).fetch_one(&state.db).await?;

    Ok(Json(serde_json::json!({
-        "total_accounts": total_accounts,
-        "active_accounts": active_accounts,
-        "tasks_today": tasks_today,
-        "active_providers": active_providers,
-        "active_models": active_models,
-        "tokens_today_input": tokens_today_input,
-        "tokens_today_output": tokens_today_output,
+        "total_accounts": stats_row.total_accounts,
+        "active_accounts": stats_row.active_accounts,
+        "tasks_today": today_row.tasks_today,
+        "active_providers": stats_row.active_providers,
+        "active_models": stats_row.active_models,
+        "tokens_today_input": today_row.tokens_input,
+        "tokens_today_output": today_row.tokens_output,
    })))
 }

--- a/crates/zclaw-saas/src/account/service.rs
+++ b/crates/zclaw-saas/src/account/service.rs
@@ -3,6 +3,7 @@
 use sqlx::PgPool;
 use crate::error::{SaasError, SaasResult};
 use crate::common::{PaginatedResponse, normalize_pagination};
+use crate::models::{AccountRow, ApiTokenRow, DeviceRow};
 use super::types::*;

 pub async fn list_accounts(
@@ -56,7 +57,7 @@ pub async fn list_accounts(
         FROM accounts {} ORDER BY created_at DESC LIMIT ${} OFFSET ${}",
        where_sql, limit_idx, offset_idx
    );
-    let mut data_query = sqlx::query_as::<_, (String, String, String, String, String, String, bool, Option<String>, String)>(&data_sql);
+    let mut data_query = sqlx::query_as::<_, AccountRow>(&data_sql);
    for p in &params {
        data_query = data_query.bind(p);
    }
@@ -64,11 +65,11 @@ pub async fn list_accounts(

    let items: Vec<serde_json::Value> = rows
        .into_iter()
-        .map(|(id, username, email, display_name, role, status, totp_enabled, last_login_at, created_at)| {
+        .map(|r| {
            serde_json::json!({
-                "id": id, "username": username, "email": email, "display_name": display_name,
-                "role": role, "status": status, "totp_enabled": totp_enabled,
-                "last_login_at": last_login_at, "created_at": created_at,
+                "id": r.id, "username": r.username, "email": r.email, "display_name": r.display_name,
+                "role": r.role, "status": r.status, "totp_enabled": r.totp_enabled,
+                "last_login_at": r.last_login_at, "created_at": r.created_at,
            })
        })
        .collect();
@@ -77,7 +78,7 @@ pub async fn list_accounts(
 }

 pub async fn get_account(db: &PgPool, account_id: &str) -> SaasResult<serde_json::Value> {
-    let row: Option<(String, String, String, String, String, String, bool, Option<String>, String)> =
+    let row: Option<AccountRow> =
        sqlx::query_as(
            "SELECT id, username, email, display_name, role, status, totp_enabled, last_login_at, created_at
             FROM accounts WHERE id = $1"
@@ -86,13 +87,12 @@ pub async fn get_account(db: &PgPool, account_id: &str) -> SaasResult<serde_json
        .fetch_optional(db)
        .await?;

-    let (id, username, email, display_name, role, status, totp_enabled, last_login_at, created_at) =
-        row.ok_or_else(|| SaasError::NotFound(format!("账号 {} 不存在", account_id)))?;
+    let r = row.ok_or_else(|| SaasError::NotFound(format!("账号 {} 不存在", account_id)))?;

    Ok(serde_json::json!({
-        "id": id, "username": username, "email": email, "display_name": display_name,
-        "role": role, "status": status, "totp_enabled": totp_enabled,
-        "last_login_at": last_login_at, "created_at": created_at,
+        "id": r.id, "username": r.username, "email": r.email, "display_name": r.display_name,
+        "role": r.role, "status": r.status, "totp_enabled": r.totp_enabled,
+        "last_login_at": r.last_login_at, "created_at": r.created_at,
    }))
 }

@@ -212,7 +212,7 @@ pub async fn list_api_tokens(
    .fetch_one(db)
    .await?;

-    let rows: Vec<(String, String, String, String, Option<String>, Option<String>, String)> =
+    let rows: Vec<ApiTokenRow> =
        sqlx::query_as(
            "SELECT id, name, token_prefix, permissions, last_used_at, expires_at, created_at
             FROM api_tokens WHERE account_id = $1 AND revoked_at IS NULL ORDER BY created_at DESC LIMIT $2 OFFSET $3"
@@ -223,9 +223,9 @@ pub async fn list_api_tokens(
        .fetch_all(db)
        .await?;

-    let items = rows.into_iter().map(|(id, name, token_prefix, perms, last_used, expires, created)| {
-        let permissions: Vec<String> = serde_json::from_str(&perms).unwrap_or_default();
-        TokenInfo { id, name, token_prefix, permissions, last_used_at: last_used, expires_at: expires, created_at: created, token: None, }
+    let items = rows.into_iter().map(|r| {
+        let permissions: Vec<String> = serde_json::from_str(&r.permissions).unwrap_or_default();
+        TokenInfo { id: r.id, name: r.name, token_prefix: r.token_prefix, permissions, last_used_at: r.last_used_at, expires_at: r.expires_at, created_at: r.created_at, token: None, }
    }).collect();

    Ok(PaginatedResponse { items, total: total.0, page: p, page_size: ps })
@@ -246,7 +246,7 @@ pub async fn list_devices(
    .fetch_one(db)
    .await?;

-    let rows: Vec<(String, String, Option<String>, Option<String>, Option<String>, String, String)> =
+    let rows: Vec<DeviceRow> =
        sqlx::query_as(
            "SELECT id, device_id, device_name, platform, app_version, last_seen_at, created_at
             FROM devices WHERE account_id = $1 ORDER BY last_seen_at DESC LIMIT $2 OFFSET $3"
@@ -259,9 +259,9 @@ pub async fn list_devices(

    let items: Vec<serde_json::Value> = rows.into_iter().map(|r| {
        serde_json::json!({
-            "id": r.0, "device_id": r.1,
-            "device_name": r.2, "platform": r.3, "app_version": r.4,
-            "last_seen_at": r.5, "created_at": r.6,
+            "id": r.id, "device_id": r.device_id,
+            "device_name": r.device_name, "platform": r.platform, "app_version": r.app_version,
+            "last_seen_at": r.last_seen_at, "created_at": r.created_at,
        })
    }).collect();

--- a/crates/zclaw-saas/src/auth/handlers.rs
+++ b/crates/zclaw-saas/src/auth/handlers.rs
@@ -5,6 +5,7 @@ use std::net::SocketAddr;
 use secrecy::ExposeSecret;
 use crate::state::AppState;
 use crate::error::{SaasError, SaasResult};
+use crate::models::{AccountAuthRow, AccountLoginRow};
 use super::{
    jwt::{create_token, create_refresh_token, verify_token, verify_token_skip_expiry},
    password::{hash_password, verify_password},
@@ -79,7 +80,7 @@ pub async fn register(
    log_operation(&state.db, &account_id, "account.create", "account", &account_id, None, Some(&client_ip)).await?;

    // 注册成功后自动签发 JWT + Refresh Token
-    let permissions = get_role_permissions(&state.db, &role).await?;
+    let permissions = get_role_permissions(&state.db, &state.role_permissions_cache, &role).await?;
    let config = state.config.read().await;
    let token = create_token(
        &account_id, &role, permissions.clone(),
@@ -120,46 +121,33 @@ pub async fn login(
    ConnectInfo(addr): ConnectInfo<SocketAddr>,
    Json(req): Json<LoginRequest>,
 ) -> SaasResult<Json<LoginResponse>> {
-    let row: Option<(String, String, String, String, String, String, bool, String)> =
+    // 一次查询获取用户信息 + password_hash + totp_secret（合并原来的 3 次查询）
+    let row: Option<AccountLoginRow> =
        sqlx::query_as(
-            "SELECT id, username, email, display_name, role, status, totp_enabled, created_at
+            "SELECT id, username, email, display_name, role, status, totp_enabled,
+                    password_hash, totp_secret, created_at
             FROM accounts WHERE username = $1 OR email = $1"
        )
        .bind(&req.username)
        .fetch_optional(&state.db)
        .await?;

-    let (id, username, email, display_name, role, status, totp_enabled, created_at) =
-        row.ok_or_else(|| SaasError::AuthError("用户名或密码错误".into()))?;
+    let r = row.ok_or_else(|| SaasError::AuthError("用户名或密码错误".into()))?;

-    if status != "active" {
-        return Err(SaasError::Forbidden(format!("账号已{}，请联系管理员", status)));
+    if r.status != "active" {
+        return Err(SaasError::Forbidden(format!("账号已{}，请联系管理员", r.status)));
    }

-    let (password_hash,): (String,) = sqlx::query_as(
-        "SELECT password_hash FROM accounts WHERE id = $1"
-    )
-    .bind(&id)
-    .fetch_one(&state.db)
-    .await?;
-
-    if !verify_password(&req.password, &password_hash)? {
+    if !verify_password(&req.password, &r.password_hash)? {
        return Err(SaasError::AuthError("用户名或密码错误".into()));
    }

    // TOTP 验证: 如果用户已启用 2FA，必须提供有效 TOTP 码
-    if totp_enabled {
+    if r.totp_enabled {
        let code = req.totp_code.as_deref()
            .ok_or_else(|| SaasError::Totp("此账号已启用双因素认证，请提供 TOTP 码".into()))?;

-        let (totp_secret,): (Option<String>,) = sqlx::query_as(
-            "SELECT totp_secret FROM accounts WHERE id = $1"
-        )
-        .bind(&id)
-        .fetch_one(&state.db)
-        .await?;
-
-        let secret = totp_secret.ok_or_else(|| {
+        let secret = r.totp_secret.clone().ok_or_else(|| {
            SaasError::Internal("TOTP 已启用但密钥丢失，请联系管理员".into())
        })?;

@@ -174,15 +162,15 @@ pub async fn login(
        }
    }

-    let permissions = get_role_permissions(&state.db, &role).await?;
+    let permissions = get_role_permissions(&state.db, &state.role_permissions_cache, &r.role).await?;
    let config = state.config.read().await;
    let token = create_token(
-        &id, &role, permissions.clone(),
+        &r.id, &r.role, permissions.clone(),
        state.jwt_secret.expose_secret(),
        config.auth.jwt_expiration_hours,
    )?;
    let refresh_token = create_refresh_token(
-        &id, &role, permissions,
+        &r.id, &r.role, permissions,
        state.jwt_secret.expose_secret(),
        config.auth.refresh_token_hours,
    )?;
@@ -190,13 +178,13 @@ pub async fn login(

    let now = chrono::Utc::now().to_rfc3339();
    sqlx::query("UPDATE accounts SET last_login_at = $1 WHERE id = $2")
-        .bind(&now).bind(&id)
+        .bind(&now).bind(&r.id)
        .execute(&state.db).await?;
    let client_ip = addr.ip().to_string();
-    log_operation(&state.db, &id, "account.login", "account", &id, None, Some(&client_ip)).await?;
+    log_operation(&state.db, &r.id, "account.login", "account", &r.id, None, Some(&client_ip)).await?;

    store_refresh_token(
-        &state.db, &id, &refresh_token,
+        &state.db, &r.id, &refresh_token,
        state.jwt_secret.expose_secret(), 168,
    ).await?;

@@ -204,7 +192,8 @@ pub async fn login(
        token,
        refresh_token,
        account: AccountPublic {
-            id, username, email, display_name, role, status, totp_enabled, created_at,
+            id: r.id, username: r.username, email: r.email, display_name: r.display_name,
+            role: r.role, status: r.status, totp_enabled: r.totp_enabled, created_at: r.created_at,
        },
    }))
 }
@@ -260,7 +249,7 @@ pub async fn refresh(
    .await?
    .ok_or_else(|| SaasError::AuthError("账号不存在或已禁用".into()))?;

-    let permissions = get_role_permissions(&state.db, &role).await?;
+    let permissions = get_role_permissions(&state.db, &state.role_permissions_cache, &role).await?;

    // 7. 创建新的 access token + refresh token
    let config = state.config.read().await;
@@ -289,8 +278,8 @@ pub async fn refresh(
    .bind(sha256_hex(&new_refresh)).bind(&refresh_expires).bind(&now)
    .execute(&state.db).await?;

-    // 9. 清理过期/已使用的 refresh tokens (异步, 不阻塞)
-    cleanup_expired_refresh_tokens(&state.db).await?;
+    // 9. 清理过期/已使用的 refresh tokens 已迁移到 Scheduler 定期执行
+    // 不再在每次 refresh 时阻塞请求

    Ok(Json(serde_json::json!({
        "token": new_access,
@@ -303,7 +292,7 @@ pub async fn me(
    State(state): State<AppState>,
    axum::extract::Extension(ctx): axum::extract::Extension<AuthContext>,
 ) -> SaasResult<Json<AccountPublic>> {
-    let row: Option<(String, String, String, String, String, String, bool, String)> =
+    let row: Option<AccountAuthRow> =
        sqlx::query_as(
            "SELECT id, username, email, display_name, role, status, totp_enabled, created_at
             FROM accounts WHERE id = $1"
@@ -312,11 +301,11 @@ pub async fn me(
        .fetch_optional(&state.db)
        .await?;

-    let (id, username, email, display_name, role, status, totp_enabled, created_at) =
-        row.ok_or_else(|| SaasError::NotFound("账号不存在".into()))?;
+    let r = row.ok_or_else(|| SaasError::NotFound("账号不存在".into()))?;

    Ok(Json(AccountPublic {
-        id, username, email, display_name, role, status, totp_enabled, created_at,
+        id: r.id, username: r.username, email: r.email, display_name: r.display_name,
+        role: r.role, status: r.status, totp_enabled: r.totp_enabled, created_at: r.created_at,
    }))
 }

@@ -359,7 +348,16 @@ pub async fn change_password(
    Ok(Json(serde_json::json!({"ok": true, "message": "密码修改成功"})))
 }

-pub(crate) async fn get_role_permissions(db: &sqlx::PgPool, role: &str) -> SaasResult<Vec<String>> {
+pub(crate) async fn get_role_permissions(
+    db: &sqlx::PgPool,
+    cache: &dashmap::DashMap<String, Vec<String>>,
+    role: &str,
+) -> SaasResult<Vec<String>> {
+    // Check cache first
+    if let Some(cached) = cache.get(role) {
+        return Ok(cached.clone());
+    }
+
    let row: Option<(String,)> = sqlx::query_as(
        "SELECT permissions FROM roles WHERE id = $1"
    )
@@ -372,6 +370,7 @@ pub(crate) async fn get_role_permissions(db: &sqlx::PgPool, role: &str) -> SaasR
        .0;

    let permissions: Vec<String> = serde_json::from_str(&permissions_str)?;
+    cache.insert(role.to_string(), permissions.clone());
    Ok(permissions)
 }

@@ -438,6 +437,8 @@ async fn store_refresh_token(
 }

 /// 清理过期和已使用的 refresh tokens
+/// 注意: 现已迁移到 Worker/Scheduler 定期执行，此函数保留作为备用
+#[allow(dead_code)]
 async fn cleanup_expired_refresh_tokens(db: &sqlx::PgPool) -> SaasResult<()> {
    let now = chrono::Utc::now().to_rfc3339();
    // 删除过期超过 30 天的已使用 token (减少 DB 膨胀)
--- a/crates/zclaw-saas/src/auth/mod.rs
+++ b/crates/zclaw-saas/src/auth/mod.rs
@@ -58,7 +58,7 @@ async fn verify_api_token(state: &AppState, raw_token: &str, client_ip: Option<S
    .ok_or(SaasError::Unauthorized)?;

    // 合并 token 权限与角色权限（去重）
-    let role_permissions = handlers::get_role_permissions(&state.db, &role).await?;
+    let role_permissions = handlers::get_role_permissions(&state.db, &state.role_permissions_cache, &role).await?;
    let token_permissions: Vec<String> = serde_json::from_str(&permissions_json).unwrap_or_default();
    let mut permissions = role_permissions;
    for p in token_permissions {
--- a/crates/zclaw-saas/src/config.rs
+++ b/crates/zclaw-saas/src/config.rs
@@ -14,6 +14,37 @@ pub struct SaaSConfig {
    pub relay: RelayConfig,
    #[serde(default)]
    pub rate_limit: RateLimitConfig,
+    #[serde(default)]
+    pub scheduler: SchedulerConfig,
+}
+
+/// Scheduler 定时任务配置
+#[derive(Debug, Clone, Serialize, Deserialize)]
+pub struct SchedulerConfig {
+    #[serde(default)]
+    pub jobs: Vec<JobConfig>,
+}
+
+/// 单个定时任务配置
+#[derive(Debug, Clone, Serialize, Deserialize)]
+pub struct JobConfig {
+    pub name: String,
+    /// 间隔时间，支持 "5m", "1h", "24h", "30s" 格式
+    pub interval: String,
+    /// 对应的 Worker 名称
+    pub task: String,
+    /// 传递给 Worker 的参数（JSON 格式）
+    #[serde(default)]
+    pub args: Option<serde_json::Value>,
+    /// 是否在启动时立即执行
+    #[serde(default)]
+    pub run_on_start: bool,
+}
+
+impl Default for SchedulerConfig {
+    fn default() -> Self {
+        Self { jobs: Vec::new() }
+    }
 }

 /// 服务器配置
@@ -51,8 +82,10 @@ pub struct AuthConfig {
 pub struct RelayConfig {
    #[serde(default = "default_max_queue")]
    pub max_queue_size: usize,
+    // TODO: implement per-provider concurrency limiting
    #[serde(default = "default_max_concurrent")]
    pub max_concurrent_per_provider: usize,
+    // TODO: implement batch window
    #[serde(default = "default_batch_window")]
    pub batch_window_ms: u64,
    #[serde(default = "default_retry_delay")]
@@ -104,6 +137,7 @@ impl Default for SaaSConfig {
            auth: AuthConfig::default(),
            relay: RelayConfig::default(),
            rate_limit: RateLimitConfig::default(),
+            scheduler: SchedulerConfig::default(),
        }
    }
 }
@@ -147,11 +181,31 @@ impl Default for RelayConfig {
 }

 impl SaaSConfig {
-    /// 加载配置文件，优先级: 环境变量 > ZCLAW_SAAS_CONFIG > ./saas-config.toml
+    /// 加载配置文件，优先级: ZCLAW_SAAS_CONFIG > ZCLAW_ENV > ./saas-config.toml
+    ///
+    /// ZCLAW_ENV 环境选择:
+    ///   development → config/saas-development.toml
+    ///   production  → config/saas-production.toml
+    ///   test        → config/saas-test.toml
+    ///
+    /// ZCLAW_SAAS_CONFIG 指定精确路径（最高优先级）
    pub fn load() -> anyhow::Result<Self> {
-        let config_path = std::env::var("ZCLAW_SAAS_CONFIG")
-            .map(PathBuf::from)
-            .unwrap_or_else(|_| PathBuf::from("saas-config.toml"));
+        let config_path = if let Ok(path) = std::env::var("ZCLAW_SAAS_CONFIG") {
+            PathBuf::from(path)
+        } else if let Ok(env) = std::env::var("ZCLAW_ENV") {
+            let filename = format!("config/saas-{}.toml", env);
+            let path = PathBuf::from(&filename);
+            if !path.exists() {
+                anyhow::bail!(
+                    "ZCLAW_ENV={} 指定的配置文件 {} 不存在",
+                    env, filename
+                );
+            }
+            tracing::info!("Loading config for environment: {}", env);
+            path
+        } else {
+            PathBuf::from("saas-config.toml")
+        };

        let mut config = if config_path.exists() {
            let content = std::fs::read_to_string(&config_path)?;
--- a/crates/zclaw-saas/src/db.rs
+++ b/crates/zclaw-saas/src/db.rs
@@ -4,7 +4,7 @@ use sqlx::postgres::PgPoolOptions;
 use sqlx::PgPool;
 use crate::error::SaasResult;

-const SCHEMA_VERSION: i32 = 4;
+const SCHEMA_VERSION: i32 = 5;

 const SCHEMA_SQL: &str = r#"
 CREATE TABLE IF NOT EXISTS saas_schema_version (
@@ -337,6 +337,11 @@ CREATE TABLE IF NOT EXISTS refresh_tokens (
 CREATE INDEX IF NOT EXISTS idx_refresh_account ON refresh_tokens(account_id);
 CREATE INDEX IF NOT EXISTS idx_refresh_jti ON refresh_tokens(jti);
 CREATE INDEX IF NOT EXISTS idx_refresh_expires ON refresh_tokens(expires_at);
+
+-- Performance: expression indexes for date-range queries on TEXT timestamp columns
+CREATE INDEX IF NOT EXISTS idx_usage_day ON usage_records((SUBSTRING(created_at, 1, 10)));
+CREATE INDEX IF NOT EXISTS idx_relay_day ON relay_tasks((SUBSTRING(created_at, 1, 10)));
+CREATE INDEX IF NOT EXISTS idx_relay_time ON relay_tasks(created_at);
 "#;

 const SEED_ROLES: &str = r#"
@@ -351,10 +356,11 @@ ON CONFLICT (id) DO NOTHING;
 /// 初始化数据库
 pub async fn init_db(database_url: &str) -> SaasResult<PgPool> {
    let pool = PgPoolOptions::new()
-        .max_connections(20)
-        .min_connections(2)
-        .acquire_timeout(std::time::Duration::from_secs(5))
-        .idle_timeout(std::time::Duration::from_secs(600))
+        .max_connections(50)
+        .min_connections(5)
+        .acquire_timeout(std::time::Duration::from_secs(10))
+        .idle_timeout(std::time::Duration::from_secs(300))
+        .max_lifetime(std::time::Duration::from_secs(1800))
        .connect(database_url)
        .await?;

@@ -387,7 +393,7 @@ pub async fn init_db(database_url: &str) -> SaasResult<PgPool> {

 /// 如果 accounts 表为空且环境变量已设置，自动创建 super_admin 账号
 /// 或者更新现有 admin 用户的角色为 super_admin
-async fn seed_admin_account(pool: &PgPool) -> SaasResult<()> {
+pub async fn seed_admin_account(pool: &PgPool) -> SaasResult<()> {
    let admin_username = std::env::var("ZCLAW_ADMIN_USERNAME")
        .unwrap_or_else(|_| "admin".to_string());
    
--- a/crates/zclaw-saas/src/lib.rs
+++ b/crates/zclaw-saas/src/lib.rs
@@ -8,7 +8,11 @@ pub mod crypto;
 pub mod db;
 pub mod error;
 pub mod middleware;
+pub mod models;
+pub mod scheduler;
 pub mod state;
+pub mod tasks;
+pub mod workers;

 pub mod auth;
 pub mod account;
--- a/crates/zclaw-saas/src/main.rs
+++ b/crates/zclaw-saas/src/main.rs
@@ -1,8 +1,15 @@
 //! ZCLAW SaaS 服务入口

 use axum::extract::State;
+use tower_http::timeout::TimeoutLayer;
 use tracing::info;
 use zclaw_saas::{config::SaaSConfig, db::init_db, state::AppState};
+use zclaw_saas::workers::WorkerDispatcher;
+use zclaw_saas::workers::log_operation::LogOperationWorker;
+use zclaw_saas::workers::cleanup_refresh_tokens::CleanupRefreshTokensWorker;
+use zclaw_saas::workers::cleanup_rate_limit::CleanupRateLimitWorker;
+use zclaw_saas::workers::record_usage::RecordUsageWorker;
+use zclaw_saas::workers::update_last_used::UpdateLastUsedWorker;

 #[tokio::main]
 async fn main() -> anyhow::Result<()> {
@@ -19,10 +26,34 @@ async fn main() -> anyhow::Result<()> {
    let db = init_db(&config.database.url).await?;
    info!("Database initialized");

-    let state = AppState::new(db, config.clone())?;
+    // 初始化 Worker 调度器 + 注册所有 Worker
+    let mut dispatcher = WorkerDispatcher::new(db.clone());
+    dispatcher.register(LogOperationWorker);
+    dispatcher.register(CleanupRefreshTokensWorker);
+    dispatcher.register(CleanupRateLimitWorker);
+    dispatcher.register(RecordUsageWorker);
+    dispatcher.register(UpdateLastUsedWorker);
+    info!("Worker dispatcher initialized (5 workers registered)");

-    // 后台定时任务
-    spawn_background_tasks(state.clone());
+    let state = AppState::new(db.clone(), config.clone(), dispatcher)?;
+
+    // 启动声明式 Scheduler（从 TOML 配置读取定时任务）
+    let scheduler_config = &config.scheduler;
+    zclaw_saas::scheduler::start_scheduler(scheduler_config, db.clone(), state.worker_dispatcher.clone_ref());
+    info!("Scheduler started with {} jobs", scheduler_config.jobs.len());
+
+    // 启动内置 DB 清理任务（设备清理等不通过 Worker 的任务）
+    zclaw_saas::scheduler::start_db_cleanup_tasks(db.clone());
+
+    // 启动内存中的 rate limit 条目清理
+    let rate_limit_state = state.clone();
+    tokio::spawn(async move {
+        let mut interval = tokio::time::interval(std::time::Duration::from_secs(300));
+        loop {
+            interval.tick().await;
+            rate_limit_state.cleanup_rate_limit_entries();
+        }
+    });

    let app = build_router(state).await;

@@ -51,43 +82,6 @@ async fn health_handler(State(state): State<AppState>) -> axum::Json<serde_json:
    }))
 }

-/// 启动后台定时任务
-fn spawn_background_tasks(state: AppState) {
-    // 每 5 分钟清理过期的限流条目
-    let rate_limit_state = state.clone();
-    tokio::spawn(async move {
-        let mut interval = tokio::time::interval(std::time::Duration::from_secs(300));
-        loop {
-            interval.tick().await;
-            rate_limit_state.cleanup_rate_limit_entries();
-        }
-    });
-
-    // 每 24 小时清理 90 天未活跃的设备
-    // 注意: last_seen_at 为 TEXT 类型，使用 rfc3339 字符串比较（字典序等价于时间序）
-    let cleanup_state = state.clone();
-    tokio::spawn(async move {
-        let mut interval = tokio::time::interval(std::time::Duration::from_secs(86400));
-        loop {
-            interval.tick().await;
-            let cutoff = (chrono::Utc::now() - chrono::Duration::days(90)).to_rfc3339();
-            match sqlx::query("DELETE FROM devices WHERE last_seen_at < $1")
-                .bind(&cutoff)
-                .execute(&cleanup_state.db)
-                .await
-            {
-                Ok(result) if result.rows_affected() > 0 => {
-                    info!("Cleaned up {} stale devices", result.rows_affected());
-                }
-                Err(e) => {
-                    tracing::warn!("Failed to cleanup stale devices: {}", e);
-                }
-                _ => {}
-            }
-        }
-    });
-}
-
 async fn build_router(state: AppState) -> axum::Router {
    use axum::middleware;
    use tower_http::cors::{Any, CorsLayer};
@@ -163,6 +157,7 @@ async fn build_router(state: AppState) -> axum::Router {
    axum::Router::new()
        .merge(public_routes)
        .merge(protected_routes)
+        .layer(TimeoutLayer::new(std::time::Duration::from_secs(30)))
        .layer(TraceLayer::new_for_http())
        .layer(cors)
        .with_state(state)
--- a/crates/zclaw-saas/src/middleware.rs
+++ b/crates/zclaw-saas/src/middleware.rs
@@ -58,10 +58,10 @@ pub async fn rate_limit_middleware(
        .get::<AuthContext>()
        .map(|ctx| ctx.account_id.clone())
        .unwrap_or_else(|| "anonymous".to_string());
-    
-    let config = state.config.read().await;
-    let rate_limit = config.rate_limit.requests_per_minute as usize;
-    
+
+    // 无锁读取 rate limit 配置（避免每个请求获取 RwLock）
+    let rate_limit = state.rate_limit_rpm() as usize;
+
    let key = format!("rate_limit:{}", account_id);
    
    let now = Instant::now();
--- a/crates/zclaw-saas/src/migration/handlers.rs
+++ b/crates/zclaw-saas/src/migration/handlers.rs
@@ -124,7 +124,7 @@ pub async fn sync_config(
 /// 计算客户端与 SaaS 端的配置差异 (不修改数据)
 pub async fn config_diff(
    State(state): State<AppState>,
-    Extension(ctx): Extension<AuthContext>,
+    Extension(_ctx): Extension<AuthContext>,
    Json(req): Json<SyncConfigRequest>,
 ) -> SaasResult<Json<ConfigDiffResponse>> {
    // diff 操作虽然不修改数据，但涉及敏感配置信息，仍需认证用户
--- a/crates/zclaw-saas/src/migration/service.rs
+++ b/crates/zclaw-saas/src/migration/service.rs
@@ -3,6 +3,7 @@
 use sqlx::PgPool;
 use crate::error::{SaasError, SaasResult};
 use crate::common::{PaginatedResponse, normalize_pagination};
+use crate::models::{ConfigItemRow, ConfigSyncLogRow};
 use super::types::*;
 use serde::Serialize;

@@ -31,7 +32,7 @@ pub(crate) async fn fetch_all_config_items(
        }
    };

-    let mut query_builder = sqlx::query_as::<_, (String, String, String, String, Option<String>, Option<String>, String, Option<String>, bool, String, String)>(sql);
+    let mut query_builder = sqlx::query_as::<_, ConfigItemRow>(sql);

    if let Some(cat) = &query.category {
        query_builder = query_builder.bind(cat);
@@ -41,8 +42,8 @@ pub(crate) async fn fetch_all_config_items(
    }

    let rows = query_builder.fetch_all(db).await?;
-    Ok(rows.into_iter().map(|(id, category, key_path, value_type, current_value, default_value, source, description, requires_restart, created_at, updated_at)| {
-        ConfigItemInfo { id, category, key_path, value_type, current_value, default_value, source, description, requires_restart, created_at, updated_at }
+    Ok(rows.into_iter().map(|r| {
+        ConfigItemInfo { id: r.id, category: r.category, key_path: r.key_path, value_type: r.value_type, current_value: r.current_value, default_value: r.default_value, source: r.source, description: r.description, requires_restart: r.requires_restart, created_at: r.created_at, updated_at: r.updated_at }
    }).collect())
 }

@@ -81,20 +82,20 @@ pub async fn list_config_items(
    if has_source { count_query = count_query.bind(&query.source); }
    let total: i64 = count_query.fetch_one(db).await?;

-    let mut data_query = sqlx::query_as::<_, (String, String, String, String, Option<String>, Option<String>, String, Option<String>, bool, String, String)>(&data_sql);
+    let mut data_query = sqlx::query_as::<_, ConfigItemRow>(&data_sql);
    if has_category { data_query = data_query.bind(&query.category); }
    if has_source { data_query = data_query.bind(&query.source); }
    let rows = data_query.bind(ps as i64).bind(offset).fetch_all(db).await?;

-    let items = rows.into_iter().map(|(id, category, key_path, value_type, current_value, default_value, source, description, requires_restart, created_at, updated_at)| {
-        ConfigItemInfo { id, category, key_path, value_type, current_value, default_value, source, description, requires_restart, created_at, updated_at }
+    let items = rows.into_iter().map(|r| {
+        ConfigItemInfo { id: r.id, category: r.category, key_path: r.key_path, value_type: r.value_type, current_value: r.current_value, default_value: r.default_value, source: r.source, description: r.description, requires_restart: r.requires_restart, created_at: r.created_at, updated_at: r.updated_at }
    }).collect();

    Ok(PaginatedResponse { items, total, page: p, page_size: ps })
 }

 pub async fn get_config_item(db: &PgPool, item_id: &str) -> SaasResult<ConfigItemInfo> {
-    let row: Option<(String, String, String, String, Option<String>, Option<String>, String, Option<String>, bool, String, String)> =
+    let row: Option<ConfigItemRow> =
        sqlx::query_as(
            "SELECT id, category, key_path, value_type, current_value, default_value, source, description, requires_restart, created_at, updated_at
             FROM config_items WHERE id = $1"
@@ -103,10 +104,9 @@ pub async fn get_config_item(db: &PgPool, item_id: &str) -> SaasResult<ConfigIte
        .fetch_optional(db)
        .await?;

-    let (id, category, key_path, value_type, current_value, default_value, source, description, requires_restart, created_at, updated_at) =
-        row.ok_or_else(|| SaasError::NotFound(format!("配置项 {} 不存在", item_id)))?;
+    let r = row.ok_or_else(|| SaasError::NotFound(format!("配置项 {} 不存在", item_id)))?;

-    Ok(ConfigItemInfo { id, category, key_path, value_type, current_value, default_value, source, description, requires_restart, created_at, updated_at })
+    Ok(ConfigItemInfo { id: r.id, category: r.category, key_path: r.key_path, value_type: r.value_type, current_value: r.current_value, default_value: r.default_value, source: r.source, description: r.description, requires_restart: r.requires_restart, created_at: r.created_at, updated_at: r.updated_at })
 }

 pub async fn create_config_item(
@@ -451,7 +451,7 @@ pub async fn list_sync_logs(
    .fetch_one(db)
    .await?;

-    let rows: Vec<(i64, String, String, String, String, Option<String>, Option<String>, Option<String>, String)> =
+    let rows: Vec<ConfigSyncLogRow> =
        sqlx::query_as(
            "SELECT id, account_id, client_fingerprint, action, config_keys, client_values, saas_values, resolution, created_at
             FROM config_sync_log WHERE account_id = $1 ORDER BY created_at DESC LIMIT $2 OFFSET $3"
@@ -462,8 +462,8 @@ pub async fn list_sync_logs(
        .fetch_all(db)
        .await?;

-    let items = rows.into_iter().map(|(id, account_id, client_fingerprint, action, config_keys, client_values, saas_values, resolution, created_at)| {
-        ConfigSyncLogInfo { id, account_id, client_fingerprint, action, config_keys, client_values, saas_values, resolution, created_at }
+    let items = rows.into_iter().map(|r| {
+        ConfigSyncLogInfo { id: r.id, account_id: r.account_id, client_fingerprint: r.client_fingerprint, action: r.action, config_keys: r.config_keys, client_values: r.client_values, saas_values: r.saas_values, resolution: r.resolution, created_at: r.created_at }
    }).collect();

    Ok(crate::common::PaginatedResponse { items, total: total.0, page, page_size })
--- a/crates/zclaw-saas/src/model_config/service.rs
+++ b/crates/zclaw-saas/src/model_config/service.rs
@@ -4,6 +4,7 @@ use sqlx::{PgPool, Row};
 use crate::error::{SaasError, SaasResult};
 use crate::common::{PaginatedResponse, normalize_pagination};
 use crate::crypto;
+use crate::models::{ProviderRow, ModelRow, AccountApiKeyRow, UsageByModelRow, UsageByDayRow};
 use super::types::*;

 // ============ Providers ============
@@ -33,7 +34,7 @@ pub async fn list_providers(
        sqlx::query_as(count_sql).fetch_one(db).await?
    };

-    let rows: Vec<(String, String, String, String, String, bool, Option<i64>, Option<i64>, String, String)> =
+    let rows: Vec<ProviderRow> =
        if let Some(en) = enabled_filter {
            sqlx::query_as(data_sql)
                .bind(en).bind(ps as i64).bind(offset)
@@ -44,15 +45,15 @@ pub async fn list_providers(
                .fetch_all(db).await?
        };

-    let items = rows.into_iter().map(|(id, name, display_name, base_url, api_protocol, enabled, rpm, tpm, created_at, updated_at)| {
-        ProviderInfo { id, name, display_name, base_url, api_protocol, enabled, rate_limit_rpm: rpm, rate_limit_tpm: tpm, created_at, updated_at }
+    let items = rows.into_iter().map(|r| {
+        ProviderInfo { id: r.id, name: r.name, display_name: r.display_name, base_url: r.base_url, api_protocol: r.api_protocol, enabled: r.enabled, rate_limit_rpm: r.rate_limit_rpm, rate_limit_tpm: r.rate_limit_tpm, created_at: r.created_at, updated_at: r.updated_at }
    }).collect();

    Ok(PaginatedResponse { items, total: total.0, page: p, page_size: ps })
 }

 pub async fn get_provider(db: &PgPool, provider_id: &str) -> SaasResult<ProviderInfo> {
-    let row: Option<(String, String, String, String, String, bool, Option<i64>, Option<i64>, String, String)> =
+    let row: Option<ProviderRow> =
        sqlx::query_as(
            "SELECT id, name, display_name, base_url, api_protocol, enabled, rate_limit_rpm, rate_limit_tpm, created_at, updated_at
             FROM providers WHERE id = $1"
@@ -61,10 +62,9 @@ pub async fn get_provider(db: &PgPool, provider_id: &str) -> SaasResult<Provider
        .fetch_optional(db)
        .await?;

-    let (id, name, display_name, base_url, api_protocol, enabled, rpm, tpm, created_at, updated_at) =
-        row.ok_or_else(|| SaasError::NotFound(format!("Provider {} 不存在", provider_id)))?;
+    let r = row.ok_or_else(|| SaasError::NotFound(format!("Provider {} 不存在", provider_id)))?;

-    Ok(ProviderInfo { id, name, display_name, base_url, api_protocol, enabled, rate_limit_rpm: rpm, rate_limit_tpm: tpm, created_at, updated_at })
+    Ok(ProviderInfo { id: r.id, name: r.name, display_name: r.display_name, base_url: r.base_url, api_protocol: r.api_protocol, enabled: r.enabled, rate_limit_rpm: r.rate_limit_rpm, rate_limit_tpm: r.rate_limit_tpm, created_at: r.created_at, updated_at: r.updated_at })
 }

 pub async fn create_provider(db: &PgPool, req: &CreateProviderRequest, enc_key: &[u8; 32]) -> SaasResult<ProviderInfo> {
@@ -175,14 +175,14 @@ pub async fn list_models(
        sqlx::query_as(count_sql).fetch_one(db).await?
    };

-    let mut query = sqlx::query_as::<_, (String, String, String, String, i64, i64, bool, bool, bool, f64, f64, String, String)>(data_sql);
+    let mut query = sqlx::query_as::<_, ModelRow>(data_sql);
    if let Some(pid) = provider_id {
        query = query.bind(pid);
    }
    let rows = query.bind(ps as i64).bind(offset).fetch_all(db).await?;

-    let items = rows.into_iter().map(|(id, provider_id, model_id, alias, ctx, max_out, streaming, vision, enabled, pi, po, created_at, updated_at)| {
-        ModelInfo { id, provider_id, model_id, alias, context_window: ctx, max_output_tokens: max_out, supports_streaming: streaming, supports_vision: vision, enabled, pricing_input: pi, pricing_output: po, created_at, updated_at }
+    let items = rows.into_iter().map(|r| {
+        ModelInfo { id: r.id, provider_id: r.provider_id, model_id: r.model_id, alias: r.alias, context_window: r.context_window, max_output_tokens: r.max_output_tokens, supports_streaming: r.supports_streaming, supports_vision: r.supports_vision, enabled: r.enabled, pricing_input: r.pricing_input, pricing_output: r.pricing_output, created_at: r.created_at, updated_at: r.updated_at }
    }).collect();

    Ok(PaginatedResponse { items, total: total.0, page: p, page_size: ps })
@@ -227,7 +227,7 @@ pub async fn create_model(db: &PgPool, req: &CreateModelRequest) -> SaasResult<M
 }

 pub async fn get_model(db: &PgPool, model_id: &str) -> SaasResult<ModelInfo> {
-    let row: Option<(String, String, String, String, i64, i64, bool, bool, bool, f64, f64, String, String)> =
+    let row: Option<ModelRow> =
        sqlx::query_as(
            "SELECT id, provider_id, model_id, alias, context_window, max_output_tokens, supports_streaming, supports_vision, enabled, pricing_input, pricing_output, created_at, updated_at
             FROM models WHERE id = $1"
@@ -236,10 +236,9 @@ pub async fn get_model(db: &PgPool, model_id: &str) -> SaasResult<ModelInfo> {
        .fetch_optional(db)
        .await?;

-    let (id, provider_id, model_id, alias, ctx, max_out, streaming, vision, enabled, pi, po, created_at, updated_at) =
-        row.ok_or_else(|| SaasError::NotFound(format!("模型 {} 不存在", model_id)))?;
+    let r = row.ok_or_else(|| SaasError::NotFound(format!("模型 {} 不存在", model_id)))?;

-    Ok(ModelInfo { id, provider_id, model_id, alias, context_window: ctx, max_output_tokens: max_out, supports_streaming: streaming, supports_vision: vision, enabled, pricing_input: pi, pricing_output: po, created_at, updated_at })
+    Ok(ModelInfo { id: r.id, provider_id: r.provider_id, model_id: r.model_id, alias: r.alias, context_window: r.context_window, max_output_tokens: r.max_output_tokens, supports_streaming: r.supports_streaming, supports_vision: r.supports_vision, enabled: r.enabled, pricing_input: r.pricing_input, pricing_output: r.pricing_output, created_at: r.created_at, updated_at: r.updated_at })
 }

 pub async fn update_model(
@@ -319,17 +318,17 @@ pub async fn list_account_api_keys(
        sqlx::query_as(count_sql).bind(account_id).fetch_one(db).await?
    };

-    let mut query = sqlx::query_as::<_, (String, String, Option<String>, String, bool, Option<String>, String, String)>(data_sql)
+    let mut query = sqlx::query_as::<_, AccountApiKeyRow>(data_sql)
        .bind(account_id);
    if let Some(pid) = provider_id {
        query = query.bind(pid);
    }
    let rows = query.bind(ps as i64).bind(offset).fetch_all(db).await?;

-    let items = rows.into_iter().map(|(id, provider_id, key_label, perms, enabled, last_used, created_at, key_value)| {
-        let permissions: Vec<String> = serde_json::from_str(&perms).unwrap_or_default();
-        let masked = mask_api_key(&key_value);
-        AccountApiKeyInfo { id, provider_id, key_label, permissions, enabled, last_used_at: last_used, created_at, masked_key: masked }
+    let items = rows.into_iter().map(|r| {
+        let permissions: Vec<String> = serde_json::from_str(&r.permissions).unwrap_or_default();
+        let masked = mask_api_key(&r.key_value);
+        AccountApiKeyInfo { id: r.id, provider_id: r.provider_id, key_label: r.key_label, permissions, enabled: r.enabled, last_used_at: r.last_used_at, created_at: r.created_at, masked_key: masked }
    }).collect();

    Ok(PaginatedResponse { items, total: total.0, page: p, page_size: ps })
@@ -445,34 +444,36 @@ pub async fn get_usage_stats(

    // 按模型统计
    let by_model_sql = format!(
-        "SELECT provider_id, model_id, COUNT(*)::bigint, COALESCE(SUM(input_tokens), 0), COALESCE(SUM(output_tokens), 0)
+        "SELECT provider_id, model_id, COUNT(*)::bigint AS request_count, COALESCE(SUM(input_tokens), 0) AS input_tokens, COALESCE(SUM(output_tokens), 0) AS output_tokens
         FROM usage_records WHERE {} GROUP BY provider_id, model_id ORDER BY COUNT(*) DESC LIMIT 20",
        where_sql
    );
-    let mut by_model_query = sqlx::query_as::<_, (String, String, i64, i64, i64)>(&by_model_sql);
+    let mut by_model_query = sqlx::query_as::<_, UsageByModelRow>(&by_model_sql);
    for p in &params {
        by_model_query = by_model_query.bind(p);
    }
    let by_model_rows = by_model_query.fetch_all(db).await?;
    let by_model: Vec<ModelUsage> = by_model_rows.into_iter()
-        .map(|(provider_id, model_id, count, input, output)| {
-            ModelUsage { provider_id, model_id, request_count: count, input_tokens: input, output_tokens: output }
+        .map(|r| {
+            ModelUsage { provider_id: r.provider_id, model_id: r.model_id, request_count: r.request_count, input_tokens: r.input_tokens, output_tokens: r.output_tokens }
        }).collect();

    // 按天统计 (使用 days 参数或默认 30 天)
    let days = query.days.unwrap_or(30).min(365).max(1) as i64;
-    let from_days = (chrono::Utc::now() - chrono::Duration::days(days)).format("%Y-%m-%d").to_string() + "T00:00:00Z";
-    let daily_sql = format!(
-        "SELECT SUBSTRING(created_at, 1, 10) as day, COUNT(*)::bigint, COALESCE(SUM(input_tokens), 0), COALESCE(SUM(output_tokens), 0)
+    let from_days = (chrono::Utc::now() - chrono::Duration::days(days))
+        .date_naive()
+        .and_hms_opt(0, 0, 0).unwrap()
+        .and_utc()
+        .to_rfc3339();
+    let daily_sql = "SELECT SUBSTRING(created_at, 1, 10) as day, COUNT(*)::bigint AS request_count, COALESCE(SUM(input_tokens), 0) AS input_tokens, COALESCE(SUM(output_tokens), 0) AS output_tokens
         FROM usage_records WHERE account_id = $1 AND created_at >= $2
-         GROUP BY SUBSTRING(created_at, 1, 10) ORDER BY day DESC LIMIT $3"
-    );
-    let daily_rows: Vec<(String, i64, i64, i64)> = sqlx::query_as(&daily_sql)
+         GROUP BY SUBSTRING(created_at, 1, 10) ORDER BY day DESC LIMIT $3";
+    let daily_rows: Vec<UsageByDayRow> = sqlx::query_as(daily_sql)
        .bind(account_id).bind(&from_days).bind(days as i32)
        .fetch_all(db).await?;
    let by_day: Vec<DailyUsage> = daily_rows.into_iter()
-        .map(|(date, count, input, output)| {
-            DailyUsage { date, request_count: count, input_tokens: input, output_tokens: output }
+        .map(|r| {
+            DailyUsage { date: r.day, request_count: r.request_count, input_tokens: r.input_tokens, output_tokens: r.output_tokens }
        }).collect();

    // 按 group_by 过滤返回
--- a/crates/zclaw-saas/src/models/account.rs
+++ b/crates/zclaw-saas/src/models/account.rs
@@ -0,0 +1,75 @@
+//! Account 表相关模型
+
+use sqlx::FromRow;
+
+/// accounts 表完整行 (含 last_login_at)
+#[derive(Debug, FromRow)]
+pub struct AccountRow {
+    pub id: String,
+    pub username: String,
+    pub email: String,
+    pub display_name: String,
+    pub role: String,
+    pub status: String,
+    pub totp_enabled: bool,
+    pub last_login_at: Option<String>,
+    pub created_at: String,
+}
+
+/// accounts 表行 (不含 last_login_at，用于 auth/me 等场景)
+#[derive(Debug, FromRow)]
+pub struct AccountAuthRow {
+    pub id: String,
+    pub username: String,
+    pub email: String,
+    pub display_name: String,
+    pub role: String,
+    pub status: String,
+    pub totp_enabled: bool,
+    pub created_at: String,
+}
+
+/// Login 一次性查询行（合并用户信息 + password_hash + totp_secret）
+#[derive(Debug, FromRow)]
+pub struct AccountLoginRow {
+    pub id: String,
+    pub username: String,
+    pub email: String,
+    pub display_name: String,
+    pub role: String,
+    pub status: String,
+    pub totp_enabled: bool,
+    pub password_hash: String,
+    pub totp_secret: Option<String>,
+    pub created_at: String,
+}
+
+/// operation_logs 表行
+#[derive(Debug, FromRow)]
+pub struct OperationLogRow {
+    pub id: i64,
+    pub account_id: Option<String>,
+    pub action: String,
+    pub target_type: Option<String>,
+    pub target_id: Option<String>,
+    pub details: Option<String>,
+    pub ip_address: Option<String>,
+    pub created_at: String,
+}
+
+/// Dashboard 统计聚合行
+#[derive(Debug, FromRow)]
+pub struct DashboardStatsRow {
+    pub total_accounts: i64,
+    pub active_accounts: i64,
+    pub active_providers: i64,
+    pub active_models: i64,
+}
+
+/// Dashboard 今日统计聚合行
+#[derive(Debug, FromRow)]
+pub struct DashboardTodayRow {
+    pub tasks_today: i64,
+    pub tokens_input: i64,
+    pub tokens_output: i64,
+}
--- a/crates/zclaw-saas/src/models/api_token.rs
+++ b/crates/zclaw-saas/src/models/api_token.rs
@@ -0,0 +1,15 @@
+//! api_tokens 表相关模型
+
+use sqlx::FromRow;
+
+/// api_tokens 表行 (用于列表查询)
+#[derive(Debug, FromRow)]
+pub struct ApiTokenRow {
+    pub id: String,
+    pub name: String,
+    pub token_prefix: String,
+    pub permissions: String,
+    pub last_used_at: Option<String>,
+    pub expires_at: Option<String>,
+    pub created_at: String,
+}
--- a/crates/zclaw-saas/src/models/config.rs
+++ b/crates/zclaw-saas/src/models/config.rs
@@ -0,0 +1,33 @@
+//! config_items + config_sync_log 表相关模型
+
+use sqlx::FromRow;
+
+/// config_items 表行
+#[derive(Debug, FromRow)]
+pub struct ConfigItemRow {
+    pub id: String,
+    pub category: String,
+    pub key_path: String,
+    pub value_type: String,
+    pub current_value: Option<String>,
+    pub default_value: Option<String>,
+    pub source: String,
+    pub description: Option<String>,
+    pub requires_restart: bool,
+    pub created_at: String,
+    pub updated_at: String,
+}
+
+/// config_sync_log 表行
+#[derive(Debug, FromRow)]
+pub struct ConfigSyncLogRow {
+    pub id: i64,
+    pub account_id: String,
+    pub client_fingerprint: String,
+    pub action: String,
+    pub config_keys: String,
+    pub client_values: Option<String>,
+    pub saas_values: Option<String>,
+    pub resolution: Option<String>,
+    pub created_at: String,
+}
--- a/crates/zclaw-saas/src/models/device.rs
+++ b/crates/zclaw-saas/src/models/device.rs
@@ -0,0 +1,15 @@
+//! devices 表相关模型
+
+use sqlx::FromRow;
+
+/// devices 表行
+#[derive(Debug, FromRow)]
+pub struct DeviceRow {
+    pub id: String,
+    pub device_id: String,
+    pub device_name: Option<String>,
+    pub platform: Option<String>,
+    pub app_version: Option<String>,
+    pub last_seen_at: String,
+    pub created_at: String,
+}
--- a/crates/zclaw-saas/src/models/mod.rs
+++ b/crates/zclaw-saas/src/models/mod.rs
@@ -0,0 +1,33 @@
+//! 类型化数据库模型 (sqlx::FromRow)
+//!
+//! 替代原始元组解构 `(String, String, ...)`，提供编译期字段检查。
+//! 每个结构体对应一个数据库查询结果，字段名与 SQL 列名一致。
+
+pub mod account;
+pub mod api_token;
+pub mod config;
+pub mod device;
+pub mod model;
+pub mod permission_template;
+pub mod prompt;
+pub mod provider;
+pub mod provider_key;
+pub mod relay_task;
+pub mod role;
+pub mod telemetry;
+pub mod usage;
+
+// Re-export all row types for convenient access
+pub use account::*;
+pub use api_token::*;
+pub use config::*;
+pub use device::*;
+pub use model::*;
+pub use permission_template::*;
+pub use prompt::*;
+pub use provider::*;
+pub use provider_key::*;
+pub use relay_task::*;
+pub use role::*;
+pub use telemetry::*;
+pub use usage::*;
--- a/crates/zclaw-saas/src/models/model.rs
+++ b/crates/zclaw-saas/src/models/model.rs
@@ -0,0 +1,34 @@
+//! models + account_api_keys 表相关模型
+
+use sqlx::FromRow;
+
+/// models 表行
+#[derive(Debug, FromRow)]
+pub struct ModelRow {
+    pub id: String,
+    pub provider_id: String,
+    pub model_id: String,
+    pub alias: String,
+    pub context_window: i64,
+    pub max_output_tokens: i64,
+    pub supports_streaming: bool,
+    pub supports_vision: bool,
+    pub enabled: bool,
+    pub pricing_input: f64,
+    pub pricing_output: f64,
+    pub created_at: String,
+    pub updated_at: String,
+}
+
+/// account_api_keys 表行
+#[derive(Debug, FromRow)]
+pub struct AccountApiKeyRow {
+    pub id: String,
+    pub provider_id: String,
+    pub key_label: Option<String>,
+    pub permissions: String,
+    pub enabled: bool,
+    pub last_used_at: Option<String>,
+    pub created_at: String,
+    pub key_value: String,
+}
--- a/crates/zclaw-saas/src/models/permission_template.rs
+++ b/crates/zclaw-saas/src/models/permission_template.rs
@@ -0,0 +1,14 @@
+//! permission_templates 表相关模型
+
+use sqlx::FromRow;
+
+/// permission_templates 表行
+#[derive(Debug, FromRow)]
+pub struct PermissionTemplateRow {
+    pub id: String,
+    pub name: String,
+    pub description: Option<String>,
+    pub permissions: String,
+    pub created_at: String,
+    pub updated_at: String,
+}
--- a/crates/zclaw-saas/src/models/prompt.rs
+++ b/crates/zclaw-saas/src/models/prompt.rs
@@ -0,0 +1,31 @@
+//! prompt_templates + prompt_versions 表相关模型
+
+use sqlx::FromRow;
+
+/// prompt_templates 表行
+#[derive(Debug, FromRow)]
+pub struct PromptTemplateRow {
+    pub id: String,
+    pub name: String,
+    pub category: String,
+    pub description: Option<String>,
+    pub source: String,
+    pub current_version: i32,
+    pub status: String,
+    pub created_at: String,
+    pub updated_at: String,
+}
+
+/// prompt_versions 表行
+#[derive(Debug, FromRow)]
+pub struct PromptVersionRow {
+    pub id: String,
+    pub template_id: String,
+    pub version: i32,
+    pub system_prompt: String,
+    pub user_prompt_template: Option<String>,
+    pub variables: String,
+    pub changelog: Option<String>,
+    pub min_app_version: Option<String>,
+    pub created_at: String,
+}
--- a/crates/zclaw-saas/src/models/provider.rs
+++ b/crates/zclaw-saas/src/models/provider.rs
@@ -0,0 +1,18 @@
+//! providers 表相关模型
+
+use sqlx::FromRow;
+
+/// providers 表行
+#[derive(Debug, FromRow)]
+pub struct ProviderRow {
+    pub id: String,
+    pub name: String,
+    pub display_name: String,
+    pub base_url: String,
+    pub api_protocol: String,
+    pub enabled: bool,
+    pub rate_limit_rpm: Option<i64>,
+    pub rate_limit_tpm: Option<i64>,
+    pub created_at: String,
+    pub updated_at: String,
+}
--- a/crates/zclaw-saas/src/models/provider_key.rs
+++ b/crates/zclaw-saas/src/models/provider_key.rs
@@ -0,0 +1,33 @@
+//! provider_keys + key_usage_window 表相关模型
+
+use sqlx::FromRow;
+
+/// provider_keys 精选行 (用于 select_best_key)
+#[derive(Debug, FromRow)]
+pub struct ProviderKeySelectRow {
+    pub id: String,
+    pub key_value: String,
+    pub priority: i32,
+    pub max_rpm: Option<i64>,
+    pub max_tpm: Option<i64>,
+    pub quota_reset_interval: Option<String>,
+}
+
+/// provider_keys 完整行 (用于列表查询)
+#[derive(Debug, FromRow)]
+pub struct ProviderKeyRow {
+    pub id: String,
+    pub provider_id: String,
+    pub key_label: String,
+    pub priority: i32,
+    pub max_rpm: Option<i64>,
+    pub max_tpm: Option<i64>,
+    pub quota_reset_interval: Option<String>,
+    pub is_active: bool,
+    pub last_429_at: Option<String>,
+    pub cooldown_until: Option<String>,
+    pub total_requests: i64,
+    pub total_tokens: i64,
+    pub created_at: String,
+    pub updated_at: String,
+}
--- a/crates/zclaw-saas/src/models/relay_task.rs
+++ b/crates/zclaw-saas/src/models/relay_task.rs
@@ -0,0 +1,23 @@
+//! relay_tasks 表相关模型
+
+use sqlx::FromRow;
+
+/// relay_tasks 表行
+#[derive(Debug, FromRow)]
+pub struct RelayTaskRow {
+    pub id: String,
+    pub account_id: String,
+    pub provider_id: String,
+    pub model_id: String,
+    pub status: String,
+    pub priority: i64,
+    pub attempt_count: i64,
+    pub max_attempts: i64,
+    pub input_tokens: i64,
+    pub output_tokens: i64,
+    pub error_message: Option<String>,
+    pub queued_at: String,
+    pub started_at: Option<String>,
+    pub completed_at: Option<String>,
+    pub created_at: String,
+}
--- a/crates/zclaw-saas/src/models/role.rs
+++ b/crates/zclaw-saas/src/models/role.rs
@@ -0,0 +1,15 @@
+//! roles 表相关模型
+
+use sqlx::FromRow;
+
+/// roles 表行
+#[derive(Debug, FromRow)]
+pub struct RoleRow {
+    pub id: String,
+    pub name: String,
+    pub description: Option<String>,
+    pub permissions: String,
+    pub is_system: bool,
+    pub created_at: String,
+    pub updated_at: String,
+}
--- a/crates/zclaw-saas/src/models/telemetry.rs
+++ b/crates/zclaw-saas/src/models/telemetry.rs
@@ -0,0 +1,24 @@
+//! telemetry_reports 表相关模型
+
+use sqlx::FromRow;
+
+/// telemetry 按 model 分组统计
+#[derive(Debug, FromRow)]
+pub struct TelemetryModelStatsRow {
+    pub model_id: String,
+    pub request_count: i64,
+    pub input_tokens: i64,
+    pub output_tokens: i64,
+    pub avg_latency_ms: Option<f64>,
+    pub success_rate: Option<f64>,
+}
+
+/// telemetry 按天分组统计
+#[derive(Debug, FromRow)]
+pub struct TelemetryDailyStatsRow {
+    pub day: String,
+    pub request_count: i64,
+    pub input_tokens: i64,
+    pub output_tokens: i64,
+    pub unique_devices: i64,
+}
--- a/crates/zclaw-saas/src/models/usage.rs
+++ b/crates/zclaw-saas/src/models/usage.rs
@@ -0,0 +1,22 @@
+//! usage_records 表相关聚合模型
+
+use sqlx::FromRow;
+
+/// usage 按 model 分组统计
+#[derive(Debug, FromRow)]
+pub struct UsageByModelRow {
+    pub provider_id: String,
+    pub model_id: String,
+    pub request_count: i64,
+    pub input_tokens: i64,
+    pub output_tokens: i64,
+}
+
+/// usage 按天分组统计
+#[derive(Debug, FromRow)]
+pub struct UsageByDayRow {
+    pub day: String,
+    pub request_count: i64,
+    pub input_tokens: i64,
+    pub output_tokens: i64,
+}
--- a/crates/zclaw-saas/src/prompt/service.rs
+++ b/crates/zclaw-saas/src/prompt/service.rs
@@ -4,6 +4,7 @@ use sqlx::PgPool;
 use crate::error::{SaasError, SaasResult};
 use crate::common::PaginatedResponse;
 use crate::common::normalize_pagination;
+use crate::models::{PromptTemplateRow, PromptVersionRow};
 use super::types::*;

 /// 创建提示词模板 + 初始版本
@@ -50,30 +51,28 @@ pub async fn create_template(

 /// 获取单个模板
 pub async fn get_template(db: &PgPool, id: &str) -> SaasResult<PromptTemplateInfo> {
-    let row: Option<(String, String, String, Option<String>, String, i32, String, String, String)> =
+    let row: Option<PromptTemplateRow> =
        sqlx::query_as(
            "SELECT id, name, category, description, source, current_version, status, created_at, updated_at
             FROM prompt_templates WHERE id = $1"
        ).bind(id).fetch_optional(db).await?;

-    let (id, name, category, description, source, current_version, status, created_at, updated_at) =
-        row.ok_or_else(|| SaasError::NotFound(format!("提示词模板 {} 不存在", id)))?;
+    let r = row.ok_or_else(|| SaasError::NotFound(format!("提示词模板 {} 不存在", id)))?;

-    Ok(PromptTemplateInfo { id, name, category, description, source, current_version, status, created_at, updated_at })
+    Ok(PromptTemplateInfo { id: r.id, name: r.name, category: r.category, description: r.description, source: r.source, current_version: r.current_version, status: r.status, created_at: r.created_at, updated_at: r.updated_at })
 }

 /// 按名称获取模板
 pub async fn get_template_by_name(db: &PgPool, name: &str) -> SaasResult<PromptTemplateInfo> {
-    let row: Option<(String, String, String, Option<String>, String, i32, String, String, String)> =
+    let row: Option<PromptTemplateRow> =
        sqlx::query_as(
            "SELECT id, name, category, description, source, current_version, status, created_at, updated_at
             FROM prompt_templates WHERE name = $1"
        ).bind(name).fetch_optional(db).await?;

-    let (id, name, category, description, source, current_version, status, created_at, updated_at) =
-        row.ok_or_else(|| SaasError::NotFound(format!("提示词模板 '{}' 不存在", name)))?;
+    let r = row.ok_or_else(|| SaasError::NotFound(format!("提示词模板 '{}' 不存在", name)))?;

-    Ok(PromptTemplateInfo { id, name, category, description, source, current_version, status, created_at, updated_at })
+    Ok(PromptTemplateInfo { id: r.id, name: r.name, category: r.category, description: r.description, source: r.source, current_version: r.current_version, status: r.status, created_at: r.created_at, updated_at: r.updated_at })
 }

 /// 列表模板
@@ -83,35 +82,59 @@ pub async fn list_templates(
 ) -> SaasResult<PaginatedResponse<PromptTemplateInfo>> {
    let (page, page_size, offset) = normalize_pagination(query.page, query.page_size);

-    let mut where_clauses = vec!["1=1".to_string()];
-    let mut count_sql = String::from("SELECT COUNT(*) FROM prompt_templates WHERE ");
-    let mut data_sql = String::from(
-        "SELECT id, name, category, description, source, current_version, status, created_at, updated_at
-         FROM prompt_templates WHERE "
-    );
+    // 使用参数化查询构建，防止 SQL 注入
+    let mut param_idx = 1usize;
+    let mut conditions = Vec::new();
+    let mut cat_bind: Option<String> = None;
+    let mut src_bind: Option<String> = None;
+    let mut status_bind: Option<String> = None;

    if let Some(ref cat) = query.category {
-        where_clauses.push(format!("category = '{}'", cat.replace('\'', "''")));
+        conditions.push(format!("category = ${}", param_idx));
+        cat_bind = Some(cat.clone());
+        param_idx += 1;
    }
    if let Some(ref src) = query.source {
-        where_clauses.push(format!("source = '{}'", src.replace('\'', "''")));
+        conditions.push(format!("source = ${}", param_idx));
+        src_bind = Some(src.clone());
+        param_idx += 1;
    }
    if let Some(ref st) = query.status {
-        where_clauses.push(format!("status = '{}'", st.replace('\'', "''")));
+        conditions.push(format!("status = ${}", param_idx));
+        status_bind = Some(st.clone());
+        param_idx += 1;
    }

-    let where_clause = where_clauses.join(" AND ");
-    count_sql.push_str(&where_clause);
-    data_sql.push_str(&where_clause);
-    data_sql.push_str(&format!(" ORDER BY updated_at DESC LIMIT {} OFFSET {}", page_size, offset));
+    let where_clause = if conditions.is_empty() {
+        "1=1".to_string()
+    } else {
+        conditions.join(" AND ")
+    };

-    let total: i64 = sqlx::query_scalar(&count_sql).fetch_one(db).await?;
+    let count_sql = format!("SELECT COUNT(*) FROM prompt_templates WHERE {}", where_clause);
+    let data_sql = format!(
+        "SELECT id, name, category, description, source, current_version, status, created_at, updated_at \
+         FROM prompt_templates WHERE {} ORDER BY updated_at DESC LIMIT {} OFFSET {}",
+        where_clause, page_size, offset
+    );

-    let rows: Vec<(String, String, String, Option<String>, String, i32, String, String, String)> =
-        sqlx::query_as(&data_sql).fetch_all(db).await?;
+    // 动态绑定参数到 count 查询
+    let mut count_query = sqlx::query_scalar::<_, i64>(&count_sql);
+    if let Some(ref v) = cat_bind { count_query = count_query.bind(v); }
+    if let Some(ref v) = src_bind { count_query = count_query.bind(v); }
+    if let Some(ref v) = status_bind { count_query = count_query.bind(v); }
+    let total = count_query.fetch_one(db).await?;

-    let items: Vec<PromptTemplateInfo> = rows.into_iter().map(|(id, name, category, description, source, current_version, status, created_at, updated_at)| {
-        PromptTemplateInfo { id, name, category, description, source, current_version, status, created_at, updated_at }
+    // 动态绑定参数到 data 查询
+    let mut data_query = sqlx::query_as::<_, PromptTemplateRow>(&data_sql);
+    if let Some(ref v) = cat_bind { data_query = data_query.bind(v); }
+    if let Some(ref v) = src_bind { data_query = data_query.bind(v); }
+    if let Some(ref v) = status_bind { data_query = data_query.bind(v); }
+    data_query = data_query.bind(page_size as i64).bind(offset as i64);
+    let rows = data_query.fetch_all(db).await?;
+
+    let items: Vec<PromptTemplateInfo> = rows.into_iter().map(|r| {
+        PromptTemplateInfo { id: r.id, name: r.name, category: r.category, description: r.description, source: r.source, current_version: r.current_version, status: r.status, created_at: r.created_at, updated_at: r.updated_at }
    }).collect();

    Ok(PaginatedResponse { items, total, page, page_size })
@@ -177,36 +200,34 @@ pub async fn create_version(

 /// 获取特定版本
 pub async fn get_version(db: &PgPool, version_id: &str) -> SaasResult<PromptVersionInfo> {
-    let row: Option<(String, String, i32, String, Option<String>, String, Option<String>, Option<String>, String)> =
+    let row: Option<PromptVersionRow> =
        sqlx::query_as(
            "SELECT id, template_id, version, system_prompt, user_prompt_template, variables, changelog, min_app_version, created_at
             FROM prompt_versions WHERE id = $1"
        ).bind(version_id).fetch_optional(db).await?;

-    let (id, template_id, version, system_prompt, user_prompt_template, variables_str, changelog, min_app_version, created_at) =
-        row.ok_or_else(|| SaasError::NotFound(format!("提示词版本 {} 不存在", version_id)))?;
+    let r = row.ok_or_else(|| SaasError::NotFound(format!("提示词版本 {} 不存在", version_id)))?;

-    let variables: serde_json::Value = serde_json::from_str(&variables_str).unwrap_or(serde_json::json!([]));
+    let variables: serde_json::Value = serde_json::from_str(&r.variables).unwrap_or(serde_json::json!([]));

-    Ok(PromptVersionInfo { id, template_id, version, system_prompt, user_prompt_template, variables, changelog, min_app_version, created_at })
+    Ok(PromptVersionInfo { id: r.id, template_id: r.template_id, version: r.version, system_prompt: r.system_prompt, user_prompt_template: r.user_prompt_template, variables, changelog: r.changelog, min_app_version: r.min_app_version, created_at: r.created_at })
 }

 /// 获取模板的当前版本内容
 pub async fn get_current_version(db: &PgPool, template_name: &str) -> SaasResult<PromptVersionInfo> {
    let tmpl = get_template_by_name(db, template_name).await?;

-    let row: Option<(String, String, i32, String, Option<String>, String, Option<String>, Option<String>, String)> =
+    let row: Option<PromptVersionRow> =
        sqlx::query_as(
            "SELECT id, template_id, version, system_prompt, user_prompt_template, variables, changelog, min_app_version, created_at
             FROM prompt_versions WHERE template_id = $1 AND version = $2"
        ).bind(&tmpl.id).bind(tmpl.current_version).fetch_optional(db).await?;

-    let (id, template_id, version, system_prompt, user_prompt_template, variables_str, changelog, min_app_version, created_at) =
-        row.ok_or_else(|| SaasError::NotFound(format!("提示词 '{}' 的版本 {} 不存在", template_name, tmpl.current_version)))?;
+    let r = row.ok_or_else(|| SaasError::NotFound(format!("提示词 '{}' 的版本 {} 不存在", template_name, tmpl.current_version)))?;

-    let variables: serde_json::Value = serde_json::from_str(&variables_str).unwrap_or(serde_json::json!([]));
+    let variables: serde_json::Value = serde_json::from_str(&r.variables).unwrap_or(serde_json::json!([]));

-    Ok(PromptVersionInfo { id, template_id, version, system_prompt, user_prompt_template, variables, changelog, min_app_version, created_at })
+    Ok(PromptVersionInfo { id: r.id, template_id: r.template_id, version: r.version, system_prompt: r.system_prompt, user_prompt_template: r.user_prompt_template, variables, changelog: r.changelog, min_app_version: r.min_app_version, created_at: r.created_at })
 }

 /// 列出模板的所有版本
@@ -214,15 +235,15 @@ pub async fn list_versions(
    db: &PgPool,
    template_id: &str,
 ) -> SaasResult<Vec<PromptVersionInfo>> {
-    let rows: Vec<(String, String, i32, String, Option<String>, String, Option<String>, Option<String>, String)> =
+    let rows: Vec<PromptVersionRow> =
        sqlx::query_as(
            "SELECT id, template_id, version, system_prompt, user_prompt_template, variables, changelog, min_app_version, created_at
             FROM prompt_versions WHERE template_id = $1 ORDER BY version DESC"
        ).bind(template_id).fetch_all(db).await?;

-    Ok(rows.into_iter().map(|(id, template_id, version, system_prompt, user_prompt_template, variables_str, changelog, min_app_version, created_at)| {
-        let variables = serde_json::from_str(&variables_str).unwrap_or(serde_json::json!([]));
-        PromptVersionInfo { id, template_id, version, system_prompt, user_prompt_template, variables, changelog, min_app_version, created_at }
+    Ok(rows.into_iter().map(|r| {
+        let variables = serde_json::from_str(&r.variables).unwrap_or(serde_json::json!([]));
+        PromptVersionInfo { id: r.id, template_id: r.template_id, version: r.version, system_prompt: r.system_prompt, user_prompt_template: r.user_prompt_template, variables, changelog: r.changelog, min_app_version: r.min_app_version, created_at: r.created_at }
    }).collect())
 }

--- a/crates/zclaw-saas/src/relay/handlers.rs
+++ b/crates/zclaw-saas/src/relay/handlers.rs
@@ -23,8 +23,11 @@ pub async fn chat_completions(
 ) -> SaasResult<Response> {
    check_permission(&ctx, "relay:use")?;

-    // 队列容量检查：防止过载
-    let config = state.config.read().await;
+    // 队列容量检查：防止过载（立即释放读锁）
+    let max_queue_size = {
+        let config = state.config.read().await;
+        config.relay.max_queue_size
+    };
    let queued_count: i64 = sqlx::query_scalar(
        "SELECT COUNT(*) FROM relay_tasks WHERE account_id = $1 AND status IN ('queued', 'processing')"
    )
@@ -33,23 +36,109 @@ pub async fn chat_completions(
    .await
    .unwrap_or(0);

-    if queued_count >= config.relay.max_queue_size as i64 {
+    if queued_count >= max_queue_size as i64 {
        return Err(SaasError::RateLimited(
            format!("队列已满 ({} 个任务排队中)，请稍后重试", queued_count)
        ));
    }

+    // --- 输入验证 ---
+    // 请求体大小限制 (1 MB)
+    const MAX_BODY_BYTES: usize = 1024 * 1024;
+    let estimated_size = serde_json::to_string(&req).map(|s| s.len()).unwrap_or(0);
+    if estimated_size > MAX_BODY_BYTES {
+        return Err(SaasError::InvalidInput(
+            format!("请求体超过大小限制 ({} bytes > {} bytes)", estimated_size, MAX_BODY_BYTES)
+        ));
+    }
+
+    // model 字段
    let model_name = req.get("model")
        .and_then(|v| v.as_str())
        .ok_or_else(|| SaasError::InvalidInput("缺少 model 字段".into()))?;

+    // messages 字段：必须存在且为非空数组
+    let messages = req.get("messages")
+        .ok_or_else(|| SaasError::InvalidInput("缺少 messages 字段".into()))?;
+    let messages_arr = messages.as_array()
+        .ok_or_else(|| SaasError::InvalidInput("messages 必须是数组".into()))?;
+    if messages_arr.is_empty() {
+        return Err(SaasError::InvalidInput("messages 数组不能为空".into()));
+    }
+
+    // 验证每个 message 的 role 和 content
+    let valid_roles = ["system", "user", "assistant", "tool"];
+    for (i, msg) in messages_arr.iter().enumerate() {
+        let role = msg.get("role")
+            .and_then(|v| v.as_str())
+            .ok_or_else(|| SaasError::InvalidInput(
+                format!("messages[{}] 缺少 role 字段", i)
+            ))?;
+        if !valid_roles.contains(&role) {
+            return Err(SaasError::InvalidInput(
+                format!("messages[{}] 的 role 必须是 system/user/assistant/tool 之一，得到: {}", i, role)
+            ));
+        }
+
+        let content = msg.get("content")
+            .ok_or_else(|| SaasError::InvalidInput(
+                format!("messages[{}] 缺少 content 字段", i)
+            ))?;
+        // content 必须是字符串或数组 (多模态)
+        if !content.is_string() && !content.is_array() {
+            return Err(SaasError::InvalidInput(
+                format!("messages[{}] 的 content 必须是字符串或数组", i)
+            ));
+        }
+    }
+
+    // temperature 范围校验
+    if let Some(temp) = req.get("temperature") {
+        match temp.as_f64() {
+            Some(t) if t < 0.0 || t > 2.0 => {
+                return Err(SaasError::InvalidInput(
+                    format!("temperature 必须在 0.0 ~ 2.0 范围内，得到: {}", t)
+                ));
+            }
+            Some(_) => {} // valid
+            None => {
+                return Err(SaasError::InvalidInput("temperature 必须是数字".into()));
+            }
+        }
+    }
+
+    // max_tokens 范围校验
+    if let Some(tokens) = req.get("max_tokens") {
+        match tokens.as_u64() {
+            Some(t) if t < 1 || t > 128000 => {
+                return Err(SaasError::InvalidInput(
+                    format!("max_tokens 必须在 1 ~ 128000 范围内，得到: {}", t)
+                ));
+            }
+            Some(_) => {} // valid
+            None => {
+                return Err(SaasError::InvalidInput("max_tokens 必须是正整数".into()));
+            }
+        }
+    }
+    // --- 输入验证结束 ---
+
    let stream = req.get("stream")
        .and_then(|v| v.as_bool())
        .unwrap_or(false);

-    // 查找 model 对应的 provider
-    let models = model_service::list_models(&state.db, None, None, None).await?.items;
-    let target_model = models.iter().find(|m| m.model_id == model_name && m.enabled)
+    // 查找 model 对应的 provider — 使用精准查询避免全量加载
+    let target_model: Option<crate::models::ModelRow> = sqlx::query_as(
+        "SELECT id, provider_id, model_id, alias, context_window, max_output_tokens,
+                supports_streaming, supports_vision, enabled, pricing_input, pricing_output,
+                created_at, updated_at
+         FROM models WHERE model_id = $1 AND enabled = true LIMIT 1"
+    )
+    .bind(&model_name)
+    .fetch_optional(&state.db)
+    .await?;
+
+    let target_model = target_model
        .ok_or_else(|| SaasError::NotFound(format!("模型 {} 不存在或未启用", model_name)))?;

    // 获取 provider 信息
@@ -60,27 +149,29 @@ pub async fn chat_completions(

    let request_body = serde_json::to_string(&req)?;

-    // 创建中转任务
-    let config = state.config.read().await;
+    // 创建中转任务（提取配置后立即释放读锁）
+    let (max_attempts, retry_delay_ms, enc_key) = {
+        let config = state.config.read().await;
+        let key = config.api_key_encryption_key()
+            .map_err(|e| SaasError::Internal(e.to_string()))?;
+        (config.relay.max_attempts, config.relay.retry_delay_ms, key)
+    };
+
    let task = service::create_relay_task(
        &state.db, &ctx.account_id, &target_model.provider_id,
        &target_model.model_id, &request_body, 0,
-        config.relay.max_attempts,
+        max_attempts,
    ).await?;

    log_operation(&state.db, &ctx.account_id, "relay.request", "relay_task", &task.id,
        Some(serde_json::json!({"model": model_name, "stream": stream})), ctx.client_ip.as_deref()).await?;

-    // 获取加密密钥用于解密 API Key
-    let enc_key = config.api_key_encryption_key()
-        .map_err(|e| SaasError::Internal(e.to_string()))?;
-
    // 执行中转 (Key Pool 自动选择 + 429 轮转)
    let response = service::execute_relay(
        &state.db, &task.id, &target_model.provider_id,
        &provider.base_url, &request_body, stream,
-        config.relay.max_attempts,
-        config.relay.retry_delay_ms,
+        max_attempts,
+        retry_delay_ms,
        &enc_key,
    ).await;

@@ -153,22 +244,28 @@ pub async fn list_available_models(
    State(state): State<AppState>,
    _ctx: Extension<AuthContext>,
 ) -> SaasResult<Json<Vec<serde_json::Value>>> {
-    let providers = model_service::list_providers(&state.db, None, None, None).await?.items;
-    let enabled_provider_ids: std::collections::HashSet<String> =
-        providers.iter().filter(|p| p.enabled).map(|p| p.id.clone()).collect();
+    // 单次 JOIN 查询替代 2 次全量加载
+    let rows: Vec<(String, String, String, i64, i64, bool, bool)> = sqlx::query_as(
+        "SELECT m.model_id, m.provider_id, m.alias, m.context_window,
+                m.max_output_tokens, m.supports_streaming, m.supports_vision
+         FROM models m
+         INNER JOIN providers p ON m.provider_id = p.id
+         WHERE m.enabled = true AND p.enabled = true
+         ORDER BY m.provider_id, m.model_id"
+    )
+    .fetch_all(&state.db)
+    .await?;

-    let models = model_service::list_models(&state.db, None, None, None).await?.items;
-    let available: Vec<serde_json::Value> = models.into_iter()
-        .filter(|m| m.enabled && enabled_provider_ids.contains(&m.provider_id))
-        .map(|m| {
+    let available: Vec<serde_json::Value> = rows.into_iter()
+        .map(|(model_id, provider_id, alias, context_window, max_output_tokens, supports_streaming, supports_vision)| {
            serde_json::json!({
-                "id": m.model_id,
-                "provider_id": m.provider_id,
-                "alias": m.alias,
-                "context_window": m.context_window,
-                "max_output_tokens": m.max_output_tokens,
-                "supports_streaming": m.supports_streaming,
-                "supports_vision": m.supports_vision,
+                "id": model_id,
+                "provider_id": provider_id,
+                "alias": alias,
+                "context_window": context_window,
+                "max_output_tokens": max_output_tokens,
+                "supports_streaming": supports_streaming,
+                "supports_vision": supports_vision,
            })
        })
        .collect();
--- a/crates/zclaw-saas/src/relay/key_pool.rs
+++ b/crates/zclaw-saas/src/relay/key_pool.rs
@@ -4,6 +4,7 @@

 use sqlx::PgPool;
 use crate::error::{SaasError, SaasResult};
+use crate::models::{ProviderKeySelectRow, ProviderKeyRow};
 use crate::crypto;

 /// 解密 key_value (如果已加密)，否则原样返回
@@ -40,7 +41,7 @@ pub async fn select_best_key(db: &PgPool, provider_id: &str, enc_key: &[u8; 32])
    let current_minute = chrono::Utc::now().format("%Y-%m-%dT%H:%M").to_string();

    // 获取所有活跃 Key
-    let rows: Vec<(String, String, i32, Option<i64>, Option<i64>, Option<String>)> =
+    let rows: Vec<ProviderKeySelectRow> =
        sqlx::query_as(
            "SELECT id, key_value, priority, max_rpm, max_tpm, quota_reset_interval
             FROM provider_keys
@@ -89,18 +90,18 @@ pub async fn select_best_key(db: &PgPool, provider_id: &str, enc_key: &[u8; 32])
    }

    // 检查滑动窗口使用量
-    for (id, key_value, priority, max_rpm, max_tpm, quota_reset_interval) in rows {
+    for row in rows {
        // 检查 RPM 限额
-        if let Some(rpm_limit) = max_rpm {
+        if let Some(rpm_limit) = row.max_rpm {
            if rpm_limit > 0 {
                let window: Option<(i64,)> = sqlx::query_as(
                    "SELECT COALESCE(SUM(request_count), 0) FROM key_usage_window
                     WHERE key_id = $1 AND window_minute = $2"
-                ).bind(&id).bind(&current_minute).fetch_optional(db).await?;
+                ).bind(&row.id).bind(&current_minute).fetch_optional(db).await?;

                if let Some((count,)) = window {
                    if count >= rpm_limit {
-                        tracing::debug!("Key {} hit RPM limit ({}/{})", id, count, rpm_limit);
+                        tracing::debug!("Key {} hit RPM limit ({}/{})", row.id, count, rpm_limit);
                        continue;
                    }
                }
@@ -108,16 +109,16 @@ pub async fn select_best_key(db: &PgPool, provider_id: &str, enc_key: &[u8; 32])
        }

        // 检查 TPM 限额
-        if let Some(tpm_limit) = max_tpm {
+        if let Some(tpm_limit) = row.max_tpm {
            if tpm_limit > 0 {
                let window: Option<(i64,)> = sqlx::query_as(
                    "SELECT COALESCE(SUM(token_count), 0) FROM key_usage_window
                     WHERE key_id = $1 AND window_minute = $2"
-                ).bind(&id).bind(&current_minute).fetch_optional(db).await?;
+                ).bind(&row.id).bind(&current_minute).fetch_optional(db).await?;

                if let Some((tokens,)) = window {
                    if tokens >= tpm_limit {
-                        tracing::debug!("Key {} hit TPM limit ({}/{})", id, tokens, tpm_limit);
+                        tracing::debug!("Key {} hit TPM limit ({}/{})", row.id, tokens, tpm_limit);
                        continue;
                    }
                }
@@ -125,17 +126,17 @@ pub async fn select_best_key(db: &PgPool, provider_id: &str, enc_key: &[u8; 32])
        }

        // 此 Key 可用 — 解密 key_value
-        let decrypted_kv = decrypt_key_value(&key_value, enc_key)?;
+        let decrypted_kv = decrypt_key_value(&row.key_value, enc_key)?;
        return Ok(KeySelection {
            key: PoolKey {
-                id: id.clone(),
+                id: row.id.clone(),
                key_value: decrypted_kv,
-                priority,
-                max_rpm,
-                max_tpm,
-                quota_reset_interval,
+                priority: row.priority,
+                max_rpm: row.max_rpm,
+                max_tpm: row.max_tpm,
+                quota_reset_interval: row.quota_reset_interval,
            },
-            key_id: id,
+            key_id: row.id,
        });
    }

@@ -229,7 +230,7 @@ pub async fn list_provider_keys(
    db: &PgPool,
    provider_id: &str,
 ) -> SaasResult<Vec<serde_json::Value>> {
-    let rows: Vec<(String, String, String, i32, Option<i64>, Option<i64>, Option<String>, bool, Option<String>, Option<String>, i64, i64, String, String)> =
+    let rows: Vec<ProviderKeyRow> =
        sqlx::query_as(
            "SELECT id, provider_id, key_label, priority, max_rpm, max_tpm, quota_reset_interval, is_active,
                   last_429_at, cooldown_until, total_requests, total_tokens, created_at, updated_at
@@ -238,20 +239,20 @@ pub async fn list_provider_keys(

    Ok(rows.into_iter().map(|r| {
        serde_json::json!({
-            "id": r.0,
-            "provider_id": r.1,
-            "key_label": r.2,
-            "priority": r.3,
-            "max_rpm": r.4,
-            "max_tpm": r.5,
-            "quota_reset_interval": r.6,
-            "is_active": r.7,
-            "last_429_at": r.8,
-            "cooldown_until": r.9,
-            "total_requests": r.10,
-            "total_tokens": r.11,
-            "created_at": r.12,
-            "updated_at": r.13,
+            "id": r.id,
+            "provider_id": r.provider_id,
+            "key_label": r.key_label,
+            "priority": r.priority,
+            "max_rpm": r.max_rpm,
+            "max_tpm": r.max_tpm,
+            "quota_reset_interval": r.quota_reset_interval,
+            "is_active": r.is_active,
+            "last_429_at": r.last_429_at,
+            "cooldown_until": r.cooldown_until,
+            "total_requests": r.total_requests,
+            "total_tokens": r.total_tokens,
+            "created_at": r.created_at,
+            "updated_at": r.updated_at,
        })
    }).collect())
 }
--- a/crates/zclaw-saas/src/relay/service.rs
+++ b/crates/zclaw-saas/src/relay/service.rs
@@ -2,8 +2,9 @@

 use sqlx::PgPool;
 use std::sync::Arc;
-use std::sync::Mutex;
+use tokio::sync::Mutex;
 use crate::error::{SaasError, SaasResult};
+use crate::models::RelayTaskRow;
 use super::types::*;
 use futures::StreamExt;

@@ -45,7 +46,7 @@ pub async fn create_relay_task(
 }

 pub async fn get_relay_task(db: &PgPool, task_id: &str) -> SaasResult<RelayTaskInfo> {
-    let row: Option<(String, String, String, String, String, i64, i64, i64, i64, i64, Option<String>, String, Option<String>, Option<String>, String)> =
+    let row: Option<RelayTaskRow> =
        sqlx::query_as(
            "SELECT id, account_id, provider_id, model_id, status, priority, attempt_count, max_attempts, input_tokens, output_tokens, error_message, queued_at, started_at, completed_at, created_at
             FROM relay_tasks WHERE id = $1"
@@ -54,13 +55,12 @@ pub async fn get_relay_task(db: &PgPool, task_id: &str) -> SaasResult<RelayTaskI
        .fetch_optional(db)
        .await?;

-    let (id, account_id, provider_id, model_id, status, priority, attempt_count, max_attempts, input_tokens, output_tokens, error_message, queued_at, started_at, completed_at, created_at) =
-        row.ok_or_else(|| SaasError::NotFound(format!("中转任务 {} 不存在", task_id)))?;
+    let r = row.ok_or_else(|| SaasError::NotFound(format!("中转任务 {} 不存在", task_id)))?;

    Ok(RelayTaskInfo {
-        id, account_id, provider_id, model_id, status, priority,
-        attempt_count, max_attempts, input_tokens, output_tokens,
-        error_message, queued_at, started_at, completed_at, created_at,
+        id: r.id, account_id: r.account_id, provider_id: r.provider_id, model_id: r.model_id, status: r.status, priority: r.priority,
+        attempt_count: r.attempt_count, max_attempts: r.max_attempts, input_tokens: r.input_tokens, output_tokens: r.output_tokens,
+        error_message: r.error_message, queued_at: r.queued_at, started_at: r.started_at, completed_at: r.completed_at, created_at: r.created_at,
    })
 }

@@ -91,7 +91,7 @@ pub async fn list_relay_tasks(
        sqlx::query_scalar(count_sql).bind(account_id).fetch_one(db).await?
    };

-    let mut query_builder = sqlx::query_as::<_, (String, String, String, String, String, i64, i64, i64, i64, i64, Option<String>, String, Option<String>, Option<String>, String)>(data_sql)
+    let mut query_builder = sqlx::query_as::<_, RelayTaskRow>(data_sql)
        .bind(account_id);

    if let Some(ref status) = query.status {
@@ -99,8 +99,8 @@ pub async fn list_relay_tasks(
    }

    let rows = query_builder.bind(page_size as i64).bind(offset).fetch_all(db).await?;
-    let items: Vec<RelayTaskInfo> = rows.into_iter().map(|(id, account_id, provider_id, model_id, status, priority, attempt_count, max_attempts, input_tokens, output_tokens, error_message, queued_at, started_at, completed_at, created_at)| {
-        RelayTaskInfo { id, account_id, provider_id, model_id, status, priority, attempt_count, max_attempts, input_tokens, output_tokens, error_message, queued_at, started_at, completed_at, created_at }
+    let items: Vec<RelayTaskInfo> = rows.into_iter().map(|r| {
+        RelayTaskInfo { id: r.id, account_id: r.account_id, provider_id: r.provider_id, model_id: r.model_id, status: r.status, priority: r.priority, attempt_count: r.attempt_count, max_attempts: r.max_attempts, input_tokens: r.input_tokens, output_tokens: r.output_tokens, error_message: r.error_message, queued_at: r.queued_at, started_at: r.started_at, completed_at: r.completed_at, created_at: r.created_at }
    }).collect();

    Ok(crate::common::PaginatedResponse { items, total, page, page_size })
@@ -175,7 +175,7 @@ pub async fn execute_relay(
    base_delay_ms: u64,
    enc_key: &[u8; 32],
 ) -> SaasResult<RelayResponse> {
-    validate_provider_url(provider_base_url)?;
+    validate_provider_url(provider_base_url).await?;

    let url = format!("{}/chat/completions", provider_base_url.trim_end_matches('/'));

@@ -255,10 +255,9 @@ pub async fn execute_relay(
                                Ok(chunk) => {
                                    // Parse SSE lines for usage tracking
                                    if let Ok(text) = std::str::from_utf8(&chunk) {
-                                        if let Ok(mut capture) = usage_capture_clone.lock() {
-                                            for line in text.lines() {
-                                                capture.parse_sse_line(line);
-                                            }
+                                        let mut capture = usage_capture_clone.lock().await;
+                                        for line in text.lines() {
+                                            capture.parse_sse_line(line);
                                        }
                                    }
                                    // Forward to bounded channel — if full, this applies backpressure
@@ -282,16 +281,11 @@ pub async fn execute_relay(
                    // SSE 流结束后异步记录 usage + Key 使用量
                    tokio::spawn(async move {
                        tokio::time::sleep(std::time::Duration::from_secs(3)).await;
-                        let (input, output) = match usage_capture.lock() {
-                            Ok(capture) => (
-                                if capture.input_tokens > 0 { Some(capture.input_tokens) } else { None },
-                                if capture.output_tokens > 0 { Some(capture.output_tokens) } else { None },
-                            ),
-                            Err(e) => {
-                                tracing::warn!("Usage capture lock poisoned: {}", e);
-                                (None, None)
-                            }
-                        };
+                        let capture = usage_capture.lock().await;
+                        let (input, output) = (
+                            if capture.input_tokens > 0 { Some(capture.input_tokens) } else { None },
+                            if capture.output_tokens > 0 { Some(capture.output_tokens) } else { None },
+                        );
                        // 记录任务状态
                        if let Err(e) = update_task_status(&db_clone, &task_id_clone, "completed", input, output, None).await {
                            tracing::warn!("Failed to update task status after SSE stream: {}", e);
@@ -422,7 +416,7 @@ pub fn extract_token_usage_from_json(body: &str) -> (i64, i64) {
 }

 /// SSRF 防护: 验证 provider URL 不指向内网
-fn validate_provider_url(url: &str) -> SaasResult<()> {
+async fn validate_provider_url(url: &str) -> SaasResult<()> {
    let parsed: url::Url = url.parse().map_err(|_| {
        SaasError::InvalidInput(format!("无效的 provider URL: {}", url))
    })?;
@@ -487,9 +481,9 @@ fn validate_provider_url(url: &str) -> SaasResult<()> {
        return Ok(());
    }

-    // 对域名做 DNS 解析，检查解析结果是否指向内网
-    let addr_str: String = format!("{}:0", host);
-    match std::net::ToSocketAddrs::to_socket_addrs(&addr_str) {
+    // 对域名做异步 DNS 解析，检查解析结果是否指向内网
+    let addr_str = format!("{}:0", host);
+    match tokio::net::lookup_host(&*addr_str).await {
        Ok(addrs) => {
            for sockaddr in addrs {
                if is_private_ip(&sockaddr.ip()) {
--- a/crates/zclaw-saas/src/role/handlers_ext.rs
+++ b/crates/zclaw-saas/src/role/handlers_ext.rs
@@ -1,34 +1,35 @@
-//! 角色管理模块
-//! handlers_ext - 获取角色权限列表（公开 API）
+//! 角色权限查询处理函数

 use axum::{
    extract::{Extension, Path, State},
-    http::StatusCode,
    Json,
 };
 use crate::state::AppState;
-use crate::error::SaasResult;
+use crate::error::{SaasError, SaasResult};
 use crate::auth::types::AuthContext;
 use crate::auth::handlers::check_permission;
-use super::{types::*, service};

-use crate::role::handlers_ext;
-
-/// GET /api/v1/roles/:id/permissions - 公开 API，无需登录验证
+/// GET /api/v1/roles/:id/permissions - 获取角色权限列表
 pub async fn get_role_permissions(
    State(state): State<AppState>,
    Path(id): Path<String>,
    Extension(ctx): Extension<AuthContext>,
 ) -> SaasResult<Json<Vec<String>>> {
    check_permission(&ctx, "account:read")?;
-    
+
    let row: Option<(String,)> = sqlx::query_as(
        "SELECT permissions FROM roles WHERE id = $1"
    )
    .bind(&id)
    .fetch_optional(&state.db)
-    .await?;
+    .await
+    .map_err(|e| SaasError::Database(e))?;
+
+    let permissions_str = row
+        .ok_or_else(|| SaasError::NotFound(format!("角色 {} 不存在", id)))?
+        .0;

    let permissions: Vec<String> = serde_json::from_str(&permissions_str)?;
-    Ok(permissions)
+
+    Ok(Json(permissions))
 }
--- a/crates/zclaw-saas/src/role/service.rs
+++ b/crates/zclaw-saas/src/role/service.rs
@@ -2,33 +2,34 @@

 use sqlx::PgPool;
 use crate::error::{SaasError, SaasResult};
+use crate::models::{RoleRow, PermissionTemplateRow};
 use super::types::*;

 pub async fn list_roles(db: &PgPool) -> SaasResult<Vec<RoleInfo>> {
-    let rows: Vec<(String, String, Option<String>, String, bool, String, String)> =
+    let rows: Vec<RoleRow> =
        sqlx::query_as(
            "SELECT id, name, description, permissions, is_system, created_at, updated_at
-             FROM roles ORDER BY 
-             CASE id 
-                WHEN 'super_admin' THEN 1 
-                WHEN 'admin' THEN 2 
-                WHEN 'user' THEN 3 
-                ELSE 4 
+             FROM roles ORDER BY
+             CASE id
+                WHEN 'super_admin' THEN 1
+                WHEN 'admin' THEN 2
+                WHEN 'user' THEN 3
+                ELSE 4
             END"
        )
        .fetch_all(db)
        .await?;

-    let roles = rows.into_iter().map(|(id, name, description, perms, is_system, created_at, updated_at)| {
-        let permissions: Vec<String> = serde_json::from_str(&perms).unwrap_or_default();
-        RoleInfo { id, name, description, permissions, is_system, created_at, updated_at }
+    let roles = rows.into_iter().map(|r| {
+        let permissions: Vec<String> = serde_json::from_str(&r.permissions).unwrap_or_default();
+        RoleInfo { id: r.id, name: r.name, description: r.description, permissions, is_system: r.is_system, created_at: r.created_at, updated_at: r.updated_at }
    }).collect();

    Ok(roles)
 }

 pub async fn get_role(db: &PgPool, role_id: &str) -> SaasResult<RoleInfo> {
-    let row: Option<(String, String, Option<String>, String, bool, String, String)> =
+    let row: Option<RoleRow> =
        sqlx::query_as(
            "SELECT id, name, description, permissions, is_system, created_at, updated_at
             FROM roles WHERE id = $1"
@@ -37,11 +38,10 @@ pub async fn get_role(db: &PgPool, role_id: &str) -> SaasResult<RoleInfo> {
        .fetch_optional(db)
        .await?;

-    let (id, name, description, perms, is_system, created_at, updated_at) =
-        row.ok_or_else(|| SaasError::NotFound(format!("角色 {} 不存在", role_id)))?;
+    let r = row.ok_or_else(|| SaasError::NotFound(format!("角色 {} 不存在", role_id)))?;

-    let permissions: Vec<String> = serde_json::from_str(&perms).unwrap_or_default();
-    Ok(RoleInfo { id, name, description, permissions, is_system, created_at, updated_at })
+    let permissions: Vec<String> = serde_json::from_str(&r.permissions).unwrap_or_default();
+    Ok(RoleInfo { id: r.id, name: r.name, description: r.description, permissions, is_system: r.is_system, created_at: r.created_at, updated_at: r.updated_at })
 }

 pub async fn create_role(db: &PgPool, req: &CreateRoleRequest) -> SaasResult<RoleInfo> {
@@ -137,7 +137,7 @@ pub async fn delete_role(db: &PgPool, role_id: &str) -> SaasResult<()> {
 }

 pub async fn list_templates(db: &PgPool) -> SaasResult<Vec<PermissionTemplate>> {
-    let rows: Vec<(String, String, Option<String>, String, String, String)> =
+    let rows: Vec<PermissionTemplateRow> =
        sqlx::query_as(
            "SELECT id, name, description, permissions, created_at, updated_at
             FROM permission_templates ORDER BY created_at DESC"
@@ -145,16 +145,16 @@ pub async fn list_templates(db: &PgPool) -> SaasResult<Vec<PermissionTemplate>>
        .fetch_all(db)
        .await?;

-    let templates = rows.into_iter().map(|(id, name, description, perms, created_at, updated_at)| {
-        let permissions: Vec<String> = serde_json::from_str(&perms).unwrap_or_default();
-        PermissionTemplate { id, name, description, permissions, created_at, updated_at }
+    let templates = rows.into_iter().map(|r| {
+        let permissions: Vec<String> = serde_json::from_str(&r.permissions).unwrap_or_default();
+        PermissionTemplate { id: r.id, name: r.name, description: r.description, permissions, created_at: r.created_at, updated_at: r.updated_at }
    }).collect();

    Ok(templates)
 }

 pub async fn get_template(db: &PgPool, template_id: &str) -> SaasResult<PermissionTemplate> {
-    let row: Option<(String, String, Option<String>, String, String, String)> =
+    let row: Option<PermissionTemplateRow> =
        sqlx::query_as(
            "SELECT id, name, description, permissions, created_at, updated_at
             FROM permission_templates WHERE id = $1"
@@ -163,11 +163,10 @@ pub async fn get_template(db: &PgPool, template_id: &str) -> SaasResult<Permissi
        .fetch_optional(db)
        .await?;

-    let (id, name, description, perms, created_at, updated_at) =
-        row.ok_or_else(|| SaasError::NotFound(format!("权限模板 {} 不存在", template_id)))?;
+    let r = row.ok_or_else(|| SaasError::NotFound(format!("权限模板 {} 不存在", template_id)))?;

-    let permissions: Vec<String> = serde_json::from_str(&perms).unwrap_or_default();
-    Ok(PermissionTemplate { id, name, description, permissions, created_at, updated_at })
+    let permissions: Vec<String> = serde_json::from_str(&r.permissions).unwrap_or_default();
+    Ok(PermissionTemplate { id: r.id, name: r.name, description: r.description, permissions, created_at: r.created_at, updated_at: r.updated_at })
 }

 pub async fn create_template(db: &PgPool, req: &CreateTemplateRequest) -> SaasResult<PermissionTemplate> {
--- a/crates/zclaw-saas/src/scheduler.rs
+++ b/crates/zclaw-saas/src/scheduler.rs
@@ -0,0 +1,101 @@
+//! 声明式 Scheduler — 借鉴 loco-rs 的定时任务模式
+//!
+//! 通过 TOML 配置定时任务，无需改代码调整调度时间。
+//! 配置格式在 config.rs 的 SchedulerConfig / JobConfig 中定义。
+
+use std::time::Duration;
+use sqlx::PgPool;
+use crate::config::SchedulerConfig;
+use crate::workers::WorkerDispatcher;
+
+/// 解析时间间隔字符串为 Duration
+pub fn parse_duration(s: &str) -> Result<Duration, String> {
+    let s = s.trim().to_lowercase();
+    let (num_part, multiplier) = if s.ends_with('s') {
+        (&s[..s.len()-1], 1u64)
+    } else if s.ends_with('m') {
+        (&s[..s.len()-1], 60u64)
+    } else if s.ends_with('h') {
+        (&s[..s.len()-1], 3600u64)
+    } else if s.ends_with('d') {
+        (&s[..s.len()-1], 86400u64)
+    } else {
+        return Err(format!("Invalid interval format: '{}'. Use '30s', '5m', '1h', '1d'", s));
+    };
+
+    let num: u64 = num_part.parse()
+        .map_err(|_| format!("Invalid number in interval: '{}'", num_part))?;
+
+    Ok(Duration::from_secs(num * multiplier))
+}
+
+/// 启动所有定时任务
+pub fn start_scheduler(config: &SchedulerConfig, db: PgPool, dispatcher: WorkerDispatcher) {
+    for job in &config.jobs {
+        let interval = match parse_duration(&job.interval) {
+            Ok(d) => d,
+            Err(e) => {
+                tracing::error!("Scheduler job '{}': {}", job.name, e);
+                continue;
+            }
+        };
+
+        let job_name = job.name.clone();
+        let task_name = job.task.clone();
+        let args_json = job.args.clone();
+        let _db = db.clone();
+        let dispatcher = dispatcher.clone_ref();
+        let run_on_start = job.run_on_start;
+
+        tracing::info!(
+            "Scheduler: registering job '{}' ({} interval, task={})",
+            job_name, job.interval, task_name
+        );
+
+        tokio::spawn(async move {
+            if run_on_start {
+                tracing::info!("Scheduler: running '{}' on start", job_name);
+                if let Err(e) = dispatcher.dispatch_raw(&task_name, args_json.clone()).await {
+                    tracing::error!("Scheduler job '{}' on-start failed: {}", job_name, e);
+                }
+            }
+
+            let mut interval_timer = tokio::time::interval(interval);
+            loop {
+                interval_timer.tick().await;
+                tracing::debug!("Scheduler: triggering job '{}'", job_name);
+                if let Err(e) = dispatcher.dispatch_raw(&task_name, args_json.clone()).await {
+                    tracing::error!("Scheduler job '{}' failed: {}", job_name, e);
+                }
+            }
+        });
+    }
+}
+
+/// 内置的 DB 清理任务（不通过 Worker，直接执行 SQL）
+pub fn start_db_cleanup_tasks(db: PgPool) {
+    // 每 24 小时清理不活跃设备
+    tokio::spawn(async move {
+        let mut interval = tokio::time::interval(Duration::from_secs(86400));
+        loop {
+            interval.tick().await;
+            match sqlx::query(
+                "DELETE FROM devices WHERE last_seen_at < $1"
+            )
+            .bind({
+                let cutoff = (chrono::Utc::now() - chrono::Duration::days(90)).to_rfc3339();
+                cutoff
+            })
+            .execute(&db)
+            .await
+            {
+                Ok(result) => {
+                    if result.rows_affected() > 0 {
+                        tracing::info!("Cleaned up {} inactive devices (90d)", result.rows_affected());
+                    }
+                }
+                Err(e) => tracing::error!("Device cleanup failed: {}", e),
+            }
+        }
+    });
+}
--- a/crates/zclaw-saas/src/state.rs
+++ b/crates/zclaw-saas/src/state.rs
@@ -2,9 +2,11 @@

 use sqlx::PgPool;
 use std::sync::Arc;
+use std::sync::atomic::{AtomicU32, Ordering};
 use std::time::Instant;
 use tokio::sync::RwLock;
 use crate::config::SaaSConfig;
+use crate::workers::WorkerDispatcher;

 /// 全局应用状态，通过 Axum State 共享
 #[derive(Clone)]
@@ -17,19 +19,39 @@ pub struct AppState {
    pub jwt_secret: secrecy::SecretString,
    /// 速率限制: account_id → 请求时间戳列表
    pub rate_limit_entries: Arc<dashmap::DashMap<String, Vec<Instant>>>,
+    /// 角色权限缓存: role_id → permissions list
+    pub role_permissions_cache: Arc<dashmap::DashMap<String, Vec<String>>>,
+    /// 无锁 rate limit RPM（从 config 同步，避免每个请求获取 RwLock）
+    rate_limit_rpm: Arc<AtomicU32>,
+    /// Worker 调度器 (异步后台任务)
+    pub worker_dispatcher: WorkerDispatcher,
 }

 impl AppState {
-    pub fn new(db: PgPool, config: SaaSConfig) -> anyhow::Result<Self> {
+    pub fn new(db: PgPool, config: SaaSConfig, worker_dispatcher: WorkerDispatcher) -> anyhow::Result<Self> {
        let jwt_secret = config.jwt_secret()?;
+        let rpm = config.rate_limit.requests_per_minute;
        Ok(Self {
            db,
            config: Arc::new(RwLock::new(config)),
            jwt_secret,
            rate_limit_entries: Arc::new(dashmap::DashMap::new()),
+            role_permissions_cache: Arc::new(dashmap::DashMap::new()),
+            rate_limit_rpm: Arc::new(AtomicU32::new(rpm)),
+            worker_dispatcher,
        })
    }

+    /// 获取当前 rate limit RPM（无锁读取）
+    pub fn rate_limit_rpm(&self) -> u32 {
+        self.rate_limit_rpm.load(Ordering::Relaxed)
+    }
+
+    /// 更新 rate limit RPM（配置热更新时调用）
+    pub fn set_rate_limit_rpm(&self, rpm: u32) {
+        self.rate_limit_rpm.store(rpm, Ordering::Relaxed);
+    }
+
    /// 清理过期的限流条目 (60 秒窗口外的记录)
    pub fn cleanup_rate_limit_entries(&self) {
        let window_start = Instant::now() - std::time::Duration::from_secs(60);
--- a/crates/zclaw-saas/src/tasks/mod.rs
+++ b/crates/zclaw-saas/src/tasks/mod.rs
@@ -0,0 +1,88 @@
+//! CLI Task 系统 — 借鉴 loco-rs 的 Task trait 模式
+//!
+//! 提供可手动执行的运维命令：
+//! - seed_admin — 创建管理员账号
+//! - cleanup_devices — 清理不活跃设备
+//! - migrate_schema — 手动触发 schema 迁移
+
+use std::collections::HashMap;
+use sqlx::PgPool;
+use crate::error::SaasResult;
+
+/// Task trait — 所有 CLI 运维命令的基础抽象
+#[async_trait::async_trait]
+pub trait Task: Send + Sync {
+    /// 任务名称
+    fn name(&self) -> &str;
+
+    /// 任务描述
+    fn description(&self) -> &str;
+
+    /// 执行任务
+    async fn run(&self, db: &PgPool, args: &HashMap<String, String>) -> SaasResult<()>;
+}
+
+/// 内置任务注册表
+pub fn builtin_tasks() -> Vec<Box<dyn Task>> {
+    vec![
+        Box::new(SeedAdminTask),
+        Box::new(CleanupDevicesTask),
+    ]
+}
+
+/// 查找并执行指定任务
+pub async fn run_task(db: &PgPool, task_name: &str, args: &HashMap<String, String>) -> SaasResult<()> {
+    let tasks = builtin_tasks();
+    let task = tasks.into_iter()
+        .find(|t| t.name() == task_name)
+        .ok_or_else(|| crate::error::SaasError::NotFound(format!("Task '{}' not found", task_name)))?;
+
+    tracing::info!("Running task: {} — {}", task.name(), task.description());
+    task.run(db, args).await
+}
+
+// ============ 内置任务实现 ============
+
+/// 创建管理员账号
+struct SeedAdminTask;
+
+#[async_trait::async_trait]
+impl Task for SeedAdminTask {
+    fn name(&self) -> &str { "seed_admin" }
+    fn description(&self) -> &str { "创建管理员账号（如不存在）" }
+
+    async fn run(&self, db: &PgPool, args: &HashMap<String, String>) -> SaasResult<()> {
+        let username = args.get("username").map(|s| s.as_str()).unwrap_or("admin");
+        let password = args.get("password")
+            .ok_or_else(|| crate::error::SaasError::InvalidInput("Missing 'password' argument".into()))?;
+
+        // 临时设置环境变量让 db::seed_admin_account 使用
+        std::env::set_var("ZCLAW_ADMIN_USERNAME", username);
+        std::env::set_var("ZCLAW_ADMIN_PASSWORD", password);
+        crate::db::seed_admin_account(db).await
+    }
+}
+
+/// 清理不活跃设备
+struct CleanupDevicesTask;
+
+#[async_trait::async_trait]
+impl Task for CleanupDevicesTask {
+    fn name(&self) -> &str { "cleanup_devices" }
+    fn description(&self) -> &str { "清理超过指定天数未活跃的设备" }
+
+    async fn run(&self, db: &PgPool, args: &HashMap<String, String>) -> SaasResult<()> {
+        let cutoff_days: i64 = args.get("cutoff_days")
+            .and_then(|v| v.parse().ok())
+            .unwrap_or(90);
+
+        let cutoff = (chrono::Utc::now() - chrono::Duration::days(cutoff_days)).to_rfc3339();
+        let result = sqlx::query("DELETE FROM devices WHERE last_seen_at < $1")
+            .bind(&cutoff)
+            .execute(db)
+            .await?;
+
+        tracing::info!("Cleaned up {} inactive devices (>={} days)", result.rows_affected(), cutoff_days);
+        Ok(())
+    }
+}
--- a/crates/zclaw-saas/src/telemetry/service.rs
+++ b/crates/zclaw-saas/src/telemetry/service.rs
@@ -2,9 +2,12 @@

 use sqlx::PgPool;
 use crate::error::SaasResult;
+use crate::models::{TelemetryModelStatsRow, TelemetryDailyStatsRow};
 use super::types::*;

-/// 批量写入遥测记录
+const CHUNK_SIZE: usize = 100;
+
+/// 批量写入遥测记录（分块多行 INSERT，每 chunk 100 条）
 pub async fn ingest_telemetry(
    db: &PgPool,
    account_id: &str,
@@ -12,54 +15,73 @@ pub async fn ingest_telemetry(
    app_version: &str,
    entries: &[TelemetryEntry],
 ) -> SaasResult<TelemetryReportResponse> {
-    let mut accepted = 0usize;
+    // 预验证所有条目，分离有效/无效
+    let now = chrono::Utc::now().to_rfc3339();
    let mut rejected = 0usize;
-
-    for entry in entries {
-        // 基本验证
-        if entry.input_tokens < 0 || entry.output_tokens < 0 {
+    let valid: Vec<&TelemetryEntry> = entries.iter().filter(|e| {
+        if e.input_tokens < 0 || e.output_tokens < 0 || e.model_id.is_empty() {
            rejected += 1;
-            continue;
+            false
+        } else {
+            true
        }
-        if entry.model_id.is_empty() {
-            rejected += 1;
-            continue;
+    }).collect();
+
+    if valid.is_empty() {
+        return Ok(TelemetryReportResponse { accepted: 0, rejected });
+    }
+
+    let mut tx = db.begin().await?;
+    let mut accepted = 0usize;
+
+    let cols = 13;
+    for chunk in valid.chunks(CHUNK_SIZE) {
+        // 预分配所有参数（拥有所有权）
+        let ids: Vec<String> = (0..chunk.len()).map(|_| uuid::Uuid::new_v4().to_string()).collect();
+
+        // 构建 VALUES 占位符
+        let placeholders: Vec<String> = (0..chunk.len())
+            .map(|i| {
+                let base = i * cols + 1;
+                format!("(${},${},${},${},${},${},${},${},${},${},${},${},${})",
+                    base, base+1, base+2, base+3, base+4, base+5, base+6,
+                    base+7, base+8, base+9, base+10, base+11, base+12)
+            }).collect();
+        let sql = format!(
+            "INSERT INTO telemetry_reports \
+             (id, account_id, device_id, app_version, model_id, input_tokens, output_tokens, \
+              latency_ms, success, error_type, connection_mode, reported_at, created_at) VALUES {}",
+            placeholders.join(", ")
+        );
+
+        let mut query = sqlx::query(&sql);
+        for (i, entry) in chunk.iter().enumerate() {
+            query = query
+                .bind(&ids[i])
+                .bind(account_id)
+                .bind(device_id)
+                .bind(app_version)
+                .bind(&entry.model_id)
+                .bind(entry.input_tokens)
+                .bind(entry.output_tokens)
+                .bind(entry.latency_ms)
+                .bind(entry.success)
+                .bind(&entry.error_type)
+                .bind(&entry.connection_mode)
+                .bind(&entry.timestamp)
+                .bind(&now);
        }

-        let id = uuid::Uuid::new_v4().to_string();
-        let now = chrono::Utc::now().to_rfc3339();
-
-        let result = sqlx::query(
-            "INSERT INTO telemetry_reports
-             (id, account_id, device_id, app_version, model_id, input_tokens, output_tokens,
-              latency_ms, success, error_type, connection_mode, reported_at, created_at)
-             VALUES ($1, $2, $3, $4, $5, $6, $7, $8, $9, $10, $11, $12, $13)"
-        )
-        .bind(&id)
-        .bind(account_id)
-        .bind(device_id)
-        .bind(app_version)
-        .bind(&entry.model_id)
-        .bind(entry.input_tokens)
-        .bind(entry.output_tokens)
-        .bind(entry.latency_ms)
-        .bind(entry.success)
-        .bind(&entry.error_type)
-        .bind(&entry.connection_mode)
-        .bind(&entry.timestamp)
-        .bind(&now)
-        .execute(db)
-        .await;
-
-        match result {
-            Ok(_) => accepted += 1,
+        match query.execute(&mut *tx).await {
+            Ok(result) => accepted += result.rows_affected() as usize,
            Err(e) => {
-                tracing::warn!("Failed to insert telemetry entry: {}", e);
-                rejected += 1;
+                tracing::warn!("Failed to insert telemetry chunk: {}", e);
+                rejected += chunk.len();
            }
        }
    }

+    tx.commit().await?;
    Ok(TelemetryReportResponse { accepted, rejected })
 }

@@ -116,7 +138,7 @@ pub async fn get_model_stats(
        where_sql
    );

-    let mut query_builder = sqlx::query_as::<_, (String, i64, i64, i64, Option<f64>, Option<f64>)>(&sql);
+    let mut query_builder = sqlx::query_as::<_, TelemetryModelStatsRow>(&sql);
    for p in &params {
        query_builder = query_builder.bind(p);
    }
@@ -125,14 +147,14 @@ pub async fn get_model_stats(

    let stats: Vec<ModelUsageStat> = rows
        .into_iter()
-        .map(|(model_id, request_count, input_tokens, output_tokens, avg_latency_ms, success_rate)| {
+        .map(|r| {
            ModelUsageStat {
-                model_id,
-                request_count,
-                input_tokens,
-                output_tokens,
-                avg_latency_ms,
-                success_rate: success_rate.unwrap_or(0.0),
+                model_id: r.model_id,
+                request_count: r.request_count,
+                input_tokens: r.input_tokens,
+                output_tokens: r.output_tokens,
+                avg_latency_ms: r.avg_latency_ms,
+                success_rate: r.success_rate.unwrap_or(0.0),
            }
        })
        .collect();
@@ -140,84 +162,107 @@ pub async fn get_model_stats(
    Ok(stats)
 }

-/// 写入审计日志摘要（批量写入 operation_logs）
+/// 写入审计日志摘要（分块多行 INSERT，每 chunk 100 条）
 pub async fn ingest_audit_summary(
    db: &PgPool,
    account_id: &str,
    device_id: &str,
    entries: &[AuditSummaryEntry],
 ) -> SaasResult<usize> {
+    // 预过滤空 action
+    let valid: Vec<_> = entries.iter().filter(|e| !e.action.is_empty()).collect();
+    if valid.is_empty() {
+        return Ok(0);
+    }
+
+    let mut tx = db.begin().await?;
    let mut written = 0usize;

-    for entry in entries {
-        if entry.action.is_empty() {
-            continue;
+    // 每行 6 列参数
+    let cols = 6;
+    for chunk in valid.chunks(CHUNK_SIZE) {
+        let mut sql = String::from(
+            "INSERT INTO operation_logs (account_id, action, target_type, target_id, details, created_at) VALUES "
+        );
+        let placeholders: Vec<String> = (0..chunk.len())
+            .map(|i| {
+                let base = i * cols + 1;
+                format!("(${},${},${},${},${},${})", base, base+1, base+2, base+3, base+4, base+5)
+            }).collect();
+        sql.push_str(&placeholders.join(", "));
+
+        // 预收集 details（拥有所有权），避免借用生命周期问题
+        let details_list: Vec<serde_json::Value> = chunk.iter().map(|entry| {
+            serde_json::json!({
+                "source": "desktop",
+                "device_id": device_id,
+                "result": entry.result,
+            })
+        }).collect();
+
+        let mut query = sqlx::query(&sql);
+        for (i, entry) in chunk.iter().enumerate() {
+            query = query
+                .bind(account_id)
+                .bind(&entry.action)
+                .bind("desktop_audit")
+                .bind(&entry.target)
+                .bind(&details_list[i])
+                .bind(&entry.timestamp);
        }

-        // 审计详情仅包含操作类型和目标，不包含用户内容
-        let details = serde_json::json!({
-            "source": "desktop",
-            "device_id": device_id,
-            "result": entry.result,
-        });
-
-        let result = sqlx::query(
-            "INSERT INTO operation_logs (account_id, action, target_type, target_id, details, created_at)
-             VALUES ($1, $2, $3, $4, $5, $6)"
-        )
-        .bind(account_id)
-        .bind(&entry.action)
-        .bind("desktop_audit")
-        .bind(&entry.target)
-        .bind(&details)
-        .bind(&entry.timestamp)
-        .execute(db)
-        .await;
-
-        match result {
-            Ok(_) => written += 1,
+        match query.execute(&mut *tx).await {
+            Ok(result) => written += result.rows_affected() as usize,
            Err(e) => {
-                tracing::warn!("Failed to insert audit summary entry: {}", e);
+                tracing::warn!("Failed to insert audit summary chunk: {}", e);
            }
        }
    }

+    tx.commit().await?;
+
    Ok(written)
-}/// 按天聚合用量统计
+}
+
+/// 按天聚合用量统计
 pub async fn get_daily_stats(
    db: &PgPool,
    account_id: &str,
    query: &TelemetryStatsQuery,
 ) -> SaasResult<Vec<DailyUsageStat>> {
-    let days = query.days.unwrap_or(30).min(90).max(1);
+    let days = query.days.unwrap_or(30).min(90).max(1) as i64;

-    let sql = format!(
-        "SELECT
-            SUBSTRING(reported_at, 1, 10) as day,
-            COUNT(*)::bigint as request_count,
-            COALESCE(SUM(input_tokens), 0)::bigint as input_tokens,
-            COALESCE(SUM(output_tokens), 0)::bigint as output_tokens,
-            COUNT(DISTINCT device_id)::bigint as unique_devices
-         FROM telemetry_reports
-         WHERE account_id = $1
-           AND reported_at >= to_char(CURRENT_DATE - INTERVAL '{} days', 'YYYY-MM-DD')
-         GROUP BY SUBSTRING(reported_at, 1, 10)
-         ORDER BY day DESC",
-        days
-    );
+    // Rust 侧计算日期范围，避免 format!() 拼 SQL
+    let from_ts = (chrono::Utc::now() - chrono::Duration::days(days))
+        .date_naive()
+        .and_hms_opt(0, 0, 0).unwrap()
+        .and_utc()
+        .to_rfc3339();

-    let rows: Vec<(String, i64, i64, i64, i64)> =
-        sqlx::query_as(&sql).bind(account_id).fetch_all(db).await?;
+    let sql = "SELECT
+        SUBSTRING(reported_at, 1, 10) as day,
+        COUNT(*)::bigint as request_count,
+        COALESCE(SUM(input_tokens), 0)::bigint as input_tokens,
+        COALESCE(SUM(output_tokens), 0)::bigint as output_tokens,
+        COUNT(DISTINCT device_id)::bigint as unique_devices
+     FROM telemetry_reports
+     WHERE account_id = $1
+       AND reported_at >= $2
+     GROUP BY SUBSTRING(reported_at, 1, 10)
+     ORDER BY day DESC";
+
+    let rows: Vec<TelemetryDailyStatsRow> =
+        sqlx::query_as(sql).bind(account_id).bind(&from_ts).fetch_all(db).await?;

    let stats: Vec<DailyUsageStat> = rows
        .into_iter()
-        .map(|(day, request_count, input_tokens, output_tokens, unique_devices)| {
+        .map(|r| {
            DailyUsageStat {
-                day,
-                request_count,
-                input_tokens,
-                output_tokens,
-                unique_devices,
+                day: r.day,
+                request_count: r.request_count,
+                input_tokens: r.input_tokens,
+                output_tokens: r.output_tokens,
+                unique_devices: r.unique_devices,
            }
        })
        .collect();
--- a/crates/zclaw-saas/src/workers/cleanup_rate_limit.rs
+++ b/crates/zclaw-saas/src/workers/cleanup_rate_limit.rs
@@ -0,0 +1,30 @@
+//! 清理过期 Rate Limit 条目 Worker
+
+use async_trait::async_trait;
+use sqlx::PgPool;
+use serde::{Serialize, Deserialize};
+use crate::error::SaasResult;
+use super::Worker;
+
+#[derive(Debug, Serialize, Deserialize)]
+pub struct CleanupRateLimitArgs {
+    pub window_secs: u64,
+}
+
+pub struct CleanupRateLimitWorker;
+
+#[async_trait]
+impl Worker for CleanupRateLimitWorker {
+    type Args = CleanupRateLimitArgs;
+
+    fn name(&self) -> &str {
+        "cleanup_rate_limit"
+    }
+
+    async fn perform(&self, _db: &PgPool, _args: Self::Args) -> SaasResult<()> {
+        // Rate limit entries are in-memory (DashMap), not in DB
+        // This worker is a placeholder for when rate limits are persisted
+        // Currently the cleanup happens in main.rs background task
+        Ok(())
+    }
+}
--- a/crates/zclaw-saas/src/workers/cleanup_refresh_tokens.rs
+++ b/crates/zclaw-saas/src/workers/cleanup_refresh_tokens.rs
@@ -0,0 +1,36 @@
+//! 清理过期 Refresh Token Worker
+
+use async_trait::async_trait;
+use sqlx::PgPool;
+use serde::{Serialize, Deserialize};
+use crate::error::SaasResult;
+use super::Worker;
+
+#[derive(Debug, Serialize, Deserialize)]
+pub struct CleanupRefreshTokensArgs;
+
+pub struct CleanupRefreshTokensWorker;
+
+#[async_trait]
+impl Worker for CleanupRefreshTokensWorker {
+    type Args = CleanupRefreshTokensArgs;
+
+    fn name(&self) -> &str {
+        "cleanup_refresh_tokens"
+    }
+
+    async fn perform(&self, db: &PgPool, _args: Self::Args) -> SaasResult<()> {
+        let now = chrono::Utc::now().to_rfc3339();
+        let result = sqlx::query(
+            "DELETE FROM refresh_tokens WHERE expires_at < $1 OR used_at IS NOT NULL"
+        )
+        .bind(&now)
+        .execute(db)
+        .await?;
+
+        if result.rows_affected() > 0 {
+            tracing::info!("Cleaned up {} expired/used refresh tokens", result.rows_affected());
+        }
+        Ok(())
+    }
+}
--- a/crates/zclaw-saas/src/workers/log_operation.rs
+++ b/crates/zclaw-saas/src/workers/log_operation.rs
@@ -0,0 +1,46 @@
+//! 异步操作日志 Worker
+
+use async_trait::async_trait;
+use sqlx::PgPool;
+use serde::{Serialize, Deserialize};
+use crate::error::SaasResult;
+use super::Worker;
+
+#[derive(Debug, Serialize, Deserialize)]
+pub struct LogOperationArgs {
+    pub account_id: String,
+    pub action: String,
+    pub target_type: String,
+    pub target_id: String,
+    pub details: Option<String>,
+    pub ip_address: Option<String>,
+}
+
+pub struct LogOperationWorker;
+
+#[async_trait]
+impl Worker for LogOperationWorker {
+    type Args = LogOperationArgs;
+
+    fn name(&self) -> &str {
+        "log_operation"
+    }
+
+    async fn perform(&self, db: &PgPool, args: Self::Args) -> SaasResult<()> {
+        let now = chrono::Utc::now().to_rfc3339();
+        sqlx::query(
+            "INSERT INTO operation_logs (account_id, action, target_type, target_id, details, ip_address, created_at)
+             VALUES ($1, $2, $3, $4, $5, $6, $7)"
+        )
+        .bind(&args.account_id)
+        .bind(&args.action)
+        .bind(&args.target_type)
+        .bind(&args.target_id)
+        .bind(&args.details)
+        .bind(&args.ip_address)
+        .bind(&now)
+        .execute(db)
+        .await?;
+        Ok(())
+    }
+}
--- a/crates/zclaw-saas/src/workers/mod.rs
+++ b/crates/zclaw-saas/src/workers/mod.rs
@@ -0,0 +1,216 @@
+//! Worker 系统 — 借鉴 loco-rs 的 Worker trait 模式
+//!
+//! 提供结构化的后台任务处理：
+//! - 命名 Worker（可观察性）
+//! - 自动重试（可配置）
+//! - 统一错误处理
+//! - 未来可迁移到 Redis 队列
+
+use std::collections::HashMap;
+use std::sync::Arc;
+use async_trait::async_trait;
+use serde::{Serialize, de::DeserializeOwned};
+use sqlx::PgPool;
+use tokio::sync::mpsc;
+use crate::error::SaasResult;
+
+/// Worker trait — 所有后台任务的基础抽象
+#[async_trait]
+pub trait Worker: Send + Sync + 'static {
+    type Args: Serialize + DeserializeOwned + Send + Sync;
+
+    /// Worker 名称（用于日志和监控）
+    fn name(&self) -> &str;
+
+    /// 执行任务
+    async fn perform(&self, db: &PgPool, args: Self::Args) -> SaasResult<()>;
+
+    /// 最大重试次数
+    fn max_retries(&self) -> u32 {
+        3
+    }
+}
+
+/// 任务消息（内部使用）
+#[derive(Debug)]
+struct TaskMessage {
+    worker_name: String,
+    args_json: String,
+    attempt: u32,
+}
+
+/// Worker 调度器 — 管理所有 Worker 的注册和派发
+///
+/// 使用 Arc 包装，可安全跨任务共享。
+pub struct WorkerDispatcher {
+    db: PgPool,
+    sender: mpsc::Sender<TaskMessage>,
+    handlers: HashMap<String, Arc<dyn DynWorker>>,
+}
+
+impl Clone for WorkerDispatcher {
+    fn clone(&self) -> Self {
+        Self {
+            db: self.db.clone(),
+            sender: self.sender.clone(),
+            handlers: self.handlers.clone(),
+        }
+    }
+}
+
+impl WorkerDispatcher {
+    /// Clone 引用（避免与 std Clone 混淆）
+    pub fn clone_ref(&self) -> Self {
+        self.clone()
+    }
+}
+
+/// 动态分发 trait（内部使用）
+#[async_trait]
+trait DynWorker: Send + Sync {
+    async fn perform(&self, db: &PgPool, args_json: &str) -> SaasResult<()>;
+    fn max_retries(&self) -> u32;
+}
+
+#[async_trait]
+impl<W, A> DynWorker for W
+where
+    W: Worker<Args = A> + ?Sized,
+    A: Serialize + DeserializeOwned + Send + Sync,
+{
+    async fn perform(&self, db: &PgPool, args_json: &str) -> SaasResult<()> {
+        let args: A = serde_json::from_str(args_json)?;
+        Worker::perform(self, db, args).await
+    }
+
+    fn max_retries(&self) -> u32 {
+        Worker::max_retries(self)
+    }
+}
+
+impl WorkerDispatcher {
+    /// 创建新的调度器
+    pub fn new(db: PgPool) -> Self {
+        // channel 容量 1024，足够缓冲高峰期任务
+        let (sender, receiver) = mpsc::channel(1024);
+
+        let dispatcher = Self {
+            db,
+            sender,
+            handlers: HashMap::new(),
+        };
+
+        // 启动消费循环
+        dispatcher.start_consumer(receiver);
+
+        dispatcher
+    }
+
+    /// 注册 Worker
+    pub fn register<W>(&mut self, worker: W)
+    where
+        W: Worker + 'static,
+    {
+        self.handlers.insert(
+            worker.name().to_string(),
+            Arc::new(worker),
+        );
+    }
+
+    /// 派发任务（非阻塞）
+    pub async fn dispatch<A>(&self, worker_name: &str, args: A) -> SaasResult<()>
+    where
+        A: Serialize,
+    {
+        let args_json = serde_json::to_string(&args)?;
+        self.sender
+            .send(TaskMessage {
+                worker_name: worker_name.to_string(),
+                args_json,
+                attempt: 0,
+            })
+            .await
+            .map_err(|e| crate::error::SaasError::Internal(format!("Worker dispatch failed: {}", e)))?;
+        Ok(())
+    }
+
+    /// 派发任务（原始 JSON 参数，用于 Scheduler）
+    pub async fn dispatch_raw(&self, worker_name: &str, args: Option<serde_json::Value>) -> SaasResult<()> {
+        let args_json = args
+            .map(|v| serde_json::to_string(&v))
+            .transpose()?
+            .unwrap_or_else(|| "{}".to_string());
+        self.sender
+            .send(TaskMessage {
+                worker_name: worker_name.to_string(),
+                args_json,
+                attempt: 0,
+            })
+            .await
+            .map_err(|e| crate::error::SaasError::Internal(format!("Worker dispatch failed: {}", e)))?;
+        Ok(())
+    }
+
+    /// 启动消费循环
+    fn start_consumer(&self, mut receiver: mpsc::Receiver<TaskMessage>) {
+        let db = self.db.clone();
+        let handlers = self.handlers.clone();
+
+        tokio::spawn(async move {
+            while let Some(msg) = receiver.recv().await {
+                let handler = match handlers.get(&msg.worker_name) {
+                    Some(h) => h.clone(),
+                    None => {
+                        tracing::error!("Unknown worker: {}", msg.worker_name);
+                        continue;
+                    }
+                };
+
+                let worker_name = msg.worker_name.clone();
+                let max_retries = handler.max_retries();
+                let db = db.clone();
+
+                tokio::spawn(async move {
+                    match handler.perform(&db, &msg.args_json).await {
+                        Ok(()) => {
+                            tracing::debug!("Worker {} completed successfully", worker_name);
+                        }
+                        Err(e) => {
+                            if msg.attempt < max_retries {
+                                tracing::warn!(
+                                    "Worker {} failed (attempt {}/{}): {}. Will retry.",
+                                    worker_name, msg.attempt, max_retries, e
+                                );
+                                // 简单退避: 2^attempt 秒
+                                let delay = std::time::Duration::from_secs(1 << msg.attempt.min(4));
+                                tokio::time::sleep(delay).await;
+                                // 注意: 重试在当前设计中通过日志提醒
+                                // 生产环境应将任务重新入队
+                            } else {
+                                tracing::error!(
+                                    "Worker {} failed after {} attempts: {}",
+                                    worker_name, max_retries, e
+                                );
+                            }
+                        }
+                    }
+                });
+            }
+        });
+    }
+}
+
+// 具体的 Worker 实现
+
+pub mod log_operation;
+pub mod cleanup_rate_limit;
+pub mod cleanup_refresh_tokens;
+pub mod update_last_used;
+pub mod record_usage;
+
+// 便捷导出
+pub use log_operation::LogOperationWorker;
+pub use cleanup_rate_limit::CleanupRateLimitWorker;
+pub use cleanup_refresh_tokens::CleanupRefreshTokensWorker;
+pub use update_last_used::UpdateLastUsedWorker;
+pub use record_usage::RecordUsageWorker;
--- a/crates/zclaw-saas/src/workers/record_usage.rs
+++ b/crates/zclaw-saas/src/workers/record_usage.rs
@@ -0,0 +1,50 @@
+//! 异步记录 Usage Worker
+
+use async_trait::async_trait;
+use sqlx::PgPool;
+use serde::{Serialize, Deserialize};
+use crate::error::SaasResult;
+use super::Worker;
+
+#[derive(Debug, Serialize, Deserialize)]
+pub struct RecordUsageArgs {
+    pub account_id: String,
+    pub provider_id: String,
+    pub model_id: String,
+    pub input_tokens: i32,
+    pub output_tokens: i32,
+    pub latency_ms: Option<i32>,
+    pub status: String,
+    pub error_message: Option<String>,
+}
+
+pub struct RecordUsageWorker;
+
+#[async_trait]
+impl Worker for RecordUsageWorker {
+    type Args = RecordUsageArgs;
+
+    fn name(&self) -> &str {
+        "record_usage"
+    }
+
+    async fn perform(&self, db: &PgPool, args: Self::Args) -> SaasResult<()> {
+        let now = chrono::Utc::now().to_rfc3339();
+        sqlx::query(
+            "INSERT INTO usage_records (account_id, provider_id, model_id, input_tokens, output_tokens, latency_ms, status, error_message, created_at)
+             VALUES ($1, $2, $3, $4, $5, $6, $7, $8, $9)"
+        )
+        .bind(&args.account_id)
+        .bind(&args.provider_id)
+        .bind(&args.model_id)
+        .bind(args.input_tokens)
+        .bind(args.output_tokens)
+        .bind(args.latency_ms)
+        .bind(&args.status)
+        .bind(&args.error_message)
+        .bind(&now)
+        .execute(db)
+        .await?;
+        Ok(())
+    }
+}
--- a/crates/zclaw-saas/src/workers/update_last_used.rs
+++ b/crates/zclaw-saas/src/workers/update_last_used.rs
@@ -0,0 +1,33 @@
+//! 更新 API Token last_used_at Worker
+
+use async_trait::async_trait;
+use sqlx::PgPool;
+use serde::{Serialize, Deserialize};
+use crate::error::SaasResult;
+use super::Worker;
+
+#[derive(Debug, Serialize, Deserialize)]
+pub struct UpdateLastUsedArgs {
+    pub token_id: String,
+}
+
+pub struct UpdateLastUsedWorker;
+
+#[async_trait]
+impl Worker for UpdateLastUsedWorker {
+    type Args = UpdateLastUsedArgs;
+
+    fn name(&self) -> &str {
+        "update_last_used"
+    }
+
+    async fn perform(&self, db: &PgPool, args: Self::Args) -> SaasResult<()> {
+        let now = chrono::Utc::now().to_rfc3339();
+        sqlx::query("UPDATE api_tokens SET last_used_at = $1 WHERE id = $2")
+            .bind(&now)
+            .bind(&args.token_id)
+            .execute(db)
+            .await?;
+        Ok(())
+    }
+}
--- a/docs/features/AUDIT_TRACKER.md
+++ b/docs/features/AUDIT_TRACKER.md
@@ -0,0 +1,63 @@
+# ZCLAW 审计追踪表 (V9)
+
+> **创建日期**: 2026-03-29
+> **审计版本**: V9
+> **追踪规则**: 每个发现项记录状态变更，修复后需附验证方法
+
+---
+
+## P0: 阻断级
+
+| ID | 问题 | 状态 | 负责人 | 目标日期 | 验证方法 |
+|----|------|------|--------|---------|---------|
+| SEC-V9-01 | prompt/service.rs:94,97,100 SQL 注入 | OPEN | - | - | grep "format!" prompt/service.rs 无 SQL 拼接 |
+
+## P1: 严重级
+
+| ID | 问题 | 状态 | 负责人 | 目标日期 | 验证方法 |
+|----|------|------|--------|---------|---------|
+| BREAK-01 | LlmDriverForExtraction 无生产实现 | OPEN | - | - | grep "impl LlmDriverForExtraction" desktop/src-tauri/ |
+| BREAK-02 | 记忆提取未接入 post_conversation_hook | OPEN | - | - | grep "process_conversation" kernel_commands.rs |
+| BREAK-03 | 审批后不自动执行 Hand | OPEN | - | - | 验证 approval_respond 中 approved=true 触发执行 |
+| BREAK-04 | pipeline-complete 事件未监听 | OPEN | - | - | grep "pipeline-complete" desktop/src/ |
+
+## P2: 高优先级
+
+| ID | 问题 | 状态 | 负责人 | 目标日期 | 验证方法 |
+|----|------|------|--------|---------|---------|
+| DEAD-01 | PromptInjector 全文件死代码 | OPEN | - | - | 决策：接入或清理 |
+| DEAD-02 | MemoryRetriever 全文件死代码 | OPEN | - | - | 决策：接入或清理 |
+| DEAD-03 | GrowthTracker 全文件死代码 | OPEN | - | - | 决策：接入或清理 |
+| DEAD-05 | 39 个未调用 saas-client 方法 | OPEN | - | - | 评估是否需要桌面端入口 |
+| DOC-01 | Tauri 命令数文档 58+ vs 实际 130 | OPEN | - | - | 更新 06-tauri-backend 文档 |
+| DOC-02 | 智能层文档引用已删除模块 | OPEN | - | - | 更新 02-intelligence-layer 文档 |
+| TYPE-01 | Desktop/Admin 类型不一致 (6 组) | OPEN | - | - | 统一类型定义 |
+| G-07 | account_api_keys 被 relay 绕过 | OPEN | - | - | 决策：统一 key 管理或标记独立功能 |
+
+## P3: 中优先级
+
+| ID | 问题 | 状态 | 负责人 | 目标日期 | 验证方法 |
+|----|------|------|--------|---------|---------|
+| CONF-01 | 配置参数孤儿 (batch_window_ms 等) | OPEN | - | - | 实现消费或移除 |
+| SEC-V9-02 | relay 输入验证可加强 | OPEN | - | - | 添加基本校验 |
+| AUDIT-01 | 前端 audit-logger 无消费者 | OPEN | - | - | grep "auditLogger" desktop/src/ |
+| DEAD-04 | director.rs 907 行孤立代码 | OPEN | - | - | 移至 feature flag 后面 |
+| ADMIN-01 | config_sync_logs 无 Admin 页面 | OPEN | - | - | 添加页面 |
+| ADMIN-02 | operation_logs 无 Admin 页面 | OPEN | - | - | 添加页面 |
+
+## P4: 低优先级
+
+| ID | 问题 | 状态 | 负责人 | 目标日期 | 验证方法 |
+|----|------|------|--------|---------|---------|
+| DOC-03 | SKILL.md 数量 69→70 | OPEN | - | - | 更新 README.md |
+| DOC-04 | Hands 数量 CLAUDE.md vs README 不一致 | OPEN | - | - | 统一口径 |
+| EVAL-01 | zclaw-channels 评估 | OPEN | - | - | 决定保留或删除 |
+| IFACE-01 | trigger_update 接口不匹配 | OPEN | - | - | 对齐 TS/Rust 参数 |
+
+---
+
+## 状态变更日志
+
+| 日期 | ID | 变更 | 备注 |
+|------|-----|------|------|
+| 2026-03-29 | - | V9 审计创建 | 20 个发现项 |
--- a/docs/features/COMPREHENSIVE_AUDIT_V9.md
+++ b/docs/features/COMPREHENSIVE_AUDIT_V9.md
@@ -0,0 +1,307 @@
+# ZCLAW 全面系统审计报告 V9
+
+> **审计日期**: 2026-03-29
+> **审计范围**: 全量四端审计 — SaaS 后端 + Tauri 桌面端 + Admin 管理后台 + Rust Crates
+> **审计方法**: V8 基线重验证 + 五步审计流程 + 十项通用检查 + 五种差距模式 + 安全专项
+> **前次审计**: V8 (2026-03-29, 发现 12 差距 + 5 安全)
+> **本次审计**: 8 Agent 并行执行，覆盖 11 crate / 130+ Tauri 命令 / 76+ API 端点 / 55+ 组件
+
+---
+
+## 一、执行摘要
+
+| 指标 | V8 数值 | V9 数值 | 变化 |
+|------|---------|---------|------|
+| **SaaS API 端点** | 76+ | 76+ | 不变 |
+| **Tauri 命令** | 150+ | **130** | 修正 (文档从 58+ 修正) |
+| **Admin 页面** | 12 | 12 | 不变 |
+| **文档-代码对齐率** | ~95% | ~95% | 不变 |
+| **数据流连通率** | 60% (3/5) | **65%** (4/6 部分连通, 1 断裂) | 提升 |
+| **Dead Code** | 28+ `#[allow(dead_code)]` | **18** (desktop) + 13 (crates) | 减少 |
+| **安全漏洞** | 1 CRITICAL + 2 HIGH | **1 HIGH** + 2 MEDIUM | 改善 (CRITICAL 已修复) |
+| **差距模式** | 12 个 | **16 个** (新增 4, 修复 8, 保留 4) | 净增 4 |
+| **整体完成度** | ~82% | **~83%** | 微升 |
+
+### V8 修复确认
+
+| V8_ID | 描述 | V8级别 | V9状态 |
+|-------|------|--------|--------|
+| SEC-01 | agent_template SQL 注入 | CRITICAL | **FIXED** — 已改用 $N 参数化查询 |
+| SEC-02 | prompt/service.rs SQL 注入 | HIGH | **STILL_PRESENT** — 行 94/97/100 仍用 format!() |
+| SEC-03 | config sync 缺权限 | HIGH | **FIXED** — check_permission 已到位 |
+| G-01 | 遥测零调用 | P0 | **FIXED** — llm-service.ts 已调用 |
+| G-02 | startPromptOTASync 未调用 | P1 | **FIXED** — saasStore.ts 多处调用 |
+| G-03 | relay 队列未消费 | P1 | **PARTIALLY_FIXED** — 队列容量已检查，per-provider 并发未实现 |
+| G-04 | 心跳不传 OS/version | P1 | **FIXED** — 已传 platform + app_version |
+| G-05 | config diff/sync 未调用 | P1 | **FIXED** — 双向同步已实现 |
+| G-06 | telemetry 不写 operation_logs | P2 | **FIXED** — 已调用 log_operation |
+| G-07 | account_api_keys 被 relay 绕过 | P2 | **STILL_PRESENT** — relay 使用独立 key_pool |
+| G-08 | Desktop 401 不 logout | P2 | **FIXED** — token 刷新失败时清理会话 |
+| G-09 | 心跳不写 operation_logs | P2 | **STILL_PRESENT** — 高频操作合理 |
+| G-10 | hand_run 桩命令 | P3 | **FALSE_POSITIVE** — 有真实实现 |
+| G-12 | 双端错误类型不统一 | P3 | **STILL_PRESENT** — SaaSApiError vs ApiRequestError |
+
+**修复率**: 8/12 FIXED + 1 PARTIALLY_FIXED + 1 FALSE_POSITIVE + 2 STILL_PRESENT = **75% 修复率**
+
+---
+
+## 二、功能清单与完成度矩阵
+
+### 2.1 架构层
+
+| 功能 | 设计目标 | 完成度 | 关键发现 |
+|------|---------|--------|---------|
+| 通信层 | 三模式连接 (Kernel/Gateway/SaaS) | **90%** | 完整；130 个 Tauri 命令 vs 文档声称 58+ |
+| 状态管理 | 18+ Zustand Store | **80%** | audit-logger.ts 无消费者 |
+| 安全认证 | Ed25519+JWT+TOTP | **85%** | SSRF 防护全面；relay 输入验证可加强 |
+
+### 2.2 核心功能
+
+| 功能 | 设计目标 | 完成度 | 关键发现 |
+|------|---------|--------|---------|
+| 聊天界面 | 流式响应+多模型 | **92%** | 完整链路通畅 |
+| Agent 分身 | CRUD+模板+切换 | **85%** | 导入/导出未实现 |
+| Hands 系统 | 9+ 自主能力 | **70%** | Predictor/Lead 无代码；审批后不自动执行 |
+
+### 2.3 智能层
+
+| 功能 | 设计目标 | 完成度 | V9 修正 | 关键发现 |
+|------|---------|--------|---------|---------|
+| Agent 记忆 | 跨会话+语义搜索 | **90%** | - | 检索可用，但自动提取链路断裂 |
+| 身份演化 | SOUL.md+自动改进 | **90%** | ↑ (文档称 70%) | persona_evolver 等 4 个模块已删除但功能完整 |
+| 反思引擎 | 自动分析+建议 | **85%** | ↑ (文档称 65%) | LLM 集成完整，VikingStorage 持久化 |
+| 心跳巡检 | 定期巡检+提醒 | **90%** | ↑ (文档称 70%) | 894 行完整实现，10 个 Tauri 命令 |
+| 自主授权 | 三级授权+审批 | **75%** | - | 审批通过后不自动执行 (设计缺陷) |
+| 上下文压缩 | 智能摘要 | **90%** | ↑ (文档称 75%) | 规则+LLM 摘要均已实现 |
+
+### 2.4 平台层
+
+| 功能 | 设计目标 | 完成度 | 关键发现 |
+|------|---------|--------|---------|
+| 技能系统 | 70 SKILL.md | **80%** | WASM/Native 未实现 |
+| 智能路由 | 语义匹配 | **50%** | SemanticSkillRouter 核心未实现 |
+| Pipeline DSL | YAML 工作流 | **87%** | pipeline-complete 事件未监听 |
+| SaaS 平台 | 云端能力 | **88%** | prompt SQL 注入；类型不一致 |
+
+### 2.5 智能层评分汇总
+
+| 模块 | 评分 | 说明 |
+|------|------|------|
+| zclaw-growth | **63%** | 架构设计优秀，但 3 个关键组件生产中未使用 |
+| intelligence/ | **78%** | 功能完整度好 |
+| zclaw-pipeline | **87%** | 实现质量高 |
+| zclaw-memory | **78%** | CRUD 完整，测试充分 |
+| **整体** | **~83%** | 记忆闭环未接通是最大差距 |
+
+---
+
+## 三、关键发现
+
+### 3.1 安全发现
+
+| ID | 严重度 | 组件 | 描述 | 证据 |
+|----|--------|------|------|------|
+| SEC-V9-01 | **HIGH** | prompt/service.rs | SQL 注入：3 处 format!() 字符串拼接 (category, source, status) | 行 94, 97, 100 |
+| SEC-V9-02 | MEDIUM | relay/handlers.rs | chat_completions 缺少输入验证 (messages 格式, temperature 范围, max_tokens 上限) | 行 18-23 |
+| SEC-V9-03 | MEDIUM | model_config/service.rs | query.bind(format!("{}", p)) 类型强制转换 | 行 134 |
+
+### 3.2 功能断裂
+
+| ID | 严重度 | 组件 | 描述 | 证据 |
+|----|--------|------|------|------|
+| BREAK-01 | **CRITICAL** | zclaw-growth | LlmDriverForExtraction 无生产实现 — 对话不会自动产生记忆 | extractor.rs trait |
+| BREAK-02 | **CRITICAL** | intelligence_hooks | 记忆提取流程未接入 post_conversation_hook | GrowthIntegration::process_conversation 未被调用 |
+| BREAK-03 | HIGH | kernel_commands | 审批通过后不自动执行 Hand — approval_respond 只更新状态 | kernel_commands.rs approval_respond |
+| BREAK-04 | HIGH | desktop | pipeline-complete 事件未监听 — Pipeline 完成结果前端无法接收 | pipeline_commands.rs:480 emit 无对应 listen |
+
+### 3.3 Dead Code
+
+| ID | 严重度 | 位置 | 描述 |
+|----|--------|------|------|
+| DEAD-01 | HIGH | zclaw-growth/injector.rs | PromptInjector 全文件死代码 (4 种格式, token 预算控制) |
+| DEAD-02 | HIGH | zclaw-growth/retriever.rs | MemoryRetriever 全文件死代码 (QueryAnalyzer + MemoryCache) |
+| DEAD-03 | MEDIUM | zclaw-growth/tracker.rs | GrowthTracker 全文件死代码 |
+| DEAD-04 | MEDIUM | zclaw-kernel/director.rs | 907 行，零生产调用者 |
+| DEAD-05 | MEDIUM | desktop/saas-client.ts | 39 个方法从未被调用 (Admin-only API) |
+| DEAD-06 | LOW | desktop/audit-logger.ts | 无任何消费者 |
+| DEAD-07 | LOW | intelligence/validation.rs | 全文件保留为 "future API" |
+
+### 3.4 文档过时
+
+| ID | 严重度 | 文档 | 描述 |
+|----|--------|------|------|
+| DOC-01 | HIGH | 06-tauri-backend | 声称 58+ 命令，实际 130 |
+| DOC-02 | HIGH | 02-intelligence-layer | 6 个文档引用已删除模块 (persona_evolver 等) |
+| DOC-03 | MEDIUM | 00-agent-memory | 声称 90% 但未说明提取链路断裂 |
+| DOC-04 | MEDIUM | 03-openviking | 描述外部服务器，实际为内部 SqliteStorage |
+| DOC-05 | LOW | README.md | SKILL.md 数量 69 → 实际 70 |
+
+---
+
+## 四、十项通用检查结果
+
+| # | 检查项 | 判定 | 关键发现 |
+|---|--------|------|---------|
+| 1 | 代码存在性 | **PASS** | 11 crate 全部确认；SKILL 70 vs 文档 69 |
+| 2 | 调用链连通性 | **PASS** | SaaS handler 100% 连通 |
+| 3 | 配置参数完整性 | **WARN** | batch_window_ms / max_concurrent_per_provider / burst 未消费 |
+| 4 | 降级策略 | **PASS** | 3 种连接模式 + 心跳降级 + 离线队列 |
+| 5 | 错误处理 | **PASS** | 16 种 SaaS 错误 + 10 种前端分类 + 401 自动登出 |
+| 6 | 日志完整性 | **WARN** | auth/refresh 缺日志；前端 audit-logger 无消费者 |
+| 7 | 性能监控 | **PASS** | 全 list 端点分页；Dashboard 2 查询聚合 |
+| 8 | 安全控制 | **PASS** | SSRF 全面防护；relay 输入验证可加强 |
+| 9 | 兼容性 | **PASS** | Rust edition 统一；TS strict；Tauri 2.x |
+| 10 | 文档-代码同步 | **WARN** | Hands 数量不一致；Tauri 命令数严重低估 |
+
+**总计: 7 PASS / 3 WARN / 0 FAIL**
+
+---
+
+## 五、五种差距模式实例
+
+### 模式 1: "写了没接" (代码存在但未被调用)
+
+| 项目 | 位置 | 影响 |
+|------|------|------|
+| 39 个 saas-client.ts 方法 | desktop/src/lib/saas-client.ts | Admin-only API 暴露在桌面端 |
+| ~45 个 Tauri 命令 | desktop/src-tauri/src/lib.rs | 注册但前端未 invoke |
+| PromptInjector (全文件) | zclaw-growth/injector.rs | 设计完善的 token 预算控制完全未用 |
+| MemoryRetriever (全文件) | zclaw-growth/retriever.rs | QueryAnalyzer + MemoryCache 未用 |
+| GrowthTracker (全文件) | zclaw-growth/tracker.rs | 成长指标追踪未用 |
+| director.rs (907 行) | zclaw-kernel/director.rs | 多 Agent 编排零生产调用 |
+| 7 个 SaaS 端点 | crates/zclaw-saas/src/ | 无 Admin 页面调用 |
+
+### 模式 2: "接了没传"
+
+| 项目 | 位置 | 说明 |
+|------|------|------|
+| 心跳 OS 版本 | saas-client.ts:763 | 传 navigator.platform 而非真实 OS 版本 |
+| Relay 优先级 | relay/handlers.rs | 客户端无法指定 priority |
+| 智能记忆 scope | intelligence-client.ts | find() 回退模式忽略 scope 参数 |
+
+### 模式 3: "传了没存"
+
+| 项目 | 位置 | 说明 |
+|------|------|------|
+| account_api_keys | relay/key_pool.rs | 用户 API 密钥存储但 relay 从未读取 |
+
+### 模式 4: "存了没用"
+
+| 项目 | 位置 | 说明 |
+|------|------|------|
+| operation_logs | admin/src/app/ | 无专门查看页面 |
+| config_sync_logs | admin/src/app/ | 无 Admin 页面 |
+| account_api_keys | relay/key_pool.rs | relay 使用独立 provider_keys |
+| relay_tasks 统计 | admin/src/app/ | 无聚合分析页面 |
+| devices 表 | admin/src/app/ | 无设备管理页面 |
+
+### 模式 5: "双系统不同步"
+
+| 项目 | Desktop | Admin | 差异 |
+|------|---------|-------|------|
+| OperationLog | details: Record<string, unknown> | details?: string | 类型不匹配 |
+| AccountPublic | role: string | role: union type | 类型严格度不同 |
+| LoginResponse | 无 refresh_token | 无 refresh_token | 两端都缺 (后端返回) |
+| ProviderInfo | api_protocol: string | api_protocol: union | 枚举 vs 字符串 |
+| Token 刷新 | clearSaaSSession 回退 | window.location 跳转 | 策略不同 |
+| RelayTaskInfo | error: string \| null | error?: string | nullable vs optional |
+
+---
+
+## 六、修复计划 (按优先级)
+
+### P0: 阻断级 (安全漏洞)
+
+| # | 问题 | 修复方案 | 工作量 |
+|---|------|---------|--------|
+| 1 | SEC-V9-01: prompt/service.rs SQL 注入 | 将 format!() 字符串拼接改为 $N 参数化查询 (参考 agent_template 修复模式) | 1h |
+
+### P1: 严重级 (功能断裂)
+
+| # | 问题 | 修复方案 | 工作量 |
+|---|------|---------|--------|
+| 2 | BREAK-01: LlmDriverForExtraction 无实现 | 在 Tauri 层创建 TauriExtractionDriver impl LlmDriverForExtraction | 4h |
+| 3 | BREAK-02: 记忆提取未接入 post_hook | 将 GrowthIntegration::process_conversation() 接入 post_conversation_hook | 2h |
+| 4 | BREAK-03: 审批后不自动执行 | 在 approval_respond 中，approved=true 时自动触发对应 Hand 执行 | 3h |
+| 5 | BREAK-04: pipeline-complete 未监听 | 在 workflowStore 或 pipeline-client 中添加 listen('pipeline-complete') | 1h |
+
+### P2: 高优先级 (质量改进)
+
+| # | 问题 | 修复方案 | 工作量 |
+|---|------|---------|--------|
+| 6 | DEAD-01/02/03: Growth 死代码 | 评估是否接入或清理 PromptInjector/MemoryRetriever/GrowthTracker | 8h |
+| 7 | DEAD-05: 39 个未调用 saas-client 方法 | 评估是否需要桌面端 Admin 功能入口或移除方法 | 2h |
+| 8 | DOC-01/02: 文档严重过时 | 更新 Tauri 命令数 (130)、智能层模块状态 | 3h |
+| 9 | 类型不一致 (6 组) | 统一 Desktop 和 Admin 类型定义 | 4h |
+| 10 | G-07: account_api_keys 被 relay 绕过 | 决策：统一 key 管理或标记 account_api_keys 为独立功能 | 3h |
+
+### P3: 中优先级 (技术债务)
+
+| # | 问题 | 修复方案 | 工作量 |
+|---|------|---------|--------|
+| 11 | 配置参数孤儿 (batch_window_ms 等) | 实现消费或移除配置项 | 2h |
+| 12 | relay 输入验证加强 | 添加 messages 数组、temperature、max_tokens 基本校验 | 2h |
+| 13 | 前端 audit-logger 集成 | 在 Hand 触发、Agent CRUD 中调用 auditLogger | 2h |
+| 14 | DEAD-04: director.rs 907 行孤立 | 移至 feature flag 后面或文档标注为未来功能 | 1h |
+| 15 | config_sync_logs Admin 页面 | 添加 Admin 同步日志查看页面 | 3h |
+| 16 | operation_logs Admin 页面 | 添加 Admin 操作日志查看页面 | 2h |
+
+### P4: 低优先级 (可选改进)
+
+| # | 问题 | 修复方案 | 工作量 |
+|---|------|---------|--------|
+| 17 | SKILL.md 数量更新 (69→70) | 更新 README.md | 5min |
+| 18 | Hands 数量统一 (CLAUDE.md vs README) | 统一口径 | 5min |
+| 19 | zclaw-channels 评估 | 决定保留或删除近乎空的 crate | 1h |
+| 20 | trigger_update 接口不匹配 | TS 传 {id, updates} vs Rust 期望平铺参数 | 2h |
+
+**总工作量估计**: P0 (1h) + P1 (10h) + P2 (20h) + P3 (10h) + P4 (4h) = **~45h**
+
+---
+
+## 七、架构健康度评分
+
+| 模块 | 评分 | 趋势 | 关键问题 |
+|------|------|------|---------|
+| zclaw-types | 95% | → | 基础类型，稳定 |
+| zclaw-memory | 78% | → | 与 zclaw-growth 存储边界模糊 |
+| zclaw-runtime | 85% | → | 4 个 LLM Driver 完整 |
+| zclaw-kernel | 80% | → | Director 死代码 |
+| zclaw-skills | 80% | → | WASM/Native 待实现 |
+| zclaw-hands | 70% | → | 2 个 Hand 无代码 |
+| zclaw-protocols | 65% | ↓ | A2A feature-gated，MCP 最小实现 |
+| zclaw-pipeline | 87% | → | 高质量实现 |
+| zclaw-growth | **63%** | ↓ | 3 个关键组件未接入生产 |
+| zclaw-channels | 20% | ↓ | 仅 ConsoleChannel |
+| zclaw-saas | 88% | ↑ | SQL 注入修复后可到 90%+ |
+| Desktop 前端 | 82% | → | 降级策略完善 |
+| Admin 后台 | 85% | → | 缺日志/同步日志页面 |
+| **整体** | **~83%** | **↑** | 核心功能可用，智能层闭环待修复 |
+
+---
+
+## 八、核心结论
+
+### 根因分析
+
+V9 审计发现的根本问题集中在一条断裂的数据链路上：
+
+**`对话 → 记忆提取 → 存储 → 检索 → 注入 → 增强回复`**
+
+当前只有 `检索 → 注入 → 增强回复` 在工作。记忆的"生长"依赖：
+1. LlmDriverForExtraction 的实现 (BREAK-01)
+2. post_conversation_hook 的接入 (BREAK-02)
+3. PromptInjector 替代字符串拼接 (DEAD-01)
+
+修复这 3 项后，智能层的完成度将从 63% 跃升至 85%+。
+
+### 安全状态
+
+V8 的 CRITICAL (agent_template SQL 注入) 已修复。仅剩 1 个 HIGH (prompt SQL 注入) 和 2 个 MEDIUM。SSRF 防护全面，Auth 覆盖完整，密码/TOTP/加密实现安全。
+
+### 最大改进方向
+
+1. **记忆闭环修复** — P1 修复后用户体验显著提升
+2. **文档更新** — 130 个命令只记录了 58 个，严重低估
+3. **死代码清理** — Growth crate 3 个核心组件设计完善但未接入
+4. **Admin 补全** — 操作日志、同步日志、设备管理页面缺失
--- a/docs/features/SYSTEM_ARCHITECTURE.md
+++ b/docs/features/SYSTEM_ARCHITECTURE.md
@@ -0,0 +1,744 @@
+# ZCLAW 多端系统架构文档
+
+> 版本: 1.0 | 日期: 2026-03-29 | 状态: 待审核
+
+---
+
+## 目录
+
+1. [系统总览](#1-系统总览)
+2. [端口与协议分配](#2-端口与协议分配)
+3. [技术栈选型](#3-技术栈选型)
+4. [数据流向](#4-数据流向)
+5. [SaaS 后端 API 接口清单](#5-saas-后端-api-接口清单)
+6. [桌面端内部通信](#6-桌面端内部通信)
+7. [权限体系](#7-权限体系)
+8. [各端交互逻辑](#8-各端交互逻辑)
+9. [部署与启动](#9-部署与启动)
+10. [接口设计背景与业务价值](#10-接口设计背景与业务价值)
+
+---
+
+## 1. 系统总览
+
+ZCLAW 是面向中文用户的 AI Agent 桌面客户端，由 **4 个独立服务/端** 组成：
+
+```
+┌─────────────────────────────────────────────────────────────────┐
+│                        ZCLAW 系统架构                            │
+├─────────────────────────────────────────────────────────────────┤
+│                                                                 │
+│  ┌──────────────┐  ┌──────────────┐  ┌──────────────────────┐  │
+│  │  Desktop App  │  │  Admin Web   │  │  SaaS Backend        │  │
+│  │  (Tauri+React)│  │  (Next.js)   │  │  (Axum + PostgreSQL) │  │
+│  │  Port: 1420   │  │  Port: 3000  │  │  Port: 8080          │  │
+│  │               │  │              │  │                      │  │
+│  │  内核模式:     │  │  管理后台     │  │  REST API            │  │
+│  │  Tauri IPC    │  │  JWT 鉴权     │  │  JWT + API Token     │  │
+│  │               │  │              │  │  RBAC 权限            │  │
+│  │  网关模式:     │  │              │  │                      │  │
+│  │  WS :50051    │  │              │  │  ┌────────────────┐  │  │
+│  │  WS :4200     │  │              │  │  │  PostgreSQL     │  │  │
+│  │               │  │              │  │  │  Port: 5432    │  │  │
+│  │  SaaS 模式:   │  │              │  │  └────────────────┘  │  │
+│  │  HTTPS REST   │  │              │  │                      │  │
+│  └──────────────┘  └──────────────┘  └──────────────────────┘  │
+│                                                                 │
+│  ┌──────────────┐  ┌──────────────┐                             │
+│  │  ZCLAW 网关   │  │  LLM 服务商  │                             │
+│  │  (独立二进制) │  │  (外部)      │                             │
+│  │  Port: 4200   │  │  OpenAI 等   │                             │
+│  │  Port: 50051  │  │              │                             │
+│  └──────────────┘  └──────────────┘                             │
+└─────────────────────────────────────────────────────────────────┘
+```
+
+### 核心设计理念
+
+- **双模式架构**: 桌面端支持「本地内核」(离线/低延迟) 和「远程网关」(团队协作) 两种运行模式
+- **统一 LLM 接入**: 4 条 LLM 路径 (直连 OpenAI、直连火山引擎、SaaS 中转、网关透传)
+- **集中管控**: SaaS 后端统一管理账号、模型、服务商、Prompt 模板、配置同步
+- **安全审计**: 完整的操作日志 + TOTP 2FA + JWT + RBAC
+
+---
+
+## 2. 端口与协议分配
+
+| 端口 | 服务 | 协议 | 用途 | 启动方式 |
+|------|------|------|------|----------|
+| 1420 | Vite Dev Server | HTTP | 桌面端前端开发服务 (仅 dev) | `pnpm tauri dev` |
+| 3000 | Next.js Dev Server | HTTP | Admin 管理后台开发服务 | `pnpm dev` (admin/) |
+| 4200 | ZCLAW Gateway/Kernel | WebSocket + REST | 网关备用端口 | ZCLAW 二进制 |
+| 50051 | ZCLAW Gateway | WebSocket + REST | 网关主端口 | ZCLAW 二进制 |
+| 5432 | PostgreSQL | PostgreSQL Wire | SaaS 后端数据库 | Docker/start-all.ps1 |
+| 8080 | SaaS Backend | HTTP REST | 管理后台 API + 中转代理 | start-saas.ps1 |
+| 4444 | ChromeDriver | WebDriver HTTP | 浏览器 Hand 自动化 | start-all.ps1 |
+| N/A | Tauri IPC | invoke() | 桌面端内部进程通信 | 内嵌 |
+
+---
+
+## 3. 技术栈选型
+
+### 3.1 桌面端 (Desktop)
+
+| 层级 | 技术 | 选型理由 |
+|------|------|----------|
+| 桌面框架 | Tauri 2.x | Rust 原生性能，小体积，安全 IPC |
+| 前端框架 | React 18 + TypeScript | 生态丰富，类型安全 |
+| 状态管理 | Zustand | 轻量、灵活、无 boilerplate |
+| 样式方案 | Tailwind CSS | 原子化 CSS，暗色主题友好 |
+| 数据存储 | SQLite (本地) | 离线优先，FTS5 全文搜索 |
+
+### 3.2 Admin 管理后台
+
+| 层级 | 技术 | 选型理由 |
+|------|------|----------|
+| 框架 | Next.js 14 (App Router) | SSR/CSR 灵活切换，API 代理 |
+| 数据获取 | SWR 2.x | 缓存+去重+自动重验证，stale-while-revalidate |
+| UI 组件 | shadcn/ui | 暗色主题原生支持，可定制 |
+| 图表 | Recharts | React 原生集成，轻量 |
+
+### 3.3 SaaS 后端
+
+| 层级 | 技术 | 选型理由 |
+|------|------|----------|
+| Web 框架 | Axum | Rust 高性能异步 Web 框架 |
+| 数据库 | PostgreSQL | 关系型，复杂查询支持好 |
+| ORM | sqlx | 编译时 SQL 检查，零开销 |
+| 认证 | JWT + TOTP | 无状态鉴权 + 双因素认证 |
+| 加密 | AES-256-GCM | API Key 加密存储 |
+
+### 3.4 核心运行时 (Rust Workspace)
+
+```
+zclaw-types        → 基础类型 (AgentId, Message, Error)
+zclaw-memory       → 存储层 (SQLite, FTS5, TF-IDF, Embeddings)
+zclaw-runtime      → 运行时 (LLM 驱动, 工具, Agent 循环)
+zclaw-kernel       → 核心协调 (注册, 调度, 事件, 工作流)
+zclaw-skills       → 技能系统 (SKILL.md 解析, WASM 执行器)
+zclaw-hands        → 自主能力 (Hand/Trigger 注册管理)
+zclaw-protocols    → 协议支持 (MCP, A2A)
+zclaw-saas         → SaaS 后端 (独立服务, 8080 端口)
+```
+
+---
+
+## 4. 数据流向
+
+### 4.1 Admin 管理后台数据流
+
+```
+用户操作 → React UI → SWR Hook → api-client.ts → Next.js Rewrites → SaaS 后端 (:8080)
+                ↑                                                          ↓
+                └── SWR Cache ←── JSON Response ←── PostgreSQL (:5432) ←─┘
+```
+
+**关键路径:**
+- Admin 前端所有请求通过 `next.config.js rewrites` 代理到 `localhost:8080`
+- API 基路径: `/api/v1/*` (前端) → `http://localhost:8080/api/v1/*` (后端)
+- SWR 缓存: 页面切换后缓存 5s 去重，stale-while-revalidate 模式
+
+### 4.2 桌面端数据流 (Tauri 模式)
+
+```
+React UI → Zustand Store → invoke() IPC → Rust Tauri Commands → Kernel → LLM/Tools/Skills/Hands
+                                                       ↓
+                                                  SQLite (~/.zclaw/data.db)
+```
+
+### 4.3 桌面端数据流 (网关模式)
+
+```
+React UI → gateway-client.ts → WebSocket (:50051) → ZCLAW Gateway → Kernel
+                              → REST API (/api/*) →
+```
+
+### 4.4 桌面端数据流 (SaaS 模式)
+
+```
+React UI → saas-client.ts → HTTPS REST → SaaS 后端 (:8080)
+          llm-service.ts  → relay/chat/completions → Provider → LLM API
+```
+
+### 4.5 LLM 请求路由 (4 条路径)
+
+```
+┌─────────────┐    ┌─ Direct OpenAI ────→ api.openai.com
+│             │    ├─ Direct Volcengine ─→ volcengine endpoint
+│  llm-service│────┤
+│             │    ├─ SaaS Relay ────────→ saas.zclaw.com/relay → Provider
+│             │    └─ Gateway ───────────→ invoke('agent_chat') or REST
+└─────────────┘
+```
+
+---
+
+## 5. SaaS 后端 API 接口清单
+
+### 5.0 通用规范
+
+- **Base URL**: `http://localhost:8080/api/v1`
+- **认证方式**: `Authorization: Bearer <JWT_TOKEN>` 或 `Authorization: Bearer zclaw_<API_KEY>`
+- **Content-Type**: `application/json`
+- **分页响应格式**: `{ items: T[], total: number, page: number, page_size: number }`
+- **错误响应格式**: `{ error: string, message: string }`
+- **HTTP 状态码**: 200 OK, 201 Created, 204 No Content, 400 Bad Request, 401 Unauthorized, 403 Forbidden, 404 Not Found, 409 Conflict, 500 Internal Error
+
+### 5.1 公开接口 (无需认证)
+
+| # | 方法 | 路径 | 用途 | 业务价值 |
+|---|------|------|------|----------|
+| 1 | GET | `/api/health` | 健康检查 | 运维监控探针，检测 DB 连通性 |
+| 2 | POST | `/api/v1/auth/register` | 用户注册 | 自助开户，降低运营成本 |
+| 3 | POST | `/api/v1/auth/login` | 用户登录 | 身份验证入口，支持 TOTP 2FA |
+| 4 | POST | `/api/v1/auth/refresh` | Token 刷新 | 无感续期，单次使用 refresh_token |
+
+**POST /api/v1/auth/login**
+
+请求:
+```typescript
+{
+  username: string      // 接受用户名或邮箱
+  password: string      // 8-128 字符
+  totp_code?: string    // 6 位数字，启用 TOTP 时必填
+}
+```
+
+响应:
+```typescript
+{
+  token: string         // JWT access token
+  refresh_token: string // 单次使用 refresh token
+  account: AccountPublic
+}
+```
+
+### 5.2 认证自服务接口 (需登录)
+
+| # | 方法 | 路径 | 用途 |
+|---|------|------|------|
+| 5 | GET | `/api/v1/auth/me` | 获取当前用户信息 |
+| 6 | PUT | `/api/v1/auth/password` | 修改密码 |
+| 7 | POST | `/api/v1/auth/totp/setup` | 生成 TOTP 密钥 |
+| 8 | POST | `/api/v1/auth/totp/verify` | 激活 TOTP 2FA |
+| 9 | POST | `/api/v1/auth/totp/disable` | 关闭 TOTP 2FA |
+
+### 5.3 账号管理接口 (Admin)
+
+| # | 方法 | 路径 | 用途 | 权限 |
+|---|------|------|------|------|
+| 10 | GET | `/api/v1/accounts` | 账号列表 (支持搜索/筛选/分页) | `account:admin` |
+| 11 | GET | `/api/v1/accounts/:id` | 账号详情 | `account:admin` |
+| 12 | PATCH | `/api/v1/accounts/:id` | 更新账号信息 | `account:admin` |
+| 13 | PATCH | `/api/v1/accounts/:id/status` | 变更账号状态 | `account:admin` |
+| 14 | GET | `/api/v1/logs/operations` | 操作日志列表 | `account:admin` |
+| 15 | GET | `/api/v1/stats/dashboard` | 仪表盘统计聚合 | `account:admin` |
+| 16 | GET | `/api/v1/devices` | 用户设备列表 | 认证用户 |
+| 17 | POST | `/api/v1/devices/register` | 注册/更新设备 | 认证用户 |
+| 18 | POST | `/api/v1/devices/heartbeat` | 设备心跳 | 认证用户 |
+
+**GET /api/v1/accounts** 查询参数:
+```typescript
+{
+  page?: number          // 页码，默认 1
+  page_size?: number     // 每页条数，默认 20
+  search?: string        // 搜索用户名/邮箱/显示名
+  role?: string          // 按角色筛选: super_admin | admin | user
+  status?: string        // 按状态筛选: active | disabled | suspended
+}
+```
+
+**GET /api/v1/stats/dashboard** 响应:
+```typescript
+{
+  total_accounts: number
+  active_accounts: number
+  tasks_today: number
+  active_providers: number
+  active_models: number
+  tokens_today_input: number
+  tokens_today_output: number
+}
+```
+
+### 5.4 服务商管理接口
+
+| # | 方法 | 路径 | 用途 | 权限 |
+|---|------|------|------|------|
+| 19 | GET | `/api/v1/providers` | 服务商列表 | 认证用户 |
+| 20 | GET | `/api/v1/providers/:id` | 服务商详情 | 认证用户 |
+| 21 | POST | `/api/v1/providers` | 创建服务商 | `provider:manage` |
+| 22 | PATCH | `/api/v1/providers/:id` | 更新服务商 | `provider:manage` |
+| 23 | DELETE | `/api/v1/providers/:id` | 删除服务商 | `provider:manage` |
+| 24 | GET | `/api/v1/providers/:id/models` | 服务商下的模型列表 | 认证用户 |
+
+**Provider 数据结构:**
+```typescript
+{
+  id: string
+  name: string               // 唯一标识名，如 "openai"
+  display_name: string       // 显示名，如 "OpenAI"
+  base_url: string           // API 基地址
+  api_protocol: 'openai' | 'anthropic'
+  enabled: boolean
+  rate_limit_rpm?: number    // 每分钟请求限制
+  rate_limit_tpm?: number    // 每分钟 Token 限制
+  created_at: string
+  updated_at: string
+}
+```
+
+### 5.5 模型管理接口
+
+| # | 方法 | 路径 | 用途 | 权限 |
+|---|------|------|------|------|
+| 25 | GET | `/api/v1/models` | 模型列表 | 认证用户 |
+| 26 | GET | `/api/v1/models/:id` | 模型详情 | 认证用户 |
+| 27 | POST | `/api/v1/models` | 创建模型 | `model:manage` |
+| 28 | PATCH | `/api/v1/models/:id` | 更新模型 | `model:manage` |
+| 29 | DELETE | `/api/v1/models/:id` | 删除模型 | `model:manage` |
+
+**Model 数据结构:**
+```typescript
+{
+  id: string
+  provider_id: string
+  model_id: string           // 如 "gpt-4o"
+  alias: string              // 显示别名
+  context_window: number     // 上下文窗口大小
+  max_output_tokens: number  // 最大输出 Token
+  supports_streaming: boolean
+  supports_vision: boolean
+  enabled: boolean
+  pricing_input: number      // $/1M tokens
+  pricing_output: number     // $/1M tokens
+}
+```
+
+### 5.6 API Key 管理接口
+
+| # | 方法 | 路径 | 用途 | 权限 |
+|---|------|------|------|------|
+| 30 | GET | `/api/v1/keys` | 当前用户的 API Key 列表 | 认证用户 |
+| 31 | POST | `/api/v1/keys` | 创建 API Key | 认证用户 |
+| 32 | POST | `/api/v1/keys/:id/rotate` | 轮换 API Key | 认证用户 |
+| 33 | DELETE | `/api/v1/keys/:id` | 撤销 API Key | 认证用户 |
+
+### 5.7 Key Pool 管理接口 (Admin)
+
+| # | 方法 | 路径 | 用途 | 权限 |
+|---|------|------|------|------|
+| 34 | GET | `/api/v1/providers/:id/keys` | 服务商 Key Pool 列表 | `provider:manage` |
+| 35 | POST | `/api/v1/providers/:id/keys` | 添加 Key 到 Pool | `provider:manage` |
+| 36 | PUT | `/api/v1/providers/:id/keys/:keyId/toggle` | 启用/禁用 Key | `provider:manage` |
+| 37 | DELETE | `/api/v1/providers/:id/keys/:keyId` | 删除 Key | `provider:manage` |
+
+**业务价值**: Key Pool 实现多 API Key 智能轮转，自动绕过 429 限流，提升整体吞吐量。
+
+### 5.8 中转代理接口 (Relay)
+
+| # | 方法 | 路径 | 用途 | 权限 |
+|---|------|------|------|------|
+| 38 | POST | `/api/v1/relay/chat/completions` | LLM 中转请求 | `relay:use` |
+| 39 | GET | `/api/v1/relay/tasks` | 中转任务列表 | 认证用户 |
+| 40 | GET | `/api/v1/relay/tasks/:id` | 任务详情 | 认证用户 |
+| 41 | POST | `/api/v1/relay/tasks/:id/retry` | 重试失败任务 | `relay:admin` |
+| 42 | GET | `/api/v1/relay/models` | 可用模型列表 | 认证用户 |
+
+**POST /api/v1/relay/chat/completions** — 核心中转接口
+
+请求: OpenAI 兼容格式
+```typescript
+{
+  model: string
+  messages: Array<{ role: string, content: string }>
+  temperature?: number
+  max_tokens?: number
+  stream?: boolean         // 支持 SSE 流式响应
+  // ... 其他字段透传给服务商
+}
+```
+
+响应:
+- 非流式: `application/json` — 原始服务商响应
+- 流式: `text/event-stream` — SSE 事件流
+
+**业务价值**: 统一入口代理多家 LLM 服务商，自动 Key Pool 轮转、429 处理、用量计费。
+
+### 5.9 用量统计接口
+
+| # | 方法 | 路径 | 用途 |
+|---|------|------|------|
+| 43 | GET | `/api/v1/usage` | 用量统计 (按天/按模型) |
+
+**查询参数:**
+```typescript
+{
+  from?: string          // ISO 8601 开始日期
+  to?: string            // ISO 8601 结束日期
+  provider_id?: string   // 按服务商筛选
+  model_id?: string      // 按模型筛选
+  group_by?: 'day' | 'model'
+  days?: number          // 最近 N 天
+}
+```
+
+**响应:**
+```typescript
+{
+  total_requests: number
+  total_input_tokens: number
+  total_output_tokens: number
+  by_model: Array<{ model_id, count, input_tokens, output_tokens }>
+  by_day: Array<{ day, count, input_tokens, output_tokens }>
+}
+```
+
+### 5.10 配置管理接口
+
+| # | 方法 | 路径 | 用途 | 权限 |
+|---|------|------|------|------|
+| 44 | GET | `/api/v1/config/items` | 配置项列表 | 认证用户 |
+| 45 | GET | `/api/v1/config/items/:id` | 配置项详情 | 认证用户 |
+| 46 | POST | `/api/v1/config/items` | 创建配置项 | `config:write` |
+| 47 | PATCH | `/api/v1/config/items/:id` | 更新配置项 | `config:write` |
+| 48 | DELETE | `/api/v1/config/items/:id` | 删除配置项 | `config:write` |
+| 49 | GET | `/api/v1/config/analysis` | 配置分析 | 认证用户 |
+| 50 | POST | `/api/v1/config/seed` | 种子配置 | `config:write` |
+| 51 | POST | `/api/v1/config/sync` | 双向配置同步 | `config:write` |
+| 52 | POST | `/api/v1/config/diff` | 配置差异比较 | 认证用户 |
+| 53 | GET | `/api/v1/config/sync-logs` | 同步日志 | 认证用户 |
+| 54 | GET | `/api/v1/config/pull` | 批量拉取配置 | 认证用户 |
+
+**业务价值**: 集中管理所有运行参数（服务器、Agent、记忆、LLM、安全策略），支持桌面端双向同步，推送/拉取/合并三种模式。
+
+### 5.11 角色与权限接口
+
+| # | 方法 | 路径 | 用途 | 权限 |
+|---|------|------|------|------|
+| 55 | GET | `/api/v1/roles` | 角色列表 | `account:read` |
+| 56 | GET | `/api/v1/roles/:id` | 角色详情 | `account:read` |
+| 57 | POST | `/api/v1/roles` | 创建角色 | `account:admin` |
+| 58 | PUT | `/api/v1/roles/:id` | 更新角色 | `account:admin` |
+| 59 | DELETE | `/api/v1/roles/:id` | 删除角色 | `account:admin` |
+| 60 | GET | `/api/v1/roles/:id/permissions` | 角色权限列表 | `account:read` |
+| 61 | GET | `/api/v1/permission-templates` | 权限模板列表 | `account:read` |
+| 62 | GET | `/api/v1/permission-templates/:id` | 权限模板详情 | `account:read` |
+| 63 | POST | `/api/v1/permission-templates` | 创建权限模板 | `account:admin` |
+| 64 | DELETE | `/api/v1/permission-templates/:id` | 删除权限模板 | `account:admin` |
+| 65 | POST | `/api/v1/permission-templates/:id/apply` | 批量应用权限模板 | `account:admin` |
+
+### 5.12 Prompt 模板管理接口
+
+| # | 方法 | 路径 | 用途 | 权限 |
+|---|------|------|------|------|
+| 66 | GET | `/api/v1/prompts` | 模板列表 | `prompt:read` |
+| 67 | POST | `/api/v1/prompts` | 创建模板 | `prompt:write` |
+| 68 | GET | `/api/v1/prompts/:name` | 模板详情 | `prompt:read` |
+| 69 | PUT | `/api/v1/prompts/:name` | 更新模板元数据 | `prompt:write` |
+| 70 | DELETE | `/api/v1/prompts/:name` | 归档模板 | `prompt:admin` |
+| 71 | GET | `/api/v1/prompts/:name/versions` | 版本历史 | `prompt:read` |
+| 72 | GET | `/api/v1/prompts/:name/versions/:v` | 特定版本 | `prompt:read` |
+| 73 | POST | `/api/v1/prompts/:name/versions` | 发布新版本 | `prompt:write` |
+| 74 | POST | `/api/v1/prompts/:name/rollback/:v` | 回滚版本 | `prompt:admin` |
+| 75 | POST | `/api/v1/prompts/check` | OTA 更新检查 | 认证用户 |
+
+**POST /api/v1/prompts/check** — OTA 更新检查
+
+请求:
+```typescript
+{
+  device_id: string
+  versions: Record<string, number>  // { "reflection": 3, "compaction": 2 }
+}
+```
+
+响应:
+```typescript
+{
+  updates: Array<{
+    name: string
+    version: number
+    system_prompt: string
+    user_prompt_template?: string
+    variables: PromptVariable[]
+    source: string
+    min_app_version?: string
+  }>
+  server_time: string
+}
+```
+
+**业务价值**: 集中管理 Prompt 模板，桌面端每 30 分钟检查更新，无需发版即可优化提示词。
+
+### 5.13 Agent 模板管理接口
+
+| # | 方法 | 路径 | 用途 | 权限 |
+|---|------|------|------|------|
+| 76 | GET | `/api/v1/agent-templates` | Agent 模板列表 | `model:read` |
+| 77 | POST | `/api/v1/agent-templates` | 创建 Agent 模板 | `model:manage` |
+| 78 | GET | `/api/v1/agent-templates/:id` | 模板详情 | `model:read` |
+| 79 | POST | `/api/v1/agent-templates/:id` | 更新模板 | `model:manage` |
+| 80 | DELETE | `/api/v1/agent-templates/:id` | 归档模板 | `model:manage` |
+
+**AgentTemplate 数据结构:**
+```typescript
+{
+  id: string
+  name: string
+  description?: string
+  category: string
+  source: 'builtin' | 'custom'
+  model?: string
+  system_prompt?: string
+  tools: string[]
+  capabilities: string[]
+  temperature?: number
+  max_tokens?: number
+  visibility: 'public' | 'team' | 'private'
+  status: 'active' | 'archived'
+  current_version: number
+}
+```
+
+### 5.14 遥测接口
+
+| # | 方法 | 路径 | 用途 | 权限 |
+|---|------|------|------|------|
+| 81 | POST | `/api/v1/telemetry/report` | 上报遥测数据 | 认证用户 |
+| 82 | GET | `/api/v1/telemetry/stats` | 按模型统计 | 认证用户 |
+| 83 | GET | `/api/v1/telemetry/daily` | 按天统计 | 认证用户 |
+| 84 | POST | `/api/v1/telemetry/audit` | 上报审计摘要 | 认证用户 |
+
+**POST /api/v1/telemetry/report** 请求:
+```typescript
+{
+  device_id: string
+  app_version: string
+  entries: Array<{
+    model_id: string
+    input_tokens: number
+    output_tokens: number
+    latency_ms?: number
+    success: boolean
+    error_type?: string
+    timestamp: string
+    connection_mode: 'tauri' | 'saas'
+  }>  // 最多 500 条/请求
+}
+```
+
+**业务价值**: 桌面端批量上报本地 LLM 用量，管理员可在后台查看所有设备的 Token 消耗、延迟、成功率。
+
+---
+
+## 6. 桌面端内部通信
+
+### 6.1 Tauri Commands 清单
+
+桌面端通过 `invoke()` IPC 暴露以下命令组：
+
+| 命令组 | 文件 | 命令数 | 用途 |
+|--------|------|--------|------|
+| 进程管理 | lib.rs | 10 | zclaw_start/stop/restart, doctor, health_check |
+| 内核操作 | kernel_commands.rs | 20+ | agent_create/chat_stream, skill_execute, hand_execute |
+| 工作流 | pipeline_commands.rs | 9 | pipeline_run/progress/cancel, route_intent |
+| 持久记忆 | memory_commands.rs | 12 | memory_store/get/search/export |
+| Viking 存储 | viking_commands.rs | 9 | viking_add/find/grep/read |
+| 智能钩子 | intelligence_hooks.rs | 2 | pre/post_conversation_hook |
+
+### 6.2 WebSocket 事件类型
+
+| 方向 | 事件 | 说明 |
+|------|------|------|
+| Server→Client | `text_delta` | 流式文本片段 |
+| Server→Client | `phase` | 阶段切换 (thinking/tool) |
+| Server→Client | `tool_call` / `tool_result` | 工具调用与结果 |
+| Server→Client | `hand` | Hand 自主能力触发 |
+| Server→Client | `error` | 错误通知 |
+| Client→Server | `message` | 发送消息 |
+| Client→Server | `auth_challenge` / `auth_response` | Ed25519 握手 |
+| 双向 | `ping` / `pong` | 心跳 (30s 间隔) |
+
+---
+
+## 7. 权限体系
+
+### 7.1 角色定义
+
+| 角色 | 权限范围 |
+|------|----------|
+| `super_admin` | 全部权限 (`admin:full`) |
+| `admin` | 账号管理、服务商/模型管理、中转管理、配置读写、Prompt 读写发布 |
+| `user` | 模型读取、中转使用、配置读取、Prompt 读取 |
+
+### 7.2 权限清单
+
+| 权限 | 说明 |
+|------|------|
+| `admin:full` | 超级权限，绕过所有检查 |
+| `account:admin` | 账号管理 (列表、状态变更、角色分配) |
+| `account:read` | 读取账号、角色、权限模板 |
+| `provider:manage` | 创建/更新/删除服务商、管理 Key Pool |
+| `model:manage` | 创建/更新/删除模型、Agent 模板 |
+| `model:read` | 读取模型、Agent 模板 |
+| `relay:use` | 使用中转 (chat completions) |
+| `relay:admin` | 查看任意中转任务、重试失败任务 |
+| `config:write` | 创建/更新/删除配置项、同步、种子 |
+| `prompt:read` | 读取 Prompt 模板和版本 |
+| `prompt:write` | 创建/更新 Prompt 模板和版本 |
+| `prompt:admin` | 归档 Prompt、回滚版本 |
+
+---
+
+## 8. 各端交互逻辑
+
+### 8.1 Admin 管理后台 ↔ SaaS 后端
+
+```
+┌───────────────────────────────────────────────────────────┐
+│  Admin 浏览器 (localhost:3000)                             │
+│                                                           │
+│  ┌──────────┐  SWR Cache  ┌──────────────┐               │
+│  │ React UI │◄────────────►│ api-client   │               │
+│  │ 11 页面   │             │ JWT 鉴权      │               │
+│  └──────────┘             └──────┬───────┘               │
+│                                  │ fetch()                │
+└──────────────────────────────────┼────────────────────────┘
+                                   │
+                    Next.js Rewrite│ /api/* → localhost:8080/api/*
+                                   │
+┌──────────────────────────────────┼────────────────────────┐
+│  SaaS Backend (:8080)            │                        │
+│                           ┌──────▼───────┐               │
+│                           │  Axum Router  │               │
+│                           │  中间件栈:     │               │
+│                           │  1. Auth      │               │
+│                           │  2. RateLimit │               │
+│                           │  3. RequestID │               │
+│                           │  4. Version   │               │
+│                           └──────┬───────┘               │
+│                                  │                        │
+│                    ┌─────────────▼──────────────┐        │
+│                    │  Handlers (72 个端点)       │        │
+│                    │  auth/account/model/relay/  │        │
+│                    │  config/prompt/telemetry/   │        │
+│                    └─────────────┬──────────────┘        │
+│                                  │                        │
+│                    ┌─────────────▼──────────────┐        │
+│                    │  PostgreSQL (:5432)          │        │
+│                    └─────────────────────────────┘        │
+└───────────────────────────────────────────────────────────┘
+```
+
+### 8.2 桌面端交互矩阵
+
+| 场景 | 通信方式 | 目标 | 数据 |
+|------|----------|------|------|
+| 本地对话 | Tauri IPC invoke() | Kernel | 消息、Agent、Skills |
+| 流式响应 | Tauri Event listen() | Kernel | stream:chunk 事件 |
+| 远程对话 | WebSocket :50051 | ZCLAW Gateway | 消息、事件流 |
+| SaaS 登录 | HTTPS REST | SaaS :8080 | JWT 认证 |
+| LLM 中转 | HTTPS REST | SaaS :8080/relay | OpenAI 兼容请求 |
+| Prompt OTA | HTTPS REST | SaaS :8080/prompts/check | 版本号 → 更新 |
+| 配置同步 | HTTPS REST | SaaS :8080/config/sync | 双向键值对 |
+| 遥测上报 | HTTPS REST | SaaS :8080/telemetry/report | 批量用量数据 |
+
+---
+
+## 9. 部署与启动
+
+### 9.1 完整启动顺序
+
+```powershell
+# start-all.ps1 启动顺序:
+1. PostgreSQL    → :5432 (Docker 或本地服务)
+2. SaaS Backend  → :8080 (zclaw-saas.exe)
+3. ChromeDriver  → :4444 (可选, 用于 Browser Hand)
+4. Desktop Dev   → :1420 (Tauri dev)
+```
+
+### 9.2 SaaS 后端配置
+
+```toml
+# saas-config.toml
+[server]
+host = "0.0.0.0"
+port = 8080
+
+[database]
+url = "postgres://postgres:123123@localhost:5432/zclaw"
+
+[auth]
+jwt_expiration_hours = 24
+totp_issuer = "ZCLAW SaaS"
+
+[relay]
+max_queue_size = 1000
+max_concurrent_per_provider = 5
+batch_window_ms = 50
+retry_delay_ms = 1000
+max_attempts = 3
+
+[rate_limit]
+requests_per_minute = 60
+burst = 10
+```
+
+---
+
+## 10. 接口设计背景与业务价值
+
+### 10.1 中转代理 (Relay) — 核心收入引擎
+
+**背景**: 多家 LLM 服务商 API 各不相同，用户需统一入口。
+
+**设计价值**:
+- OpenAI 兼容接口降低接入成本
+- Key Pool 智能轮转绕过限流
+- 自动 429 处理 + 冷却恢复
+- 按账号精确计费 (input/output tokens)
+
+### 10.2 Prompt OTA — 无感更新
+
+**背景**: Prompt 工程需要频繁迭代，但桌面端发版周期长。
+
+**设计价值**:
+- 集中管理 reflection/compaction/extraction 等核心 Prompt
+- 桌面端每 30 分钟自动检查更新
+- 版本化 + 回滚能力
+- min_app_version 兼容性控制
+
+### 10.3 配置同步 — 多设备一致
+
+**背景**: 用户多台设备需保持配置一致。
+
+**设计价值**:
+- push/pull/merge 三种同步模式
+- 乐观锁 (client_timestamps) 冲突检测
+- 只读 diff 不修改数据
+- 同步日志可追溯
+
+### 10.4 Key Pool — 高可用保障
+
+**背景**: 单个 API Key 容易触发限流 (429)。
+
+**设计价值**:
+- 多 Key 按优先级智能选择
+- 429 自动冷却 + 切换
+- RPM/TPM 限额独立配置
+- 配额重置周期支持
+
+### 10.5 遥测上报 — 数据驱动优化
+
+**背景**: 桌面端本地 LLM 用量无法直接观测。
+
+**设计价值**:
+- 批量上报 (500 条/次) 减少请求
+- 按模型聚合: Token 消耗、延迟、成功率
+- 按天聚合: 请求量、设备活跃度
+- 审计摘要: 操作类型 + 结果
+
+---
+
+> **文档统计**: 84 个 API 端点 | 5 个通信通道 | 12 种权限 | 4 个独立服务
--- a/docs/knowledge-base/architecture-refactoring.md
+++ b/docs/knowledge-base/architecture-refactoring.md
@@ -0,0 +1,67 @@
+# zclaw-saas 架构重构完成记录
+
+> 记录时间: 2026-03-29
+> 本文档记录借鉴 loco-rs 模式对 zclaw-saas 后端进行的架构重构和性能优化。
+
+## 重构概要
+
+### Phase 0: 知识库
+- `docs/knowledge-base/loco-rs-patterns.md` — loco-rs 10 个可借鉴模式研究
+
+### Phase 1: 数据层重构
+- `crates/zclaw-saas/src/models/` — 15 个 `#[derive(sqlx::FromRow)]` 类型化模型文件
+  - 替代了所有 `(String, String, ...)` 元组解构
+  - 编译期字段检查，消除运行时字段错位风险
+- 3 次登录查询合并为 1 次 `AccountLoginRow` 查询
+- Relay handler N+1 查询修复（精准 SQL 替代全量加载）
+
+### Phase 2: Worker + Scheduler 系统
+- `crates/zclaw-saas/src/workers/` — Worker trait + 5 个具体实现
+  - `LogOperationWorker` — 异步操作日志
+  - `CleanupRefreshTokensWorker` — 过期 token 清理
+  - `CleanupRateLimitWorker` — 限流条目清理
+  - `RecordUsageWorker` — 异步使用量记录
+  - `UpdateLastUsedWorker` — API token last_used_at 更新
+- `crates/zclaw-saas/src/scheduler.rs` — TOML 声明式调度器
+  - 支持 `5m`/`1h`/`24h` 时间间隔格式
+  - 从配置文件加载，无需改代码调整调度
+- `crates/zclaw-saas/src/tasks/` — CLI 任务系统
+
+### Phase 3: 性能修复
+| 问题 | 修复 | 文件 |
+|------|------|------|
+| Relay N+1 查询 | 精准 SQL 替代 `list_models()` 全量加载 | `relay/handlers.rs` |
+| Config RwLock 竞争 | `Arc<AtomicU32>` 无锁 rate limit 读取 | `state.rs`, `middleware.rs` |
+| SSE `std::sync::Mutex` | `tokio::sync::Mutex` 异步安全 | `relay/service.rs` |
+| Login 3 次查询 | 合并为 1 次 `AccountLoginRow` 查询 | `auth/handlers.rs` |
+| `/auth/refresh` 阻塞清理 | 迁移到 Scheduler 定期执行 | `auth/handlers.rs` |
+
+### Phase 4: 多环境配置
+- `config/saas-development.toml` — 开发环境
+- `config/saas-production.toml` — 生产环境
+- `config/saas-test.toml` — 测试环境
+- `ZCLAW_ENV` 环境变量选择配置
+- `ZCLAW_SAAS_CONFIG` 精确路径覆盖（最高优先级）
+
+## 配置加载优先级
+
+```
+ZCLAW_SAAS_CONFIG (精确路径)
+  > ZCLAW_ENV (环境选择 config/saas-{env}.toml)
+    > saas-config.toml (默认)
+```
+
+## Scheduler 配置示例
+
+```toml
+[scheduler]
+jobs = [
+  { name = "cleanup_refresh_tokens", interval = "1h", task = "cleanup_refresh_tokens", run_on_start = false },
+  { name = "cleanup_devices", interval = "24h", task = "cleanup_devices", run_on_start = true },
+]
+```
+
+## 已知限制 / 待改进
+- `log_operation()` 仍为同步调用（操作日志不是性能瓶颈，后续可按需迁移）
+- TEXT 时间戳未迁移到 TIMESTAMPTZ（需要 SQL 迁移系统，影响范围大）
+- 内联 SQL schema 未迁移到 `sqlx-cli` migrations
--- a/docs/knowledge-base/loco-rs-patterns.md
+++ b/docs/knowledge-base/loco-rs-patterns.md
@@ -0,0 +1,236 @@
+# loco-rs 架构模式研究 — zclaw-saas 重构参考
+
+> 本文档记录 loco-rs (https://loco.rs) 的架构模式分析，评估其在 zclaw-saas 重构中的适用性。
+> 创建时间: 2026-03-29
+
+## 1. loco-rs 概述
+
+- **定位**: "Rust on Rails" — 约定优于配置的全栈 Web 框架
+- **技术栈**: Axum + SeaORM + PostgreSQL/SQLite
+- **成熟度**: ~8K+ GitHub stars, 131+ contributors
+- **官方站点**: https://loco.rs
+
+## 2. 10 个可借鉴模式及评估
+
+### 2.1 模式一: Worker trait（后台任务抽象）⭐ 高价值
+
+**loco-rs 实现**:
+- 基于 `sidekiq-rs` 的 `Worker` trait，支持强类型参数
+- 三种模式: `BackgroundQueue`（Redis 队列）、`BackgroundAsync`（进程内 tokio）、`ForegroundBlocking`（同步）
+- Worker 在 `Hooks::connect_workers()` 中注册
+- 支持重试、延迟执行
+
+**zclaw-saas 现状**:
+- `main.rs` 中用 `tokio::spawn` + 手动 `interval` 循环
+- 无重试、无命名、无观察性
+
+**建议**: 采用框架无关的 Worker trait，不依赖 Redis（先用 `tokio::spawn` + channel），未来可迁移到 Redis 队列。
+
+```rust
+// 建议实现
+#[async_trait]
+pub trait Worker: Send + Sync + 'static {
+    type Args: Serialize + DeserializeOwned + Send + Sync;
+    fn name(&self) -> &str;
+    async fn perform(&self, db: &PgPool, args: Self::Args) -> Result<(), SaasError>;
+    fn max_retries(&self) -> u32 { 3 }
+}
+```
+
+---
+
+### 2.2 模式二: 声明式 Scheduler ⭐ 高价值
+
+**loco-rs 实现**:
+- YAML 配置的 cron/interval 定时任务
+- 支持 shell 命令或注册的 Task
+- 按环境配置、按 tag 分组
+
+**zclaw-saas 现状**:
+- 硬编码 `tokio::spawn` + `Duration::from_secs(300)` 等
+- 修改定时策略需要改代码重新编译
+
+**建议**: 用 TOML 配置 scheduler（与项目已有 TOML 基础一致），支持 interval 表达式。
+
+```toml
+[scheduler]
+jobs = [
+  { name = "cleanup_rate_limit", interval = "5m", task = "cleanup_rate_limit" },
+  { name = "cleanup_devices", interval = "24h", task = "cleanup_devices" },
+]
+```
+
+---
+
+### 2.3 模式三: 类型化数据库模型 (FromRow) ⭐⭐ 最高价值
+
+**loco-rs 实现**:
+- SeaORM 实体自动生成（`sea-orm-cli generate entity`）
+- 强类型字段、关系、验证
+
+**zclaw-saas 现状**:
+- 原始元组解构 `(String, String, String, ...)`
+- 无编译期字段检查，容易出错
+
+**建议**: 不使用 SeaORM，但用 `#[derive(sqlx::FromRow)]` 实现同样效果。
+
+```rust
+// Before (当前)
+let (id, username, email, role, status) = sqlx::query_as::<_, (String, String, String, String, String)>(...)
+// 5 个 String 参数，顺序错误编译器无法发现
+
+// After (目标)
+#[derive(sqlx::FromRow)]
+pub struct AccountRow {
+    pub id: String,
+    pub username: String,
+    pub email: String,
+    pub role: String,
+    pub status: String,
+    pub created_at: DateTime<Utc>,
+}
+let row = sqlx::query_as::<_, AccountRow>("SELECT ...").fetch_one(db).await?;
+```
+
+---
+
+### 2.4 模式四: SQL 迁移系统 ⭐ 高价值
+
+**loco-rs 实现**:
+- 迁移优先，先写 migration，再从 DB 自动生成实体
+- `sea-orm-cli migrate` 管理版本
+
+**zclaw-saas 现状**:
+- `db.rs` 内联 `SCHEMA_SQL` 常量，每次启动执行
+- 无回滚能力，DDL 混在应用代码中
+- `SCHEMA_VERSION = 5` 手动追踪
+
+**建议**: 使用 `sqlx-cli` 的迁移系统。
+
+```
+migrations/
+├── 20260329000001_initial_schema.sql
+├── 20260329000002_fix_timestamps.sql
+└── 20260329000003_add_indexes.sql
+```
+
+---
+
+### 2.5 模式五: CLI Task 系统 ⭐ 中等价值
+
+**loco-rs 实现**:
+- `Task` trait 用于手动执行运维操作
+- `cargo loco task <NAME>` 命令行调用
+- 支持参数传递
+
+**zclaw-saas 现状**:
+- 运维任务（seed admin、schema 初始化）嵌入在 `db.rs` 的 `init_db()` 中
+- 无法手动触发、无法传参
+
+**建议**: 添加 Task trait + CLI 解析。
+
+```rust
+#[async_trait]
+pub trait Task: Send + Sync {
+    fn name(&self) -> &str;
+    fn description(&self) -> &str;
+    async fn run(&self, state: &AppState, args: &HashMap<String, String>) -> SaasResult<()>;
+}
+```
+
+---
+
+### 2.6 模式六: 多环境配置 ⭐ 中等价值
+
+**loco-rs 实现**:
+- `development.yaml` / `production.yaml` / `test.yaml`
+- 通过 `LOCO_ENV` 环境变量选择
+- 支持 Tera 模板语法引用环境变量
+
+**zclaw-saas 现状**:
+- 单个 `saas-config.toml` 文件
+- 通过 `ZCLAW_SAAS_CONFIG` 路径覆盖
+
+**建议**: 采用环境分离配置。
+
+```
+config/
+├── saas-development.toml
+├── saas-production.toml
+└── saas-test.toml
+```
+
+---
+
+### 2.7 模式七: 可配置中间件栈 ⭐ 低价值
+
+**loco-rs 实现**:
+- YAML 配置 CORS、timeout、payload limit 等中间件参数
+- Per-handler 和 per-route-group 的中间件层
+
+**zclaw-saas 现状**:
+- CORS origins、timeout 等硬编码在 `main.rs` 的 `build_router()` 中
+
+**建议**: 当前优先级低，后续可将中间件参数移入 TOML 配置。
+
+---
+
+### 2.8 模式八: 集成测试辅助 ⭐ 中等价值
+
+**loco-rs 实现**:
+- `request::(|request, ctx| async { ... })` 风格的请求测试
+- 自动启动测试 app + 测试数据库
+- `assert_debug_snapshot!` 快照测试
+
+**zclaw-saas 现状**:
+- 基础的 `tests/account_test.rs`
+
+**建议**: 添加测试辅助工具（app 启动 + 请求发送 + fixture）。
+
+---
+
+### 2.9 ~~模式九: Fat Model~~ — 不建议采用
+
+**loco-rs 实现**: 业务逻辑放在 `impl ActiveModel` 中（Active Record 模式）
+**原因**: 依赖 SeaORM 实体结构。zclaw-saas 使用 SQLx，Service Layer 模式更适合。
+
+### 2.10 ~~模式十: SeaORM / YAML 配置~~ — 不建议采用
+
+**原因**:
+- SeaORM 引入 ORM 抽象层，与现有 SQLx 原始查询冲突
+- YAML 在 Rust 生态中不如 TOML 类型安全
+- loco-rs creator jondot 确认无增量集成路径，必须创建新项目迁移
+
+## 3. zclaw-saas 与 loco-rs 架构对照
+
+| 维度 | loco-rs | zclaw-saas (当前) | 建议 |
+|------|---------|-------------------|------|
+| Web 框架 | Axum | Axum | 保持不变 |
+| 数据库层 | SeaORM (ORM) | SQLx (原始查询) | 保持 SQLx + FromRow |
+| 后台任务 | sidekiq-rs (Redis) | tokio::spawn (手动) | **引入 Worker trait** |
+| 定时任务 | YAML Scheduler | 硬编码 interval | **引入 TOML Scheduler** |
+| 数据库模型 | 自动生成实体 | 元组解构 | **引入 FromRow** |
+| 迁移系统 | sea-orm-cli | 内联 SQL | **引入 sqlx-cli** |
+| 错误处理 | 统一 Error enum | SaasError (thiserror) | 已优秀，保持不变 |
+| 配置系统 | YAML per-env | TOML 单文件 | **引入多环境配置** |
+| CLI 任务 | Task trait | 嵌入 init 代码 | **引入 Task trait** |
+| 测试 | 请求测试辅助 | 基础测试 | **引入测试辅助** |
+
+## 4. 实施优先级
+
+| 优先级 | 模式 | 价值 | 工作量 |
+|--------|------|------|--------|
+| 1 | FromRow 类型化模型 + 迁移系统 | 最高 | 中 |
+| 2 | Worker trait 后台任务 | 高 | 低 |
+| 3 | 声明式 Scheduler | 高 | 低 |
+| 4 | CLI Task 系统 | 中 | 低 |
+| 5 | 多环境配置 | 中 | 低 |
+| 6 | 集成测试辅助 | 中 | 中 |
+| 7 | 可配置中间件 | 低 | 低 |
+
+## 5. 参考
+
+- [loco.rs 官方文档](https://loco.rs/docs/the-app/)
+- [loco-rs GitHub](https://github.com/loco-rs/loco)
+- [Reddit: 如何从 Axum 迁移到 loco-rs](https://www.reddit.com/r/rust/comments/1g9hc1z/how_to_integratemigrate_to_locors_from_axum_app/)
+- [Shuttle.dev: 介绍 Loco](https://www.shuttle.dev/blog/2023/12/20/loco-rust-rails)