Phase 4: Type System Completion (P2) - Add comprehensive Workflow type definitions: - WorkflowStepType: hand, skill, agent, condition, parallel, delay - WorkflowStep: individual step configuration - Workflow: complete workflow definition - WorkflowRunStatus: pending, running, completed, failed, cancelled, paused - WorkflowRun: execution instance tracking - Request/Response types for API operations - Control types for pause/resume/cancel - Update types/index.ts with workflow exports Phase 5: Skills Ecosystem Expansion (P2) - Add 5 new Skills with SKILL.md definitions: - git: Git version control operations - file-operations: File system operations - web-search: Web search capabilities - data-analysis: Data analysis and visualization - shell-command: Shell command execution - Skills coverage now at 9/60+ (15%) Documentation: - Update SYSTEM_ANALYSIS.md Phase 4 & 5 status - Mark Phase 4 as completed - Update Phase 5 progress tracking Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2.7 KiB
2.7 KiB
name, description, triggers, tools
| name | description | triggers | tools | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| data-analysis | 数据分析和可视化 - 分析数据、生成统计、创建图表 |
|
|
数据分析和可视化
分析数据、生成统计信息、创建数据可视化图表。
能力
- 数据统计:计算均值、中位数、标准差等
- 数据清洗:处理缺失值、异常值
- 数据转换:格式转换、数据聚合
- 趋势分析:识别数据趋势和模式
- 可视化建议:推荐合适的图表类型
- 报告生成:生成数据分析报告
工具依赖
- bash: 执行数据处理脚本(Python/Node.js)
- read: 读取数据文件
- write: 输出分析结果
支持的数据格式
| 格式 | 扩展名 | 说明 |
|---|---|---|
| CSV | .csv | 逗号分隔值 |
| JSON | .json | JSON 数据 |
| Excel | .xlsx | Excel 表格 |
| TSV | .tsv | 制表符分隔 |
| YAML | .yaml/.yml | YAML 格式 |
常用分析方法
描述性统计
# 使用 pandas
import pandas as pd
df = pd.read_csv('data.csv')
# 基本统计
print(df.describe())
# 缺失值检查
print(df.isnull().sum())
数据聚合
# 分组统计
df.groupby('category').agg({
'value': ['mean', 'sum', 'count']
})
时间序列分析
# 日期转换
df['date'] = pd.to_datetime(df['date'])
# 按时间聚合
df.set_index('date').resample('M').mean()
图表类型选择
| 数据类型 | 推荐图表 | 用途 |
|---|---|---|
| 对比 | 柱状图、条形图 | 比较不同类别 |
| 趋势 | 折线图、面积图 | 展示变化趋势 |
| 占比 | 饼图、环形图 | 显示部分与整体 |
| 分布 | 直方图、箱线图 | 展示数据分布 |
| 关系 | 散点图、气泡图 | 显示变量关系 |
示例用法
用户: 分析 data/sales.csv 文件,生成销售报告
助手: 读取并分析数据...
[使用 read 工具读取文件]
[使用 bash 执行 Python 分析脚本]
## 销售数据分析报告
### 数据概览
- 总记录数: 1,234 条
- 时间范围: 2024-01 至 2024-12
- 产品类别: 5 个
### 关键指标
| 指标 | 值 |
|------|-----|
| 总销售额 | ¥1,234,567 |
| 平均订单额 | ¥1,000 |
| 最高单笔 | ¥15,000 |
| 月均增长 | 12.5% |
### 趋势分析
- Q1: 缓慢增长
- Q2: 快速增长期
- Q3: 稳定期
- Q4: 年末冲刺
### 建议
1. 加强 Q2 营销投入
2. 优化低利润产品线
3. 关注客户复购率
输出规范
- 使用中文输出分析结果
- 表格使用 Markdown 格式
- 关键数据加粗标注
- 提供数据解读和建议
- 标注数据来源和时间范围