04db423416
- 70 skills with code and documentation - Add .gitignore (ignore __pycache__, output/, temp/, venv/) - Clean up test intermediates and caches
367 lines
7.9 KiB
Markdown
367 lines
7.9 KiB
Markdown
# Delegation Templates for multimodal-looker
|
|
|
|
Ready-to-use prompts for delegating visual analysis tasks.
|
|
|
|
## Template Structure
|
|
|
|
```markdown
|
|
@multimodal-looker [分析类型] 这张 [图片类型]
|
|
|
|
**图片**: [路径/URL/描述]
|
|
|
|
**用户需求**: [原始需求]
|
|
|
|
**分析重点**:
|
|
1. [重点 1]
|
|
2. [重点 2]
|
|
3. [重点 3]
|
|
|
|
**输出格式**: [期望格式]
|
|
```
|
|
|
|
## Scenario Templates
|
|
|
|
### 1. Error Screenshot Analysis
|
|
|
|
```markdown
|
|
@multimodal-looker 请分析这个错误日志截图
|
|
|
|
**图片**: [图片路径]
|
|
|
|
**用户需求**: 诊断错误原因并提供解决方案
|
|
|
|
**分析重点**:
|
|
1. 错误类型和错误代码
|
|
2. 堆栈跟踪的关键信息
|
|
3. 出错的文件名和行号
|
|
4. 任何相关的上下文信息
|
|
|
|
**输出格式**:
|
|
- 错误类型:[类型]
|
|
- 错误位置:[文件:行号]
|
|
- 可能原因:[分析]
|
|
- 建议解决方案:[步骤]
|
|
```
|
|
|
|
### 2. Architecture Diagram Analysis
|
|
|
|
```markdown
|
|
@multimodal-looker 请分析这个架构图
|
|
|
|
**图片**: [图片路径]
|
|
|
|
**用户需求**: [理解系统架构/生成部署方案/识别组件]
|
|
|
|
**分析重点**:
|
|
1. 所有组件/模块的名称和功能
|
|
2. 组件之间的连接关系和数据流向
|
|
3. 使用的技术栈标识(如果有)
|
|
4. 架构模式(微服务、单体、分层等)
|
|
|
|
**输出格式**:
|
|
- 组件列表:[表格形式]
|
|
- 连接关系:[描述]
|
|
- 架构模式:[类型]
|
|
- 技术栈:[列表]
|
|
```
|
|
|
|
### 3. Data Chart Analysis
|
|
|
|
```markdown
|
|
@multimodal-looker 请分析这个数据图表
|
|
|
|
**图片**: [图片路径]
|
|
|
|
**用户需求**: [提取数据趋势/比较数据/理解指标]
|
|
|
|
**分析重点**:
|
|
1. 图表类型(柱状图、折线图、饼图等)
|
|
2. X 轴和 Y 轴的标签和范围
|
|
3. 数据点的具体数值(尽可能读取)
|
|
4. 趋势、峰值、谷值
|
|
5. 图例和颜色含义
|
|
|
|
**输出格式**:
|
|
- 图表类型:[类型]
|
|
- 时间范围:[起止时间]
|
|
- 数据系列:[列表]
|
|
- 关键趋势:[描述]
|
|
- 异常点:[如有]
|
|
```
|
|
|
|
### 4. UI/UX Mockup Analysis
|
|
|
|
```markdown
|
|
@multimodal-looker 请分析这个界面设计稿
|
|
|
|
**图片**: [图片路径]
|
|
|
|
**用户需求**: [实现界面/评估设计/提取需求]
|
|
|
|
**分析重点**:
|
|
1. 界面布局和区域划分
|
|
2. 所有 UI 元素(按钮、输入框、列表等)
|
|
3. 文案内容和标签
|
|
4. 配色方案和字体(如果能识别)
|
|
5. 交互元素和状态
|
|
|
|
**输出格式**:
|
|
- 布局结构:[描述]
|
|
- UI 元素清单:[列表]
|
|
- 配色方案:[颜色值]
|
|
- 交互说明:[描述]
|
|
```
|
|
|
|
### 5. Flowchart/Process Diagram Analysis
|
|
|
|
```markdown
|
|
@multimodal-looker 请分析这个流程图
|
|
|
|
**图片**: [图片路径]
|
|
|
|
**用户需求**: [理解流程/生成文档/实现逻辑]
|
|
|
|
**分析重点**:
|
|
1. 流程的起点和终点
|
|
2. 所有步骤/节点的内容
|
|
3. 决策点和分支条件
|
|
4. 流程方向和箭头含义
|
|
5. 并行流程或循环
|
|
|
|
**输出格式**:
|
|
- 流程步骤:[有序列表]
|
|
- 决策点:[条件 + 分支]
|
|
- 流程图描述:[文字版]
|
|
```
|
|
|
|
### 6. Table/Data Grid Analysis
|
|
|
|
```markdown
|
|
@multimodal-looker 请分析这个表格
|
|
|
|
**图片**: [图片路径]
|
|
|
|
**用户需求**: [提取数据/理解结构/转换格式]
|
|
|
|
**分析重点**:
|
|
1. 表格的行列结构
|
|
2. 表头和各列含义
|
|
3. 所有单元格的数据内容
|
|
4. 合并单元格(如果有)
|
|
5. 表格的总计或汇总行
|
|
|
|
**输出格式**:
|
|
- 表格结构:[行数 x 列数]
|
|
- 列名:[列表]
|
|
- 数据内容:[Markdown 表格]
|
|
```
|
|
|
|
### 7. Code Screenshot Analysis (OCR)
|
|
|
|
```markdown
|
|
@multimodal-looker 请识别这个代码截图中的文字
|
|
|
|
**图片**: [图片路径]
|
|
|
|
**用户需求**: [提取代码/理解逻辑/转换格式]
|
|
|
|
**分析重点**:
|
|
1. 完整的代码内容(逐行识别)
|
|
2. 代码语言(根据语法判断)
|
|
3. 缩进和格式
|
|
4. 注释内容
|
|
5. 任何特殊符号
|
|
|
|
**输出格式**:
|
|
- 代码语言:[语言]
|
|
- 代码内容:[代码块]
|
|
- 关键逻辑:[简述]
|
|
```
|
|
|
|
### 8. Handwritten Notes Analysis
|
|
|
|
```markdown
|
|
@multimodal-looker 请识别这个手写笔记
|
|
|
|
**图片**: [图片路径]
|
|
|
|
**用户需求**: [转录文字/理解内容/整理笔记]
|
|
|
|
**分析重点**:
|
|
1. 所有可识别的文字内容
|
|
2. 标题和分段
|
|
3. 列表和要点
|
|
4. 图示或草图(如果有)
|
|
5. 标注和高亮
|
|
|
|
**输出格式**:
|
|
- 标题:[标题]
|
|
- 内容:[结构化文本]
|
|
- 要点:[列表]
|
|
- 备注:[识别不清的部分]
|
|
```
|
|
|
|
### 9. Comparison Task (Multiple Images)
|
|
|
|
```markdown
|
|
@multimodal-looker 请对比分析这两张图片
|
|
|
|
**图片 1**: [路径 1]
|
|
**图片 2**: [路径 2]
|
|
|
|
**用户需求**: [比较差异/选择更好的/找出变化]
|
|
|
|
**分析重点**:
|
|
1. 每张图片的独立分析
|
|
2. 相似之处
|
|
3. 差异之处
|
|
4. 各自的优缺点
|
|
|
|
**输出格式**:
|
|
- 图片 1 分析:[描述]
|
|
- 图片 2 分析:[描述]
|
|
- 相似点:[列表]
|
|
- 差异点:[列表]
|
|
- 建议:[如有]
|
|
```
|
|
|
|
### 10. General Purpose (Open-ended)
|
|
|
|
```markdown
|
|
@multimodal-looker 请分析这张图片
|
|
|
|
**图片**: [图片路径]
|
|
|
|
**用户需求**: [原始需求]
|
|
|
|
**分析重点**:
|
|
1. 图片的整体内容描述
|
|
2. 关键视觉元素
|
|
3. 任何文字信息
|
|
4. 颜色、布局、风格
|
|
5. 与用户需求相关的部分
|
|
|
|
**输出格式**: 自由格式,但请结构化输出
|
|
```
|
|
|
|
## Response Integration Patterns
|
|
|
|
After receiving analysis from multimodal-looker, integrate results:
|
|
|
|
### Pattern 1: Acknowledge + Connect
|
|
```markdown
|
|
感谢分析。我看到了 [图片内容简述]。
|
|
|
|
根据你的需求 [xxx],结合图片中的 [关键信息],我建议...
|
|
```
|
|
|
|
### Pattern 2: Summary + Action
|
|
```markdown
|
|
根据图片分析,关键信息是:
|
|
1. [要点 1]
|
|
2. [要点 2]
|
|
|
|
基于此,下一步行动是...
|
|
```
|
|
|
|
### Pattern 3: Validation + Expansion
|
|
```markdown
|
|
图片分析结果确认了 [某信息]。
|
|
|
|
除此之外,还需要考虑...
|
|
```
|
|
|
|
## Error Handling Templates
|
|
|
|
### Timeout Response
|
|
```markdown
|
|
抱歉,图片分析超时了。可能原因:
|
|
- 图片文件过大
|
|
- 网络延迟
|
|
- 服务繁忙
|
|
|
|
你可以:
|
|
1. 压缩图片后重试
|
|
2. 用文字描述关键信息
|
|
3. 稍后重试
|
|
```
|
|
|
|
### Format Not Supported
|
|
```markdown
|
|
这个图片格式([格式])可能不被支持。
|
|
|
|
建议:
|
|
- 转换为 PNG 或 JPG 格式
|
|
- 或者描述图片内容,我继续帮助你
|
|
```
|
|
|
|
### Analysis Failed
|
|
```markdown
|
|
抱歉,无法分析这张图片。可能原因:
|
|
- 图片文件损坏
|
|
- 图片内容无法识别
|
|
- 服务暂时不可用
|
|
|
|
请尝试:
|
|
- 重新上传清晰的图片
|
|
- 或者用文字描述你想了解的内容
|
|
```
|
|
|
|
## Best Practices
|
|
|
|
### DO:
|
|
1. Be specific about what you want analyzed
|
|
2. Provide context about why you're asking
|
|
3. Specify output format if you have preferences
|
|
4. Acknowledge the analysis when received
|
|
5. Connect visual info to the broader task
|
|
|
|
### DON'T:
|
|
1. Don't just say "analyze this" without context
|
|
2. Don't expect perfect OCR on blurry images
|
|
3. Don't ignore the analysis results
|
|
4. Don't delegate if the image isn't crucial
|
|
5. Don't forget to thank multimodal-looker (optional but nice)
|
|
|
|
## Example Conversations
|
|
|
|
### Example 1: Error Debugging
|
|
```
|
|
User: 帮我看看这个报错 screenshot.png
|
|
|
|
Agent: @multimodal-looker 请分析这个错误日志截图...
|
|
[delegation with template 1]
|
|
|
|
multimodal-looker: 分析结果:
|
|
- 错误类型:NullPointerException
|
|
- 位置:UserService.java:42
|
|
- 原因:user 对象为 null
|
|
- 建议:添加 null 检查
|
|
|
|
Agent: 我看到了这个错误,是 UserService 第 42 行的空指针异常。
|
|
根据你的需求,解决方案是:
|
|
1. 在调用 user 之前检查是否为 null
|
|
2. 或者使用 Optional 包装
|
|
...
|
|
```
|
|
|
|
### Example 2: Architecture Review
|
|
```
|
|
User: 根据这个架构图 arch.png,帮我设计部署方案
|
|
|
|
Agent: @multimodal-looker 请分析这个架构图...
|
|
[delegation with template 2]
|
|
|
|
multimodal-looker: 分析结果:
|
|
- 组件:Frontend(React), API Gateway(Nginx), Backend(Node.js), DB(PostgreSQL)
|
|
- 连接:React → Nginx → Node.js → PostgreSQL
|
|
- 架构:典型的三层架构
|
|
|
|
Agent: 根据架构图,系统包含三层:前端、API 层、数据层。
|
|
基于此,部署方案如下:
|
|
1. 前端:部署到 CDN 或 S3
|
|
2. API 层:Docker 容器化,负载均衡
|
|
3. 数据库:主从复制,定期备份
|
|
...
|
|
```
|