Files
hmo 04db423416 Initial commit: skills library
- 70 skills with code and documentation
- Add .gitignore (ignore __pycache__, output/, temp/, venv/)
- Clean up test intermediates and caches
2026-04-26 19:27:40 +08:00

7.9 KiB

Delegation Templates for multimodal-looker

Ready-to-use prompts for delegating visual analysis tasks.

Template Structure

@multimodal-looker [分析类型] 这张 [图片类型]

**图片**: [路径/URL/描述]

**用户需求**: [原始需求]

**分析重点**:
1. [重点 1]
2. [重点 2]
3. [重点 3]

**输出格式**: [期望格式]

Scenario Templates

1. Error Screenshot Analysis

@multimodal-looker 请分析这个错误日志截图

**图片**: [图片路径]

**用户需求**: 诊断错误原因并提供解决方案

**分析重点**:
1. 错误类型和错误代码
2. 堆栈跟踪的关键信息
3. 出错的文件名和行号
4. 任何相关的上下文信息

**输出格式**: 
- 错误类型:[类型]
- 错误位置:[文件:行号]
- 可能原因:[分析]
- 建议解决方案:[步骤]

2. Architecture Diagram Analysis

@multimodal-looker 请分析这个架构图

**图片**: [图片路径]

**用户需求**: [理解系统架构/生成部署方案/识别组件]

**分析重点**:
1. 所有组件/模块的名称和功能
2. 组件之间的连接关系和数据流向
3. 使用的技术栈标识(如果有)
4. 架构模式(微服务、单体、分层等)

**输出格式**:
- 组件列表:[表格形式]
- 连接关系:[描述]
- 架构模式:[类型]
- 技术栈:[列表]

3. Data Chart Analysis

@multimodal-looker 请分析这个数据图表

**图片**: [图片路径]

**用户需求**: [提取数据趋势/比较数据/理解指标]

**分析重点**:
1. 图表类型(柱状图、折线图、饼图等)
2. X 轴和 Y 轴的标签和范围
3. 数据点的具体数值(尽可能读取)
4. 趋势、峰值、谷值
5. 图例和颜色含义

**输出格式**:
- 图表类型:[类型]
- 时间范围:[起止时间]
- 数据系列:[列表]
- 关键趋势:[描述]
- 异常点:[如有]

4. UI/UX Mockup Analysis

@multimodal-looker 请分析这个界面设计稿

**图片**: [图片路径]

**用户需求**: [实现界面/评估设计/提取需求]

**分析重点**:
1. 界面布局和区域划分
2. 所有 UI 元素(按钮、输入框、列表等)
3. 文案内容和标签
4. 配色方案和字体(如果能识别)
5. 交互元素和状态

**输出格式**:
- 布局结构:[描述]
- UI 元素清单:[列表]
- 配色方案:[颜色值]
- 交互说明:[描述]

5. Flowchart/Process Diagram Analysis

@multimodal-looker 请分析这个流程图

**图片**: [图片路径]

**用户需求**: [理解流程/生成文档/实现逻辑]

**分析重点**:
1. 流程的起点和终点
2. 所有步骤/节点的内容
3. 决策点和分支条件
4. 流程方向和箭头含义
5. 并行流程或循环

**输出格式**:
- 流程步骤:[有序列表]
- 决策点:[条件 + 分支]
- 流程图描述:[文字版]

6. Table/Data Grid Analysis

@multimodal-looker 请分析这个表格

**图片**: [图片路径]

**用户需求**: [提取数据/理解结构/转换格式]

**分析重点**:
1. 表格的行列结构
2. 表头和各列含义
3. 所有单元格的数据内容
4. 合并单元格(如果有)
5. 表格的总计或汇总行

**输出格式**:
- 表格结构:[行数 x 列数]
- 列名:[列表]
- 数据内容:[Markdown 表格]

7. Code Screenshot Analysis (OCR)

@multimodal-looker 请识别这个代码截图中的文字

**图片**: [图片路径]

**用户需求**: [提取代码/理解逻辑/转换格式]

**分析重点**:
1. 完整的代码内容(逐行识别)
2. 代码语言(根据语法判断)
3. 缩进和格式
4. 注释内容
5. 任何特殊符号

**输出格式**:
- 代码语言:[语言]
- 代码内容:[代码块]
- 关键逻辑:[简述]

8. Handwritten Notes Analysis

@multimodal-looker 请识别这个手写笔记

**图片**: [图片路径]

**用户需求**: [转录文字/理解内容/整理笔记]

**分析重点**:
1. 所有可识别的文字内容
2. 标题和分段
3. 列表和要点
4. 图示或草图(如果有)
5. 标注和高亮

**输出格式**:
- 标题:[标题]
- 内容:[结构化文本]
- 要点:[列表]
- 备注:[识别不清的部分]

9. Comparison Task (Multiple Images)

@multimodal-looker 请对比分析这两张图片

**图片 1**: [路径 1]
**图片 2**: [路径 2]

**用户需求**: [比较差异/选择更好的/找出变化]

**分析重点**:
1. 每张图片的独立分析
2. 相似之处
3. 差异之处
4. 各自的优缺点

**输出格式**:
- 图片 1 分析:[描述]
- 图片 2 分析:[描述]
- 相似点:[列表]
- 差异点:[列表]
- 建议:[如有]

10. General Purpose (Open-ended)

@multimodal-looker 请分析这张图片

**图片**: [图片路径]

**用户需求**: [原始需求]

**分析重点**:
1. 图片的整体内容描述
2. 关键视觉元素
3. 任何文字信息
4. 颜色、布局、风格
5. 与用户需求相关的部分

**输出格式**: 自由格式,但请结构化输出

Response Integration Patterns

After receiving analysis from multimodal-looker, integrate results:

Pattern 1: Acknowledge + Connect

感谢分析。我看到了 [图片内容简述]。

根据你的需求 [xxx],结合图片中的 [关键信息],我建议...

Pattern 2: Summary + Action

根据图片分析,关键信息是:
1. [要点 1]
2. [要点 2]

基于此,下一步行动是...

Pattern 3: Validation + Expansion

图片分析结果确认了 [某信息]。

除此之外,还需要考虑...

Error Handling Templates

Timeout Response

抱歉,图片分析超时了。可能原因:
- 图片文件过大
- 网络延迟
- 服务繁忙

你可以:
1. 压缩图片后重试
2. 用文字描述关键信息
3. 稍后重试

Format Not Supported

这个图片格式([格式])可能不被支持。

建议:
- 转换为 PNG 或 JPG 格式
- 或者描述图片内容,我继续帮助你

Analysis Failed

抱歉,无法分析这张图片。可能原因:
- 图片文件损坏
- 图片内容无法识别
- 服务暂时不可用

请尝试:
- 重新上传清晰的图片
- 或者用文字描述你想了解的内容

Best Practices

DO:

  1. Be specific about what you want analyzed
  2. Provide context about why you're asking
  3. Specify output format if you have preferences
  4. Acknowledge the analysis when received
  5. Connect visual info to the broader task

DON'T:

  1. Don't just say "analyze this" without context
  2. Don't expect perfect OCR on blurry images
  3. Don't ignore the analysis results
  4. Don't delegate if the image isn't crucial
  5. Don't forget to thank multimodal-looker (optional but nice)

Example Conversations

Example 1: Error Debugging

User: 帮我看看这个报错 screenshot.png

Agent: @multimodal-looker 请分析这个错误日志截图...
[delegation with template 1]

multimodal-looker: 分析结果:
- 错误类型:NullPointerException
- 位置:UserService.java:42
- 原因:user 对象为 null
- 建议:添加 null 检查

Agent: 我看到了这个错误,是 UserService 第 42 行的空指针异常。
根据你的需求,解决方案是:
1. 在调用 user 之前检查是否为 null
2. 或者使用 Optional 包装
...

Example 2: Architecture Review

User: 根据这个架构图 arch.png,帮我设计部署方案

Agent: @multimodal-looker 请分析这个架构图...
[delegation with template 2]

multimodal-looker: 分析结果:
- 组件:Frontend(React), API Gateway(Nginx), Backend(Node.js), DB(PostgreSQL)
- 连接:React → Nginx → Node.js → PostgreSQL
- 架构:典型的三层架构

Agent: 根据架构图,系统包含三层:前端、API 层、数据层。
基于此,部署方案如下:
1. 前端:部署到 CDN 或 S3
2. API 层:Docker 容器化,负载均衡
3. 数据库:主从复制,定期备份
...