04db423416
- 70 skills with code and documentation - Add .gitignore (ignore __pycache__, output/, temp/, venv/) - Clean up test intermediates and caches
7.9 KiB
7.9 KiB
Delegation Templates for multimodal-looker
Ready-to-use prompts for delegating visual analysis tasks.
Template Structure
@multimodal-looker [分析类型] 这张 [图片类型]
**图片**: [路径/URL/描述]
**用户需求**: [原始需求]
**分析重点**:
1. [重点 1]
2. [重点 2]
3. [重点 3]
**输出格式**: [期望格式]
Scenario Templates
1. Error Screenshot Analysis
@multimodal-looker 请分析这个错误日志截图
**图片**: [图片路径]
**用户需求**: 诊断错误原因并提供解决方案
**分析重点**:
1. 错误类型和错误代码
2. 堆栈跟踪的关键信息
3. 出错的文件名和行号
4. 任何相关的上下文信息
**输出格式**:
- 错误类型:[类型]
- 错误位置:[文件:行号]
- 可能原因:[分析]
- 建议解决方案:[步骤]
2. Architecture Diagram Analysis
@multimodal-looker 请分析这个架构图
**图片**: [图片路径]
**用户需求**: [理解系统架构/生成部署方案/识别组件]
**分析重点**:
1. 所有组件/模块的名称和功能
2. 组件之间的连接关系和数据流向
3. 使用的技术栈标识(如果有)
4. 架构模式(微服务、单体、分层等)
**输出格式**:
- 组件列表:[表格形式]
- 连接关系:[描述]
- 架构模式:[类型]
- 技术栈:[列表]
3. Data Chart Analysis
@multimodal-looker 请分析这个数据图表
**图片**: [图片路径]
**用户需求**: [提取数据趋势/比较数据/理解指标]
**分析重点**:
1. 图表类型(柱状图、折线图、饼图等)
2. X 轴和 Y 轴的标签和范围
3. 数据点的具体数值(尽可能读取)
4. 趋势、峰值、谷值
5. 图例和颜色含义
**输出格式**:
- 图表类型:[类型]
- 时间范围:[起止时间]
- 数据系列:[列表]
- 关键趋势:[描述]
- 异常点:[如有]
4. UI/UX Mockup Analysis
@multimodal-looker 请分析这个界面设计稿
**图片**: [图片路径]
**用户需求**: [实现界面/评估设计/提取需求]
**分析重点**:
1. 界面布局和区域划分
2. 所有 UI 元素(按钮、输入框、列表等)
3. 文案内容和标签
4. 配色方案和字体(如果能识别)
5. 交互元素和状态
**输出格式**:
- 布局结构:[描述]
- UI 元素清单:[列表]
- 配色方案:[颜色值]
- 交互说明:[描述]
5. Flowchart/Process Diagram Analysis
@multimodal-looker 请分析这个流程图
**图片**: [图片路径]
**用户需求**: [理解流程/生成文档/实现逻辑]
**分析重点**:
1. 流程的起点和终点
2. 所有步骤/节点的内容
3. 决策点和分支条件
4. 流程方向和箭头含义
5. 并行流程或循环
**输出格式**:
- 流程步骤:[有序列表]
- 决策点:[条件 + 分支]
- 流程图描述:[文字版]
6. Table/Data Grid Analysis
@multimodal-looker 请分析这个表格
**图片**: [图片路径]
**用户需求**: [提取数据/理解结构/转换格式]
**分析重点**:
1. 表格的行列结构
2. 表头和各列含义
3. 所有单元格的数据内容
4. 合并单元格(如果有)
5. 表格的总计或汇总行
**输出格式**:
- 表格结构:[行数 x 列数]
- 列名:[列表]
- 数据内容:[Markdown 表格]
7. Code Screenshot Analysis (OCR)
@multimodal-looker 请识别这个代码截图中的文字
**图片**: [图片路径]
**用户需求**: [提取代码/理解逻辑/转换格式]
**分析重点**:
1. 完整的代码内容(逐行识别)
2. 代码语言(根据语法判断)
3. 缩进和格式
4. 注释内容
5. 任何特殊符号
**输出格式**:
- 代码语言:[语言]
- 代码内容:[代码块]
- 关键逻辑:[简述]
8. Handwritten Notes Analysis
@multimodal-looker 请识别这个手写笔记
**图片**: [图片路径]
**用户需求**: [转录文字/理解内容/整理笔记]
**分析重点**:
1. 所有可识别的文字内容
2. 标题和分段
3. 列表和要点
4. 图示或草图(如果有)
5. 标注和高亮
**输出格式**:
- 标题:[标题]
- 内容:[结构化文本]
- 要点:[列表]
- 备注:[识别不清的部分]
9. Comparison Task (Multiple Images)
@multimodal-looker 请对比分析这两张图片
**图片 1**: [路径 1]
**图片 2**: [路径 2]
**用户需求**: [比较差异/选择更好的/找出变化]
**分析重点**:
1. 每张图片的独立分析
2. 相似之处
3. 差异之处
4. 各自的优缺点
**输出格式**:
- 图片 1 分析:[描述]
- 图片 2 分析:[描述]
- 相似点:[列表]
- 差异点:[列表]
- 建议:[如有]
10. General Purpose (Open-ended)
@multimodal-looker 请分析这张图片
**图片**: [图片路径]
**用户需求**: [原始需求]
**分析重点**:
1. 图片的整体内容描述
2. 关键视觉元素
3. 任何文字信息
4. 颜色、布局、风格
5. 与用户需求相关的部分
**输出格式**: 自由格式,但请结构化输出
Response Integration Patterns
After receiving analysis from multimodal-looker, integrate results:
Pattern 1: Acknowledge + Connect
感谢分析。我看到了 [图片内容简述]。
根据你的需求 [xxx],结合图片中的 [关键信息],我建议...
Pattern 2: Summary + Action
根据图片分析,关键信息是:
1. [要点 1]
2. [要点 2]
基于此,下一步行动是...
Pattern 3: Validation + Expansion
图片分析结果确认了 [某信息]。
除此之外,还需要考虑...
Error Handling Templates
Timeout Response
抱歉,图片分析超时了。可能原因:
- 图片文件过大
- 网络延迟
- 服务繁忙
你可以:
1. 压缩图片后重试
2. 用文字描述关键信息
3. 稍后重试
Format Not Supported
这个图片格式([格式])可能不被支持。
建议:
- 转换为 PNG 或 JPG 格式
- 或者描述图片内容,我继续帮助你
Analysis Failed
抱歉,无法分析这张图片。可能原因:
- 图片文件损坏
- 图片内容无法识别
- 服务暂时不可用
请尝试:
- 重新上传清晰的图片
- 或者用文字描述你想了解的内容
Best Practices
DO:
- Be specific about what you want analyzed
- Provide context about why you're asking
- Specify output format if you have preferences
- Acknowledge the analysis when received
- Connect visual info to the broader task
DON'T:
- Don't just say "analyze this" without context
- Don't expect perfect OCR on blurry images
- Don't ignore the analysis results
- Don't delegate if the image isn't crucial
- Don't forget to thank multimodal-looker (optional but nice)
Example Conversations
Example 1: Error Debugging
User: 帮我看看这个报错 screenshot.png
Agent: @multimodal-looker 请分析这个错误日志截图...
[delegation with template 1]
multimodal-looker: 分析结果:
- 错误类型:NullPointerException
- 位置:UserService.java:42
- 原因:user 对象为 null
- 建议:添加 null 检查
Agent: 我看到了这个错误,是 UserService 第 42 行的空指针异常。
根据你的需求,解决方案是:
1. 在调用 user 之前检查是否为 null
2. 或者使用 Optional 包装
...
Example 2: Architecture Review
User: 根据这个架构图 arch.png,帮我设计部署方案
Agent: @multimodal-looker 请分析这个架构图...
[delegation with template 2]
multimodal-looker: 分析结果:
- 组件:Frontend(React), API Gateway(Nginx), Backend(Node.js), DB(PostgreSQL)
- 连接:React → Nginx → Node.js → PostgreSQL
- 架构:典型的三层架构
Agent: 根据架构图,系统包含三层:前端、API 层、数据层。
基于此,部署方案如下:
1. 前端:部署到 CDN 或 S3
2. API 层:Docker 容器化,负载均衡
3. 数据库:主从复制,定期备份
...