新增16个AI技能:包含图像生成、视频剪辑、数据分析、智能查询等功能模块

This commit is contained in:
hmo
2026-02-13 20:18:38 +08:00
parent 456cd45de4
commit 8200a17176
154 changed files with 14585 additions and 1 deletions

View File

@@ -0,0 +1,26 @@
# videocut:字幕
> 字幕生成与烧录
## 文件
| 文件 | 作用 |
|------|------|
| `SKILL.md` | 流程定义 |
| `词典.txt` | 正确写法列表(每行一个) |
## 词典格式
```
skills
Claude
钉钉AI录音卡
```
用户只写正确的词,我识别所有错误变体。
## 流程
```
转录 → 词典纠错 → 用户审核 → 烧录
```

View File

@@ -0,0 +1,113 @@
---
name: videocut-subtitle
description: 字幕生成与烧录。转录→词典纠错→审核→烧录。触发词:加字幕、生成字幕、字幕
metadata:
version: "1.0.0"
alias: "videocut:字幕"
---
# 字幕
> 转录 → 纠错 → 审核 → 匹配 → 烧录
## 流程
```
1. 转录视频Whisper
2. 词典纠错 + 分句
3. 输出字幕稿(纯文本,一句一行)
【用户审核修改】
4. 用户给回修改后的文本
5. 我匹配时间戳 → 生成 SRT
6. 烧录字幕FFmpeg
```
## 转录
使用 OpenAI Whisper 模型进行语音转文字:
```bash
whisper video.mp4 --model medium --language zh --output_format json
```
| 模型 | 用途 |
|------|------|
| `medium` | 默认,平衡速度与准确率 |
| `large-v3` | 高精度,较慢 |
输出 JSON 包含逐词时间戳,用于后续 SRT 生成。
---
## 字幕规范
| 规则 | 说明 |
|------|------|
| 一屏一行 | 不换行,不堆叠 |
| ≤15字/行 | 超过15字必须拆分4:3竖屏 |
| 句尾无标点 | `你好` 不是 `你好。` |
| 句中保留标点 | `先点这里,再点那里` |
---
## 词典纠错
读取 `词典.txt`,每行一个正确写法:
```
skills
Claude
iPhone
```
我自动识别变体:`claude``Claude`
---
## 字幕稿格式
**我给用户的**纯文本≤15字/行):
```
今天给大家分享一个技巧
很多人可能不知道
其实这个功能
藏在设置里面
你只要点击这里
就能看到了
```
**用户修改后给回我**,我再匹配时间戳生成 SRT。
---
## 样式
默认24号白字、黑色描边、底部居中
**可选样式:**
| 样式 | 说明 |
|------|------|
| 默认 | 白字黑边 |
| 黄字 | 黄字黑边(醒目) |
用户可说:
- "字大一点" → 32号
- "放顶部" → 顶部居中
- "黄色字幕" → 黄字黑边
---
## 输出
```
01-xxx_字幕稿.txt # 纯文本,用户编辑
01-xxx.srt # 字幕文件
01-xxx-字幕.mp4 # 带字幕视频
```

View File

@@ -0,0 +1,8 @@
skills
Claude
iPhone
GitHub
API
APP
NO.1
钉钉