--- name: videocut-subtitle description: 字幕生成与烧录。转录→词典纠错→审核→烧录。触发词:加字幕、生成字幕、字幕 metadata: version: "1.0.0" alias: "videocut:字幕" --- # 字幕 > 转录 → 纠错 → 审核 → 匹配 → 烧录 ## 流程 ``` 1. 转录视频(Whisper) ↓ 2. 词典纠错 + 分句 ↓ 3. 输出字幕稿(纯文本,一句一行) ↓ 【用户审核修改】 ↓ 4. 用户给回修改后的文本 ↓ 5. 我匹配时间戳 → 生成 SRT ↓ 6. 烧录字幕(FFmpeg) ``` ## 转录 使用 OpenAI Whisper 模型进行语音转文字: ```bash whisper video.mp4 --model medium --language zh --output_format json ``` | 模型 | 用途 | |------|------| | `medium` | 默认,平衡速度与准确率 | | `large-v3` | 高精度,较慢 | 输出 JSON 包含逐词时间戳,用于后续 SRT 生成。 --- ## 字幕规范 | 规则 | 说明 | |------|------| | 一屏一行 | 不换行,不堆叠 | | ≤15字/行 | 超过15字必须拆分(4:3竖屏) | | 句尾无标点 | `你好` 不是 `你好。` | | 句中保留标点 | `先点这里,再点那里` | --- ## 词典纠错 读取 `词典.txt`,每行一个正确写法: ``` skills Claude iPhone ``` 我自动识别变体:`claude` → `Claude` --- ## 字幕稿格式 **我给用户的**(纯文本,≤15字/行): ``` 今天给大家分享一个技巧 很多人可能不知道 其实这个功能 藏在设置里面 你只要点击这里 就能看到了 ``` **用户修改后给回我**,我再匹配时间戳生成 SRT。 --- ## 样式 默认:24号白字、黑色描边、底部居中 **可选样式:** | 样式 | 说明 | |------|------| | 默认 | 白字黑边 | | 黄字 | 黄字黑边(醒目) | 用户可说: - "字大一点" → 32号 - "放顶部" → 顶部居中 - "黄色字幕" → 黄字黑边 --- ## 输出 ``` 01-xxx_字幕稿.txt # 纯文本,用户编辑 01-xxx.srt # 字幕文件 01-xxx-字幕.mp4 # 带字幕视频 ```