Initial commit to git.yoin
This commit is contained in:
131
videocut-clip-oral/SKILL.md
Normal file
131
videocut-clip-oral/SKILL.md
Normal file
@@ -0,0 +1,131 @@
|
||||
---
|
||||
name: videocut-clip-oral
|
||||
description: 口播视频转录和口误识别。生成审查稿和删除任务清单。触发词:剪口播、处理视频、识别口误
|
||||
metadata:
|
||||
version: "1.0.0"
|
||||
alias: "videocut:剪口播"
|
||||
---
|
||||
|
||||
<!--
|
||||
input: 视频文件 (*.mp4)
|
||||
output: 转录JSON、审查稿、删除任务TodoList
|
||||
pos: 转录+识别,到用户审核为止
|
||||
|
||||
架构守护者:一旦我被修改,请同步更新:
|
||||
1. ../README.md 的 Skill 清单
|
||||
2. /CLAUDE.md 路由表
|
||||
-->
|
||||
|
||||
# 剪口播
|
||||
|
||||
> 转录 + 口误/静音识别 → 生成审查稿
|
||||
|
||||
## 快速使用
|
||||
|
||||
```
|
||||
用户: 帮我剪这个口播视频
|
||||
用户: 处理一下这个视频
|
||||
```
|
||||
|
||||
## 流程
|
||||
|
||||
```
|
||||
1. FunASR 30s 分段转录(字符级时间戳)
|
||||
↓
|
||||
2. 识别口误(逐句检查)
|
||||
↓
|
||||
3. 识别微口误(VAD 检测短片段)
|
||||
↓
|
||||
4. 识别语气词(嗯/哎/诶 等)
|
||||
↓
|
||||
5. 识别静音(≥1s)
|
||||
↓
|
||||
6. 生成审查稿(时间戳驱动)
|
||||
↓
|
||||
7. 输出删除任务 TodoList
|
||||
↓
|
||||
【等待用户确认】→ 用户确认后,执行 /videocut:剪辑
|
||||
```
|
||||
|
||||
### ⚠️ 为什么用 30s 分段
|
||||
|
||||
FunASR 长视频有时间戳漂移,30s 分段可避免。
|
||||
|
||||
## 进度 TodoList
|
||||
|
||||
启动时创建:
|
||||
|
||||
```
|
||||
- [ ] 读取「转录最佳实践」→ 转录视频
|
||||
- [ ] 读取「口误识别方法论」→ 识别口误
|
||||
- [ ] VAD 检测微口误(短片段 < 0.5s)
|
||||
- [ ] 扫描语气词(嗯/哎/诶 等)
|
||||
- [ ] 识别静音(≥1s)
|
||||
- [ ] 生成审查稿
|
||||
- [ ] 输出删除任务清单
|
||||
```
|
||||
|
||||
### ⚠️ 必须先读方法论再执行
|
||||
|
||||
| 阶段 | 先读 | 再执行 |
|
||||
|------|------|--------|
|
||||
| 转录 | `tips/转录最佳实践.md` | 调用ASR |
|
||||
| 识别口误 | `tips/口误识别方法论.md` | 逐句分析 |
|
||||
|
||||
---
|
||||
|
||||
## 核心:时间戳驱动
|
||||
|
||||
### 删除任务格式
|
||||
|
||||
每项**必须标注精确时间戳** `(start-end)`:
|
||||
|
||||
```
|
||||
口误(N处):
|
||||
- [ ] 1. `(start-end)` 删"错误文本" → 保留"正确文本"
|
||||
|
||||
语气词(N处):
|
||||
- [ ] 1. `(前字end-后字start)` 删"嗯" 上下文: XX【嗯】YY
|
||||
|
||||
静音(N处):
|
||||
- [ ] 1. `(start-end)` 静音Xs
|
||||
```
|
||||
|
||||
### 口误类型
|
||||
|
||||
| 类型 | 示例 | 删除策略 |
|
||||
|------|------|----------|
|
||||
| 重复型 | `拉满新拉满` | 只删差异("新") |
|
||||
| 替换型 | `AI就是AI就会` | 删第一个完整版本("AI就是") |
|
||||
| 卡顿型 | `听会会` | 删第一个重复字 |
|
||||
|
||||
### ⚠️ 关键规则
|
||||
|
||||
1. **时间戳驱动**:审查稿直接标注时间戳,剪辑不再搜索文本
|
||||
2. **逐token分析**:对于"删前面保后面"的口误,必须逐token查时间戳
|
||||
3. **检查时间跨度**:如果口误时间跨度 > 2秒,必有静音,需拆分
|
||||
|
||||
---
|
||||
|
||||
## 输出文件
|
||||
|
||||
```
|
||||
01-xxx-v1_transcript.json # 转录结果(含时间戳)
|
||||
01-xxx-v1_审查稿.md # 口误审查稿
|
||||
```
|
||||
|
||||
### 展示要求
|
||||
|
||||
生成审查稿后,**必须展示给用户**:
|
||||
1. 写入文件 `01-xxx-v1_审查稿.md`
|
||||
2. 读取并展示内容
|
||||
3. 等待用户确认要删除哪些项目
|
||||
|
||||
---
|
||||
|
||||
## 方法论
|
||||
|
||||
详见 `tips/口误识别方法论.md`:
|
||||
- 口误识别方法(逐句检查)
|
||||
- "删前面保后面"的精确处理
|
||||
- FunASR 时间戳对齐规则
|
||||
Reference in New Issue
Block a user