04db423416
- 70 skills with code and documentation - Add .gitignore (ignore __pycache__, output/, temp/, venv/) - Clean up test intermediates and caches
2.3 KiB
2.3 KiB
钢琴课精华视频生成技能使用说明
快速开始
1. 准备工作
- 准备好原始钢琴课视频文件(MP4格式)
- 准备配套PPT/PDF文件,提取知识点的名称和对应的时间点
- 复制
references/config_template.yaml为你的项目配置文件,比如my_course_config.yaml
2. 编辑配置文件
修改你的配置文件:
video_src: "你的视频路径.mp4"
clips:
- title: "知识点1名称"
start: 开始时间(秒)
end: 结束时间(秒)
- title: "知识点2名称"
start: 开始时间
end: 结束时间
# 添加更多知识点...
term_corrections:
# 扩展你的术语纠正规则
"错误词": "正确词"
3. 运行生成脚本
python scripts/generate_highlights.py --config your_config.yaml --output ./output_dir
4. 审核与修改
生成后会在输出目录下得到:
vN_final.mp4- 最终视频(N为版本号,自动递增)subs/v1_original.srt- 原始转录字幕subs/v1_terms.srt- 术语库纠正后字幕subs/v1_ai.srt- AI上下文纠正后字幕
如果需要修改字幕,直接编辑对应版本的srt文件,然后重新运行脚本即可生成新版本。
高级用法
自定义术语库
参考references/terms_template.md扩展你的术语库,添加到配置文件的term_corrections字段。
调整样式
在配置文件中修改:
- 标题大小、颜色、显示时长
- 字幕大小、颜色
- 转场时长
- 转录模型(如果需要更高精度用large模型)
重新生成
如果只修改了字幕,不需要重新转录,可以直接使用修改后的srt文件烧录:
ffmpeg -i concated.mp4 -vf "subtitles=modified.srt" -c:a copy new_version.mp4
输入要求
- 视频格式:MP4/H.264编码
- 视频时长:建议不超过2小时
- 知识点数量:建议3-10个,每个20-60秒
- 音频质量:清晰无杂音,识别效果更好
常见问题
字幕识别不准怎么办?
- 扩展术语库,添加更多常见错误映射
- 使用更大的Whisper模型(large)
- 手动修改srt文件重新生成
时间戳不对怎么办?
检查配置文件中的知识点开始/结束时间是否正确,确保时间是视频中的实际秒数。
字幕不同步怎么办?
确保转录和切分使用的是同一个原始视频,没有经过二次编辑。