lesson-highlights/docs/USAGE.md

# 使用指南

## 快速开始

### 1. 配置

编辑项目根目录的 `config.py`：

```python
VIDEO = r"D:\...\直播回放.mp4"
PPT = r"D:\...\课程.pptx"
OUTPUT = r"D:\...\output"
MAX_TOTAL_DURATION = 600  # 精华片段总时长上限（秒）
API_KEY = "your-api-key"
API_HOST = "https://ark.cn-beijing.volces.com/api/coding/v3"
```

所有路径和 API 配置只改这一个文件。

### 2. 完整流程（首次运行）

```bash
run.bat
```

或直接：

```bash
python run.py
```

完整流程：PPT解析 → Whisper转录 → LLM校正 → 字幕生成 → 合并 → 烧录

### 3. 修改字幕后快速重烧

改完 `v1_title.srt` 或 `v1_content.srt` 后，直接：

```bash
burn.bat
```

跳过所有转录/字幕生成步骤，直接用已有片段和字幕文件合并烧录。**只改字幕文本时用这个**。

## 修改知识点（替换PPT中的某个知识点）

LLM 从 PPT 提取了 clip 后，如果你想把其中一个换成 PPT 里另一个知识点（比如把"音高"换成"旋律"）：

### 步骤

1. **改 `generated_config.yaml`**：把对应 clip 的 title 改成新知识点名称

```yaml
clips:
  - title: 旋律    # ← 改成PPT里有的知识点
    start: 200
    end: 260
```

2. **删该 clip 的中间文件**（让它重新生成）：

```
intermediates/clip5.json    ← 删掉
intermediates/clip5.mp4    ← 删掉
```

3. **重新运行**：

```bash
run.bat
```

系统会跳过其他已有 JSON 的 clip，只重新生成被删除了 JSON 的那一个 clip。

### 原理

- `run.bat` 检测到 `clip*.json` 已存在，就跳过 Whisper 转录
- 删掉某个 clip 的 JSON 后，系统认为它需要重新生成
- 重新生成时用新的 title 去 transcript 里匹配，重新找时间范围

### 注意

- `start`/`end` 如果填错了，生成的视频片段时间会不对
- 如果不确定新知识点的时间范围，可以先随便填一个，跑完看效果再调整

## 文件结构

```
output/
├── generated_config.yaml   # clips 配置（可手动修改）
├── intermediates/         # 中间文件（可删除特定clip的.json/.mp4重生成）
│   ├── clip1.json        # Whisper 转录结果
│   ├── clip1.mp4         # 提取的视频片段
│   └── ...
├── subs/                 # 字幕文件
│   ├── v1_title.srt      # 标题轨（可手动修改文本+时间轴）
│   └── v1_content.srt    # 正文字幕
├── concat_merged.mp4     # 合并后的视频
└── final.mp4             # 最终输出
```

## 命令对比

| 命令 | 用途 | 耗时 |
|------|------|------|
| `run.bat` | 完整流程（PPT→视频） | 几十分钟 |
| `burn.bat` | 只改字幕后快速重烧 | 几分钟 |

## 常见问题

**Q: `burn.bat` 改了字号没变化？**
A: `burn.bat` 直接烧已有的 SRT 文件，不走 `subtitle.py` 的生成逻辑。如果改了渲染参数（如字号）需要重新生成字幕，必须 `run.bat`。

**Q: 想改某个知识点的出现时间？**
A: 直接改 `v1_title.srt` 里的时间轴，或者改 `generated_config.yaml` 然后删对应 clip 的 JSON 重新生成。

**Q: 想删掉某个 clip？**
A: 从 `generated_config.yaml` 里删掉那一条，然后删对应 `intermediates/clip*.json` 和 `clip*.mp4`，最后 `run.bat`。

## GUI 编辑模式

### 启动方式

GUI 支持两种启动模式：

**方式一：新建项目**
```bash
python src/main.py
# 或双击 start.bat
```
在启动页选择"新建项目"，选择视频+PPT，运行完整流程。

**方式二：打开已有项目**
在启动页选择"打开已有项目"，选择 output 目录。
项目文件 `generated_config.yaml` 包含所有项目信息（视频路径、PPT路径、知识点列表）。

### 编辑知识点

打开项目后进入编辑界面：

- **改标题**：双击 clip 列表中的任意条目，输入新标题 → 系统自动在 transcript 中重新匹配时间段 → 处理重叠
- **删 clip**：右键点击 clip → 删除此 Clip
- **新增知识点**：点击"+ 新增知识点"按钮，输入标题 → 系统在 transcript 中匹配 → 如有重叠自动合并

> 注意：匹配不到的 clip 显示红色背景的"未匹配"标签，不参与最终烧录

### 编辑字幕

右侧字幕预览区显示 `v1_content.srt` 内容，可直接编辑文本。

### 应用更改

点击"应用"按钮：
1. 检测字幕是否有修改 → 有则重烧字幕轨
2. 检测 clips 是否有修改 → 重烧标题轨
3. 自动合并+烧录最终视频

### 文件结构

```
output_dir/
├── generated_config.yaml   ← 项目文件（GUI 编辑后同步更新）
├── intermediates/        ← 中间缓存
│   ├── clip*.json       ← Whisper 转录（删后可重新生成）
│   ├── clip*.mp4        ← 视频片段
│   └── corrected_transcript.json ← LLM校正后的全量转录
├── subs/
│   ├── v1_title.srt    ← 标题轨
│   └── v1_content.srt   ← 字幕轨（可直接编辑）
└── final.mp4            ← 最终输出
```

## CLI/GUI 互操作

CLI 和 GUI 共用同一套项目文件体系：

```bash
# 1. CLI 批量处理
run.bat

# 2. GUI 审核修改
python src/main.py
# → 选择"打开已有项目" → 选择同一 output_dir
```

修改后点"应用"，GUI 自动判断需要重生成哪些部分。