skills/audio-generator/README.md

# Audio Generator Skill

文本转音频生成技能，使用 Edge TTS 生成高质量中文语音。

## 功能特性

- 支持 Markdown、纯文本、分隔符三种格式
- 自动分割长文本为章节
- 使用微软 Edge TTS，语音自然流畅
- 支持批量生成和增量更新
- 可指定特定章节生成

## 安装依赖

```bash
pip install edge-tts
```

## 使用方法

### 生成音频

```bash
# 生成纯文本音频
python scripts/generate_audio.py text.txt

# 生成 Markdown 音频
python scripts/generate_audio.py doc.md --format markdown

# 指定输出目录
python scripts/generate_audio.py text.txt --output-dir ./my_audio
```

### 合并音频

```bash
# 合并指定目录所有MP3为一个完整版
python scripts/merge_audio.py ./audio_chapters

# 指定输出文件名
python scripts/merge_audio.py ./audio_chapters --output 完整版.mp3

# 指定文件模式
python scripts/merge_audio.py ./audio_chapters --pattern "chapter_*.mp3"
```

### 高级用法

```bash
# 使用不同语音
python scripts/generate_audio.py text.txt --voice zh-CN-YunxiNeural

# 只生成特定章节
python scripts/generate_audio.py text.txt --chapters "第一章,第二章"

# 按分隔符分割（适用于有【章节标题】的文本）
python scripts/generate_audio.py text.txt --format separator
```

## 可用语音

| 语音代码 | 性别 | 特点 |
|---------|------|------|
| zh-CN-XiaoxiaoNeural | 女 | 晓晓，适合长文朗读，自然流畅 |
| zh-CN-YunxiNeural | 男 | 云希，适合旁白解说 |
| zh-CN-YunjianNeural | 男 | 云健，适合新闻播报 |
| zh-CN-XiaoyiNeural | 女 | 晓伊，温柔亲切 |

完整语音列表：https://speech.platform.bing.com/consumer/speech/synthesize/readaloud/voices/list?trustedclienttoken=6A5AA1D4EAFF4E9FB37E23D68491D6F4

## 文本格式建议

### Markdown 格式
```markdown
## 第一章：标题
内容...

## 第二章：标题
内容...
```

### 分隔符格式（推荐）
```
================================================================
【第一章】
内容...

================================================================
【第二章】
内容...
```

## 输出结构

```
output_dir/
├── 01_第一章标题.mp3
├── 02_第二章标题.mp3
├── 03_第三章标题.mp3
└── ...
```

## 工作流程集成

这个技能通常用于以下工作流程：

1. **知识库转音频**
   - 将知识库文档转换为可听的音频课程
   - 便于通勤、运动时学习

2. **长文朗读**
   - 将长篇文章分段生成音频
   - 支持离线收听

3. **内容创作**
   - 为视频配音
   - 生成播客内容

## 最佳实践

1. **预处理文本**
   - 移除不必要的 Markdown 标记
   - 添加适当的口语化表达
   - 添加术语解释

2. **章节划分**
   - 每个章节控制在 5-10 分钟
   - 过长内容可以进一步细分

3. **语音选择**
   - 课程内容：晓晓（女声）或云希（男声）
   - 故事朗读：根据角色选择合适语音
   - 新闻播报：云健

## 故障排除

### 生成失败
- 检查 edge-tts 是否安装：`pip list | grep edge`
- 检查网络连接（Edge TTS 需要联网）
- 检查文本编码是否为 UTF-8

### 文件名问题
- 脚本会自动清理非法字符
- 章节标题过长会被截断

## 更新日志

### v1.0.0 (2026-02-19)
- 初始版本
- 支持三种文本格式
- 支持章节过滤
- 支持多种语音

## License

MIT License