hmo/skills

Files

T

hmo 04db423416 Initial commit: skills library

- 70 skills with code and documentation
- Add .gitignore (ignore __pycache__, output/, temp/, venv/)
- Clean up test intermediates and caches

2026-04-26 19:27:40 +08:00

scripts

Initial commit: skills library

2026-04-26 19:27:40 +08:00

README.md

Initial commit: skills library

2026-04-26 19:27:40 +08:00

requirements.txt

Initial commit: skills library

2026-04-26 19:27:40 +08:00

SKILL.md

Initial commit: skills library

2026-04-26 19:27:40 +08:00

README.md

Audio Generator Skill

文本转音频生成技能，使用 Edge TTS 生成高质量中文语音。

功能特性

支持 Markdown、纯文本、分隔符三种格式
自动分割长文本为章节
使用微软 Edge TTS，语音自然流畅
支持批量生成和增量更新
可指定特定章节生成

安装依赖

pip install edge-tts

使用方法

生成音频

# 生成纯文本音频
python scripts/generate_audio.py text.txt

# 生成 Markdown 音频
python scripts/generate_audio.py doc.md --format markdown

# 指定输出目录
python scripts/generate_audio.py text.txt --output-dir ./my_audio

合并音频

# 合并指定目录所有MP3为一个完整版
python scripts/merge_audio.py ./audio_chapters

# 指定输出文件名
python scripts/merge_audio.py ./audio_chapters --output 完整版.mp3

# 指定文件模式
python scripts/merge_audio.py ./audio_chapters --pattern "chapter_*.mp3"

高级用法

# 使用不同语音
python scripts/generate_audio.py text.txt --voice zh-CN-YunxiNeural

# 只生成特定章节
python scripts/generate_audio.py text.txt --chapters "第一章,第二章"

# 按分隔符分割（适用于有【章节标题】的文本）
python scripts/generate_audio.py text.txt --format separator

可用语音

语音代码	性别	特点
zh-CN-XiaoxiaoNeural	女	晓晓，适合长文朗读，自然流畅
zh-CN-YunxiNeural	男	云希，适合旁白解说
zh-CN-YunjianNeural	男	云健，适合新闻播报
zh-CN-XiaoyiNeural	女	晓伊，温柔亲切

完整语音列表：https://speech.platform.bing.com/consumer/speech/synthesize/readaloud/voices/list?trustedclienttoken=6A5AA1D4EAFF4E9FB37E23D68491D6F4

文本格式建议

Markdown 格式

## 第一章：标题
内容...

## 第二章：标题
内容...

分隔符格式（推荐）

================================================================
【第一章】
内容...

================================================================
【第二章】
内容...

输出结构

output_dir/
├── 01_第一章标题.mp3
├── 02_第二章标题.mp3
├── 03_第三章标题.mp3
└── ...

工作流程集成

这个技能通常用于以下工作流程：

知识库转音频
- 将知识库文档转换为可听的音频课程
- 便于通勤、运动时学习
长文朗读
- 将长篇文章分段生成音频
- 支持离线收听
内容创作
- 为视频配音
- 生成播客内容

最佳实践

预处理文本
- 移除不必要的 Markdown 标记
- 添加适当的口语化表达
- 添加术语解释
章节划分
- 每个章节控制在 5-10 分钟
- 过长内容可以进一步细分
语音选择
- 课程内容：晓晓（女声）或云希（男声）
- 故事朗读：根据角色选择合适语音
- 新闻播报：云健

故障排除

生成失败

检查 edge-tts 是否安装：pip list | grep edge
检查网络连接（Edge TTS 需要联网）
检查文本编码是否为 UTF-8

文件名问题

脚本会自动清理非法字符
章节标题过长会被截断

更新日志

v1.0.0 (2026-02-19)

初始版本
支持三种文本格式
支持章节过滤
支持多种语音

License

MIT License