hmo/skills

Files

T

hmo 04db423416 Initial commit: skills library

- 70 skills with code and documentation
- Add .gitignore (ignore __pycache__, output/, temp/, venv/)
- Clean up test intermediates and caches

2026-04-26 19:27:40 +08:00

4.4 KiB

Raw Blame History

name, description

name	description
video-analysis	视频内容分析技能，支持视频转录，内容分析，知识提取。当用户提到分析视频、视频转录、提取视频内容时触发。

视频分析技能

概述

能力	说明	脚本
视频转录	使用Whisper等工具转录视频内容	`scripts/transcribe_video.py`
快速转录	备用转录方案，支持多种方法	`scripts/quick_transcribe.py`
内容分析	结构化分析视频内容，提取关键信息	`scripts/analyze_video_content.py`
简单转录	基础转录功能	`scripts/simple_transcribe.py`
音频转MP3	使用edge-tts生成音频	`scripts/text_to_speech.py`

配置

环境要求

FFmpeg: 用于提取音频
Whisper/faster-whisper: 用于语音识别
edge-tts: 用于生成音频（微软TTS）
Python依赖: openai-whisper, faster-whisper, edge-tts, pydub, moviepy

安装依赖

pip install openai-whisper faster-whisper edge-tts pydub moviepy

推荐：使用 faster-whisper（更快）

# 比原版 Whisper 快10倍
pip install faster-whisper

# 使用示例
python -c "from faster_whisper import WhisperModel; model = WhisperModel('tiny', device='cpu', compute_type='int8'); segments, info = model.transcribe('audio.wav', language='zh'); text = ' '.join([s.text for s in segments]); print(text)"

推荐：使用 edge-tts 生成音频

pip install edge-tts

# 使用示例
import edge_tts
import asyncio

async def main():
    with open('script.txt', 'r', encoding='utf-8') as f:
        text = f.read()
    communicate = edge_tts.Communicate(text, 'zh-CN-XiaoxiaoNeural')
    await communicate.save('output.mp3')

asyncio.run(main())

执行规范

视频文件预处理

文件名处理: 避免中文特殊字符和引号
编码检查: 确保文件可正常读取
路径处理: 使用绝对路径或相对路径

转录流程

提取音频（WAV格式，16kHz，单声道）
加载Whisper模型（自动下载tiny/base模型）
执行转录
保存文本结果

分析流程

读取转录文本
结构化分析内容
提取关键概念、技术、原理
生成分析报告

快速使用

基础转录

python .opencode/skills/video-analysis/scripts/transcribe_video.py "video.mp4"

快速转录（备用方案）

python .opencode/skills/video-analysis/scripts/quick_transcribe.py "video.mp4"

内容分析

python .opencode/skills/video-analysis/scripts/analyze_video_content.py "视频标题" "transcription.txt"

故障排除

常见问题

Whisper模型下载失败: 检查网络连接，或手动下载模型
FFmpeg未安装: 安装FFmpeg并添加到PATH
内存不足: 使用tiny模型而非base模型
中文识别不准: 尝试base模型或添加语言参数

备用方案

如果本地Whisper太慢或不可用：

使用在线API（需配置API Key）
使用其他开源工具（FunASR等）
手动转录关键部分

应用场景

知识提取

教育视频内容分析
技术教程转录
演讲/讲座内容整理

内容分析

心理学视频技巧分析
商业策略视频解析
技能教学视频总结

研究用途

媒体内容分析
语言模式研究
信息传播研究

输出格式

转录文本

纯文本格式
包含时间戳（可选）
分段清晰

分析报告

JSON结构化数据
关键概念提取
技术要点总结
伦理风险评估

最佳实践

文件命名: 使用英文名，避免特殊字符
路径管理: 保持工作目录整洁
模型选择: 根据需求选择tiny/base模型（faster-whisper推荐tiny）
结果验证: 人工检查关键部分准确性
知识沉淀: 转录结果存入知识库系统
音频生成: 生成MP3前先确保文本是纯文本（无MD格式）

4.4 KiB

Raw Blame History

视频分析技能

概述

配置

环境要求

安装依赖

推荐：使用 faster-whisper（更快）

推荐：使用 edge-tts 生成音频

执行规范

视频文件预处理

转录流程

分析流程

快速使用

基础转录

快速转录（备用方案）

内容分析

故障排除

常见问题

备用方案

应用场景

知识提取

内容分析

研究用途

输出格式

转录文本

分析报告

最佳实践

常见问题

Whisper转录太慢

生成MP3有杂音

相关技能

4.4 KiB Raw Blame History Unescape Escape

视频分析技能

概述

配置

环境要求

安装依赖

推荐：使用 faster-whisper（更快）

推荐：使用 edge-tts 生成音频

执行规范

视频文件预处理

转录流程

分析流程

快速使用

基础转录

快速转录（备用方案）

内容分析

故障排除

常见问题

备用方案

应用场景

知识提取

内容分析

研究用途

输出格式

转录文本

分析报告

最佳实践

常见问题

Whisper转录太慢

生成MP3有杂音

相关技能

4.4 KiB

Raw Blame History