Files
opencode-skills/videocut-install/SKILL.md
2026-02-11 22:02:47 +08:00

162 lines
2.9 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
name: videocut-install
description: 环境准备。安装依赖、下载模型、验证环境。触发词:安装、环境准备、初始化
metadata:
version: "1.0.0"
alias: "videocut:安装"
---
<!--
input: 无
output: 环境就绪
pos: 前置 skill首次使用前运行
架构守护者:一旦我被修改,请同步更新:
1. ../README.md 的 Skill 清单
2. /CLAUDE.md 路由表
-->
# 安装
> 首次使用前的环境准备
## 快速使用
```
用户: 安装环境
用户: 初始化
用户: 下载模型
```
## 依赖清单
| 依赖 | 用途 | 安装命令 |
|------|------|----------|
| funasr | 口误识别 | `pip install funasr` |
| modelscope | 模型下载 | `pip install modelscope` |
| openai-whisper | 字幕生成 | `pip install openai-whisper` |
| ffmpeg | 视频剪辑 | `brew install ffmpeg` |
## 模型清单
### FunASR 模型(口误识别用)
首次运行自动下载到 `~/.cache/modelscope/`
| 模型 | 大小 | 用途 |
|------|------|------|
| paraformer-zh | 953MB | 语音识别(带时间戳) |
| punc_ct | 1.1GB | 标点预测 |
| fsmn-vad | 4MB | 语音活动检测 |
| **小计** | **~2GB** | |
### Whisper 模型(字幕生成用)
首次运行自动下载到 `~/.cache/whisper/`
| 模型 | 大小 | 用途 |
|------|------|------|
| large-v3 | 2.9GB | 字幕转录(质量最好) |
### 总计
**5GB** 模型文件
## 安装流程
```
1. 安装 Python 依赖
2. 安装 FFmpeg
3. 下载 FunASR 模型(口误识别)
4. 下载 Whisper 模型(字幕生成)
5. 验证环境
```
## 执行步骤
### 1. 安装 Python 依赖
```bash
pip install funasr modelscope openai-whisper
```
### 2. 安装 FFmpeg
```bash
# macOS
brew install ffmpeg
# Ubuntu
sudo apt install ffmpeg
# 验证
ffmpeg -version
```
### 3. 下载 FunASR 模型约2GB
```python
from funasr import AutoModel
model = AutoModel(
model="paraformer-zh",
vad_model="fsmn-vad",
punc_model="ct-punc",
)
print("FunASR 模型下载完成")
```
### 4. 下载 Whisper 模型约3GB
```python
import whisper
model = whisper.load_model("large-v3")
print("Whisper 模型下载完成")
```
### 5. 验证环境
```python
from funasr import AutoModel
model = AutoModel(
model="paraformer-zh",
vad_model="fsmn-vad",
punc_model="ct-punc",
disable_update=True
)
# 测试转录(用任意音频/视频)
result = model.generate(input="test.mp4")
print("文本:", result[0]['text'][:50])
print("时间戳数量:", len(result[0]['timestamp']))
print("✅ 环境就绪")
```
## 常见问题
### Q1: 模型下载慢
**解决**:使用国内镜像或手动下载
### Q2: ffmpeg 命令找不到
**解决**:确认已安装并添加到 PATH
```bash
which ffmpeg # 应该输出路径
```
### Q3: funasr 导入报错
**解决**:检查 Python 版本(需要 3.8+
```bash
python3 --version
```