新增16个AI技能:包含图像生成、视频剪辑、数据分析、智能查询等功能模块
This commit is contained in:
20
.opencode/skills/videocut-install/README.md
Normal file
20
.opencode/skills/videocut-install/README.md
Normal file
@@ -0,0 +1,20 @@
|
||||
<!--
|
||||
架构守护者:一旦此文件夹内容变化,请更新此文件
|
||||
-->
|
||||
|
||||
# videocut:安装
|
||||
|
||||
> 环境准备 skill
|
||||
|
||||
## 文件清单
|
||||
|
||||
| 文件 | 用途 |
|
||||
|------|------|
|
||||
| `SKILL.md` | skill 定义(安装流程) |
|
||||
| `README.md` | 本文件 |
|
||||
|
||||
## 依赖
|
||||
|
||||
- Python 3.8+
|
||||
- pip
|
||||
- brew (macOS) / apt (Linux)
|
||||
161
.opencode/skills/videocut-install/SKILL.md
Normal file
161
.opencode/skills/videocut-install/SKILL.md
Normal file
@@ -0,0 +1,161 @@
|
||||
---
|
||||
name: videocut-install
|
||||
description: 环境准备。安装依赖、下载模型、验证环境。触发词:安装、环境准备、初始化
|
||||
metadata:
|
||||
version: "1.0.0"
|
||||
alias: "videocut:安装"
|
||||
---
|
||||
|
||||
<!--
|
||||
input: 无
|
||||
output: 环境就绪
|
||||
pos: 前置 skill,首次使用前运行
|
||||
|
||||
架构守护者:一旦我被修改,请同步更新:
|
||||
1. ../README.md 的 Skill 清单
|
||||
2. /CLAUDE.md 路由表
|
||||
-->
|
||||
|
||||
# 安装
|
||||
|
||||
> 首次使用前的环境准备
|
||||
|
||||
## 快速使用
|
||||
|
||||
```
|
||||
用户: 安装环境
|
||||
用户: 初始化
|
||||
用户: 下载模型
|
||||
```
|
||||
|
||||
## 依赖清单
|
||||
|
||||
| 依赖 | 用途 | 安装命令 |
|
||||
|------|------|----------|
|
||||
| funasr | 口误识别 | `pip install funasr` |
|
||||
| modelscope | 模型下载 | `pip install modelscope` |
|
||||
| openai-whisper | 字幕生成 | `pip install openai-whisper` |
|
||||
| ffmpeg | 视频剪辑 | `brew install ffmpeg` |
|
||||
|
||||
## 模型清单
|
||||
|
||||
### FunASR 模型(口误识别用)
|
||||
|
||||
首次运行自动下载到 `~/.cache/modelscope/`:
|
||||
|
||||
| 模型 | 大小 | 用途 |
|
||||
|------|------|------|
|
||||
| paraformer-zh | 953MB | 语音识别(带时间戳) |
|
||||
| punc_ct | 1.1GB | 标点预测 |
|
||||
| fsmn-vad | 4MB | 语音活动检测 |
|
||||
| **小计** | **~2GB** | |
|
||||
|
||||
### Whisper 模型(字幕生成用)
|
||||
|
||||
首次运行自动下载到 `~/.cache/whisper/`:
|
||||
|
||||
| 模型 | 大小 | 用途 |
|
||||
|------|------|------|
|
||||
| large-v3 | 2.9GB | 字幕转录(质量最好) |
|
||||
|
||||
### 总计
|
||||
|
||||
约 **5GB** 模型文件
|
||||
|
||||
## 安装流程
|
||||
|
||||
```
|
||||
1. 安装 Python 依赖
|
||||
↓
|
||||
2. 安装 FFmpeg
|
||||
↓
|
||||
3. 下载 FunASR 模型(口误识别)
|
||||
↓
|
||||
4. 下载 Whisper 模型(字幕生成)
|
||||
↓
|
||||
5. 验证环境
|
||||
```
|
||||
|
||||
## 执行步骤
|
||||
|
||||
### 1. 安装 Python 依赖
|
||||
|
||||
```bash
|
||||
pip install funasr modelscope openai-whisper
|
||||
```
|
||||
|
||||
### 2. 安装 FFmpeg
|
||||
|
||||
```bash
|
||||
# macOS
|
||||
brew install ffmpeg
|
||||
|
||||
# Ubuntu
|
||||
sudo apt install ffmpeg
|
||||
|
||||
# 验证
|
||||
ffmpeg -version
|
||||
```
|
||||
|
||||
### 3. 下载 FunASR 模型(约2GB)
|
||||
|
||||
```python
|
||||
from funasr import AutoModel
|
||||
|
||||
model = AutoModel(
|
||||
model="paraformer-zh",
|
||||
vad_model="fsmn-vad",
|
||||
punc_model="ct-punc",
|
||||
)
|
||||
print("FunASR 模型下载完成")
|
||||
```
|
||||
|
||||
### 4. 下载 Whisper 模型(约3GB)
|
||||
|
||||
```python
|
||||
import whisper
|
||||
|
||||
model = whisper.load_model("large-v3")
|
||||
print("Whisper 模型下载完成")
|
||||
```
|
||||
|
||||
### 5. 验证环境
|
||||
|
||||
```python
|
||||
from funasr import AutoModel
|
||||
|
||||
model = AutoModel(
|
||||
model="paraformer-zh",
|
||||
vad_model="fsmn-vad",
|
||||
punc_model="ct-punc",
|
||||
disable_update=True
|
||||
)
|
||||
|
||||
# 测试转录(用任意音频/视频)
|
||||
result = model.generate(input="test.mp4")
|
||||
print("文本:", result[0]['text'][:50])
|
||||
print("时间戳数量:", len(result[0]['timestamp']))
|
||||
print("✅ 环境就绪")
|
||||
```
|
||||
|
||||
## 常见问题
|
||||
|
||||
### Q1: 模型下载慢
|
||||
|
||||
**解决**:使用国内镜像或手动下载
|
||||
|
||||
### Q2: ffmpeg 命令找不到
|
||||
|
||||
**解决**:确认已安装并添加到 PATH
|
||||
|
||||
```bash
|
||||
which ffmpeg # 应该输出路径
|
||||
```
|
||||
|
||||
### Q3: funasr 导入报错
|
||||
|
||||
**解决**:检查 Python 版本(需要 3.8+)
|
||||
|
||||
```bash
|
||||
python3 --version
|
||||
```
|
||||
Reference in New Issue
Block a user