Initial commit to git.yoin

2026-02-11 22:02:47 +08:00
commit cf10ab6473
153 changed files with 14581 additions and 0 deletions
--- a/videocut-install/README.md
+++ b/videocut-install/README.md
@@ -0,0 +1,20 @@
+<!--
+架构守护者：一旦此文件夹内容变化，请更新此文件
+-->
+
+# videocut:安装
+
+> 环境准备 skill
+
+## 文件清单
+
+| 文件 | 用途 |
+|------|------|
+| `SKILL.md` | skill 定义（安装流程） |
+| `README.md` | 本文件 |
+
+## 依赖
+
+- Python 3.8+
+- pip
+- brew (macOS) / apt (Linux)
--- a/videocut-install/SKILL.md
+++ b/videocut-install/SKILL.md
@@ -0,0 +1,161 @@
+---
+name: videocut-install
+description: 环境准备。安装依赖、下载模型、验证环境。触发词：安装、环境准备、初始化
+metadata:
+  version: "1.0.0"
+  alias: "videocut:安装"
+---
+
+<!--
+input: 无
+output: 环境就绪
+pos: 前置 skill，首次使用前运行
+
+架构守护者：一旦我被修改，请同步更新：
+1. ../README.md 的 Skill 清单
+2. /CLAUDE.md 路由表
+-->
+
+# 安装
+
+> 首次使用前的环境准备
+
+## 快速使用
+
+```
+用户: 安装环境
+用户: 初始化
+用户: 下载模型
+```
+
+## 依赖清单
+
+| 依赖 | 用途 | 安装命令 |
+|------|------|----------|
+| funasr | 口误识别 | `pip install funasr` |
+| modelscope | 模型下载 | `pip install modelscope` |
+| openai-whisper | 字幕生成 | `pip install openai-whisper` |
+| ffmpeg | 视频剪辑 | `brew install ffmpeg` |
+
+## 模型清单
+
+### FunASR 模型（口误识别用）
+
+首次运行自动下载到 `~/.cache/modelscope/`：
+
+| 模型 | 大小 | 用途 |
+|------|------|------|
+| paraformer-zh | 953MB | 语音识别（带时间戳） |
+| punc_ct | 1.1GB | 标点预测 |
+| fsmn-vad | 4MB | 语音活动检测 |
+| **小计** | **~2GB** | |
+
+### Whisper 模型（字幕生成用）
+
+首次运行自动下载到 `~/.cache/whisper/`：
+
+| 模型 | 大小 | 用途 |
+|------|------|------|
+| large-v3 | 2.9GB | 字幕转录（质量最好） |
+
+### 总计
+
+约 **5GB** 模型文件
+
+## 安装流程
+
+```
+1. 安装 Python 依赖
+       ↓
+2. 安装 FFmpeg
+       ↓
+3. 下载 FunASR 模型（口误识别）
+       ↓
+4. 下载 Whisper 模型（字幕生成）
+       ↓
+5. 验证环境
+```
+
+## 执行步骤
+
+### 1. 安装 Python 依赖
+
+```bash
+pip install funasr modelscope openai-whisper
+```
+
+### 2. 安装 FFmpeg
+
+```bash
+# macOS
+brew install ffmpeg
+
+# Ubuntu
+sudo apt install ffmpeg
+
+# 验证
+ffmpeg -version
+```
+
+### 3. 下载 FunASR 模型（约2GB）
+
+```python
+from funasr import AutoModel
+
+model = AutoModel(
+    model="paraformer-zh",
+    vad_model="fsmn-vad",
+    punc_model="ct-punc",
+)
+print("FunASR 模型下载完成")
+```
+
+### 4. 下载 Whisper 模型（约3GB）
+
+```python
+import whisper
+
+model = whisper.load_model("large-v3")
+print("Whisper 模型下载完成")
+```
+
+### 5. 验证环境
+
+```python
+from funasr import AutoModel
+
+model = AutoModel(
+    model="paraformer-zh",
+    vad_model="fsmn-vad",
+    punc_model="ct-punc",
+    disable_update=True
+)
+
+# 测试转录（用任意音频/视频）
+result = model.generate(input="test.mp4")
+print("文本:", result[0]['text'][:50])
+print("时间戳数量:", len(result[0]['timestamp']))
+print("✅ 环境就绪")
+```
+
+## 常见问题
+
+### Q1: 模型下载慢
+
+**解决**：使用国内镜像或手动下载
+
+### Q2: ffmpeg 命令找不到
+
+**解决**：确认已安装并添加到 PATH
+
+```bash
+which ffmpeg  # 应该输出路径
+```
+
+### Q3: funasr 导入报错
+
+**解决**：检查 Python 版本（需要 3.8+）
+
+```bash
+python3 --version
+```