skills/llm-hub/references/model_comparison.md

# 模型对比表

## 按场景推荐

| 场景 | 推荐模型 | 供应商 | 特点 | 适合 |
|-----|---------|-------|------|------|
| 👑 **最新最强** | qwen3.5-plus | 阿里云 | 2026.2.16发布，超GPT-5.2，0.8元/百万Token | 所有场景 |
| 👑 **最新最强** | qwen3.5-397b-a17b | 阿里云 | 3970亿参数激活170亿，旗舰开源 | 复杂推理 |
| 代码生成 | deepseek-coder | DeepSeek | 专用代码模型 | 编程任务 |
| 代码生成 | codeqwen:7b | Ollama | 本地可跑 | 低延迟 |
| 中文对话 | qwen-plus | 阿里云 | 中文优化 | 日常对话 |
| 中文对话 | deepseek-chat | DeepSeek | 性价比高 | 日常对话 |
| 快速响应 | mixtral-8x7b-32768 | Groq | 超低延迟 | 实时交互 |
| 快速响应 | llama-3.1-8b-instruct | Ollama | 本地快速 | 离线使用 |
| 多模态 | qwen2.5vl:7b | Ollama | 看图理解 | 图像分析 |
| 多模态 | llama3.2-vision:11b | Ollama | 图像理解强 | 复杂图像 |
| 免费优先 | mistral-small-3 | OpenRouter | 免费层可用 | 预算有限 |
| 推理能力 | deepseek-r1 | OpenRouter | 推理能力强 | 复杂逻辑 |

## Qwen3.5 新模型（2026.2.16发布）

| 模型 | 参数 | 激活参数 | 特点 | API价格 |
|-----|------|---------|------|-------|
| qwen3.5-plus | 3970亿 | 170亿 | 最强开源，超越GPT-5.2 | 0.8元/百万Token |
| qwen3.5-397b-a17b | 3970亿 | 170亿 | 旗舰开源，支持多模态 | 参考plus |

**新用户福利**: 阿里云百炼新用户送 **100万免费Token**

## 按硬件选择

### 16GB VRAM (RTX 3080)

| 模型 | 量化 | 内存需求 | 速度 |
|-----|-----|---------|------|
| llama3.1:8b | Q4_K_M | ~5GB | 快 |
| qwen2.5:7b | Q4_K_M | ~4.5GB | 快 |
| mistral:7b | Q4_K_M | ~4.5GB | 极快 |
| phi4:14b | Q4_K_M | ~9GB | 中 |
| llama3.2-vision:11b | Q4_K_M | ~7GB | 中 |
| qwen2.5vl:7b | Q4_K_M | ~5GB | 中 |

### 24GB+ VRAM

| 模型 | 量化 | 内存需求 | 速度 |
|-----|-----|---------|------|
| qwen2.5:14b | Q4_K_M | ~9GB | 中 |
| deepseek-r1:8b | Q4_K_M | ~5GB | 快 |
| llama3.3:70b | Q4_K_M | ~40GB | 慢 |