04db423416
- 70 skills with code and documentation - Add .gitignore (ignore __pycache__, output/, temp/, venv/) - Clean up test intermediates and caches
50 lines
2.0 KiB
Markdown
50 lines
2.0 KiB
Markdown
# 模型对比表
|
||
|
||
## 按场景推荐
|
||
|
||
| 场景 | 推荐模型 | 供应商 | 特点 | 适合 |
|
||
|-----|---------|-------|------|------|
|
||
| 👑 **最新最强** | qwen3.5-plus | 阿里云 | 2026.2.16发布,超GPT-5.2,0.8元/百万Token | 所有场景 |
|
||
| 👑 **最新最强** | qwen3.5-397b-a17b | 阿里云 | 3970亿参数激活170亿,旗舰开源 | 复杂推理 |
|
||
| 代码生成 | deepseek-coder | DeepSeek | 专用代码模型 | 编程任务 |
|
||
| 代码生成 | codeqwen:7b | Ollama | 本地可跑 | 低延迟 |
|
||
| 中文对话 | qwen-plus | 阿里云 | 中文优化 | 日常对话 |
|
||
| 中文对话 | deepseek-chat | DeepSeek | 性价比高 | 日常对话 |
|
||
| 快速响应 | mixtral-8x7b-32768 | Groq | 超低延迟 | 实时交互 |
|
||
| 快速响应 | llama-3.1-8b-instruct | Ollama | 本地快速 | 离线使用 |
|
||
| 多模态 | qwen2.5vl:7b | Ollama | 看图理解 | 图像分析 |
|
||
| 多模态 | llama3.2-vision:11b | Ollama | 图像理解强 | 复杂图像 |
|
||
| 免费优先 | mistral-small-3 | OpenRouter | 免费层可用 | 预算有限 |
|
||
| 推理能力 | deepseek-r1 | OpenRouter | 推理能力强 | 复杂逻辑 |
|
||
|
||
## Qwen3.5 新模型(2026.2.16发布)
|
||
|
||
| 模型 | 参数 | 激活参数 | 特点 | API价格 |
|
||
|-----|------|---------|------|-------|
|
||
| qwen3.5-plus | 3970亿 | 170亿 | 最强开源,超越GPT-5.2 | 0.8元/百万Token |
|
||
| qwen3.5-397b-a17b | 3970亿 | 170亿 | 旗舰开源,支持多模态 | 参考plus |
|
||
|
||
**新用户福利**: 阿里云百炼新用户送 **100万免费Token**
|
||
|
||
## 按硬件选择
|
||
|
||
### 16GB VRAM (RTX 3080)
|
||
|
||
| 模型 | 量化 | 内存需求 | 速度 |
|
||
|-----|-----|---------|------|
|
||
| llama3.1:8b | Q4_K_M | ~5GB | 快 |
|
||
| qwen2.5:7b | Q4_K_M | ~4.5GB | 快 |
|
||
| mistral:7b | Q4_K_M | ~4.5GB | 极快 |
|
||
| phi4:14b | Q4_K_M | ~9GB | 中 |
|
||
| llama3.2-vision:11b | Q4_K_M | ~7GB | 中 |
|
||
| qwen2.5vl:7b | Q4_K_M | ~5GB | 中 |
|
||
|
||
### 24GB+ VRAM
|
||
|
||
| 模型 | 量化 | 内存需求 | 速度 |
|
||
|-----|-----|---------|------|
|
||
| qwen2.5:14b | Q4_K_M | ~9GB | 中 |
|
||
| deepseek-r1:8b | Q4_K_M | ~5GB | 快 |
|
||
| llama3.3:70b | Q4_K_M | ~40GB | 慢 |
|
||
|