模型对比表
按场景推荐
| 场景 |
推荐模型 |
供应商 |
特点 |
适合 |
| 👑 最新最强 |
qwen3.5-plus |
阿里云 |
2026.2.16发布,超GPT-5.2,0.8元/百万Token |
所有场景 |
| 👑 最新最强 |
qwen3.5-397b-a17b |
阿里云 |
3970亿参数激活170亿,旗舰开源 |
复杂推理 |
| 代码生成 |
deepseek-coder |
DeepSeek |
专用代码模型 |
编程任务 |
| 代码生成 |
codeqwen:7b |
Ollama |
本地可跑 |
低延迟 |
| 中文对话 |
qwen-plus |
阿里云 |
中文优化 |
日常对话 |
| 中文对话 |
deepseek-chat |
DeepSeek |
性价比高 |
日常对话 |
| 快速响应 |
mixtral-8x7b-32768 |
Groq |
超低延迟 |
实时交互 |
| 快速响应 |
llama-3.1-8b-instruct |
Ollama |
本地快速 |
离线使用 |
| 多模态 |
qwen2.5vl:7b |
Ollama |
看图理解 |
图像分析 |
| 多模态 |
llama3.2-vision:11b |
Ollama |
图像理解强 |
复杂图像 |
| 免费优先 |
mistral-small-3 |
OpenRouter |
免费层可用 |
预算有限 |
| 推理能力 |
deepseek-r1 |
OpenRouter |
推理能力强 |
复杂逻辑 |
Qwen3.5 新模型(2026.2.16发布)
| 模型 |
参数 |
激活参数 |
特点 |
API价格 |
| qwen3.5-plus |
3970亿 |
170亿 |
最强开源,超越GPT-5.2 |
0.8元/百万Token |
| qwen3.5-397b-a17b |
3970亿 |
170亿 |
旗舰开源,支持多模态 |
参考plus |
新用户福利: 阿里云百炼新用户送 100万免费Token
按硬件选择
16GB VRAM (RTX 3080)
| 模型 |
量化 |
内存需求 |
速度 |
| llama3.1:8b |
Q4_K_M |
~5GB |
快 |
| qwen2.5:7b |
Q4_K_M |
~4.5GB |
快 |
| mistral:7b |
Q4_K_M |
~4.5GB |
极快 |
| phi4:14b |
Q4_K_M |
~9GB |
中 |
| llama3.2-vision:11b |
Q4_K_M |
~7GB |
中 |
| qwen2.5vl:7b |
Q4_K_M |
~5GB |
中 |
24GB+ VRAM
| 模型 |
量化 |
内存需求 |
速度 |
| qwen2.5:14b |
Q4_K_M |
~9GB |
中 |
| deepseek-r1:8b |
Q4_K_M |
~5GB |
快 |
| llama3.3:70b |
Q4_K_M |
~40GB |
慢 |