Files
skills/llm-hub/references/model_comparison.md
T
hmo 04db423416 Initial commit: skills library
- 70 skills with code and documentation
- Add .gitignore (ignore __pycache__, output/, temp/, venv/)
- Clean up test intermediates and caches
2026-04-26 19:27:40 +08:00

2.0 KiB
Raw Blame History

模型对比表

按场景推荐

场景 推荐模型 供应商 特点 适合
👑 最新最强 qwen3.5-plus 阿里云 2026.2.16发布,超GPT-5.20.8元/百万Token 所有场景
👑 最新最强 qwen3.5-397b-a17b 阿里云 3970亿参数激活170亿,旗舰开源 复杂推理
代码生成 deepseek-coder DeepSeek 专用代码模型 编程任务
代码生成 codeqwen:7b Ollama 本地可跑 低延迟
中文对话 qwen-plus 阿里云 中文优化 日常对话
中文对话 deepseek-chat DeepSeek 性价比高 日常对话
快速响应 mixtral-8x7b-32768 Groq 超低延迟 实时交互
快速响应 llama-3.1-8b-instruct Ollama 本地快速 离线使用
多模态 qwen2.5vl:7b Ollama 看图理解 图像分析
多模态 llama3.2-vision:11b Ollama 图像理解强 复杂图像
免费优先 mistral-small-3 OpenRouter 免费层可用 预算有限
推理能力 deepseek-r1 OpenRouter 推理能力强 复杂逻辑

Qwen3.5 新模型(2026.2.16发布)

模型 参数 激活参数 特点 API价格
qwen3.5-plus 3970亿 170亿 最强开源,超越GPT-5.2 0.8元/百万Token
qwen3.5-397b-a17b 3970亿 170亿 旗舰开源,支持多模态 参考plus

新用户福利: 阿里云百炼新用户送 100万免费Token

按硬件选择

16GB VRAM (RTX 3080)

模型 量化 内存需求 速度
llama3.1:8b Q4_K_M ~5GB
qwen2.5:7b Q4_K_M ~4.5GB
mistral:7b Q4_K_M ~4.5GB 极快
phi4:14b Q4_K_M ~9GB
llama3.2-vision:11b Q4_K_M ~7GB
qwen2.5vl:7b Q4_K_M ~5GB

24GB+ VRAM

模型 量化 内存需求 速度
qwen2.5:14b Q4_K_M ~9GB
deepseek-r1:8b Q4_K_M ~5GB
llama3.3:70b Q4_K_M ~40GB