模型更换:MTPLX-Optimized-Speed(12s干净JSON)vs OptiQ(48s带思考泄漏)

This commit is contained in:
知微
2026-06-20 21:50:39 +08:00
parent 08852600c1
commit 47e3aea1c9
+3 -1
View File
@@ -224,7 +224,9 @@ signal_news 写入后,知微立即读取:
### 4.4 小果 LLM 调用设计
**模型:** Qwen3.6-27B-OptiQ-4bit192.168.1.122:18003
**模型:** Qwen3.6-27B-MTPLX-Optimized-Speed192.168.1.122:18003
- 单次调用约 10-15 秒,无 thinking process 泄漏,直接输出 JSON
- 备用:Qwen3.6-27B-OptiQ-4bit(较慢,约 40-50 秒,输出带 thinking 过程需后处理)
**每次调用内容:**
```