模型更换:MTPLX-Optimized-Speed(12s干净JSON)vs OptiQ(48s带思考泄漏)
This commit is contained in:
@@ -224,7 +224,9 @@ signal_news 写入后,知微立即读取:
|
|||||||
|
|
||||||
### 4.4 小果 LLM 调用设计
|
### 4.4 小果 LLM 调用设计
|
||||||
|
|
||||||
**模型:** Qwen3.6-27B-OptiQ-4bit(192.168.1.122:18003)
|
**模型:** Qwen3.6-27B-MTPLX-Optimized-Speed(192.168.1.122:18003)
|
||||||
|
- 单次调用约 10-15 秒,无 thinking process 泄漏,直接输出 JSON
|
||||||
|
- 备用:Qwen3.6-27B-OptiQ-4bit(较慢,约 40-50 秒,输出带 thinking 过程需后处理)
|
||||||
|
|
||||||
**每次调用内容:**
|
**每次调用内容:**
|
||||||
```
|
```
|
||||||
|
|||||||
Reference in New Issue
Block a user