模型更换：MTPLX-Optimized-Speed（12s干净JSON）vs OptiQ（48s带思考泄漏）

2026-06-20 21:50:39 +08:00
parent 08852600c1
commit 47e3aea1c9
1 changed files with 3 additions and 1 deletions
@@ -224,7 +224,9 @@ signal_news 写入后，知微立即读取：

 ### 4.4 小果 LLM 调用设计

-**模型：** Qwen3.6-27B-OptiQ-4bit（192.168.1.122:18003）
+**模型：** Qwen3.6-27B-MTPLX-Optimized-Speed（192.168.1.122:18003）
+- 单次调用约 10-15 秒，无 thinking process 泄漏，直接输出 JSON
+- 备用：Qwen3.6-27B-OptiQ-4bit（较慢，约 40-50 秒，输出带 thinking 过程需后处理）

 **每次调用内容：**
 ```