Phase 3 · 本地算力中心 | 2026-02-13
| CPU | 4 核 |
| 内存 | 8GB (6G 可用) |
| Ollama | ● 运行中 |
| CPU | 2 核 (限流 15%) |
| 内存 | 4GB |
| VPN | ● 已连接 |
| CPU | 2 核 |
| 内存 | 2GB |
| 磁盘 | 50GB (10%) |
| 防线 | 策略 | 实现 |
| 量化 | Q4_0 模型 | 内存 ~4GB (省 50%) |
| 上下文 | 1024 tokens | 减少 75% 内存占用 |
| 内存 | OLLAMA_MEMORY=6g | 保留 1GB 给 OS |
| 线程 | --threads 2 | 单线程推理 |
| 任务 | 状态 | 说明 |
| Ollama 部署 | ✅ 完成 | Node A · 服务运行中 |
| 本地模型 | ✅ 完成 | TinyLlama 1B · 637MB |
| CPU 限流 | ✅ 完成 | Node B · cpulimit -l 15 |
| 监控面板 | ✅ 完成 | 本页面 |