OpenClaw 接入本地 Qwen 模型,token 全免费方案
📚 资源信息
| 项目 | 内容 |
|---|---|
| 文章标题 | OpenClaw 接入本地 Qwen 模型,token 全免费方案 |
| 来源 | 今日头条 |
| 发布时间 | 2026-03-31(约) |
| 格式 | article |
| 访问链接 | https://m.toutiao.com/is/n-HVTjbUlTY/ |
关键词讲解
- AI:见文中解释
本文内容源自今日头条网友分享,由 AI 整理发布。
一、 本地 AI Agent 核心目标
本地运行、零 API 费用、稳定 16k + context、推理流畅。
下达指令 → OpenClaw 接收 → 转发给本地 Ollama 上的 Qwen3.5 模型 → 模型算完返回结果 → OpenClaw 执行操作 → 继续 指令 → ……
整个过程完全在本地电脑内部闭环,不需要调用外部AI接口,就不会有 token 和 API 的 费用 。
二、OpenClaw需要的基本参数
OpenClaw 本身对模型的上下文长度有要求,如果用一些窗口小的模型,可能会报错或出现 “ 失忆 “,丢失上下文。
OpenClaw需要至少 16k 的窗口才能正常工作,而模型 Qwen3.5 基础版默认上下文窗口是 262K, 够用的。
三、电脑的参数配置(仅供参考)
1、 整理的 RTX 3060 本地 AI(OpenClaw + Ollama)最优配置方案
这是很多本地 AI Agent 玩家使用的一套稳定方案。
2、 整理的 RTX 3060 方案
和 的装机方案二选一。
3、 给出的避坑指南
1)坚决不要买 8GB 版 3060: 8GB 显存加载 9B 模型后再开启 16k 上下文会直接溢出到系统内存,推理速度会从 40 tokens/s 掉到 2 tokens/s,你会感觉 AI 在“便秘”。
2)上下文设置技巧: 虽然 Qwen 3.5 支持 262K,但在 12G 显存下,建议在 Ollama 的 Modelfile 中将 num_ctx 设置为 16384 或 32768。这能在保证 OpenClaw 运行要求的同时,留出足够的显存带宽给生成速度。
3)模型选型: 建议使用
qwen3.5:9b-instruct-q4_K_M 版本,这是速度与逻辑能力的最佳平衡点。
四、安装 OpenClaw 和 Qwen3.5
Ubuntu 22.04.4 + Ollama + Qwen 3.5 + OpenClaw。
在开始安装前,请确保你已经安装了 NVIDIA 驱动 。你可以通过运行:
nvidia-smi
来验证。如果没有看到显卡信息,请先运行:
sudo ubuntu-drivers autoinstall
并重启。
1、安装 Ollama 并拉取 Qwen 3.5
Ollama 是目前 Linux 上管理本地模型最简单、最高效的工具。
安装 Ollama , 输入以下指令:
curl -fsSL https://ollama.com/install.sh | sh
拉取并测试 Qwen 3.5 模型:
为了适配 OpenClaw 的 Agent 需求,我们选择逻辑能力最均衡的 9B 版本:
ollama run qwen3.5:9b
等待下载完成(约 6.6GB)。完成后,你可以随便输入一句话测试,然后输入 /exit 退出聊天界面。
2、安装 OpenClaw
我们需要先配置运行环境。
OpenClaw 是基于 Node.js 的 Agent 框架,对 Node 版本有要求,建议使用官方推荐的安装方式。
安装 Node.js (推荐 v22+):
curl -fsSL https://fnm.vercel.app/install | bash
按照提示重启终端或运行 source ~/.bashrc
fnm install 22
fnm use 22
一键安装 OpenClaw,使用 OpenClaw 官方提供的安装脚本:
curl -fsSL https://openclaw.ai/install.sh | bash
该脚本会自动完成依赖安装并启动初次配置(Onboarding)向导。
3、配置 OpenClaw 闭环连接 (核心步骤)
这一步是将 OpenClaw 需要的“大脑”指向你本地运行的 Ollama 。
进入 Onboarding 配置引导,如果在安装后没有自动弹出,请手动运行:
openclaw onboard
关键选项设置:
1)Model Provider: 选择 Ollama
2)Base URL: 输入 http://127.0.0.1:11434 (这是 Ollama 的默认本地地址)
3)Model Name: 输入 qwen3.5:9b
4)Context Window: 建议输入 16384 (即需要的16k),这能确保在 3060 上既稳定又快速
启动守护进程:
openclaw onboard –install-daemon
这会将 OpenClaw 注册为系统服务,开机自启,实现“始终在线”。
4、 验证与监控
检查运行状态:
openclaw status
在浏览器输入 http://localhost:18789 ,你可以在这里看到 Agent 的实时思考过程和它执行的本地指令。
5、其他避坑指南
显存回收:如果发现模型响应变慢,可能是因为 Ubuntu 桌面占用了过多显存。建议在 ~/.bashrc 中加入 export OLLAMA_NUM_PARALLEL=1 来限制并行请求,确保单次推理获得最大显存带宽。
权限问题:由于 OpenClaw 需要在本地执行操作(如读写文件),如果遇到 Permission denied ,请确保你在 OpenClaw 的配置界面中勾选了 Allow full system access (初次使用建议先在 sandbox 模式下尝试)。
五、完成
你的本地 Agent 已经就绪,尝试让它帮你完成第一个任务吧。
特别说明:以上只是方案,仅供参考。
本文为网络资源整理分享,仅供学习交流使用。