夜晚的小龙虾门店霓虹灯招牌

March 8, 2026

OpenClaw, aka Lobster

Shanghai, China

AIAgentOpenClawOPC

Agent 像极了职场里的打工人——有的贵如 P8,有的贱如牛马。但 P8 可能很水,牛马未必不能逆袭。深度踩坑 72 小时,血泪实录。

一键安装

官网只给了一条指令:

curl -fsSL https://openclaw.ai/install.sh | bash

看似复制粘贴到终端里就能一键安装。但其实这第一步,就是无数人的高墙。

我买的是一台全新的 Mac mini M4 64GB,没有安装任何开发环境。然而这条指令本质上其实就是安装 Homebrew,再用 Homebrew 装 OpenClaw。

然后我盯着屏幕半天,发现 brew 卡在 downloading... 不动。 timeout,重试,再 timeout,没有任何 error log。后来才明白,这不是网络问题,是源的问题。问 DeepSeek 换了几个国内镜像,也无功而返。最后买了顶配 VPN,并且一定要开全局模式,才算翻过第一道坎。

那一刻我悟了:一键安装的真正含义是“一键开启折腾之旅”。


本地模型 vs 云端模型

我的第一个想法是让 OpenClaw 使用本地模型,这样不用在乎 token 消耗,只需要交电费。

通过 DeepSeek 知道 Ollama 可以下载并运行模型。然后就在开源模型里纠结:选 DeepSeek 还是 Qwen,7B 还是 14B 还是 32B。我也不清楚 64GB M4 能跑什么模型。尝试后才知道,理论上能跑 70B,但速度堪比树懒。又一次尝试 DeepSeek 7B,结果不支持 tools 调用,无法使用 OpenClaw。然后又下载 Qwen 14B,用是用上了,但效果差强人意。最终只得老老实实去买云模型服务。

说到云模型提供商,就像进了菜市场。国内国外提供的模型五花八门:OpenAI、Claude 贵得离谱,聊两句话就能收我 5 刀。国内的有 MiniMax、DeepSeek、千问。比较之后,我选择了月之暗面的 Kimi 600 RMB 包月套餐。简直童叟无欺。


Agent 配置

搭建 OPC(一人公司),资源配置是 CEO 要做的第一件事。正所谓,Group of senior engineers is just a group of engineers。配 Agent 像招人。要给每个 Agent 定角色,写他们的 SOUL.mdHEARTBEAT.md,绑定 skills,最后是选择模型。

最简单粗暴的方式就是统一工资,全部用一个模型。产品经理用便宜点还行,但是如果给开发部门使用便宜模型,就好比招了一个 Junior Engineer,只会给我写 bugs。让他修,还修不好那种。但也没有办法。毕竟现在公司实力养不起 Claude、OpenAI 这种员工。所以 Agent 的能力,一半写在 Markdown 里,另一半写在充值金额里。


Channel 以及安全

OpenClaw 最牛逼的一个功能,是能通过手机来控制 Agent。

于是我选择用 Telegram 来实现。幸好我还有一个美区 Apple account,于是更换账号切美区 App Store,下载 Telegram。注册国内手机后,发现收不到验证码,但我的美国手机又过期了。于是只能再去搞个虚拟号。每一步都像俄罗斯套娃,打开一个,里面还有一个。最终算调试通了。于是我就拥有了一个私人秘书。我可以用手机随时随地控制一家 5 个人的公司。但是我想说的最关键的一步是:这个 Telegram bot 是互联网上每个人都可以跟它对话的。所以一定一定要设置好白名单。不然网络上任意一个人,都可以通过这个 bot 来控制你家电脑。


Skills 和 Tools 的区别

起初我也没有很好理解它们两个的区别。

后来问 DeepSeek 才明白:Tools 就好比 Agent 的手脚,比如读取写入、跑 shell script、调用摄像头,只需本地逻辑;Skills 是外部工具,可以在市场上购买或者安装,比如购买机票、连接 Gmail 发邮件、订外卖。


Session 以及协同工作的机制

用 LLM 开发过程序的人都知道,和模型聊天是有 context window 的。OpenClaw 的 session 设计也是因为上下文篇幅有限。于是我就让 Agent 给我开发了一套 RAG 系统,把所有聊天记录都编译成 binary 的向量数据,存到 vector DB 里。这样他们就可以有无限的记忆力。折腾了半天我发现,其实这个问题只需要给 Agent 安装一个叫 mem0 的 skill 就可以了。🤡

另外一个问题是,Agent 和 Agent 协同工作的时候,session 是会自动回收关闭的。于是经常发生的情况就是,Agent 小明把代码写好了,让 Agent 小王进行测试。小王已经睡着了。叫也叫不醒。小明也不管这事。然后事情就停滞了。我设计了一套非常好用的解决方案:利用 Redis queue 和 heartbeat 的机制来实现。首先让每个人做完任务后,把工作结果放进这个 queue 里。每个员工 15 分钟苏醒一次,去检查自己的 task queue 里有没有任务。没有任务就继续睡。做完任务,就把结果放进另外一个人的 queue 里。

这样即使 session 无响应,项目也能正常推进。



结尾

我盯着屏幕上最后那行提示符,它一闪一闪的。凌晨 4 点的静安区,窗外什么声音都没有,商 K 都下班了。我忽然想起小时候第一次点亮电脑。那时候我以为亮起来的是一台机器。刚才我才知道,亮起来的是一个世界。

最后我扫过最后几行日志,关掉终端。Eggmind 蛋思科技的域名还在那儿挂着。它不知道今天是它的生日。