用 Hermes 打造你的第一个 AI 个人助理

我做为一个程序员,从最开始的小龙虾,一直折腾到 Hermes 河马,中间见过太多小白踩坑, 特别是小龙虾,从入门到放弃😆,每天都在修它,而不是再用它 以及 Hermes,虽然相比小龙虾稳定多了,但对非技术的人来说,从零搭一套能稳定跑的 AI 助理,还是挺难的。 所以我把自己踩过的坑、群友问过最多的问题,整理了一份教程 希望能帮到想入门 Hermes 和 AI 助理,但不知道从哪下手的你...

多Agent是伪命题

多 Agent 协作,是当下最热门的表演项目。 一张架构图里塞十几个 Agent:研究、写作、代码、审查、规划、执行……看起来很热闹,很“先进”。 但我越来越觉得,这个方向容易走偏。 一个人不该直接管一堆 Agent。精力有限,不可能每种任务都手动挑一个专门的 Agent,再去判断谁先做、谁后做、谁来检查谁。 老板也不会直接管所有员工,可行的组织方式,一定是分层的。...

这两天给 ShareThis.Chat 加了图片、音频上传、长文分页功能

现在你分享的内容不再只有文字,也可以直接包含图片和音频

另外也处理了一个用户反馈:不同模型在执行 Skill 时,有时会走出完全不同的方法和步骤,结果很不稳定。

所以这次我把 Skill 文档也重新整理了一遍,少写描述,多写具体步骤,用更明确的执行路径约束 Agent 行为。

同时还添加了长内容和压缩上下文的处理方式,不会再出现压缩摘要和真实聊天内容重复的问题

整个 SKill 文档从原来的近 3000 字,减少到了 1300 字左右

呐,这就叫做专业

昨天发推吐槽了下 Hermes,想不到被创始人 TK 关注了, 然后私聊了具体情况,今天就开 issue 解决了,这效率,没话说 我想我有必要重新安装,不进行迁移,重新试一试了

有娃 vs 没娃

有娃: 早上5点被小儿子闹醒,喝奶洗漱,在床上陪玩(我再眯一会,顺便被他玩) 6点40起床,给女儿和老婆准备早餐,洗奶瓶洗奶嘴收拾被褥,打开洗衣机,继续陪玩,期间打开电脑,准备上班内容,看看有什么单子要做 7点,叫女儿起床,开始吃饭,防止小儿子闹事 8点,送女儿上学回来,晾衣服,收拾碗筷,把小儿子交给老婆,回到电脑前发会呆准备上班 -------- 没娃: 醒了,缠绵会,起床,跑步,吃饭,上班

Versun
听说 Hermes 最近迭代了很多,稳定了很多,下午我让openclaw 去安装 hermes,还挺顺利,有惊无险,先用几天看看分享下整个对话过程https://t.co/bxCvMGBGJ2

再次卸载了 Hermes Agent,太傻了,和 OpenClaw 比差的不是一点两点,严重怀疑那些吹它聪明的人,有没有深入用过?我的版本号:V0.11.0

 

列举下我遇到的主要问题:

  1. 工具调用不灵活,一个方案行不通就会一直尝试,而不是换一个方案,容易一条路走到黑
  2. 上下文管理非常糟糕,只要超出模型上下文,基本就是重开,没有任何之前会话的记忆
  3. 对于子代理的管理也非常糟糕,不会审查/核实子代理返回的结果
  4. 无法同时处理多条信息,或者说处理的不够优雅
  5. 对于自己的配置文件不熟悉,哪些能改哪些不能改,比我还陌生
  6. 系统提示词和模型的调教上和 OpenClaw 比还有非常大的差距

 

这几天的使用感受甚至还不如我几个月前用 Pi-Agent 的体验好

除了升级丝滑、响应快以外,没有任何优点。

完。

 

AI 工具会不会变成炮灰,重要吗?

今天下午微信群里在聊 Hermes 和 OpenClaw。 有个群友说了一句挺有代表性的话:这些工具本质上都是过渡性的炮灰产品。大模型迟早会把这些能力自己集成掉,应用层工具不会有什么位置。 我觉得他说得没错。 但也只对了一半。 这些工具当然是实验性的,甚至很多现在看起来很热闹的东西,过半年可能就没人用了。AI 时代的工具淘汰速度太快了,今天刚搭好的工作流,明天模型一更新,可能就直接原地报废。...

昨天在给我的 Hermes Agent 添加 ShareThis.Chat 技能时,踩了一个坑

 

Hermes 有一层安全机制:它会自动扫描所有工具输出,把看起来像 token、密钥的字符串脱敏

 

这本来是好事,防止敏感信息泄露。但问题是,ShareThis.Chat 创建分享后会返回一个管理 token,而这个 token 需要保存到本地,结果 Hermes 一脱敏,终端里看到的 token 就变成了类似 RAkGuW...hWOL 这种不完整字符串,保存下来当然也就不能用了

 

解决方法也很土:不要依赖终端输出

 

因为被脱敏的是“输出层”,所以直接让 Hermes 把 API 原始响应写入文件。文件系统里的内容不会被这层安全机制改写,本地再从文件里读 token

 

有点脱裤子放屁,但没办法

 

所以我也顺手更新了 ShareThis.Chat 的 skill 文档,明确告诉 Agent:

• 先把 API 响应写入本地文件
• 不要从终端输出或日志里复制 token
• 因为你看到的 token 很可能已经是脱敏后的残缺版本

 

看来以后写 skill,不能只考虑 API 怎么调用,还得考虑 Agent 平台可能特有的机制破坏了流程