Knowledge Vault

Snapshot Reader

Captured

📌 一句话摘要

Atomic Bot 发布的基于 Qwen 35B 的 OpenClaw 与 Hermes Agent 真实任务视频对比，引发了双方创始人的技术辩论，涉及基准科学性、模型性能与用户选择。

📝 详细摘要

该推文详细报道了 Atomic Bot 发布的一个真实任务视频对比，使用本地模型 Qwen 35B 测试 OpenClaw 和 Hermes Agent 抓取 GitHub 仓库 star 历史并构建仪表盘的能力。视频显示 OpenClaw 用时 12 分钟、消耗 203k tokens，而 Hermes Agent 用时 33 分钟、消耗 257k tokens。Hermes 联创 Teknium 随后反击，指出该基准不科学：单次运行、无重复测试、Qwen 35B 模型波动大。他强调 Hermes 在公开基准上全面领先，并引用用户数据证明 Hermes 上线后 token throughput 已接近 OpenClaw 的 2.5 倍。这场辩论反映了 AI Agent 领域在基准测试方法和性能评估上的核心分歧。

📊 文章信息

AI 初评：82

来源：meng shao(@shao__meng)

作者：meng shao

分类：人工智能

语言：中文

阅读时间：3 分钟

字数：742

标签： OpenClaw, Hermes Agent, AI Agent, 基准测试, Qwen 35B

阅读推文

OpenClaw 与 Hermes Agent 真实任务对比引发技术辩论

Snapshot Reader

📌 一句话摘要

📝 详细摘要

📊 文章信息