Snapshot Reader
Captured
📌 一句话摘要
Atomic Bot 发布的基于 Qwen 35B 的 OpenClaw 与 Hermes Agent 真实任务视频对比,引发了双方创始人的技术辩论,涉及基准科学性、模型性能与用户选择。
📝 详细摘要
该推文详细报道了 Atomic Bot 发布的一个真实任务视频对比,使用本地模型 Qwen 35B 测试 OpenClaw 和 Hermes Agent 抓取 GitHub 仓库 star 历史并构建仪表盘的能力。视频显示 OpenClaw 用时 12 分钟、消耗 203k tokens,而 Hermes Agent 用时 33 分钟、消耗 257k tokens。Hermes 联创 Teknium 随后反击,指出该基准不科学:单次运行、无重复测试、Qwen 35B 模型波动大。他强调 Hermes 在公开基准上全面领先,并引用用户数据证明 Hermes 上线后 token throughput 已接近 OpenClaw 的 2.5 倍。这场辩论反映了 AI Agent 领域在基准测试方法和性能评估上的核心分歧。
📊 文章信息
AI 初评:82
来源:meng shao(@shao__meng)
作者:meng shao
分类:人工智能
语言:中文
阅读时间:3 分钟
字数:742
标签:
OpenClaw, Hermes Agent, AI Agent, 基准测试, Qwen 35B