Knowledge VaultReading Workbench
Reading Detail

35B 参数科学性能比肩万亿参数模型,『书生』科学大模型 Intern-S2-Preview 开源

BestBlogs.dev · 2026-05-18
#人工智能
Open Original
inboxunread

Snapshot Reader

Captured

📌 一句话摘要

上海 AI 实验室开源 35B 参数科学大模型 Intern-S2-Preview,通过全链路通专融合训练和强化学习,在多个核心科学领域实现比肩万亿参数模型的能力,并首次在开源通用大模型中实现材料晶体结构生成。

📝 详细摘要

本文介绍了上海人工智能实验室于 5 月 15 日开源的新一代科学大模型 Intern-S2-Preview。该模型以 35B 参数规模,通过创新的「全链路训练」范式和强化学习探索,在多个核心科学领域实现了比肩万亿参数模型 Intern-S1-Pro 的性能,大幅降低了科学大模型的使用门槛。文章详细阐述了其技术突破:通过提升任务难度和多样性实现 Scaling 效应,引入实数预测模块首次在开源通用大模型中实现材料晶体结构生成,并在科学智能体能力上超越 Claude-Haiku-4.5、GPT5.4-Nano 等主流闭源模型。此外,模型深化了与昇腾算力生态的协同,实现了训练、推理与评测的全流程优化。文章还提供了模型体验链接、GitHub 和 ModelScope 地址,以及魔搭社区提供的限时免费 API 服务。

💡 主要观点

  1. 35B 参数模型通过全链路通专融合训练,在多个科学领域比肩万亿参数模型。 研究团队发现,通过提升任务难度和多样性,而非单纯增加参数,可以持续拉升模型能力上限。全链路融合训练使不同任务之间形成协同效应,释放小参数模型在复杂科学任务中的潜力。
  2. 首次在开源通用大模型中实现材料晶体结构生成能力。 通过引入实数预测模块,Intern-S2-Preview 能够生成数十个高精度空间坐标描述材料晶体结构,结构生成通过率超 40%,远超 GPT-5.5 等闭源模型的 10%左右。
  3. 科学智能体能力领先,在科学发现任务中超越主流闭源模型。 模型在 PinchBench 等通用智能体评测基准中展现出稳健的任务理解与工具调用能力,在 SciCode 科学编程基准上位居同量级模型前列,可高效支撑复杂科研任务。

💬 文章金句

  • 通过提升任务难度、丰富任务多样性,亦可持续拉升模型能力上限,具备 Scaling 效应。
  • 当大量高难度、多样化任务进行统一融合训练时,小模型能够在多项科学任务上达到万亿参数模型的表现水平。
  • Intern-S2-Preview 不仅填补了开源通用大模型在该领域的空白,也是首个能给出思考过程的结构生成模型。

📊 文章信息

AI 初评:86
来源:魔搭ModelScope社区
作者:魔搭ModelScope社区
分类:人工智能
语言:中文
阅读时间:13 分钟
字数:3228
标签: Intern-S2-Preview, 科学大模型, 上海AI实验室, 开源模型, 强化学习