关闭广告

上海AI实验室开源书生万亿科学大模型Intern-S1-Pro

IT之家858人阅读

IT之家 2 月 4 日消息,上海 AI 实验室今日(2 月 4 日)宣布开源基于“通专融合”技术架构 SAGE 打造的万亿参数科学多模态大模型 Intern-S1-Pro


上海 AI 实验室表示,作为当前全球开源社区中参数规模最大的科学多模态模型,Intern-S1-Pro 的核心科学能力实现了跃升,高难度综合学科评测稳居 AI4S 领域国际领先水平,复杂数理逻辑推理能力达奥赛金牌水平,面向真实科研流程的智能体能力位居开源模型第一梯队。


该模型基于混合专家架构(MoE),共拥有 512 个专家,总参数达 1T,每次调用仅激活 8 个专家、22B 参数。其通用能力和科学能力协同演进,并在底层架构实现了两大核心突破:

  • 在 SAGE 的基础模型层,通过引入傅里叶位置编码并重构时序编码器,赋予模型统一理解从微观生命信号到宏观宇宙波动的“物理直觉”;
  • 通过高效路由机制,系统攻克了训练万亿参数 MoE 模型在稳定性与算力效率上的瓶颈,为超大规模模型的训练提供了工程基础。

与此同时,Intern-S1-Pro 验证了从原创模型架构到国产算力基座自主技术的完整链路,为构建开放共享的 AGI4S 基础设施奠定了底座。

IT之家附 Intern-S1-Pro 开源地址如下:

  • 在线体验链接:https://chat.intern-ai.org.cn/
  • GitHub 链接:https://github.com/InternLM/Intern-S1
  • HuggingFace 链接:https://huggingface.co/internlm/Intern-S1-Pro
  • ModelScope 链接:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/Intern-S1-Pro
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

官方:利物浦从德比郡召回23岁后卫欧文-贝克

懂球帝 浏览 1221

GEO炒出了个大乌龙,301171,20CM跌停!

看财经show 浏览 1025

车标比界“少一角”,华为系“境”与“界”差别在哪?

汽扯扒谈 浏览 995

间谍入住海景民宿拍军港敏感画面 被民宿店主识破上报

央视新闻客户端 浏览 8395

官方:巴黎前锋杜埃右大腿肌肉拉伤,将伤缺数周

懂球帝 浏览 1639

抖音&LV-NUS开源多模态新模,以小博大刷新SOTA,8B推理比肩GPT4o

量子位 浏览 2085

媒体:特朗普关税战半年 市场没能打得开还弄丢了

新民晚报 浏览 7700

状态不佳,阿森纳对阵森林上半场8脚射门0射正

懂球帝 浏览 1046

佩德里:我们没参与抗议,开场也静默15秒是出于对同行的尊重

懂球帝 浏览 1920

文晏回应争奖!直言不认识白百何否认沪圈投资,白百何再次内涵

萌神木木 浏览 1642

埃尔多安专机在空中一直盘旋 确认以总理不参会才降落

红星新闻 浏览 8588

厦大EMBA,四维一体、育见未来

经理人杂志 浏览 1830

清华团队破解:大模型训练崩溃之谜

科技行者 浏览 1631

"老虎"高以忱被开除党籍:大搞政商勾连 大肆收钱敛财

界面新闻 浏览 3483

剑南春丨曼联客场2-2热刺,德利赫特读秒绝平,姆伯莫建功

懂球帝 浏览 1656

S妈含泪手捧小s奖杯,姐姐大S的遗照摆在角落

素素娱乐 浏览 1386

对话郝飞:智能座舱新物种 斑马为端芯片带来的新机遇

网易汽车 浏览 2097

神预测,热乎乎的最新诺奖得主电影神作来了

幕味儿 浏览 2130

长安银行“踩油门”

北京商报 浏览 1069

和不扫兴的人在一起多重要?看完花少7后,精神状态都被治愈了

娱乐圈笔娱君 浏览 2077

2000万亿!史无前例的泡沫破裂!

米筐投资 浏览 1936
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1