搜狗9
关闭广告

上海AI实验室开源书生万亿科学大模型Intern-S1-Pro

IT之家852人阅读

IT之家 2 月 4 日消息,上海 AI 实验室今日(2 月 4 日)宣布开源基于“通专融合”技术架构 SAGE 打造的万亿参数科学多模态大模型 Intern-S1-Pro


上海 AI 实验室表示,作为当前全球开源社区中参数规模最大的科学多模态模型,Intern-S1-Pro 的核心科学能力实现了跃升,高难度综合学科评测稳居 AI4S 领域国际领先水平,复杂数理逻辑推理能力达奥赛金牌水平,面向真实科研流程的智能体能力位居开源模型第一梯队。


该模型基于混合专家架构(MoE),共拥有 512 个专家,总参数达 1T,每次调用仅激活 8 个专家、22B 参数。其通用能力和科学能力协同演进,并在底层架构实现了两大核心突破:

  • 在 SAGE 的基础模型层,通过引入傅里叶位置编码并重构时序编码器,赋予模型统一理解从微观生命信号到宏观宇宙波动的“物理直觉”;
  • 通过高效路由机制,系统攻克了训练万亿参数 MoE 模型在稳定性与算力效率上的瓶颈,为超大规模模型的训练提供了工程基础。

与此同时,Intern-S1-Pro 验证了从原创模型架构到国产算力基座自主技术的完整链路,为构建开放共享的 AGI4S 基础设施奠定了底座。

IT之家附 Intern-S1-Pro 开源地址如下:

  • 在线体验链接:https://chat.intern-ai.org.cn/
  • GitHub 链接:https://github.com/InternLM/Intern-S1
  • HuggingFace 链接:https://huggingface.co/internlm/Intern-S1-Pro
  • ModelScope 链接:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/Intern-S1-Pro
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

252名记者在加沙遇难 巴勒斯坦记者游行悼念

环球网资讯 浏览 2035

电影《寻秦记》番位惹争议,白百何排第三成女主,原版女主变女二

萌神木木 浏览 1462

吴子嘉问"上任后如何收拾民进党" 郑丽文回应

海峡导报社 浏览 7619

小米澎湃OS 3上线2026年元旦限定水印,三种版式自由选择

IT之家 浏览 1189

比利亚雷亚尔下赛季预算达到2.15亿欧,创下俱乐部纪录

懂球帝 浏览 1272

没想到这3个小习惯,给我生活带来这么大的变化

黎贝卡的异想世界 浏览 2105

刘亦菲早年 告白遭考古,老己竟是全网粉丝?

山野卢员外 浏览 1371

特朗普:不想“浪费时间”与普京会晤

参考消息 浏览 7503

上海女子"喊冤"汽车压上石头爆胎无人赔偿 网友吵翻了

环球网资讯 浏览 4566

冬季不臃肿穿搭指南来了,奔五奔六照着穿,拿捏温暖与高级感

静儿时尚达人 浏览 1022

乌在黑海海域击沉一艘俄“影子舰队”油轮

上观新闻 浏览 1183

肖战官宣微博之夜!红西装造型要复刻?

孤城落日 浏览 900

香港中文大学团队突破:让AI有了"超级记忆",多步推理能力飙升!

科技行者 浏览 1098

50+姐姐冬季穿搭别“作妖”,4个法则穿得简约高级,时髦极了

静儿时尚达人 浏览 1339

大带宽+低时延!F5G如何撑起城域“毫秒用算”?

览富财经网 浏览 1979

徐静蕾美国超市现身,黄立行白发相伴

墨语家 浏览 1182

官方下场,内娱要出大事儿了

独立鱼 浏览 1836

14岁女孩被同学杀害案择日宣判 被告人在庭上跪求原谅

潇湘晨报 浏览 8579

或告别燃油时代 丰田Supra将于明年停产

车质网 浏览 1754

胡塞武装宣布:打掉隶属美以沙三方间谍网络

环球网资讯 浏览 1589

生物芯片上海国家工程研究中心四川分中心在成都揭牌

封面新闻 浏览 1941
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1