今天,“临港新片区智算大会”在上海成功举办。商汤科技深度参与,在会上展示了多项以大装置赋能大模型的最新实践成果。
会上,临港新片区智算产业联盟正式成立,商汤作为联盟算力提供企业将与智算产业上下游及高校与科研院所共同开展资源共享、技术交流和项目合作;同时,商汤还被授予“新片区智算产业链链主”企业
大模型迭代和处理能力日日更新
商汤科技前瞻打造了软硬结合的AGI基础设施大装置SenseCore,并在此基础上构建了“商汤日日新SenseNova”大模型体系,推进自身AGI发展战略的同时,也为行业提供大模型算法服务、训练和推理优化以及数据服务。
会上,商汤科技董事长兼CEO徐立分享了商汤大装置SenseCore所带来的算力价值,以及在大装置赋能下商汤在2023上半年在大模型领域取得的一系列突破性成果。
SenseCore赋能“书生2.5”多模态大模型
今年3月开源的商汤多模态多任务通用大模型“书生(INTERN)2.5”,在检测、分割、分类三大主流视觉任务下二十多个权威数据集上全面领先。
这为自动驾驶、机器人等通用场景任务提供高效精准的感知和理解能力支持。
(点击图片可放大查看)
SenseCore赋能气象预报大模型“风乌”
再如人工智能基础科学(AI For Science),在气象气候预报任务中,全球中期天气预报是最重要的预测任务之一。今年4月亮相的全球中期气象预报AI大模型“风乌”首次实现在高分辨率上对核心大气变量进行超过10天的有效预报,且在80%的评估指标上优于DeepMind GraphCast模型。
得益于对高分辨率全球大气数据建模,“风乌”还可以模拟台风等极端气象,可以准确地预测台风轨迹。
SenseCore赋能自动驾驶多模态大模型
商汤构建的业界首个感知决策一体化的端到端自动驾驶解决方案UniAD,在多项关键数据集与指标上超越了SOTA方法。
使得车道线的预测准确率提升了30%,预测运动位移的误差降低了近40%,规划误差降低了近30%。
SenseCore赋能遥感大模型
商汤推出的SenseEarth 3.0遥感大模型,不仅拥有业内最全的解译类别,且在解译效率、泛化能力、解译精度等众多指标上均实现了技术突破。
SenseCore赋能通才AI智能体GITM研发
商汤联合提出通才AI智能体GITM,能够在紧密模拟真实世界的畅销游戏《我的世界》中做到像人类一样生存、探索和创造。
在主世界所有技术挑战上实现了100%的任务覆盖率,在标准任务“获取钻石”上,较目前最佳成绩提升47.5%。
SenseCore赋能“商汤商量SenseChat”语言大模型
“商汤商量SenseChat”在持续快速提升、迭代,相比发布时有了诸多长足进步,目前包括多语言能力叠加表格生成处理能力、历史知识能力和归纳能力、多轮对话和长文本理解能力等取得多方面提升。
SenseCore赋能AI代码助手
在过去一个月,商汤AI代码助手通过快速迭代,实现619%的推理效率提升,可以在相同算力资源下支持6倍的用户数量,大大降低使用成本。
商汤科技董事长兼CEO徐立表示,“AGI时代,模型的能力可以用算力来衡量。我们以商汤大装置SenseCore打造AGI时代的基础设施,在模型的迭代速度及处理问题的能力上日日更新,不断解锁AGI的更多可能。商汤期待与更多同行者建立纵深合作,共商行业新模式,共探未来新方向。”
商汤大装置SenseCore赋能智算产业
范式革新
在极短时间内实现多个具有突破意义的大模型成果,正是源于商汤大装置SenseCore提供的高效率、低成本、规模化的AI基础设施与服务,赋能人工智能生产新范式。
商汤SenseCore不仅拥有5000 Petaflops算力,支持20个千亿参数超大模型同时训练,还为客户及生态伙伴提供全链条MaaS大模型即服务,加速大模型的创新和应用效率。
其中,自动化数据标注服务可将智能标注效率提升百倍;大模型推理部署服务可将大模型推理效率提高600%;大模型并行训练服务支持单集群3200卡5000亿稠密参数模型训练;大模型增量训练服务能够将增量微调成本降低90%。商汤还开放模型及AI开发工具链,赋能开发者效率提升。
截至今年5月,商汤大装置已累计服务超40个核心客户,其中大模型客户10家以上,涵盖智能驾驶、生物制药、芯片设计、智慧商业、高校科研等前沿领域,并已在超过20个落地场景中实现大模型交付。
商汤科技联合创始人、大装置事业群总裁杨帆指出,“大模型并非单纯的暴力美学,背后是大量的软件工程系统问题,商汤大装置长期沉淀了大量的专家认知和工具,具备端到端产品应用解决方案能力。AI产业即将迎来一个更加繁荣的大航海时代,商汤大装置将通过更加大规模、高效率、低成本的AI基础设施,实现更好的服务,支撑未来百花齐放的产业生态。”
为进一步将智能算力转化为产业价值,商汤还与来自集成电路、人工智能、生物医药、高端装备制造等产业界、科研界的专家代表共同探讨如何释放智算潜能,助推临港打造成为人工智能的新高地。
相关阅读,戳这里 

《商汤“日日新SenseNova”大模型超市来了!》

《商汤发布多模态多任务通用大模型“书生2.5”》

《商汤SenseEarth 3.0智能遥感云平台发布》

《商汤联合发布通才AI智能体通关<我的世界>》

《商汤AIDC启动运营》

继续阅读
阅读原文