商汤技术交流日,带着人工智能前沿成果,如约而至
基于“大模型+大算力”推进AGI(通用人工智能)发展的战略布局,商汤“日日新SenseNova”大模型体系,正式问世。
这一大模型体系,可提供自然语言、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力,同时结合决策智能大模型,为AGI实现提供重要起点
(点击图片可放大查看)
商汤不仅展示了“日日新SenseNova”大模型体系下的语言大模型,还展示了AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用,还揭开了依托商汤AI大装置SenseCore实现“大模型+大算力”融合创新的研发体系
当前业界训练大模型,对大算力的需求非常旺盛,而真正好用的基础设施却十分稀缺。
商汤历时五年,建设了业界领先的AI大装置,共有2万7千块GPU芯片卡,可输出5000P的总算力,是亚洲目前最大的智能计算平台之一。基于大装置,商汤已构建了计算机视觉、自然语言处理、AI内容生成、多模态、决策智能等多个领域的大模型,持续演进能力并广泛支持各种应用。
商汤科技董事长兼CEO徐立表示:“在AI大模型时代,数据、算法和算力这三要素在经历新的演变,大模型参数量将以指数级速率提升,而数据量随着多模态的引入也将大规模增长,因此必然会导致对算力需求的剧增。我们以商汤AI大装置SenseCore打造AGI时代的基础设施,并基于此将大模型体系命名为‘日日新’,寓意‘苟日新、日日新、又日新’,希望在模型迭代速度及处理问题的能力上可以日日更新,不断解锁AGI的更多可能。”
商汤提供一个大模型的“超市”,在这个“日日新”大模型超市里面,有数据、模型训练以及部署的三位一体的飞轮,以此来作为上下游合作的基础。
“AGI催生了新的研究范式,即基于一个强大的多模态基模型,通过强化学习和人类反馈不断解锁基模型新的能力,从而更高效地解决海量的开放式任务。AGI将实现从‘数据飞轮’到‘智慧飞轮’的演进,最终迈向人机共智。”商汤科技联合创始人、首席科学家王晓刚表示:“商汤已建立全栈的大模型研发体系,并在多个行业场景中落地,场景的多样性、任务的复杂度、数据的丰富度均充分展示了我们大模型的能力和未来潜力。商汤将持续推动基础设施建设,期待和合作伙伴一起投入到AGI的时代大潮中。”
从以前的投喂数据,让机器按照既定路线机械处理;到如今我们授“机”以渔,适当引导,它就能自己举一反三,遇到新问题能自己处理。
“日日新SenseNova”为政企客户提供了多种灵活的API接口和服务(API申请网址:https://techday.sensetime.com/list),包括图片生成、自然语言生成、视觉感知通用任务与标注服务,客户可根据实际应用需求,调用日日新SenseNova大模型的各项AI技术能力,低门槛、低成本、高效率地实现各类AI应用。
自然语言是人机沟通的关键手段,“日日新SenseNova”也推出了商汤最新研发的语言大模型“商量SenseChat”。作为千亿级参数的自然语言处理模型,“商量”使用大量数据训练,并充分考虑了中文语境,能够更好地理解和处理中文文本。
活动现场,“商量”展现了出色的多轮对话和超长文本的理解能力。商汤也展示了语言大模型支持的几项创新应用:包括编程助手,可帮助开发者更高效地编写和调试代码;健康咨询助手,为用户提供个性化的医疗建议;PDF文件阅读助手,能轻松从复杂文档中提取和概括信息等。
扩散模型引爆了AIGC应用的流行,商汤“日日新SenseNova”也具有各种AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用
  • 秒画SenseMirage”文生图创作平台,展现了光影真实、细节丰富、风格多变的文生图能力,可支持6K高清图生成;客户还可根据自身需求训练生成模型。
  • 如影SenseAvatar”AI数字人视频生成平台,仅需一段5分钟的真人视频素材,就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。
  • 琼宇SenseSpace”和“格物SenseThings”3D内容生成平台,可以高效低成本生成大规模三维场景和精细化的物件,为元宇宙、虚实融合应用打开新的想象空间。
大模型的发展,离不开大规模AI基础设施的算力支持。
汤AI大装置SenseCore,拥有行业领先的算力输出能力、超大模型训练及大规模推理能力,将成为AGI和大模型时代的基础设施服务领导者。
基于商汤AI大装置SenseCore 和“日日新SenseNova”大模型体系,商汤面向行业伙伴提供涵盖自动化数据标注、自定义大模型并行训练、模型增量训练、模型推理部署、开发者效率提升等多种大模型即服务(Model-as-a-Service)。
  • 基于预训练大模型的自动化数据标注可实现相较于人工数据标注近百倍的效率提升。
  • 大模型并行训练和模型增量训练服务能够帮助客户快速利用自有数据训练模型,包括在预训练大模型之上进行垂域行业模型的开发,生产千行千面的自定义模型。
  • 模型推理部署服务可将大模型推理效率提高100%以上,降低用模型提供服务的成本。
  • 商汤也向行业开发人员开放大量预训练模型及AI开发工具链,全面赋能客户提升开发效率。
商汤将持续推进“日日新SenseNova”大模型体系建设。
商汤大模型研发期待在数据量上、参数结构上、以及能处理的问题上,可以日复一日地提高,携手行业生态共同迎来更强大的AGI技术突破
相关阅读,戳这里 

《商汤发布多模态多任务通用大模型“书生2.5”,迈向AGI通用人工智能》

《亚洲最大人工智能计算中心之一,商汤AIDC启动运营》

继续阅读
阅读原文