AI 2.0时代，商汤靠什么「突围」？丨氪金

生成式AI成为商汤新的增长引擎。

作为中国最早一批投入人工智能基础设施的公司之一，在成立的第十个年头，商汤迎来了自家生成式AI业务的爆发式增长。

3月26日，商汤在港交所披露其2023年业绩。财报显示，2023年商汤实现总收入34亿元，借助“大装置+大模型”的协同布局，其生成式AI业务在去年创造出11.8亿元的收入，增速近200%，营收贡献率达到35%。

在大模型遍地开花，呈现井喷式发展的契机下，生成式AI业务成为商汤以最快速度从无到有并超过10亿元收入体量的新业务。

“生成式AI对商汤来说已不仅仅是技术领域的变革性创新，更成为公司的核心业务。”商汤科技董事长兼CEO徐立如是说。

打铁仍需自身硬，商汤抢占AI 2.0先机

前不久，徐立在2024全球开发者先锋大会（GDC）上曾发表主旨演讲。他表示：“最近，‘新质生产力’成为热议话题，尤其在开发者领域，生成式AI被视为引领生产力突破的技术，也标志着人工智能进入了一个新的发展阶段，我们称之为AI 2.0时代。”

与AI 1.0相比，AI 2.0标志着从基于规则的自动化处理向深度学习和自主学习能力的飞跃。这一跃进不仅提高了AI的理解能力，更赋予了机器创造性思考的可能性，从根本上改变了AI在社会各领域中的应用景象。

《新一代人工智能基础设施白皮书》认为，新一代人工智能基础设施将会通过支持大模型的爆发式发展，带来知识工程的生产力变革，重构软件生态，颠覆原有数字经济霸主，并随着本身的技术革新和突破，实现边际成本持续下降，边际效益持续增长等特征，进而实现AI算力成本的持续下降，真正带来普惠AI。

换言之，AI 2.0时代，人工智能将不仅仅只是效率的提升者，更成为推动未来社会进步和产业革新的关键力量。在这样一个关键节点，商汤凭借其"大模型+大装置"的协同策略突围而出。

查阅官方资料显示，不足一年时间，“日日新”大模型已升级至4.0版本，且其能力每隔三个月就会显著提升，迭代速度之快不仅揭示了生成式AI模型潜在的巨大发展潜力，也指向了其作为新营收支柱的可能性。

然而，标志着技术快速前进的道路并非全是平坦，挑战亦随之浮现。

相关数据显示，过去四年，大模型参数量以年均400%的复合增长率增长，AI算力需求的增长也超过15倍。如此庞大的数据量，以CPU为中心的传统计算基础设施已经无法满足需求。在这一背景下，必然需要新一代的基础设施来支撑大模型的训练与推理、生成式AI应用的规模化落地。

打铁仍需自身硬，因此，要想搭高楼，前提是要夯实地基。此时，算法、算力和数据的整合显得尤为重要，而商汤的前瞻布局则在此刻适时发挥了作用。

2018年前后，商汤开始每年数十亿投入到专为AI原生打造的智算云服务平台——SenseCore商汤大装置，并建设上海临港超算中心。五年时间里，商汤大装置的总算力规模突破性增长至12,000 petaFLOPS，上线GPU数量高达45,000卡。SenseCore商汤大装置已成为国内稀缺的大模型基础设施。

在算力和数据规模支持下，"日日新"大模型得以持续优化。以“日日新”4.0版本为例，其在代码编写、数据分析和医疗问答等多个场景中展现的能力，已与GPT-4不相上下。

立于AI 2.0的最前沿，商汤进一步率先推出“模型即服务”商业模式，使客户能够轻松微调和使用各类生成式AI功能，无需承担建设和管理底层基础设施的负担，为商汤在市场中带来众多正面评价。

打造生成式AI新高地，底气从何而来

作为国内首批符合《生成式人工智能服务管理暂行办法》的企业，商汤在生成式AI领域的爆发式增长并非一蹴而就，也绝非一日之功。

首先，过去十年间，商汤在感知智能、决策智能领域的积累，多模态数据的储备，强化了商汤基础模型对物理世界的理解和多模态能力，为其在生成式AI的发展和实践中打下良好基础。

其次，“大装置+大模型”的协同优势进一步提升，其大装置平台显著提升了大模型训练的支撑能力。除了万卡算力的加持，商汤还维持了高达90%的加速效率并实现了超过30天的稳定训练，训练中断恢复时间更是优化至半小时内。

第三，在实现从AI 1.0到AI 2.0的跃迁过程中，端侧部署的积累必不可少。自2015年起，商汤便开始同全球主要的安卓手机厂商和主流车企合作，将感知与决策类的AI模型植入至超过20亿台手机和数百万台汽车中，实现端侧推理的极致优化。

商汤的服务范围广泛，据财报披露，商汤已与包括全球科技巨头高通、国内三大电信运营商、金融领域的领军企业如招商银行、海通证券以及互联网行业的重要玩家如京东、小米、荣耀在内的广泛行业领域建立合作。

基于这一深厚积累，商汤率先推出了业界性能最优、推理速度最快的端侧小模型，例如，同样是7B模型，商汤的性能领先于Meta的Llama2和谷歌的Gemma。这一举措不仅帮助商汤有效地满足市场对高效、低成本AI解决方案的需求。

值得关注的是，在过去一年内，商汤生成式AI业务超过70%的客户为新客户，这不仅彰显了市场对商汤技术的广泛认可，也为公司业务增长注入了强劲动力。

商汤在端侧部署领域的成功实践，增强了商汤在技术竞争中的议价能力和市场影响力，为其在端侧生成式AI业务领域的未来扩张提供了广阔的空间。

最后，大模型“花样百出”，但最终仍需“落在实处”，商汤始终将AI技术在实际应用场景中的落地作为重点。“日日新”大模型已在金融、医疗、智能终端等多个行业展现出显著的应用价值，证明了其广泛的适用性和强大的业务推动能力。

在金融行业，商汤通过检索增强生成（RAG）技术，显著提升了模型的数据处理和问题回答能力，中国银行、招商银行、中国工商银行等均采用“日日新”大模型构建其“数字员工”和“数字客服”系统。在医疗领域，其“商量 •大医”大模型能够提供专业的医疗知识问答服务，并具备医学图像的识别能力，已应用于多家顶级医疗机构，有效提升了医疗服务质量和效率。

综上所述，商汤在生成式AI领域的成功，归因于其在技术开发和商业应用方面的紧密集成。

从"大模型+大装置"战略，到感知智能、决策智能以及端侧部署的积累，再到AI落地应用场景，商汤完成了从研发到商业化应用的闭环，形成驱动商汤在该领域业务持续增长的关键动力。

由点到面，产业质变的动力源

下半场的竞争早已不限于技术本身，而在于生态拓展。

随着ChatGPT引发的大模型热潮和日益增长的大模型开发需求，在推进公司业务成长的同时，商汤也在驱动整个AI产业的的升级和质变的过程中，扮演着举足轻重的角色。

商汤科技董事长兼CEO徐立曾强调，AI大装置是商汤长线核心竞争力的标志，是公司持续经营和更大规模跃迁的护城河，以及推动AI时代生产要素降低的关键一步。

国际知名调研机构弗若斯特沙利文《2023年中国AI开发平台市场报告》显示，SenseCore商汤大装置可实现大模型推理效率提升600%，大模型增量训练降低90%。

依托SenseCore商汤大装置这一强大的AI开发平台，商汤正在为越来越多的企业提供算力支持，最新财报显示，商汤订单金额超过千万元人民币的客户数已达到数十家。从客户名单看，商汤的典型客户来自各行各业，比如三大运营商，招商银行、海通证券等金融机构，京东、小米、阅文等头部互联网公司，HiDream.ai、澜舟科技等创业公司、清华大学、上海交通大学等学术机构，，商汤已然成为大模型产业的推动者。

业内共识是，作为培育新质生产力的重要工具，生成式AI具有带来生产力突破的潜力。

在这一趋势下，通过开发先进的生成式AI工具，商汤正在重新定义生产力工具的边界，其秒画文生图模型的参数量已经升级至百亿参数级别；即将在4月推出的“日日新5.0”将支持百万字无损上下文。

过去一年，大模型赛道神仙打架，但能否真正实现应用落地，则成为检验大模型能力的关键。正因此，商汤的脚步并未完全停留于模型与平台开发上，在应用和基础设施层上的深耕，正在让商汤成为连接不同产业需求与AI技术能力的桥梁。

具体来看，在应用层面，商汤推出“日日新全家桶”“小浣熊”等一系列创新性生成式AI工具，为不同行业提供了新质生产力解决方案。在基础设施层面，商汤的大装置平台也成为了芯片验证的重要场所，SenseCore商汤大装置AI云、商汤日日新·商量SenseChat大语言模型都已成功通过与华为Atlas系列服务器的相互兼容性测试。

尤其值得一提的，是商汤基于商汤的“日日新SenseNova”大语言模型打造的AI Native生产力系列工具“小浣熊家族”。

其中，AI编程助手“代码小浣熊”可提升编程效率超50%，在权威测试中，一次通过率达到75.6%，超过GPT-4的74.4%。AI数据分析工具“办公小浣熊”则能够通过自然语言输入，自动将数据转化为有意义的分析和可视化结果，其底层技术商汤日日新·商量语言大模型-数据分析版本，在测试中也以85.71%的正确率胜过GPT-4。

通过两款工具，商汤展示出其在大模型技术在实际工作场景中的高效性和创新性，标志着商汤在AI的商业化落地方面上走在了前列。

AI 2.0时代的序幕已然拉开，商汤管理层认为，生成式AI业务在2024年预计将继续保持高速增长。

十年淬炼，商汤又站在新的起点上，走向属于自己的2.0时代。

继续阅读

阅读原文