商汤科技发布行业首个“云、端、边”全栈大模型布局实现AI自由_新闻_聚焦东方_中国发展网

中国经济导报、中国发展网讯 4月23日，商汤科技在上海举办技术交流日活动，发布行业首个“云、端、边”全栈大模型产品矩阵，以满足不同规模场景的应用需求。同时还全新升级“日日新SenseNova 5.0”大模型体系，其综合能力全面对标GPT-4 Turbo，技术领跑加速生成式AI向产业落地的全面跃迁，实现大模型按需所取。

在人工智能发展的最基本法则——尺度定律（Scaling Law）的准则下，商汤持续寻求最优数据配比并建立数据质量评价体系，推动自身大模型研发的同时，也为行业伙伴提供大模型训练、微调、部署和各类生成式AI的能力及服务。商汤科技董事长兼CEO徐立表示，商汤在尺度定律的指导下，会持续探索大模型能力的KRE三层架构（知识—推理—执行），不断突破大模型能力边界。

自去年4月首次发布，商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TB tokens训练、覆盖大量合成数据，全新的“日日新SenseNova 5.0”（以下简称：日日新5.0）采用混合专家架构，推理时上下文窗口可以有效到200K左右。

据悉，本次更新主要聚集增强了知识、数学、推理及代码能力，全面对标 GPT-4 Turbo，主流客观评测上达到或超越 GPT-4 Turbo。在文科能力方面，“日日新5.0”的创意写作能力、推理能力以及总结能力均大幅提升，相同的中文知识注入后，可以获得更好的理解总结及问答，为教育、内容产业等垂直应用场景提供有力辅助。在理科能力方面，“日日新5.0”数理能力、代码能力及推理能力达到业内领先水平，为金融、数据分析等场景落地提供坚实基础。

此外，本次发布的“日日新5.0”另一核心指标就是多模态能力，商汤多模态大模型的图文感知能力达到全球领先水平，在多模态大模型权威综合基准测试MMBench中综合得分排名首位，在多个知名多模态榜单MathVista，AI2D，ChartQA，TextVQA，DocVQA，MMMU 取得领先成绩。同时，还在应用产品层面也实现了更卓越的多模态能力，支持高清长图的解析和理解以及文生图交互式生成，还可以实现复杂的跨文档知识抽取及总结问答展示，还具备丰富的多模态交互能力。

前瞻洞察中心化算力需求向端侧扩展的未来趋势及企业级在边缘侧的AI需求，商汤科技领先业内首次推出“云、端、边”全栈大模型产品矩阵，其中包括应用于终端设备的“商汤端侧大模型”，以及面向金融、代码、医疗、政务等多个领域的边缘产品“商汤企业级大模型一体机”。

今年是端侧大模型应用的元年，为了满足移动终端用户对大模型技术的应用需求，商汤推出日日新·端侧大模型，性能实现同等尺度性能最优，跨级尺度全面领先。同时，还推出端云协同解决方案，可以通过智能化判断协同发挥端云各自优势，需要联网搜索或处理复杂场景时分流至云端处理，部分场景端侧处理占比超过80%，从而显著降低推理成本。

据了解，商汤日日新·端侧大语言模型的推理速度达到了业内最快，可在中端平台实现18.3字/s的平均生成速度，旗舰平台更是达到了78.3字/s。扩散模型同样可在端侧实现业内最快的推理速度，端侧LDM-AI扩图技术在某主流平台上，推理速度小于1.5秒，比友商云端app快10倍，支持输出1200万像素及以上的高清图片，支持在端上快速进行等比扩图、自由扩图、旋转扩图等图像编辑功能。

对于金融、代码、医疗、政务等重点行业边缘侧日益增长的AI应用需求，商汤推出企业级大模型一体机，可同时支持企业级千亿模型加速和知识检索硬件加速，实现本地化部署，即买即用，降低企业应用大模型的门槛。相比行业同类产品，推理成本节约80%，检索大大加速，CPU工作负载50%。

当天，商汤科技董事长兼CEO徐立还带来了三段完全由大模型生成的视频，并强调文生视频平台对于人物、动作和场景的可控性。通过商汤打造的智能算力中心，可以不断赋能于大模型的训练，目前，日日新大模型体系在自然语言处理、视频生成和深度学习优化等多个方面取得创新。未来，通过输入一段文字或一个完整的描述，就可以生成一段视频，而且人物的服饰、发型、场景都可以根据预先设定，保持视频内容的连贯性和一致性。（倪珺）

商汤科技发布行业首个“云、端、边”全栈大模型布局 实现AI自由

商汤科技发布行业首个“云、端、边”全栈大模型布局实现AI自由