找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 81|回复: 2

[科技新闻] 540亿商汤,甩出一张新牌

[复制链接]
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-4-14 20:59 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
1.webp



记者/ 何己派 编辑/ 鄢子为
一上台,商汤科技董事长兼CEO 徐立就感叹,“如果三个月不更新自己的认知,可能就会被淘汰。”
4月10日,商汤举办2025技术交流日,徐立正式发布全新升级的“日日新SenseNova V6”(以下简称“日日新V6”)大模型体系。
商汤第六代大模型,以“多模态”为关键词,这是今年AI产业的重头戏。从Gemini 2.0、GPT 4.5到刚发布的Llama 4,我们可以看到,头部AI大厂在往原生多模态能力的方向走。
在徐立看来,多模态模型和通用人工智能的发展,画上约等号,以计算机视觉起家的商汤,从视觉能力到原生多模态模型的布局,则是自然延伸。
商汤科技联合创始人兼大模型首席科学家林达华向《21CBR》记者表示,公司去年5、6月份就在做多模态的探索,到了9、10月,技术路线基本跑通。
林达华称,之所以专注多模态推理,而非纯文本赛道的竞争,在于坚信未来的交互,必然是多模态的。
日日新V6,作为拥有超6000亿参数的MoE原生多模态通用大模型,凭借单一模型就可以完成文本、多模态等各类任务。
其技术能力上的突破,重在四个方面:
长思维链:超过200B高质量多模态长思维链数据,最长64K思维链;数理能力:数据分析能力大幅领先GPT-4o;推理能力:多模态深度推理国内第一,对标OpenAI o1;全局记忆:率先在国内突破长视频理解,支持10分钟的视频理解及深度推理。
2.webp


值得一提的是,长记忆。林达华表示,日日新V6可以做到将整段10分钟的视频,完整放在输入窗口,深入进行理解、分析和推理,甚至推断情景背后的“言外之意”。
他向记者透露,2025年内,放进输入窗口的视频时长,将做到1个小时。
“我们要抢占未来多模态交互的入口。”林达华表示。
加码多模态、重押生成式AI和视觉AI,如今的商汤,沿着新战略方向,稳步前进,截至4月14日收盘,市值超540亿港元。
去年末,公司发布“大装置-大模型-应用”三位一体战略,进一步聚焦主业,边缘业务则以生态方式来孵化,由此,做“最懂算力的大模型服务商”和“最懂大模型的算力服务商”,打造端到端的竞争力。
在此之上,以日日新大模型为基石,商汤深耕两大落地方向:
一是提供生产力工具,切入高价值的业务环境,如金融、政务、企业业务等,帮助客户提升效率、优化流程、改善体验。
二是提供交互工具,包括智能陪伴、智能硬件交互、智能营销等,以改善人机交互体验、提供个性化内容和服务、增强用户粘性。
对当下AI产业的发展趋势,商汤科技联合创始人兼大装置事业群总裁杨帆,提到三点:
一是,开源模型与工具,渐成主流;二是,性价比是所有大模型应用的生死线;三是,多模态正成为最新、最火热的技术焦点,将打开更多新应用场景,甚至新硬件形态。
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-4-14 21:10 | 显示全部楼层
多模态交互的未来会怎样?
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-4-14 21:10 | 显示全部楼层
这日日新V6的多模态能力确实牛,能处理10分钟视频,以后看电影找情节都能靠它了,不过6000亿参数这得多少电啊
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )

GMT+8, 2025-4-19 20:34 , Processed in 0.181756 second(s), 6 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表