计算天花板的突破:大模型与影像设备新物种的爆发今天,计算的天花板正在被彻底突破。一个由「本体算力 + 本地模型 + 云端大模型」构成的全新计算架构正在形成:各类智能设备本身(或部分结合手机)具备了前所未有的处理能力;轻量化的本地模型可以实现实时、低延迟的 AI 功能;而云端的大模型则提供了近乎无限的推理、理解和生成能力。大模型的本质就是「高计算」的产物,它的出现,为影像领域带来了「计算」这一端的巨大资源突破,这是通向前所未有想象空间的绝对红利。
如果说以前的「计算」是算法,是在给定的规则内做优化(比如防抖、拼接),那么今天大模型背后的「高计算」,带来的则是「推理+生成」,是在开放世界中进行理解、推理与生成,创造无限的可能性。这种「高计算」正在解锁全新的场景和价值,它给了所有创业公司一个前所未有的势能:你无需自建庞大的 AI 1.0 时代的一大串算法团队搞工程,就能站在巨人的肩膀上,调用过去无法想象的推理与生成能力。
沿着「计算」占比不断提升的这条主线,可以初步看到一条价值跃迁的路径,在传统影像设备「复刻现实」之外,它正在开启三个前所未有的新空间:
第一层,是「理解现实」,传统相机是忠实的记录者,而 AI 的介入,让摄像头作为一个输入工具,成为了 AI 的感知器官。它在像素之上,叠加了一个全新的「认知图层」。我们追求的,不再仅仅是看到画面,还想「看懂」画面背后的信息与内涵。例如,Dex 用高清摄像头结合 AI 视觉识别,做了一款给孩子用的「智能放大镜」。其核心价值并非高清光学成像,而是 AI 实时识别万物并提供知识讲解的「认知能力」。在这里,计算让影像长出一个全新价值图层,产品价值从单纯的「记录」扩展到了「理解与交互」。
做给孩子的「智能放大镜」 Dex Camera|图源:Dex Camera 官网第二层,是「增强现实」。当机器能够「看懂」世界,它便能更好地服务于人的主观意愿与情感表达。AI 不再仅仅是做降噪、调色,而是更深度地参与到创作与表达中。计算的角色从「理解」走向「美化与再表达」。例如,PhotaLabs 借助 AIGC 技术,可以让那些因为构图、光线、镜头、时机等种种原因留下遗憾的照片,可以被修复得「和回忆一样美」,这正是计算赋予影像「情感共鸣」与「自我表达」的全新价值。
PhotaLabs 功能和效果示意|图源:PhotaLabs 官网第三层,将计算的价值比重推到极致,是「生成现实」。这一阶段,光学捕捉到的现实,不再是最终结果或加工对象,可能只是一个激发 AI 创造的「引子」或 Prompt。计算彻底从幕后走向台前,成为创造的主体。最终交付的产物,可能完全是生成的。这层设想不只停留在思维推演中,现实中已经有了「如此极端」的产品案例。丹麦艺术家 Bjørn Karmann 做了一款没有光学部件、「纯靠计算」的相机 Paragraphica。它通过使用开放的 API 收集地理位置数据,利用地址、天气、时间、附近位置这些信息组成的文本段落,相机上的三个旋钮可以分别调节焦距、胶片颗粒、生成精度,最后使用 AI 基于文本「生成」出照片。
没有光学部件纯靠计算的「相机」 Paragraphica|图源:Paragraphica 官网这种多层次的价值释放,预言着一场影像领域「物种大爆炸」的可能性,尤其是在那些看似「小众」的垂直场景中。这背后的洞察是:许多看似「小众」的市场,并非需求本身小,而是过去的价值供给不充足,方式太过老旧或体验不够好。当 AI 驱动的高计算能力,能够主动交付出精准、便捷、远超以往的价值时,那些被压抑的潜在需求就可能被全面激活。
大疆 Pocket 系列的成功就是一个例证:「视频稳拍」的需求一直存在,但过去笨重的物理稳定器将其局限在了专业圈层,Pocket 用极致的便携和智能化的体验,将这一「老旧」的价值供给方式彻底革新,从而将一个最开始相对不大的细分市场作为体验突破口,最终重新定义了便携影像设备的形态,做到了总销量破一千万台的规模。可见只要价值供给足够好,小众也能变大众,甚至专用设备的能力,也可以成为通向新一代通用设备的突破口。
大疆 Pocket 3|图源:大疆 Pocket 3 官网未来,巨大的机遇就蕴藏在这些被高计算能力解锁的全新场景,以及交互和交付方式的细节之中。AI Native 影像公司的机会,将在于向着更专业、更场景化、更个性化的方向发展。它们将通过高计算能力,在一个个具体的场景里交付前所未有的用户价值,甚至有能力将一些过去看起来很垂直的小众场景,放大为更具普遍性的市场。
Plaud Note 录音卡的成功,为我们提供了一个参照。手机有录音功能,但这并未阻碍 AI 录音卡片 Plaud Note 和 AI 录音硬件 NotePin 销售突破一百万台。其成功的核心逻辑在于,它在特定场景下(例如会议、通话录音),针对特定人群(例如商务人士、记者、学生),提供了远胜于手机的交互与交付体验。它通过极致轻薄的硬件形态、一键录音的便捷交互,以及与大模型深度整合的 AI 转写、多模版总结与洞察、思维导图生成等功能,提供了精准而高效的「价值闭环」。
DWARF 3 和所拍摄的星云|图源:DWARFLAB 官网其实在更多的场景下,以简化操作,优化体验,用「高计算」替代「高光学」产出更大的用户价值供给,依旧有机会激发更大的需求。
虽然今天这些「高计算」影像设备还在早期,出货量都还没有爆发。但这条道路刚刚开始,那些即将诞生的 AI Native 影像公司,必须是全新的物种,必须有足够创新的产品思维,也必须坚定地站在「成熟的」光学供应链上,去建设更强的 AI(计算与交互)能力栈。它们从第一天起,就应该是一家有 AI 为核心驱动,以场景的深度理解+可以形成数据飞轮的公司。
每一次计算能力的跃迁,都会催生出新的优秀企业。这一次,舞台已经出现,那些真正懂得驾驭 AI 力量的影像新物种们该「惊蛰」了。