夜间模式 切换到宽版

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 67|回复: 2

[科技新闻] 太上头了,字节的新模型

[复制链接]
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-9-15 17:24 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
早在六月时,就有朋友对我说,这一轮 AI 浪潮中,国内可能只有字节跳动,是唯一能够在模型和应用方向都拿到船票的公司。现在想想,他的话还真有几分道理。
Nano Banana 火爆出圈之后,字节很快也发布了自己的图像创作模型 Seedream 4.0。从目前我的实测效果来看,它在中文、动漫等场景的能力是完全超过 Nano Banana 的。说真的,确实有点猛。
而且,上周我刷 X,看到 Seedream 一口气拿下了知名第三方评测机构 Artificial Analysis 的文生图和图像编辑榜单的双第一。
1.webp

今年前半年,大家应该记得,依靠 GPT-4o 的吉卜力风格图片生成能力,ChatGPT 的用户迅速突破了 5 亿大关。那时候,我的感觉是,目前 AI 产品破圈,多模态确实是一个重要的方向。
这次,无论是 Nano Banana,还是 Seedream,他们的商业价值我们都已经感受到了。
举个很简单的例子,我朋友做小生意,周末我告诉他,你没必要再找外包给你做那些蹩脚的宣传图了。只要你会用豆包,那现在 AI 完全可以快速生成出来比之前水准还要高的照片。
我哥们不懂 AI,我说你就找个 00 后的小朋友,我教他一天,他就能会。
今天他已经开始行动了。
Seedream 4.0 给我的感受是,指令的遵循和理解能力特别强,而且生图的速度也比上一代模型快了很多。这是一个里程碑式的突破。除此之外,它还有下面几个优点:
1、抠图能力强。在背景很复杂的图里,它也能认出主体,替换、增删都干净利落,边缘自然,不会出现穿帮的破绽感。
2、支持多图融合。可以同时输入多张参考图和文字,把不同元素自由拼在一起,风格统一,构图自然,生成效果很可控。
3、中文排版靠谱。中文不再乱码,标题、副文都能清晰排版出来,不用再一张图一张图手动修字。
4、画质极高。能直接生成 4K 图,细节非常到位,放大看也不糊,用来做电商图、海报这些都完全够格。
除了在豆包和即梦外,我们还可以在火山方舟中免费体验 Seedream 4.0,而且支持生成 4K 图片。很多人不知道这个入口:
https://event1.cn/5LGO92

2.webp

接下来,我给大家分享下我最近玩的一些有实际意义的案例。
#01
生成好看的海报

这两天,罗永浩和西贝的事情闹得沸沸扬扬。我在朋友圈看到一张罗永浩的海报,感觉设计感还不错。灵机一动,我在想,这种图片,Seedream 能不能直接出图。能的话,那后面肯定能省不少功夫。
3.webp

我在网上找了马斯克的图片,然后截了他的某个 X 帖子,然后输入下面的提示词:
模仿图一重新做一张图。要求新图背景是蓝色的,人物是图二中的人,手里拿的牌子是图三,图三不要做任何改动,包括文字,文字排版,头像和上面显示的时间,直接让图二人拿手上。背景上方文字是两行,第一行是“机器人”,第二行是“太难做了”。
4.webp

下面是最终生成的图片,我去,太酷了。
 该图片疑似AI生成
5.webp

#02
手机壁纸

Guim Tió 是西班牙的一位年轻画家,我一直很喜欢他的作品。那种带着童话感的色彩和温柔的笔触,总能让人一下子安静下来。前阵子我在 Instagram 上刷到他的新画,忍不住截了几张收藏起来。
6.webp

现在,我可以让 Seedream 4.0 参考这种风格帮我生成一张手机壁纸。下面是我的提示词:
根据参考图的绘画风格进行创作,生成一张保持相同风格特征的全新图片。要求整体画面与参考图在色彩、笔触、质感、氛围和艺术表现方式上保持一致,但不必照搬具体内容。图片的内容是:秋天丰收的田野里,几个小朋友在开心的奔跑。
7.webp

下面是最后生成的效果图:
 该图片疑似AI生成
8.webp

有了壁纸,我们还可以接着生成一张手机和壁纸结合在一起的展示图。以前这种图肯定得让设计师来 P,现在我觉得已经没这个必要了。AI 可以直接干。下面是我的提示词:
在桌面中央平放一部 iPhone 17 手机,宽高比是 19.5:9 ,第二、第三、第四张图是 iPhone 17 的照片。周围自然摆放耳机、平板、笔和台灯底座等物品,整体画面真实写实,光影柔和,突出日常桌面氛围。手机屏幕中显示第一张图的画面,比例和角度与屏幕自然契合,光影和反射效果融合协调,使其看起来就像手机本身正在展示该画面,真实可信。
9.webp

咱们看看效果,左边是壁纸图,右侧是放到手机上的实景图:
 该图片疑似AI生成
10.webp

#03
生成冰箱贴

冰箱贴算是文创产品里最常见的一类了。在很多景区的小店里,总能看到它的身影,有些游客也会买一两枚当作纪念。我就想着,不如让 Seedream 4.0 来试试看,能不能直接把地标建筑做成一套冰箱贴。
我的提示词是:
设计一款文创半圆形状金属冰箱贴。将图片中的建筑变成 Q 版冰箱贴,冰箱贴放在一个精致的礼品盒里面。
下面左图是我上传的天坛祈年殿图片,右图就是 Seedream 生成的冰箱贴效果图。真的有那种小小一枚、精致可爱的感觉,想象力被打开了。
 该图片疑似AI生成
11.webp

#04
头像和证件照

再尝试生成一个简笔画风格的头像,以及证件照。下面是我的提示词,我随手附了在家里拍的照片,光线很暗,人很黑,咱们看看 AI 能不能出图。
根据参考图,设计两张人物形象:一张是简洁清爽的 Notion 风格头像,线条极简、配色柔和;另一张是证件照,构图端正、细节清晰,整体呈现干净专业的感觉。
12.webp

效果不错,下图是 AI 一次性生成的效果,我已经很满意了。
13.webp

证件照如果是我想红底的,也没问题,继续告诉他,我要红底的证件照:
 该图片疑似AI生成
14.webp

#05
中秋海报

中秋节快到了,我们也该做一张海报。可这几年网上的中秋海报,看来看去都差不多:背景是一轮巨大得不太真实的月亮,上面端端正正地压着几行大字,冷冰冰的,几乎没有一丝烟火气。看完很难让人联想到团圆的温情,只像是一个任务式的节日符号。而我心里想象的中秋,不该是这样的。那应该是一幅柔和的画面:一家老小围坐在老院子里,竹椅吱呀作响,桌上摆着刚泡好的热茶、切开的月饼,还有几盘新鲜的应季水果。
大人们轻声闲聊,脸上带着岁月打磨后的安稳笑意,孩子们在院子角落追逐打闹,月光悄悄落在他们发亮的额头上。
远处的夜空深蓝而澄澈,天边挂着一轮不张扬却很圆满的月亮,像是悄悄守望的眼睛,把整个院子都笼在一种安宁的喜悦里。
我把我的想法,告诉给了 Seedream 4.0:
15.webp

下面是我抽卡三次后,选中的两张图片:
16.webp

#06
绘本

之前,Gemini 曾经上线了一个名为 Storybook 的新功能。用户只需输入一句话,就能自动生成一本完整的故事书。故事书每一页都配有精美的插图和生动的文字描述,非常适合儿童阅读。这一次,Seedream 4.0 也已经具备了这个能力。参考下图,选择故事书之后,输入自己的提示词就行。有喜欢的参考图,你可以上传,或者直接纯文字也能够搞定。
17.webp

下面是我的提示词:
18.webp

还有最终生成出来的效果:
19.png

#07
建筑漫画

电影《浪浪山小妖怪》里,有个细节让我印象特别深,他们把很多熟悉的中国传统建筑,做了艺术化的处理。原本那些沉静、端庄、规整得近乎严苛的殿堂、牌楼、街巷,被他们画出了另一种气质:瓦片不再一片片工整排列,而是微微翘起,像风能吹动的羽毛;屋檐也不是笔直的线条,而是像动物的脊背一样,带着一点弧度的生气。这种处理,一下子让建筑变得鲜活、灵动,甚至有点像会眨眼睛的生物。那一刻我突然觉得,原来建筑也可以不是冰冷的,而是有生命的存在。
下面是我的提示词:
参考左图,生成一座中国传统寺庙的二次元动漫风格插画,仅保留单层结构。寺庙上的文字必须与参考图一致,并保持清晰,同时带有自然破损痕迹,其余部分完全自由发挥,不必与参考图相同。墙面与柱子自然破旧,比例协调,不穿帮。前景去掉所有遮挡寺庙的元素,去掉寺庙上的牌匾,画面保持完全通透清晰。地面砖面参考乡下破瓦房风格,呈现严重自然破损,裂纹、磨损、风化痕迹明显且符合真实破坏逻辑。寺庙屋顶参考右图,并借鉴乡下破瓦房的风格,呈现真实自然破损效果,裂纹、斑驳、风化与褪色合理且符合建筑破坏逻辑,不显叠加或分层感。整体采用二次元清晰线条、赛璐璐上色、柔和低饱和色彩,呈现古朴沉稳的氛围。天空柔和动漫蓝,树木低饱和二次元风格,细节丰富,营造独特的二次元破旧美感。
20.webp

#08
连环画

我家孩子特别爱看连环画,于是我就想着,干脆让 Seedream 4.0 帮我一起做一套属于她自己的。提示词我写得很简单:
生成多图,画面比例设成 3:4,一共 8 个分镜,整体风格是 Q 版治愈系,故事内容就是《小马过河》。
最妙的是,Seedream 根本不需要我多做解释,它一听到“小马过河”,就能明白这是个讲勇气与判断的故事,于是画出来的小马会先犹豫、再尝试、最后坚定地迈过河流。整套画面不仅可爱,也把故事的情绪节奏拿捏得很准。
孩子拿到这套自己专属的连环画时,兴奋地一页页翻着看,还不停补充自己的想象。我忽然觉得,AI 真是让想象力变得可以被触摸的一件事。
21.webp

#09
小红书海报

还有经常我会在小红书上看到一些有趣好看的封面,比如下面这种,现在也完全可以用 AI 生成了。我挑了几张自己收藏的封面图,让 Seedream 4.0 生成了一组。颜色、排版、氛围都还原得很到位,而且几分钟就能出图,效率完全不是一个量级。
所以,未来多数的图片,其实 AI 都能够直接搞定,能不能让 AI 做出来有质感的图片,更多是考验我们的审美能力。
22.webp

#10
写在最后

https://event1.cn/5LGO92

玩到最后,我忽然意识到一件事:我再也不用会画画、会修图,才敢去想象画面了。
现在只要有念头、有冲动,Seedream 4.0 就能把它立刻拉到眼前。那一瞬间会让人觉得,创作这件事,好像终于轮到我们每个人都能做了。
想基于 Seedream 4.0 做应用的话,可以直接在页面右上角的 API 接入菜单。
模型的能力只是一方面,好的应用还需要更好的交互,更多的 Context,比如儿童绘本,就不仅要会出图,还得理解故事的情节节奏、人物性格、年龄段审美这些语境信息。
23.webp

而这恰恰是接下来更值得期待的部分:当图像生成不再稀缺、不再昂贵,真正的差异化就会转向谁能把模型和场景结合得更好,谁能做出真正解决问题的东西。
也许这正是字节最值得关注的地方:不只是做出了一个厉害的模型,更是把它变成了人人都能用起来的工具。

最后,以刚刚我在 X 上刷到的帖子作为今天文章收尾吧。纯粹的自由创作的时代彻底来了。
是的,也许 Seedream 4.0还不够完美,但不可否认,它也已经迈过了可用的水准,况且,技术的发展速度这么快,我相信,新的版本已经在路上。
24.webp
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-9-15 17:52 | 显示全部楼层
有用但更期待下一次更新,距离生产力还是有点距离。
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:410
发表于 2025-9-16 05:57 | 显示全部楼层
豆包反正不咋地,问个家常里短可以。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2026-4-24 10:29 , Processed in 0.248333 second(s), 6 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表