本文来自微信公众号: APPSO ,作者:发现明日产品的,原文标题:《以为是站姐神图,结果是豆包新功能直出!能跟Nano Banana Pro扳手腕吗丨附提示词》
就在最近,豆包上新了图像创作模型Doubao-Seedream-4.5(以下简称Seedream 4.5)。
猜猜下面两张图片,哪张是Seedream 4.5生成的?哪张是最近风头正盛的Nano Banana Pro生成的?
答案是:上边是Seedream 4.5生成的。你猜对了吗?
为了进一步测试它的底子,我们接着和Nano Banana Pro搞了几场「PK」。
同样的提示词:
一位时尚的年轻亚裔女性在准备外出赴约时,用闪光灯拍摄了一张极具魅力的镜前自拍照。
上边是Seedream 4.5,下边是Nano Banana Pro。
Seedream 4.5精准捕捉到了亚裔女性的特征,甚至在没有限制尺寸的情况下,自动生成了更符合自拍逻辑的竖画幅。 第一眼看到这张图,我以为是哪位颜值博主在某书发的自拍。
相比之下,Nano Banana Pro显得没有那么了解当下亚洲女孩的审美。
接下来看看一致性,我将刚刚Seedream 4.5生成的亚裔女孩喂给了它们俩,让它们生成一组《时尚芭莎》风格的照片。
几个问题:能看出是刚才的女孩去拍大片了吗?你发现上图是Seedream 4.5生成的了吗?你是如何分辨出来的?
话不多说,接下来带大家深扒一下,这个新模型大家都在怎么玩。
姐妹,神图有了
但这次……Seedream 4.5好像真的值得「托付」。
还是刚才的亚裔女孩,使用Seedream 4.5达成了夸张的广角畸变,让前景的手部看起来巨大,但手指的关节结构、脸部的神态依然保持得非常清晰锐利,完全没有崩坏。那种电影海报般的「故事感」扑面而来。
提示词:一张16:9的图片,描绘了一个充满张力的战斗场景。画面采用超广角镜头和戏剧性的荷兰式倾斜构图(Dutch angle)。主体姿态大胆动感,身体随镜头倾斜带有惯性。关键细节:她的右手在脸前比出「手枪」手势(食指伸直,拇指竖起),目光锐利地跟随指尖指向前方;左手置于右手下方略靠前,五指完全张开掌心向上。由于广角镜头的极端透视畸变,前景的左手显得非常巨大,极具视觉冲击力。光影与画质:尽管透视夸张,但双手和脸部细节必须清晰锐利,解剖结构准确,线条干净。光线为柔和的室内照明,背景是中性模糊的环境,突显出动作的紧张感。
不用反复摆姿势,AI一次就能给你满意的结果。我的新结论是: 求人不如求己,求己不如求Seedream 4.5。
AI也懂你的搭配小巧思
以往AI很难处理好汉字,但这张图里,无论是「美疯了」还是「长发配礼帽绝了啊啊啊」,中文字迹很自然,有点像是用记号笔直接在照片上涂鸦一样。甚至能根据人物的穿搭自动生成夸赞的文案。
但是效果并不稳定,需要耐心调试。
打破次元壁
直接上图,帅到谁了我不说。
提示词@TechieBySA:角色的分割肖像,左侧为风格化的二维卡通或漫画风格,右侧为超写实的电影肖像风格。两部分在中心完美对齐,中间以撕开的漫画纸边缘分隔,象征着从插画到现实的过渡。卡通部分采用扁平化的简洁图形,而写实部分则展现出丰富的纹理细节。柔和的中性摄影棚背景,戏剧性的光线,平衡对称的构图,1080x1080正方形画幅。
图中同时呈现出了两种画风。左边是二维卡通漫画风格,右边是超写实风格,中间用「撕开的漫画纸边缘」作为分割线,实现了无缝对齐,非常适合做个性头像或概念海报。
说实话,能够在一个Prompt里同时调度两种完全不同的渲染逻辑,且构图依然保持平衡对称,非常考验也展示了模型的指令遵循能力。
大道具,小人物
巨物题材最怕「假」,但看下面两张图,Seedream 4.5对物理重量的理解还是让人惊喜的。
一个普通身材的角色与一个体积巨大的物体进行互动,通过夸张的比例差制造视觉奇观,但AI依然能处理好身体的受力姿态,不会出现违和的「悬浮感」。
那还说啥了,提示词也放后面了。
主体与视角:一张图片主体的全身超逼真摄影棚人像,采用低角度仰视视角。角色以充满力量感的运动姿态被捕捉,正在与一个巨大的超大尺寸篮球进行互动。互动描述:表现为单手将其托举在背部,画面展现出肉眼可见的身体张力。物体细节:一个细节丰富的超大篮球,材质为带有颗粒感的橙色皮革配金色线条。它占据了画面的角色身高的80%。背景:无缝的浅灰色墙壁和搭配的地板。氛围与风格:极简奢华运动风。8K超精细渲染,构图精准,完美比例,自然的物理接触,纹理清晰,反射准确,色调平衡。
主体与视角:一张衣着专业、身上沾满面粉尘埃的年轻女性甜点师的全身超逼真摄影棚人像,采用富有冲击力的低角度仰视视角。角色以充满爆发力的运动感杂志大片姿态被捕捉,正在与一个巨大的超大尺寸金属线状打蛋器进行互动。互动描述:表现为双脚分开站稳,身体大幅度前倾,用全身的重量和核心力量压住并试图转动那个巨大的打蛋器,仿佛在搅拌一缸粘稠的原料,画面展现出肉眼可见的手臂肌肉线条紧绷、自然的吃力感和瞬间冻结的动态能量。角色和物体在画面中完全可见,比例缩放得当,呈现出一种既超现实又具真实感的视觉平衡。物体细节:一个细节丰富的超大钢丝打蛋器,材质为高度抛光的食品级不锈钢,金属线圈上粘着少许逼真的、半透明的蛋白霜或面糊残留物。它占据了画面的角色身高的130%(巨大的头部倾斜着占据前景)。表面具有逼真的冷金属光反射、钢丝交织的复杂纹理细节,以及角色双手紧握手柄时指关节发白的精确物理接触感。灯光与环境:柔和的专业摄影棚布光,具有平衡的高光和漫射阴影,清晰的反射和柔和的光线衰减,以强调真实感。背景:无缝的柔和奶油色墙壁和搭配的地板,极简、干净、带有微弱反光,与面粉和金属的色调相得益彰,保持画面干净。氛围与风格:充满活力的烹饪动作大片,强调材质触感与动态张力。8K超精细超逼真摄影棚渲染,构图精准,完美比例,自然的物理接触,纹理清晰,反射准确,色调平衡。
这才是自带BGM
今年不想截图官方平台的年度听歌报告?这里有一种既能展现喜爱歌手的美貌,又能秀一把自己听歌品味的方式。
巨大的竖屏手机不仅没有产生割裂感,反而通过对屏幕透明度的精细处理,让界面的微光与人物身上的影棚柔光完美融合。
提示词@TechieBySA:一幅歌手的逼真全身肖像,采用其标志性风格,旁边是一部巨大的竖屏智能手机,屏幕上显示音乐播放器界面播放歌曲,并采用()强调色,透明度约为80%,以营造高级美感。艺人身着标志性的服装,摆出自信而富有时尚感的姿势,完美诠释了歌曲的情绪和能量。她的表情与她的形象相得益彰。纯色背景,带有柔和的灯光点缀•采用柔和的影棚灯光,搭配()调彩色滤光片;35mm或50mm镜头,f/2.2光圈,ISO 100-160,快门速度1/125秒;清晰聚焦于主体和手机界面•编辑风格与高端音乐平台推广活动保持一致。
总的来说,你不再需要精通复杂的修图软件或排版理论,只需要一个好的脑洞,就能让AI像一个懂审美、懂排版的设计搭档一样,精准还原你脑海中的画面。
还没试过的朋友,赶紧去豆包试试看!
