开启辅助访问

我的威客商家入驻客服中心网站导航时代威客APP

　　

立即注册

快捷导航

科技信息

用完这次更新的豆包，我想把PS卸了

有一说一，前几天就已经立冬了，眼瞅着又快到年底了现在。搁往年的情况，到了年底这才到各大厂商纷纷发力的时候，年关将近嘛，总得搞出点啥新东西，给各人涨涨眼界。固然说最近关于 AI 的新消息不是很多，但是人家这

有一说一，前几天就已经立冬了，眼瞅着又快到年底了现在。

搁往年的情况，到了年底这才到各大厂商纷纷发力的时候，年关将近嘛，总得搞出点啥新东西，给各人涨涨眼界。

固然说最近关于 AI 的新消息不是很多，但是人家这段时间肯定也没闲着，这不，一个多月前，也就是 925 那天我们才跟各人说了豆包的视频天生，这两天，豆包又又又上新了新功能。

简单来说，这回豆包支持 “ 一句话编辑修改图片 ” 了。

固然文生图已经搞了两三年，但这回，我敢说真算是国产 AI 文生图里的新突破了。

可能不少差友还以为， AI 生图不是已经挺厉害的了嘛，怎么还不能修改图片？

现实上，我们这几年也测了不少文生图大模型了，支持图片正确修改的还真没有，现在做的最好的真就是豆包。

就比如说 ChatGPT-4o ，你让他画个打篮球的人还可以，但是你要想改动一下，把情况换成沙滩，不好意思，整张图都变了。

不止 OpenAI 的不行，谷歌的 Gemini 也一样。

原来说让它把图中的鸡酿成鳄鱼，结果不仅没酿成，还把配景给全改了，两次的篮球也完全不一样。

拿 AI 自己生的图搞都如许，更别说当地上传的照片了。

就拿最简单的给图像换颜色来说，即使在豆包以前的版本里，这种结果也不抱负。

比如我们直接把 925 运动里，给脖子哥拍的照片传上去，然后告诉豆包，你给我把脖子哥抱着的小白狗换成小黄。

结果就是，整张图都变了，风格大变就算了，构图也不一样。

但是现在，这回用上这个上新了的豆包，同样的照片同样的提示词，你再看看：

固然有一点点小瑕疵，但要跟前面的一比，是不是高下立判！

不但保存了脖子哥的动作，表情，小狗的外形也跟上传的图差不多，说换成黄色就换黄色，一点不暗昧。

再来试试图像消除，结果也不错。

Prompt: 帮我天生图片：消除白色小狗

发现没，这个文生图变得智能了，它能识别出照片里的内容，你想修改啥他就只改啥，那里不对改那里， so eazy!

而且不仅能做到识别，修改颜色，消除物品这些根本功能，你想整点复杂的也一样可以。

比如更换图片的配景。

我们把差评硬件部视频里，米罗的照片传上去，然后叫豆包把我们的拍摄间配景改成上海陆家嘴。

Prompt: 帮我天生图片：配景换成陆家嘴

哎嘿！还真就换成了，纸张的折痕还都一点没变。

你乃至可以分得清配景里，哪个是 “ 开瓶器 ” 环球金融中心；哪个是 “ 注射器 ” 金茂大厦；哪个是 “ 打蛋器 ” 上海中心大厦，陆家嘴三件套安排的显着白白。不知道的故意第一眼看去，还真以为我们公司搬到浦东了。

除了这些现实中存在的场景，科幻作品中想象的东西，这回豆包也能够天生。

我们让豆包把米罗改造成战锤 40K 风格，结果也是相当的 amazing 啊，固然换了个人种，但是五官还算依稀能看出米罗的影子，要是戴上头盔，真就跟星际兵士一样了。

Prompt: 帮我天生图片：衣服换成战锤40K装甲，手拿激光炮

更告急的是，固然人物的着装和风格变了，但图片前面的桌子，跟配景的墙壁、窗帘、挂画可都是一点没动。

就这个结果，你要不跟别人说，谁知道这到底是 AI 天生还是 PS ，一眼望去是真分不清。

不外，在人物测试中我们还发现，假如你拿AI 天生的图举行修改，结果比用照片还要强上不少。

你比如就说，我们老师成一张屏幕前各位彦祖的日系写真，然后告诉豆包，把彦祖的衬衣换换颜色。

Prompt: 帮我天生图片：衣服颜色换成棕色

你瞅瞅，脸部的细节，头发的细节，乃至背后墙砖上的纹理，远处的电线杆子，都一点没动，说换装就换装，那叫一个干净利落。

固然了，用人像演示还是为了测试它在人脸细节上的把握本领，究竟人脸这玩意，一但天生的不好，就会产生可骇欢乐谷效应，一眼盯真的事。

戴珍珠耳环的少女都见过吧，天下名画，我们让豆包给你把人脸换成猫脸版本，来看看它对跨物种的面部融合做的咋样。

Prompt: 帮我天生图片：把人脸换成猫

结果团体瞅下来，表现还是相当不错。不但保存了头饰、衣服纹理的细节，小猫耳朵这块也处理的很好，没穿模，直接能拿去当微信头像用了。

除了照片人像这些，物品啥的理论上会更轻易，但是我们还得测，比方说汽车。

我们把一张大众 CC 的照片传上去，让它给换成奔驰。

Prompt: 帮我天生图片：车头换成奔驰

结果也还行，前脸一套都改成了奔驰 C260 ，还是现款的，其他的像车身颜色，附近的情况，也都没变。

但遇上了多人物，复杂场景的情况下，豆包又会表现成啥样呢？

就像刘华强买瓜这段，咱本日就把这个换成刘华强买炸鸡和棉花。

结果结果还怪好嘞，瓜贩子衣服上的图案都一模一样，全部的西瓜都改掉了，特聪明。

Prompt: 帮我天生图片：把西瓜换成棉花和炸鸡

尚有一个重点是，假如同时给豆包差别的修改要求，它能不能全部完成。

就比如，西游记里的唐三藏，我想给改成战地版唐三葬，给的提示一句话里有三个指令，同时要完成戴墨镜，拿机枪，换配景，三样使命。

Emmm ，结果还是全部都完成了，结果也可以。墨镜一戴谁也不爱，身处战场手拿机枪，六根清净贫铀弹，一息三千六百转，杀生为护生，斩业非斩人，主打一个物理超度。

综合来看的话，不止照片、视频截图，包罗在制作梗图表情包这一块，豆包都能够手到擒来，即便细节上还能发现可以进步的地方，但话又说返来，不怕人比人，就怕货比货嘛。

就现在来说，比起以前的文生图模型，确实是高的不知道那里去了。

看到这可能有差友就要问了，世超鸽鸽，为啥豆包这次突然就跟换了个妈妈生的一样，比之前聪明确这么多？

该说不说，这内里确实有门道。

这么说吧，我们以前用的文生图模型，根本用的都是 Diffusion 技能，是先把图片一步步变糊，然后反向分析怎么从糊到清晰，从而产生新的图像。

但题目是，在这个过程中，模型天生图像是基于全局信息的，要想局部修改，不好意思，团体全都要重来，以是每次天生的都不一样，也没法在细节上再调解。

我们这两年也测了不少文生图模型，咋说呢，东西是没题目，可以天生，但都没法一模一样的，正确还原出想象中谁人样子，就比如这种：

而那些 AI 艺术家们，搞出来的都是下面这种，细节拉满，跟影戏截图似的。

是不是感觉跟人家用的都不是一个软件？

图源：Mac Baconai ， “Al 的异星 cult 理想之城 ”

可要实现人家这种结果，提示词弄的就得巨复杂，还要微调好久好久，乃至他们还编纂了专门的提示词辞典。大伙要是没训练过这个，现实上就很难做好图，更别说把自己的照片传上去编辑了。

假如能像画画一样，那里不对改那里，渐渐成型就好了。

而豆包这次更新的，正是这个方向。为了实现图片编辑的结果，豆包这次的文生图接纳的是 SeedEdit 模型。

相比只是通过笔墨天生，这玩意更微操，它会把图片的明确和天生融合到一个同一的大模型框架里，从而在天生和编辑图像的时候，可以事无巨细的参考咱传上去的图像，完事儿控制的就相对精准，而且出来的图片也更自然。

打个比方，假如说以前的文生图模型是无情泼墨画匠， SeedEdit 就更像画笔良好，有创造力的画家。现实我们上面用下来，可以说结果确实相当不错。

现实上， SeedEdit 如许的技能，现在行业内也刚开始用，能集成在 AI 助手里的，豆包实在是第一家。

而像 AI 编辑图片这种方向，现在早就已经是是图片编辑行业的标配，各种修图软件、剪辑软件乃至手机相册里都在做。

但是先不说结果，最少现在实在大多数产品都还是要手动涂抹修改，大概自己在上面 P 图，加配饰，不知道大伙怎么以为，我反正每次 P 配景，消除人物，都得花不少功夫。。。

至于 AI 直接出的图嘛，咱上面也说了，跟抽卡似的，很难一次就有抱负的图，还没法再二次修改。

这也就是为啥咱开头就说，由 AI 直接控制的编辑修改图片，会是一个技能突破了。

换句话说，这个技能不仅改变的是 AI 文生图，其他的照片修改、视频剪辑啥的，根本全都能用得到。

到时候，直接跟语音助手说一声给我出图！AI 就帮你往你想的方向调解，美美当甲方，想想都爽。

收藏邀请

上一篇：“算力黄牛”无法一夜暴富下一篇：谷歌又塌房了，但更大的题目还在反面

我有任务需求要发布

专业服务商主动承接

快速解决你的需求

专注IT众包服务

平台只专注IT众包，服务数十万用户，快速解决需求

资金安全

交易资金托管平台，保障资金安全，确认完成再付款

实力商家

优秀软件人才汇集，实力服务商入驻，高效解决需求

全程监管

交易过程中产生纠纷，官方100%介入受理，交易无忧

今日头条

热门资讯

微信访问
手机APP

优

优秀人才汇聚时代

快

及时响应快速匹配

专

专注软件众包服务

保

信息保障隐私保护

新手帮助

平台规则

关于时代

便捷服务

友情链接 : 时代威客网有招网自考365 测试网

微信小程序
新浪微博
手机客户端

关于我们|广告合作|联系我们|隐私条款|免责声明| 时代威客网 ( 闽ICP备20007337号 ) |网站地图

Copyright 2019-2024 www.eravik.com 版权所有 All rights reserved.

VIP特权
客服
扫一扫

微信访问

时代APP
工单
返回