有一说一,前几天就已经立冬了,眼瞅着又快到年底了现在。 搁往年的情况,到了年底这才到各大厂商纷纷发力的时候,年关将近嘛,总得搞出点啥新东西,给各人涨涨眼界。 固然说最近关于 AI 的新消息不是很多,但是人家这段时间肯定也没闲着,这不,一个多月前,也就是 925 那天我们才跟各人说了豆包的视频天生,这两天,豆包又又又上新了新功能。 简单来说,这回豆包支持 “ 一句话编辑修改图片 ” 了。 固然文生图已经搞了两三年,但这回,我敢说真算是国产 AI 文生图里的新突破了。 可能不少差友还以为, AI 生图不是已经挺厉害的了嘛,怎么还不能修改图片? 现实上,我们这几年也测了不少文生图大模型了,支持图片正确修改的还真没有,现在做的最好的真就是豆包。 就比如说 ChatGPT-4o ,你让他画个打篮球的人还可以,但是你要想改动一下,把情况换成沙滩,不好意思,整张图都变了。 不止 OpenAI 的不行,谷歌的 Gemini 也一样。 原来说让它把图中的鸡酿成鳄鱼,结果不仅没酿成,还把配景给全改了,两次的篮球也完全不一样。 拿 AI 自己生的图搞都如许,更别说当地上传的照片了。 就拿最简单的给图像换颜色来说,即使在豆包以前的版本里,这种结果也不抱负。 比如我们直接把 925 运动里,给脖子哥拍的照片传上去,然后告诉豆包,你给我把脖子哥抱着的小白狗换成小黄。 结果就是,整张图都变了,风格大变就算了,构图也不一样。 但是现在,这回用上这个上新了的豆包,同样的照片同样的提示词,你再看看: 固然有一点点小瑕疵,但要跟前面的一比,是不是高下立判! 不但保存了脖子哥的动作,表情,小狗的外形也跟上传的图差不多,说换成黄色就换黄色,一点不暗昧。 再来试试图像消除,结果也不错。 Prompt: 帮我天生图片:消除白色小狗 发现没,这个文生图变得智能了,它能识别出照片里的内容,你想修改啥他就只改啥,那里不对改那里, so eazy! 而且不仅能做到识别,修改颜色,消除物品这些根本功能,你想整点复杂的也一样可以。 比如更换图片的配景。 我们把差评硬件部视频里,米罗的照片传上去,然后叫豆包把我们的拍摄间配景改成上海陆家嘴。 Prompt: 帮我天生图片:配景换成陆家嘴 哎嘿!还真就换成了,纸张的折痕还都一点没变。 你乃至可以分得清配景里,哪个是 “ 开瓶器 ” 环球金融中心;哪个是 “ 注射器 ” 金茂大厦;哪个是 “ 打蛋器 ” 上海中心大厦,陆家嘴三件套安排的显着白白。不知道的故意第一眼看去,还真以为我们公司搬到浦东了。 除了这些现实中存在的场景,科幻作品中想象的东西,这回豆包也能够天生。 我们让豆包把米罗改造成战锤 40K 风格,结果也是相当的 amazing 啊,固然换了个人种,但是五官还算依稀能看出米罗的影子,要是戴上头盔,真就跟星际兵士一样了。 Prompt: 帮我天生图片:衣服换成战锤40K装甲,手拿激光炮 更告急的是,固然人物的着装和风格变了,但图片前面的桌子,跟配景的墙壁、窗帘、挂画可都是一点没动。 就这个结果,你要不跟别人说,谁知道这到底是 AI 天生还是 PS ,一眼望去是真分不清。 不外,在人物测试中我们还发现,假如你拿AI 天生的图举行修改,结果比用照片还要强上不少。 你比如就说,我们老师成一张屏幕前各位彦祖的日系写真,然后告诉豆包,把彦祖的衬衣换换颜色。 Prompt: 帮我天生图片:衣服颜色换成棕色 你瞅瞅,脸部的细节,头发的细节,乃至背后墙砖上的纹理,远处的电线杆子,都一点没动,说换装就换装,那叫一个干净利落。 固然了,用人像演示还是为了测试它在人脸细节上的把握本领,究竟人脸这玩意,一但天生的不好,就会产生可骇欢乐谷效应,一眼盯真的事。 戴珍珠耳环的少女都见过吧,天下名画,我们让豆包给你把人脸换成猫脸版本,来看看它对跨物种的面部融合做的咋样。 Prompt: 帮我天生图片:把人脸换成猫 结果团体瞅下来,表现还是相当不错。不但保存了头饰、衣服纹理的细节,小猫耳朵这块也处理的很好,没穿模,直接能拿去当微信头像用了。 除了照片人像这些,物品啥的理论上会更轻易,但是我们还得测,比方说汽车。 我们把一张大众 CC 的照片传上去,让它给换成奔驰。 Prompt: 帮我天生图片:车头换成奔驰 结果也还行,前脸一套都改成了奔驰 C260 ,还是现款的,其他的像车身颜色,附近的情况,也都没变。 但遇上了多人物,复杂场景的情况下,豆包又会表现成啥样呢? 就像刘华强买瓜这段,咱本日就把这个换成刘华强买炸鸡和棉花。 结果结果还怪好嘞,瓜贩子衣服上的图案都一模一样,全部的西瓜都改掉了,特聪明。 Prompt: 帮我天生图片:把西瓜换成棉花和炸鸡 尚有一个重点是,假如同时给豆包差别的修改要求,它能不能全部完成。 就比如,西游记里的唐三藏,我想给改成战地版唐三葬,给的提示一句话里有三个指令,同时要完成戴墨镜,拿机枪,换配景,三样使命。 Emmm ,结果还是全部都完成了,结果也可以。墨镜一戴谁也不爱,身处战场手拿机枪,六根清净贫铀弹,一息三千六百转,杀生为护生,斩业非斩人,主打一个物理超度。 综合来看的话,不止照片、视频截图,包罗在制作梗图表情包这一块,豆包都能够手到擒来,即便细节上还能发现可以进步的地方,但话又说返来,不怕人比人,就怕货比货嘛。 就现在来说,比起以前的文生图模型,确实是高的不知道那里去了。 看到这可能有差友就要问了,世超鸽鸽,为啥豆包这次突然就跟换了个妈妈生的一样,比之前聪明确这么多? 该说不说,这内里确实有门道。 这么说吧,我们以前用的文生图模型,根本用的都是 Diffusion 技能,是先把图片一步步变糊,然后反向分析怎么从糊到清晰,从而产生新的图像。 但题目是,在这个过程中,模型天生图像是基于全局信息的,要想局部修改,不好意思,团体全都要重来,以是每次天生的都不一样,也没法在细节上再调解。 我们这两年也测了不少文生图模型,咋说呢,东西是没题目,可以天生,但都没法一模一样的,正确还原出想象中谁人样子,就比如这种: 而那些 AI 艺术家们,搞出来的都是下面这种,细节拉满,跟影戏截图似的。 是不是感觉跟人家用的都不是一个软件? 图源:Mac Baconai , “Al 的异星 cult 理想之城 ” 可要实现人家这种结果,提示词弄的就得巨复杂,还要微调好久好久,乃至他们还编纂了专门的提示词辞典。大伙要是没训练过这个,现实上就很难做好图,更别说把自己的照片传上去编辑了。 假如能像画画一样,那里不对改那里,渐渐成型就好了。 而豆包这次更新的,正是这个方向。为了实现图片编辑的结果,豆包这次的文生图接纳的是 SeedEdit 模型。 相比只是通过笔墨天生,这玩意更微操,它会把图片的明确和天生融合到一个同一的大模型框架里,从而在天生和编辑图像的时候,可以事无巨细的参考咱传上去的图像,完事儿控制的就相对精准,而且出来的图片也更自然。 打个比方,假如说以前的文生图模型是无情泼墨画匠, SeedEdit 就更像画笔良好,有创造力的画家。现实我们上面用下来,可以说结果确实相当不错。 现实上, SeedEdit 如许的技能,现在行业内也刚开始用,能集成在 AI 助手里的,豆包实在是第一家。 而像 AI 编辑图片这种方向,现在早就已经是是图片编辑行业的标配,各种修图软件、剪辑软件乃至手机相册里都在做。 但是先不说结果,最少现在实在大多数产品都还是要手动涂抹修改,大概自己在上面 P 图,加配饰,不知道大伙怎么以为,我反正每次 P 配景,消除人物,都得花不少功夫。。。 至于 AI 直接出的图嘛,咱上面也说了,跟抽卡似的,很难一次就有抱负的图,还没法再二次修改。 这也就是为啥咱开头就说,由 AI 直接控制的编辑修改图片,会是一个技能突破了。 换句话说,这个技能不仅改变的是 AI 文生图,其他的照片修改、视频剪辑啥的,根本全都能用得到。 到时候,直接跟语音助手说一声给我出图!AI 就帮你往你想的方向调解,美美当甲方,想想都爽。 |

专注IT众包服务
平台只专注IT众包,服务数 十万用户,快速解决需求

资金安全
交易资金托管平台,保障资 金安全,确认完成再付款

实力商家
优秀软件人才汇集,实力服务商入驻,高效解决需求

全程监管
交易过程中产生纠纷,官方100%介入受理,交易无忧

微信访问
手机APP
关于我们|广告合作|联系我们|隐私条款|免责声明| 时代威客网
( 闽ICP备20007337号 ) |网站地图
Copyright 2019-2024 www.eravik.com 版权所有 All rights reserved.


