丁香成人网
GPT4o 的多模态生图前天上线之后。
经过两天的发酵,含金量还在不休栽植。
在我的群里,也曾能看到越来越多的,插足到骨子坐褥设施的例子。
比如 @银海的径直作念商品图的翻译和合成,这是原来的算法,很难作念的成果,可是目下,有手就行。
特别复杂的电商过程,一张原始图,换产品换脸换穿戴。
比如 @歸藏的径直把 UI 图放样机内部的例子,如果作念过 UI 或者产品狡计的一又友详情齐知说念,以前咱们在作念作念展示,或者作念讲演的时候,陆续作念样机作念的挺悲凉的。
比如给他头像,画的两套样式包,是不错径直上架到微信样式商店的那种。
来自狡计大佬 @付遥,用 GPT-4o 来径直作念之前特别流行的 3D 品牌海报。
比如我一个很可爱的小红书 AI 博主 @Rico 有三猫,用 GPT-4o 给她作念小红书封面。
也用 GPT-4o 径直作念商品图翻译出海。
群友 @默月佥在用 GPT-4o 出蜜蜂的剖解科普图。
一个很专科的公众号 AI 博主 @阿真 lrene,不仅用 GPT-4o 生成复杂的漫画,还能抠图,一键直出透明通说念的 PNG 图。
干死多样抠图软件的不是更过劲的抠图软件,而是大模子。。。
还有一又友 @不著明网友虎子哥,用 GPT-4o 给他我方家的屋子装修。。。
还有一些我照实不知说念泉源的可是被传播的蛮广的例子(如有作家,宽待挑剔区认领)。
给几个产品作念一个展示图,这个场景在电商规模无敌。
之前我写可灵的 AI 模特的时候,许多东说念主问,能不可让模特带首饰?目下,不错了。
还用它,径直 P 图,遗弃东说念主物。
老像片一键设置 + 上色。
以致,还不错师法字体作念自体狡计。
在 GPT-4o 的冲击下,N 多的狡计师和创业者,齐有点 emo 了。
比如就有大佬在 X 上惊奇说念:
一又友圈里还看到了一张图,是 glif 的雇主,在 X 上发的。
记念 ComfyUI,记念一切的 AI 图像责任流。
OpenAI 的一次更新,又屠杀了一堆公司。
又一次真切的叙述了那句《三体》中的经典台词:丁香成人网
我消除你,与你无关。
GPT-4o 的冲击虽然是有,可是,他的上限在哪?能作念到什么地步?真实能透彻替代 ComfyUI 的 AI 图像责任流吗?
我思弄明晰这个谜底。
最初我以为我如故要跟各人特别浅易的用一两句话讲明一下 ComfyUI,让各人知说念这玩意是个啥,咱们才好连续往下聊。
ComfyUI 是一个特别专科的责任流器具,不局限于 AI 画图,AI 视频啥的也齐不错往内部接。他的界面大约是这么的,很像电路板。
这个即是在 Liblib 上搭的 ComfyUI 责任流。
它是以节点方式,把各个器具、各个模子给串起来,酿成一整套的责任流,比如一张图进去,经过多样节点和插件,输出一个绝对格调不同的 AI 视频,这齐是 OK 的。
坦率的讲,我不是 ComfyUI 的巨匠的,作念过的责任流也未几,我以为在这个规模,我并莫得那么强的发言权,是以。
我去请问了一下我的 1 个好一又友,AI 画图大神 @真金不怕火丹师忠忠。
我思听听,他的看法。
最初是,GPT-4o 对电商狡计的冲击到底有多大?
我跟忠忠聊了很久。
临了获得的论断,跟我我方在狡计行业里感受到的水温差未几。
关于鄙俚水平的电商狡计师,详情是有打击的,他们原有的妙技水平也就只可产出跟 gpt4o 差未几的图,相对来说意旨不大了。
上游的运营专员不错我方操作器具来坐褥同样质料的图。跟被冲击的插画师类似,可能会变为襄助修补 gpt4o 产出的图的 bug,还有叠加原图部分细节上去加强细节回答(类似于上下频设置过程)。
坐褥资本缩短后,需求量会变大,正本用不起多样丽都配景图包装的商家,目下也用的起了。
从成果上极简操作就能生图的器具有好意思图狡计室等一堆器具,GPT4o 仅仅在某些成果方面更进一步汉典,关于专科级的骨子生意坐褥的影响可能莫得那么大。
而从视觉狡计角度,对现存的通盘开源生态,反而是利好作用。
忠忠举了我方狡计的公司 IP 的例子。
目下,不错一句话把 IP 的 3D 模子,直出到品牌海报上,不需要走以前的 3D 建模 + 渲染了,大大从简了时候。
三级片网站同期,更道理的极少是,GPT-4o 不错凭据一张 IP 草图,来生成这个 IP 的各角度视图。
而这些图,会进一步推进 flux 等开源模子的微调版块的成果。
你可能会问,齐有 GPT-4o 了,为什么还要去微调 flux,在 ComfyUI 搭责任流用呢?这不是脱裤子放屁冠上加冠呢?
其实有两个原因。
数据阴私性和精确性。
数据阴私很好讲明,即是 GPT-4o 是一个闭源的模子,背面最多最多也即是通达一个 API,让各人接到 ComfyUI 内部去用,可是,就 OpenAI 这个尿性,咱们给昔时的东西,大约率就成他后续的历练素材了。
举个例子,《流浪地球 3》2027 年上映,如果目下好意思术组把中枢成见图或者设定图径直灌给 GPT-4o 作念一些处理,到时候,《流浪地球 3》电影还没上映,设定图你不错径直在 GPT-5o 内部让它画出来,这特么就炸了。。。
是以,数据阴私性至关紧要,在真实的坐褥环境里,至极是一些大厂里,必须只可用土产货的 ComfyUI 搭,真实的输出,必须是土产货环境,用开源的模子。
是以,这个时候,咱们就不错用一些不敏锐的信息,扔给 GPT-4o,来接济生成数据集,反过来微调我方的 flux 模子,这个点,真实很灵验。
精确性其实也很浅易,咱们回过甚来看忠忠用 GPT-4o 输出的我方家 IP 的海报。
先不说其他的细节了,这几处,你是能发现一些彰着的 BUG 的。
这其着实坐褥环境里,这种 BUG 是品牌方以为不可能袭取的,就思你给一个手机产品作念告白,你把东说念主手机弄变形了,你跟东说念主说不行 AI 出得即是这么的,你看对面会不会把你挂在电电扇上转着打。
而这个时候,用 Flux 特意微调的 Lora,是不错无缺的治理这种精确性和一致性的问题的。
这其实即是鄙俚狡计场景和专科狡计场景的区别。
GPT-4o 虽然不错替代大部分的鄙俚责任流,会让 ComfyUI 里一多数的责任流失去价值,可是这就不代表,ComfyUI 失去价值了。
很浅易的极少是,在专科的狡计责任里,纯对话式的浅易界面餍足不了复杂专科的需求的。
就像你问一个专科狡计师,为什么狡计是用 PS 作念狡计,而无须好意思图秀秀来作念狡计,对方只会把你当痴人。
在真实的专科的 AI 狡计责任里,可控性,许多时候特别的紧要。
需要精确的法例重绘区域,需要精确的调度格调成果,出图尺寸比例等,是以在专科坐褥中需要精确调度的细节,不可指望 OpenAI 全作念成效用。
还有前后处理过程,比如说前置的剪辑,抠图,语义识别,后置的比如对图片的放大,贴回原图细节(上下频设置),再接入其他责任流连续处理等。
自动化一键完成的效率要比多轮对话高许多。
包括在一些精确度条目高的产品和场景上,GPT-4o 目下还够不上专科级的水准。
看个例子。
比如咱们要把问界 M9 这款车,换到另一个场景里。车这种产品,跟笔、适度、香水等等条目的考究度,绝对不同样。
这是 GPT-4o 出的图。
而如果咱们用大佬的过劲责任流呢?
生成出来的成果在举座比例和质感上,是更好的。
对比应该特别直不雅了。
这里我要给我方叠个甲,我并不是在这里饱读舞,GPT-4o 不行,ComfyUI 的成果不错吊打 GPT-4o。
如果是这么的话,我也不会连更两篇,来给各人看一看,GPT-4o,有多酷,有多强。
我思说的是,GPT-4o,跟当年的 SD、Midjorney、Runway、可灵等等 AI 器具是同样的。
会无辞别替代通盘这个行业内部的低级扩充职位。
屠杀通盘也曾在工程层面临大模子进行的一些优化。
然后,极少极少侵蚀更表层的建筑。
它更像是一层层倾盆飞腾的潮流,将通盘 AI 图像规模原有的规模打得一鳞半瓜。
齐说作念 AI 产品,要看到大模子的规模,在规模除外的安全地带作念。
可是目下,你根柢不知说念规模在何方。
那些看似高耸的期间壁垒与责任过程,如果仅仅基于浅易拼装或者低级扩充的逻辑,正在被 GPT-4o 以近乎暴力的方式消解。
绝大多数机械式的制作责任,一朝被浩大的多模态结实与生成替代,就会像那些轰然倒塌的围墙同样,被历史的风尘毛糙掩饰。
有莫得一种第一次工业改变时候,机器代替手工服务的即视感?
历史老是在不休的近似。
可一如上文所言,这毫不代表 ComfyUI 之流就会被绝对淘汰。
在工业级、专科级的深度责任流里,东说念主们对数据安全、狡计精度、可控度的需求不可能编造隐匿。
那种图像与视频的屡次处理、分层输出、版块管束、剧本化批量运行、自动化节点衔尾,惟有是大型企业或中枢团队,齐会很堤防。
GPT-4o 会在 C 端和中小 B 端市集里摧枯拉腐,取代了多量低端或者近似性责任。
而 ComfyUI、Flux、ControlNet 等开源生态则在更专科的规模连续进化,专揽它们考究、可控、可离线部署的特点,为高端客户或秘要形状提供服务。
这威望就像云表办公与土产货办公的联系同样,前者无穷方便,后者安全可控。
也如同家用轿车与顶级跑车的划分,各自指标用户并不突破。
GPT-4o 也一定会不休进化,去扩大我方的规模蚕食更多的场景。
开源生态也会有多样不错复刻成果的模子、产品出来,从而进行独到化。
没什么能够阻隔波澜上前。
要么成为波澜的奴隶者,要么成为波澜的推手。
这二者,齐详情比作念一块千里在海底的礁石,要精彩得多。
你说是吗。
着手:微信公众号:数字生命卡兹克丁香成人网