XuLaLa.Tech

首页客户端下载Windows 使用V2Ray 教程SSR 教程Clash 教程

Midjourney新版本太炸了:AI绘画再无BUG,“图为真”时代彻底结束

2024.06.24

哈喽大家好我是站长,美区火箭apple ID 土耳其apple ID 其他apple ID 账号资源,可加微信: 咨询 公众号:Ai

进化后的AI绘图工具,创造了一个平行世界。

文本 | Juny 编辑 | 肖薇

过去几个月,以 ChatGPT 为首的聊天机器人在科技界掀起了一阵风暴。大家都在忙着和 AI 聊天,让它们写邮件、写代码、写诗。在语言模型飞速进化的同时,AIGC 的另一个重要分支——绘画,最近也忙得不可开交。

去年 AI 生成图像的火爆程度堪比 OpenAI,Midjourney V4 在去年底几乎和 ChatGPT 同期推出,而就在上周 GPT-4 推出时,Midjourney 也火速推出了第五代版本,而这一次的更新堪称“爆款”。

过去一周,Midjourney 生成的各种令人惊艳的图片层出不穷,包括中国国家足球队夺冠、特朗普种稻、教皇当 DJ、外星人下乡……只要你敢想,AI 都能画出来,而且任何一张都可以逼真到与实物难分伯仲。不过,部分生成的假照片可能过于真实,引发过多争议,大量新用户涌入,导致服务器超负荷。周二,Midjourney 宣布将关闭其免费账户的访问权限。

不过另一方面,在人们疯狂享受的同时,也有人在尝试将ChatGPT与Midjourney结合起来,一些由人类构想、由AI主导和操作的“人机协作”作品正逐渐显露出商业应用的轮廓。

|当图片进化成照片:一个由AI创造的平行世界诞生

你有没有想象过这样的事情:

不久前结束的卡塔尔世界杯上,整个绿色的球场变成了一片红色的海洋,大家欢呼雀跃,全场观众掌声雷动。

图片来自小红书博主,账号:艾队长

爱因斯坦没有出现在实验室,而是留着他标志性的发型,出席音乐节聚会。

图片来自Twitter

马斯克并没有去21世纪制造火箭和电动汽车,而是穿越到苏联的一家工厂,真正成为了一名“钢铁侠”(工人)。

图片来自Twitter

您对于这样的世界有什么看法?

上述这些极其真实的照片并非是花大量时间用Photoshop制作出来的,而是普通人只需动动手指,输入几个关键词,就能在十几秒内由人工智能自动生成的。

这个如此真实的世界背后的驱动力是一款名为 Midjourney 的 AI 生成图像工具。可以说,在 AIGC 制图领域,MidJourney 比 OpenAI 还要厉害。Midjourney 是一家自筹资金的独立研究实验室,没有任何重大资金支持,其创始人是 Leap Motion 创始人 David Holz,曾两次拒绝苹果的收购。目前,全职员工只有 11 人。

但就是这样一个规模较小的团队,却是当前AI图形领域最炙手可热的明星,甚至把OpenAI的DALL-E、Stable Diffusion,以及Nvidia的GauGAN2等同类工具都抛在身后。

|更新速度堪比GPT,惊喜与争议接踵而至

Midjourney 的迭代速度甚至比 OpenAI 还要快,去年 3 月上线第一个版本,4 月迅速更新第二个版本,随后 7 月上线 Open Beta V3 版本,首次向公众开放,凭借独特的艺术风格吸引了一部分用户,其中最受欢迎的是这幅油画,是普通人给出提示后,由 AI 创作,与人类艺术家比赛,并获得金牌。

在这之后,Midjourney 就没有停止更新,11 月份推出了第四代版本,画面风格更加丰富,随后今年 3 月份,Midjourney V5 正式发布,V5 更新之所以受到广泛关注,主要是因为它解决了一个技术难题,实现了一次飞跃。

其中,技术难度指的是画家的难度。

让AI绘制出逼真的人类手部特征,是一个看似简单却出奇复杂的任务。首先,在AI训练集中,手部往往不是画面的焦点。同时,人们的手部在握手、握手、鼓掌等动作时形状各异,难以形成标准化模板,这导致AI学习难度激增。

此外,即便对于传统的人体画家来说,画手也是最难的部分之一。手的几何形状复杂,没有标准的线条或形状,关节上的皱纹和褶皱、手掌上的阴影等细节非常多。而且每个人的手都是不同的,独一无二,无法套用。

因此,如何正确细致地画出手部,是所有AI工具面临的一个难题,在Midjourney V5之前,业界的AI绘画工具都无法取得好成绩。

Midjourney(左)、Stable Diffusion(右上)和DALL-E 2(右下)之前生成过奇怪的人手,图片来自buzzfeednews

但现在,Midjourney V5已经完美解决了这个问题。

图片来自Twitter

它不仅告别六指或畸形,还可以根据人物特点绘制不同状态、年龄的手部细节,甚至光影中的指纹也能完美呈现。

图片来自mpost

除了攻克画师的技术难题之外,Midjourney V5的另一大突破就是可以生成照片品质的图片,而且是摄影大师拍出的照片级别。

在 V5 之前,Midjourney 生成的图像主要以卡通或超现实风格为主,但 V5 可以支持的风格更加广泛包括写实、抽象、油画等,图像分辨率也比上一版本提升了 2 倍。此次写实风格的推出,可以说直接让不少摄影爱好者感叹“摄影不再存在”。

比如“90年代街头模特”这一主题,就完美地创造出了真假难辨的照片。

图片来自推特,账号 Nick St. Pierre

以“你好,小朋友”为主题,用电影的质感重现童年时光。

图片来自小红书博主,账号:豆比

以“飓风新闻报道”为主题,凭空制造灾难场景等等。

图片来自Twitter

从以上照片范例可以看出,Midjourney 的写实图像生成并不局限于固定的风格,而是会根据你所描述的场景和想要的风格,智能地调整色调、像素、镜头语言等。近期,Midjourney 制作的很多图片甚至已经达到了人眼无法辨别真伪的程度。

从技术层面看,Midjourney 的进步无疑是惊人的,令人钦佩。但或许是因为这些照片太过真实,加上太多新用户蜂拥而至,Midjourney 周二宣布将关闭免费账户访问权限。分析人士认为,此举也是为了防止更多离谱的“照片”出现,从而扰乱现实世界,传播有害信息。

例如,部分媒体将生成的特朗普被捕图片误认为是真实图片,导致虚假新闻的出现和发酵。此外,Midjourney 目前的关键词审核机制并不严格,因此也存在生成大量有害照片的风险。Midjourney 表示,他们正在进一步加强对 AI 生成内容的监管和审查。

图片来自 The Verge

|ChatGPT+Midjourney联手,助力AI作品商业化

目前MidJourney还是需要和Discord配合使用,使用方法还是很简单的,只需要输入文字和一些参数要求来描述即可。目前还支持用户自己上传图片,然后AI根据图片来生成。

目前,完整的 Midjourney“咒语”的示例可能如下所示:

穿着具有赛博朋克细节的未来派盔甲的男人(您想要呈现的图像的文字描述,您可以添加更多细节),使用佳能 R6 和 50mm f1.2 拍摄(风格描述,您可以提到使用什么设备拍摄的,或者著名艺术家或摄影师的风格),–v 5(使用第五代版本技术)–ar 4:6(帧比,在 V5 版本中您可以自定义任何比例)–iw 1(输入参考图的权重比)

虽然咒语并不复杂,但对于很多只有模糊概念的普通用户来说,让 Midjourney 画出自己脑海中的图像还是有些困难。于是 ChatGPT 也应运而生。

ChatGPT 是做什么的呢?首先,你可以模糊地描述你的想法,让 ChatGPT 将其扩展为详细的图片描述,然后让它从这个文本描述中提取关键词。然后,你可以告诉 ChatGPT Midjourney 提示句的语法结构,经过几次训练后,让 Midjounery 记住如何通过你输入的关键词来创建 Midjourney 的命令语法。

之后你只需要把ChatGPT给出的指令复制粘贴到Midjourney的命令框中就可以生成图片了,如果不满意的话可以让ChatGPT继续帮你修改完善关键词。

目前已经有很多人尝试将ChatGPT与Midjourney结合的成果运用到自己的工作中,比如电商企业不再需要花大价钱去寻找摄影师、设计师,而只需要将商品图片和关键词提供给AI工具,就能直接生成商业大片。

图片来自小红书博主,账号:阿堂娇娇、阿太ATAI动视

将来我们甚至不需要寻找真实的模型,只需使用人工智能来生成它们。

有些人还将其运用到室内家居设计领域,帮助自己建立网站、生成宣传图片等。

可以预见的是,ChatGPT与Midjourney的合作或许只是AI商业应用的开始,随着AI技术的飞速发展,各类工具的出现将使AI应用范围成倍扩大,目前在设计、电商、广告、游戏、影视等各个领域都出现了更多的用例,在娱乐性大幅提升的同时,一条新的机会赛道也正在被打开。

最后我们来做个无奖猜谜游戏,你觉得下面两张烤鸡的照片哪一张是真相机拍的呢?

如果你认为是上面的,请在评论区留下1,如果你认为是下面的,请留下2。欢迎大家参与!

注:封面图片来自博主AI队长,版权归原作者所有,如不同意使用请尽快联系我们,我们将立即删除。

哈喽大家好我是站长,美区火箭apple ID 土耳其apple ID 其他apple ID 账号资源,可加微信: 咨询 可扫码下方关注公众号获取账号教程资源

© 2010-2022 XuLaLa 保留所有权利 本站由 WordPress 强力驱动
请求次数:69 次,加载用时:0.665 秒,内存占用:32.19 MB