当前位置:趣投网 > 科技资讯 > 正文

企鹅肉 用企鹅做出的炸鸡什么样?“毕加索”给出了答案

导语:由“企鹅”组成的“炸鸡”长什么样?“长颈鹿”做的“鸡”是什么鬼...长脖子的鸡?你可能觉得这个不存在的东西太荒谬了,很难用你自己的想象来描述,但是最近,AI可以画这些东西。比如你给的设定,由“大象”组成的“鸡”,一般人还是鸡头应该排在哪里。这个最新的AI已经完成了,一口气画了几十张图:我不禁想到了一句“理解,

由“企鹅”组成的“炸鸡”长什么样?“长颈鹿”做的“鸡”是什么鬼...长脖子的鸡?

你可能觉得这个不存在的东西太荒谬了,很难用你自己的想象来描述,但是最近,

AI可以画这些东西。

比如你给的设定,由“大象”组成的“鸡”,一般人还是鸡头应该排在哪里。这个最新的AI已经完成了,一口气画了几十张图:

我不禁想到了一句“理解,鼓掌”。

没错,OpenAI又在工作了。今天AI里的新毕加索就是他们最近培训的图像生成器Dall E。

狂丸之前没有推出过会画画的AI,但是DALL E有点特别。在一定的框架下,它可以根据人类的文字给出图片,不管这种描述多么让人迷失方向。

如果让你画一张“一个穿着芭蕾舞裙遛狗的小小白菜”的照片,你可能会看起来很傻,但达尔·E直截了当地说:

把主角换成皮卡丘没关系,每个狗都不一样:

所以这好像是一个可以利用文字描述生成图像的AI。人的教导就像完成空题。有一些可选选项。模式类似:画一个“xxx”的“xxx”。例如,在下图中,选择“绿色”并获得一个绿色表格。

所以不同的关键词组成了奇怪的东西。虽然有一点点沙雕,但其实这个AI在绘画方面功能更全面。

DALL E能“画”出什么?

比较的依据是“控制属性”。我们刚才介绍了,比如“立方体”的“老虎”,由两个简单的关键词组成的一组单词,然后生成一个图片:

“圆环体”的“水”很美:

您还可以“绘制多个对象”,包括它们的空关系,如下图所示:

一个小的“红色”广场矗立在一个大的“绿色”广场上。

这时候AI不仅要正确组合短语,还要形成正确的联想,避免混淆。下图为“一只绿象坐在一只红老鼠上”,可以感受到AI的抽象画:

此外,还可以根据“图片视角”生成图片。

比如《美洲狮》《坐月山》的“鸟瞰”,当然也可以选择平视或特写等多个视角选项:

根据“画面风格”的变化,《狐狸》和《坐在森林里》的“3D渲染”:

类似的关键字也可以更改为前几年流行的低多边形样式,或者可以更改为像素样式:

还可以生成一个“横断面图”,让AI切割成碎片:

还有很多其他的功能,比如“推理背景细节”,给AI一个大致的方向来补充画面。

就像“一幅水豚早上坐在森林里的画”一样,AI会根据关键词来推断光线的需求,进而生成不同风格的“画”的结果。效果真的很艺术:

而我最喜欢的是“融合不相关的概念”。

一般来说,我们结合一个词来描述真实的东西,比如木桌。但有趣的是,DALL E可以“强行”缝合不同概念的物体,创造出新的东西。比如设置一个由“蜗牛”组成的“汉堡”,然后有一个汉堡蜗牛:

感觉是类似的生成方法,非常适合设计。下图中的关键词是“冰川”和“形态”的“茶壶”:

再进一步,还可以做“脑洞插画”、“皮卡丘”、“穿西装”、“擤鼻涕”:

“动物间的嵌合体”、“鸡”组成的“长颈鹿”;

还有在神话难以想象的“猫和龙”。在AI眼里,原来是这样的:

DALL-E,什么事?

如果你还记得去年的GTP 3,你可以更简单地理解DALL E。是的,GTP-3是一个人工智能,它可以通过给出一些单词或句子来自己写张文。

这次DALL E也有类似的功能,只是变成了文字的图片。

它的本质和GPT-3一样,也是一个变压器语言模型。在GTP 3中,变形者从“文本到文本”,这个DALL E更进一步,变成了“文本到图片”。

是不是很神奇?那么,这个AI是如何工作的呢?根据DALL E的创作者OpenAI的说法,实现这个DALL E有两个关键核心,第一个是接收数据流进行训练。DALL E将接收由图像和文本组成的数据流。在模型训练之前,需要对数据进行预处理。接收一次后,将使用1280个标签,其中256个标签用于文本,1024个标签用于图像。

然后,对这些数据进行自回归建模。这时,DALL E使用了一种“自我注意层”及其“注意面具”。

如何理解这个概念?你可以回忆一下,当你用心观察一件事情的时候,你是否忽略了身边的事情?那时候,你的注意力都集中在那东西上了?

是的,AI中有一个类似的概念:注意机制。简单来说就是用算法,让AI有选择地观察不同的外部需求,找出最有用的点。不同算法得出的不同结果,类似于我们对同一件事的不同关注,就像诗里说的“望岭而进峰”。

关于“自我注意”,和注意只有一个字的区别,是后者的变体。两者的区别在于,“自我关注”减少了对外部信息的依赖,而在最初的“关注”分析中,更注重数据流中每个标记的相关性分析。

在这个DALL E里,有64个这样不同的注意力面具。

正是有了足够的关注和分析角度,训练中同一输入的每个图像标记都可以与文本标记强关联或弱关联。

其次,DALL E还有一个核心:看他画得好不好。

如果你让他画,他其实会先画512幅,但AI会自己考虑后再把结果输出给你。

这个用的是CLIP网络,这是一个评测系统,它给自己的作品打分,然后按照高低的顺序排列,排名靠前的就会输出给你。

DALL E画的沙雕

了解前因后果,下一步就是整段时间。

虽然DALL E推给你的作品都是精挑细选的,但还是有很多鬼畜他妈的给鬼畜开门的作品。

例如,“地球的横截面”就像《我的世界》的一个正方形,或者像一块火腿。

狮子看完森林里美洲狮的黏土动画想离开森林;

我这辈子坐过上千次厕所,但第一次看到“粉色”和“六角形”的厕所:

同时,这样的厕所,一秒钟就画一堆。

我们从未见过“圆形”“西瓜”,但DALL E给出的答案似乎有些道理:

而这个“四面体”“斑马”让我彻底笑翻了。

看完自然,打电话给行家。

还有长颈鹿做的鱿鱼:

下图是鳄鱼、羊驼、企鹅、鲸鱼、鱿鱼,哪个最可爱?

企鹅做的黄瓜:

企鹅炸鸡...这是炸鸡还是炸企鹅?

但是,不管哪一个,都很可爱,而且好像很好吃。

最后推荐DALL E最不可思议的画作《企鹅与肉饼》。真实——“笑死,企业鹅”。

免责申明:以上内容属作者个人观点,版权归原作者所有,不代表趣投网立场!登载此文只为提供信息参考,并不用于任何商业目的。如有侵权或内容不符,请联系我们处理,谢谢合作!
当前文章地址:https://www.qthbsb.com/keji/642696.html 感谢你把文章分享给有需要的朋友!
上一篇:无线宝 会赚京豆的WiFi 6路由器!Redmi AX5京东云无线宝上架:269元 下一篇: 雄忻高铁 国家发改委正式批复雄忻高铁:投资572.4亿元、时速350公里