企鹅肉用企鹅做出的炸鸡什么样？“毕加索”给出了答案

科技资讯认证作者

2021-03-20 09:05:00

导语：由“企鹅”组成的“炸鸡”长什么样？“长颈鹿”做的“鸡”是什么鬼...长脖子的鸡？你可能觉得这个不存在的东西太荒谬了，很难用你自己的想象来描述，但是最近，AI可以画这些东西。比如你给的设定，由“大象”组成的“鸡”，一般人还是鸡头应该排在哪里。这个最新的AI已经完成了，一口气画了几十张图:我不禁想到了一句“理解，

由“企鹅”组成的“炸鸡”长什么样？“长颈鹿”做的“鸡”是什么鬼...长脖子的鸡？

你可能觉得这个不存在的东西太荒谬了，很难用你自己的想象来描述，但是最近，

AI可以画这些东西。

比如你给的设定，由“大象”组成的“鸡”，一般人还是鸡头应该排在哪里。这个最新的AI已经完成了，一口气画了几十张图:

我不禁想到了一句“理解，鼓掌”。

没错，OpenAI又在工作了。今天AI里的新毕加索就是他们最近培训的图像生成器Dall E。

狂丸之前没有推出过会画画的AI，但是DALL E有点特别。在一定的框架下，它可以根据人类的文字给出图片，不管这种描述多么让人迷失方向。

如果让你画一张“一个穿着芭蕾舞裙遛狗的小小白菜”的照片，你可能会看起来很傻，但达尔·E直截了当地说:

把主角换成皮卡丘没关系，每个狗都不一样:

所以这好像是一个可以利用文字描述生成图像的AI。人的教导就像完成空题。有一些可选选项。模式类似:画一个“xxx”的“xxx”。例如，在下图中，选择“绿色”并获得一个绿色表格。

所以不同的关键词组成了奇怪的东西。虽然有一点点沙雕，但其实这个AI在绘画方面功能更全面。

DALL E能“画”出什么？

比较的依据是“控制属性”。我们刚才介绍了，比如“立方体”的“老虎”，由两个简单的关键词组成的一组单词，然后生成一个图片:

“圆环体”的“水”很美:

您还可以“绘制多个对象”，包括它们的空关系，如下图所示:

一个小的“红色”广场矗立在一个大的“绿色”广场上。

这时候AI不仅要正确组合短语，还要形成正确的联想，避免混淆。下图为“一只绿象坐在一只红老鼠上”，可以感受到AI的抽象画:

此外，还可以根据“图片视角”生成图片。

比如《美洲狮》《坐月山》的“鸟瞰”，当然也可以选择平视或特写等多个视角选项:

根据“画面风格”的变化，《狐狸》和《坐在森林里》的“3D渲染”:

类似的关键字也可以更改为前几年流行的低多边形样式，或者可以更改为像素样式:

还可以生成一个“横断面图”，让AI切割成碎片:

还有很多其他的功能，比如“推理背景细节”，给AI一个大致的方向来补充画面。

就像“一幅水豚早上坐在森林里的画”一样，AI会根据关键词来推断光线的需求，进而生成不同风格的“画”的结果。效果真的很艺术:

而我最喜欢的是“融合不相关的概念”。

一般来说，我们结合一个词来描述真实的东西，比如木桌。但有趣的是，DALL E可以“强行”缝合不同概念的物体，创造出新的东西。比如设置一个由“蜗牛”组成的“汉堡”，然后有一个汉堡蜗牛:

感觉是类似的生成方法，非常适合设计。下图中的关键词是“冰川”和“形态”的“茶壶”:

再进一步，还可以做“脑洞插画”、“皮卡丘”、“穿西装”、“擤鼻涕”:

“动物间的嵌合体”、“鸡”组成的“长颈鹿”；

还有在神话难以想象的“猫和龙”。在AI眼里，原来是这样的:

DALL-E，什么事？

如果你还记得去年的GTP 3，你可以更简单地理解DALL E。是的，GTP-3是一个人工智能，它可以通过给出一些单词或句子来自己写张文。

这次DALL E也有类似的功能，只是变成了文字的图片。

它的本质和GPT-3一样，也是一个变压器语言模型。在GTP 3中，变形者从“文本到文本”，这个DALL E更进一步，变成了“文本到图片”。

是不是很神奇？那么，这个AI是如何工作的呢？根据DALL E的创作者OpenAI的说法，实现这个DALL E有两个关键核心，第一个是接收数据流进行训练。DALL E将接收由图像和文本组成的数据流。在模型训练之前，需要对数据进行预处理。接收一次后，将使用1280个标签，其中256个标签用于文本，1024个标签用于图像。

然后，对这些数据进行自回归建模。这时，DALL E使用了一种“自我注意层”及其“注意面具”。

如何理解这个概念？你可以回忆一下，当你用心观察一件事情的时候，你是否忽略了身边的事情？那时候，你的注意力都集中在那东西上了？

是的，AI中有一个类似的概念:注意机制。简单来说就是用算法，让AI有选择地观察不同的外部需求，找出最有用的点。不同算法得出的不同结果，类似于我们对同一件事的不同关注，就像诗里说的“望岭而进峰”。

关于“自我注意”，和注意只有一个字的区别，是后者的变体。两者的区别在于，“自我关注”减少了对外部信息的依赖，而在最初的“关注”分析中，更注重数据流中每个标记的相关性分析。

在这个DALL E里，有64个这样不同的注意力面具。

正是有了足够的关注和分析角度，训练中同一输入的每个图像标记都可以与文本标记强关联或弱关联。

其次，DALL E还有一个核心:看他画得好不好。

如果你让他画，他其实会先画512幅，但AI会自己考虑后再把结果输出给你。

这个用的是CLIP网络，这是一个评测系统，它给自己的作品打分，然后按照高低的顺序排列，排名靠前的就会输出给你。

DALL E画的沙雕

了解前因后果，下一步就是整段时间。

虽然DALL E推给你的作品都是精挑细选的，但还是有很多鬼畜他妈的给鬼畜开门的作品。

例如，“地球的横截面”就像《我的世界》的一个正方形，或者像一块火腿。

狮子看完森林里美洲狮的黏土动画想离开森林；

我这辈子坐过上千次厕所，但第一次看到“粉色”和“六角形”的厕所:

同时，这样的厕所，一秒钟就画一堆。

我们从未见过“圆形”“西瓜”，但DALL E给出的答案似乎有些道理:

而这个“四面体”“斑马”让我彻底笑翻了。

看完自然，打电话给行家。

还有长颈鹿做的鱿鱼:

下图是鳄鱼、羊驼、企鹅、鲸鱼、鱿鱼，哪个最可爱？

企鹅做的黄瓜:

企鹅炸鸡...这是炸鸡还是炸企鹅？

但是，不管哪一个，都很可爱，而且好像很好吃。

最后推荐DALL E最不可思议的画作《企鹅与肉饼》。真实——“笑死，企业鹅”。

免责申明：以上内容属作者个人观点，版权归原作者所有，不代表趣投网立场！登载此文只为提供信息参考，并不用于任何商业目的。如有侵权或内容不符，请联系我们处理，谢谢合作！

当前文章地址：https://www.qthbsb.com/keji/642696.html 感谢你把文章分享给有需要的朋友！

上一篇：无线宝会赚京豆的WiFi 6路由器！Redmi AX5京东云无线宝上架：269元下一篇：雄忻高铁国家发改委正式批复雄忻高铁：投资572.4亿元、时速350公里

企鹅肉 用企鹅做出的炸鸡什么样？“毕加索”给出了答案

相关文章

企鹅肉用企鹅做出的炸鸡什么样？“毕加索”给出了答案