草根影响力新视野(琪拉编译)
艺术家即便没有亲眼见过,他们也可以画出一个想像中拟人化,穿著芭蕾舞裙的白萝卜,牵著一只狗走路。这种抽象想像的技能,对人类很容易,对电脑却不容易。不过,新的人工智能技术,已经证明电脑有能力自己办到这件事,画出精确而且可爱的白萝卜牵小狗散步。
专职于AI研究的非营利组织OpenAI这礼拜公布,他们的DALL-E电脑,只要经由指令,就可以创作出杰出,甚至有点超现实的艺术创作。像是[有著酪梨外观的椅子],或是[在阳光下坐著休息的一只水豚]。而DALL-E这个名字,就是结合超现实主义画家达利与卡通WALL-E的合称。
过去AI已经有听从指令画画的能力,画得效果并不好。但是DALL-E创作出的作品却精确、复杂、清楚。这告诉我们,人工智能已经有能力听从更复杂的指令,甚至将来可以帮助人类修图或是创造更多未来人类日常生活需要的设计,像是家具或是车子。
DALLE-E的原型是GPT-3,过去GPT-3被训练从数亿份的文件中被训练,有能力自己创作文章、新诗,或是新闻稿。而DALL-E则被训练可以从无数的画作与相关的文字中自己做比较,创造出人类脑中真正思考出的画面。而OpenAI也研发了另一个人工智能CLIP,来决定哪个作品是最好的。
研发DALL-E的首席工程师也自己很惊讶,发现DALL-E有能力把两个毫无相关的概念结合起来,把他们巧妙的融合在一起,创作出有功能的产品。像是酪梨形状的椅子,甚至自己拟人化,把一株阳光下晒太阳的蔬菜加了人类的胡子。
经由指令改变,DALL-E可以更改创作的原型,像是把酪梨形状的椅子变成[魔术方块形状的时钟],或是设计出各式各样不同类型、不同年代的作品,像是一个八十年代风格的时钟、一个人脑的三維切面图,或是一个洋红色洋芋形状的刺青。
不过,现在DALL-E仍有其限制,显然它们还无法接受太复杂,一个图样中有太多东西的指令,对于他不熟悉的物品,他也没法画得很精确,甚至有点奇怪。也有可能因为DALL-E是经由网络上的信息所训练,所以网络上信息越少的东西,他也乐不熟悉。像是要它画一只[穿著睡衣的虾子]、[放风筝],结果就没那麽理想。
Polygon recent comments