“请给我一个五彩斑斓的黑”,只需一行命令就
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。
OpenAI今年1月公布的Dall-E可谓艳惊四座,只需输入一段话,就能根据内容输出一幅画。连吴恩达老师都不禁点赞。
比如让它设计一个“像牛油果一样的座椅”。
,OpenAI只在官网设置了几种固定模板,代码也没有开源,用户无法用AI设计出更多的图片。
不过现在有个好消息,一位华人小哥Philip Wang已经复现了一个PyTorch版Dall-E,叫做Deep Daze。
他使用了OpenAI的CLIP以及斯坦福大学的Siren,可以在个人电脑上运行。
只需输入在命令行中输入一段描述,这个AI就能画出各式图片。
比如在绿色山丘上的薄雾(mist over green hills)
或者是“草地上的碎盘子”(shattered plates on the grass)
你觉得实际效果如何?
开发该项目的Philip Wang,就是在今年年初公布要复现Dall-E的那位大神,没想到不到3个月的时间,这个项目已经如此强大,在GitHub上已收获1.1k星。
安装与使用
Deep Daze可直接通过pip安装
pip install deep-daze
安装完成后,输入以下命令运行。
imagine TEXT
其中imagine是命令,TEXT必须是一段不超过77个字符的英文描述,为可选参数,可加可不加。
如果我们想生成文章开始那张山中薄雾的图片,就输入以下命令
imagine mist over green hills
中可加入的参数有—deeper,获取更高的图像质量;—num-layers,指定网络的层数……更多用法可以去GitHub项目主页查询。
如果担心AI的想象力过于天马行空,可以指定一张图片,让AI在此图像基础上想象。这样就能保证图像不至于太过离谱。
具体的命令如下
imagine ‘description’ —start-image-path /path/to/picture.jpg
假设我们给AI一张披萨的图片,让它想象“上面铺满青椒的样子”。
那么我们将上述命令中的描述改成“A pizza ith green pepper”。
你以为这就是Deep Daze的全部?其实,它还有一个更强大的完全体——故事模式。
只需设置—create_story=True,就可以解锁该模式,取消77个字符的限制,项目作者将美国诗人罗伯特·弗罗斯特的诗《雪夜林边歇马》输入其中,得到了一段mp4视频。
到这里我有点想让AI画一下“五彩斑斓的黑”,但贫穷限制了我的操作。
因为使用Deep Daze必须要安装CUDA,而且最好在不小于8GB显存的GPU上,才能获得不错的效果。而我现在根本买不起英伟达显卡。
项目地址
https://github./lucidrains/deep-daze
人工智能培训
- 真正能和人交流的机器人什么时候实现
- 国产机器人成功完成首例远程冠脉介入手术
- 人工智能与第四次工业革命
- 未来30年的AI和物联网
- 新三板创新层公司东方水利新增专利授权:“一
- 发展人工智能是让人和机器更好地合作
- 新春贺喜! 经开区持续推进工业互联网平台建设
- 以工业机器人为桥 传统企业如何趟过智造这条河
- 山立滤芯SAGL-1HH SAGL-2HH
- 2015国际智能星创师大赛火热报名中!
- 未来机器人会咋看人类?递归神经网络之父-像蚂
- 成都新川人工智能创新中心二期主体结构封顶
- 斯坦德机器人完成数亿元人民币C轮融资,小米产
- 到2020年,智能手机将拥有十项AI功能,有些可能
- 寻找AI机器人的增长“跳板”:老龄化为支点的产
- 力升高科耐高温消防机器人参加某支队性能测试