OpenAI推出根据文字描述生成图片的AI模型
人工智能 2021-06-01 11:12www.robotxin.com人工智能专业
据外媒,知名公司OpenAI近日推出两套多模态人工智能系统模型DALL-E和CLIP,DALL-E可以基于文本直接生成图像,CLIP能够完成图像与文本类别的匹配。DALL-E可以将以自然语言形式表达的大量概念转换为恰当的图像,并使用了GPT-3 同样的方法,只不过DALL-E将其应用于文本-图像对。
另一个CLIP能够执行一系列视觉识别任务。给出一组以语言形式表述的类别,CLIP能够立即将一张图像与其中某个类别进行匹配,而且它不像标准那样需要针对这些类别的特定数据进行微调。在ImageNet基准上,CLIP的性能超过ResNet-50,在识别不常见图像任务中的性能远超ResNet。
虽然CLIP在识别常见对象时往往表现良好,但在计算图像中对象数量等更抽象或更系统的任务,以及预测照片中最靠近车辆间的距离等更复杂任务上的表现不佳。在这两项任务上,zero-shot CLIP的效果也只比随机猜测好一点。
(7601324)
人工智能培训
- 人工智能的利与弊有哪些 如何看待人工智能的利
- 人工智能到底是什么 人工智能的概念是什么
- 国内十大人工智能公司 国内十大人工智能公司排
- 人工智能的东西有哪些 人工智能的东西有什么
- 人工智能的发展历程 简述人工智能的发展历程
- 国内人工智能比较厉害的公司 国内人工智能比较
- ai人工智能语音系统 ai人工智能语音系统有哪些
- 人工智能存在的弊端 人工智能存在的弊端有哪些
- 人工智能的八大应用领域 人工智能有那些应用领
- 人工智能的利与弊观点 如何看待人工智能的利与
- 人工智能的发展前景如何 人工智能的发展前景有
- 人工智能app排行:国内ai人工智能app排行
- 人工智能ai系统:人工智能ai系统有哪些
- 人工智能包含哪些具体内容 人工智能包含什么内
- ai人工智能是什么意思 人工智能的概念是什么
- 人工智能ai是指什么 人工智能ai是指什么内容