Imagen
AI学术科研
Imagen

Imagen 是一个人工智能系统,可以根据输入文本创建逼真的图像!

Imagen是一种文本到图像的扩散模型,具有前所未有的逼真度和深层次的语言理解能力。Imagen 建立在大型 Transformer 语言模型理解文本的能力之上,并依赖于扩散模型在高保真图像生成方面的优势。Imagen 在 COCO 数据集上取得了 7.27 的新的最先进的 FID 分数,而无需在 COCO 上进行训练,人类评分者发现 Imagen 样本在图像文本对齐方面与 COCO 数据本身不相上下。我们将 Imagen 与最近的方法(包括 VQ-GAN CLIP、潜在扩散模型和 DALL-E 2)进行比较,发现人类评分者在并排比较中更喜欢 Imagen,无论是在样本质量方面和图文对齐。

相关导航

vee
免梯子 | 部分免费

智能技术和人性化的交互方式为您提供最佳的解决方案

网页
小门道AI
免梯子 | 部分免费

小门道AI平台专注于:AI绘画、AI问答和AI图片处理功能

网页
Dragonfly AI
免梯子 | 免费

免费版ChatGPT,基于OpenAI GPT-3.5/4

网页
Landing AI
免梯子 | 部分免费

通过自然提示交互在几分钟内构建计算机视觉系统

网页
Play.ht
付费 | 免梯子

超逼真的在线AI语音生成器!

网页
量子位
免梯子 | 免费

一家专注于人工智能与前沿科技领域的产业服务平台

macOS
Windows

发表回复