近日消息,谷歌近期向美国用户开放了其最先进的文字生成图像AI模型Imagen 3,用户现可通过访问AI Test Kitchen亲身体验这一创新技术。据官方介绍,新版Imagen在图像的清晰度、光影效果以及减少不自然痕迹方面实现了显著提升,为用户创造更加栩栩如生、富有创意的视觉内容提供了强大工具。
谷歌于今年 5 月召开的 I / O 开发者大会上宣布 Imagen 3 模型,6 月邀请部分 Vertex AI 用户测试使用,而现在正式向美国用户开放。
谷歌人工智能研究部门 DeepMind 负责人德米斯·哈萨比斯(Demis Hassabis)说,与前代产品 Imagen 2 相比,Imagen 3 能更准确地理解文字提示,并将其转化为图像,而且其生成的图像更具“创造性和细节”,且模型产生的干扰元素和错误也更少。
在谷歌的人工和自动评估中,Imagen 3 的表现优于 Imagen 2、DALL-E 3、Midjourney v6、Stable Diffusion 3 和 Stable Diffusion XL 1.0,Imagen 3 在将文本描述与生成的图像相匹配以及处理详细提示方面表现尤为突出。
文明上网,理性发言,共同做网络文明传播者