外媒 VentureBeat 报导,Google 打造的第三代文字转图像工具 Imagen 3 悄悄向美国用户推出,可在 Google 的 AI Test Kitchen 存取使用。
Imagen 3 将提供出色的图像生成品质,且较上一代 Imagen 2 拥有更多强化功能,包括生成速度提升 40% 以上,更好的文字提示理解和指令遵循能力。Imagen 3 也包括多语言、多种画面比例的支援,内建安全功能(例如 Google DeepMind 的 SynthID 数位浮水印)。
Imagen 3 似乎保有一些保护措施,它无法生成受版权保护的角色图像,拒绝产生泰勒丝(Taylor Swift)等公众人物图像,也无法生成有关武器的图像,这与 xAI 新推出的 Grok-2 形成强烈对比,後者对於生成政治人物图像没有任何保护措施。
5 月份 Google I/O 2024 开发者大会宣布将升级更新成 Imagen 3,随後预览版本开放给申请早期实验阶段的 Vertex AI 客户试用,Google 则在 8 月 13 日发表有关这项文字转图像工具的论文。
无论 Google 或 xAI 未来几个月很重要,因为它们必须面对用户意见回馈、潜在监管审查及影像生成技术带来的广泛影响。
- Google quietly opens Imagen 3 access to all US users
(首图来源:Google Cloud Blog)