文字转图像更细致，Google Imagen 3 模型悄悄在美推出

外媒 VentureBeat 报导，Google 打造的第三代文字转图像工具 Imagen 3 悄悄向美国用户推出，可在 Google 的 AI Test Kitchen 存取使用。

Imagen 3 将提供出色的图像生成品质，且较上一代 Imagen 2 拥有更多强化功能，包括生成速度提升 40% 以上，更好的文字提示理解和指令遵循能力。Imagen 3 也包括多语言、多种画面比例的支援，内建安全功能（例如 Google DeepMind 的 SynthID 数位浮水印）。

Imagen 3 似乎保有一些保护措施，它无法生成受版权保护的角色图像，拒绝产生泰勒丝（Taylor Swift）等公众人物图像，也无法生成有关武器的图像，这与 xAI 新推出的 Grok-2 形成强烈对比，後者对於生成政治人物图像没有任何保护措施。

5 月份 Google I/O 2024 开发者大会宣布将升级更新成 Imagen 3，随後预览版本开放给申请早期实验阶段的 Vertex AI 客户试用，Google 则在 8 月 13 日发表有关这项文字转图像工具的论文。

无论 Google 或 xAI 未来几个月很重要，因为它们必须面对用户意见回馈、潜在监管审查及影像生成技术带来的广泛影响。

（首图来源：Google Cloud Blog）