文:阎纪宇
阿瓦德(Mona Awad)、特伦布雷(Paul Tremblay)、凯德瑞(Richard Kadrey)、高登(Christopher Golden)四位美国惊悚小说家最近两人一组走上法院,挑战全球瞩目的新一代「生成式人工智慧」(Generative AI),并且得到一位大咖名流加持:喜剧女伶/作家、艾美奖(Emmy Awards)得主莎拉席佛曼(Sarah Silverman)也投入战局。
前两位控告生成式AI应用ChatGPT的研发公司OpenAI,後三位还加码控告另一款AI应用LLaMA的研发者Meta,也就是脸书(Facebook)的母公司。原告指称OpenAI与Meta在训练其AI应用的过程中,「复制并摄取」原告受版权保护的作品,而且「未经同意、未做引述、未曾付费」,显然构成侵权,而且获取利益,因此要求损害赔偿与禁制令。
生成式AI近年来势汹汹,它能够与个别人类「聊天」,接收对方的提示(prompt),藉助於海量的资料库与超人的学习能力,完成各种以自然语言(人类使用的语言)构成的任务。换言之,生成式AI已经可以进行一定品质的「委托创作」,从文案、歌词、论文、剧本到小说,未必能登大雅之堂,但绝对足以吸引一般读者/内容使用者。
但这类大型语言模型(LLM)AI的训练过程需要大量文本,尤其是高品质、堪称「作品」甚至「着作」的文本。一个重要来源是多伦多大学( UToronto)与麻省理工学院(MIT)建置的「BookCorpus」资料集,拥有逾一万一千本(近十亿字)未出版书籍。但原告指控,合法资料集之外,ChatGPT与LLaMA显然还用了规模更大、但侵犯着作权的「影子图书馆」(shadow library),五位原告的作品也因此成为AI的训练材料。
生成式AI的训练用资料有如恒河沙数,如何证明涉及侵权?其实比想像中简单:以子之矛攻子之盾,以席佛曼的案子为例,律师团要求ChatGPT「摘要叙述席佛曼《尿床女孩》(The Bedwetter)一书的细节」,於是ChatGPT非常认真、洋洋洒洒写出一千五百字,充分显示它真的「读过」席佛曼这本2010年出版的回忆录,结果自然是让控方「人赃俱获」。
当然,律师团接下来还必须证明AI的侵权行为造成作家的财务损失,并要求相应的赔偿,这个过程相对困难。生成式AI前程似锦,OpenAI目前市值上看三百亿美元,靠山微软(Microsoft)更是「两兆美元俱乐部」成员,Meta也是一兆美元等级,两巨头必然会好好呵护旗下的金鸡母,最可能的结果是花钱摆平、庭外和解。
看似一场小虾米对大鲸鱼的不对称诉讼战,不过有一点值得注意:五位作家打的是一场集体诉讼(class action),所谓的「集体」代表「所有在美国拥有版权、其作品曾被OpenAI语言模型当成训练资料、在美国居住个人或实体」,这些作者随时可以共襄盛举。也就是说,本案的「潜在原告」成千上万。
五位原告并非孤军奋战。美国作家协会(The Authors Guild)上个月发布一封公开信,呼吁两家生成式AI公司(OpenAI与Stability AI)与科技业四巨头(Alphabet、Meta、IBM、微软)的执行长,强调「没有我们的作品,AI将平平无奇,发展极度受限」,并提出三点要求:AI程式使用有版权材料须获同意;作品被生成式AI使用的作家须获合理报酬,并溯及继往;作品被AI产出使用的作家须获合理报酬。这封公开信得到四千多位作家联署。
而且只要是艺术创作者,应该都会非常在意侵权这回事。今年一月,一批视觉艺术家率先发难,控告三家图像AI大厂Stability AI、Midjourney与DeviantArt侵权。Stability AI另外还被影像公司Getty Images控告。相关案件如果持续发酵,有可能成为美国司法史的一座里程碑,深刻影响AI的发展方向。
回到文本的领域,除了蜂涌而来的版权侵权争议,依赖大型语言模型的生成式AI还面临另一项危机:供训练用的高品质文本日益青黄不接,一项研究甚至预测二〇二六年就将耗尽。毕竟这类文本——书籍、新闻报导、科学文献、维基百科、筛选过的网路内容——创作主力仍然是人类,而「工人智慧」的生产速度当然跟不上「人工智慧」的消化速度。
这就透显出多重吊诡。生成式AI对人类创作者生成莫大威胁,动摇「人类创作」作为文化与文明运作基础的价值。ChatGPT与其AI同侪「写出」畅销书指日可待,但《纽约时报》应该将它列入排行榜吗?作家提告AI一方面是维权,一方面也颇有「打不过它就加入它」的意味,希望至少在这个生态系中站稳有利可图的一席之地。
然而AI业者也必须有所体悟,不能再坚持「未经同意、未做引述、未曾付费」、竭泽而渔的掠食者/食物模式,如此才不会断绝文化与文明运作的活水泉源,进而与人类创作者携手摸索出共存共荣的可能性。AI大军已经进城,但「征服者」未必是最後的赢家,近来这一波创作者提告潮反倒有可能是一个柳暗花明的契机。