本文结合Adobe股东诉讼案例,分析了使用AI生成图训练AI的侵权风险,指出Adobe该行为侵权风险较低,但前期高调版权宣传放大了争议。 ## 1. 案件背景:Adobe因训练数据问题被股东起诉 这是一起涉证券法的虚假陈述诉讼,股东指控Adobe违反自身宣传,使用包含盗版书籍的SlimPajama、Books3数据集,以及竞争对手Midjourney的AI图片训练AI模型,涉嫌误导投资者。 ## 2. AI生成图片训练AI的核心版权争议 目前国内外司法对AI生成内容的版权定性仍有分歧:2023年北京互联网法院在“春风送来了温柔”案中,认定有人类创造性投入的AI生成图片构成美术作品、享有著作权;2024年江苏张家港法院“幻之翼透明艺术椅”案中,认定无实质智力投入的AI生成图片不构成作品;2025年上海黄浦区法院提示词侵权案中,认定较长提示词仍属抽象构思,不构成文字作品。 目前主流趋势是认定无充分人类创造性投入的纯AI生成图片不构成著作权法意义上的作品,若图片本身无版权,训练行为自然难以构成侵权。 ## 3. Midjourney图片训练的潜在源头侵权风险 Midjourney本身是用海量未经授权的互联网图片训练而成,若原始侵权作品的特征性表达保留在模型中,最终被Adobe训练的模型输出,且转换性不足,仍可能侵犯原始作品权利人的著作权,风险并非来自Midjourney图片本身,而是更早的未授权原始素材。 ## 4. Adobe的模式已经大幅降低合规风险 Adobe并非直接从Midjourney网站大规模抓取图片,而是由用户上传至Adobe Stock,再由Adobe筛选决定是否纳入训练集,被采用素材的上传者还可获得奖励,Adobe承认纳入的Midjourney图片占比不高。 这种模式规避了AI训练中的两类常见风险:一是规避了直接大规模抓取违反Midjourney用户协议的问题,二是规避了批量抓取竞争对手内容攫取成果的不正当竞争风险。 ## 5. 案件争议放大的核心原因 Adobe整体做法的合规性在行业内已经偏谨慎,源头侵权风险虽未彻底消除,但直接侵权可能性已经大幅降低,真正的问题是Adobe长期高调宣传自身AI“仅使用授权内容训练”“商业安全”,才让微小瑕疵被放大,成为股东诉讼的突破口。 ## 6. 案件结尾的核心警示 对于Adobe这类以知识产权为核心资产的公司而言,自身知识产权保护调门极高,若自身开发行为违反知识产权法规,不仅会面临巨额赔偿,还会直接冲击公司核心的重复性软件收入,对利润和增长产生不利影响,这也是股东本次诉讼的核心逻辑。
正版调门拉得太高,Adobe用AI图片训练AI被自家股东告了
2026-06-22 19:45

正版调门拉得太高,Adobe用AI图片训练AI被自家股东告了

 

近日,一贯高调版权维权的美国软件公司Adobe及其管理层因为用盗版素材训练AI被自家股东在加州北区法院起诉虚假陈述。诉状描述的核心盗版问题包括Adobe使用大量盗版书籍,以及源自竞争对手Midjourney的AI图片训练其AI模型,用盗版训练AI的法律问题笔者经常聊,今天就跟大家聊聊,用AI生成的图片训练AI模型有什么法律风险。

 

先介绍下案情,Adobe被起诉的案件其实是个涉及证券法的虚假陈述诉讼,Adobe因使用包含盗版书籍的SlimPajama和Books3等数据集训练Slim LM模型被起诉版权侵权。另外,彭博社报道称,Adobe的图像生成AI萤火虫(Firefly)训练数据中包含部分Midjourney等平台的AI生成图片,而Midjourney AI模型有大量训练素材是未经授权的图片。但Adobe在给美国证监会的文件和公开宣传中反复强调“仅使用授权内容训练 AI”。两件事情都涉嫌虚假陈述,误导投资者。

 

使用Midjourney AI生成的图片是不是涉嫌侵权,首先看AI生成的图片本身是否受著作权保护。著作权法的基本原理就是人创作的内容才受著作权保护,纯粹由AI自动生成的内容,因为缺乏人类创造性投入,很难构成著作权法意义上的作品。如果作品本身没有版权,那么后续训练行为自然难以构成对该图片版权的侵害。

 

不过国内法院的判决给了此问题一定争议,2023年北京互联网法院在“春风送来了温柔”案中认定,原告通过精心设计提示词、调整参数、选定图片,体现了个人创造性,该AI生成图片构成美术作品,享有著作权。如果此观点成立,那么使用AI图片训练AI,也可能会有涉嫌侵权提示词作者美术作品版权的争议。

 

不过2024年风向就转变了,江苏张家港法院在“幻之翼透明艺术椅”案中则持相反观点,其判决认定原告仅输入简单提示词,缺乏实质智力投入记录,图片不构成作品。2025年,上海黄浦区法院审理的AI生成图片涉及的提示词侵权案中,认为即便是较长的提示词,仍属抽象构思,不构成文字作品,更不用说图片本身了,也驳回了原告诉请。总体而言,笔者认为北京互联网法院的案例是个良好的探索,但目前的主流趋势还是倾向于认定AI生成的图片不构成受著作权法保护的作品。

 

实际上,用AI生成图片作为素材训练AI的主要风险来自于素材中的特征性表达元素。Midjourney AI模型是利用海量互联网图片训练出来的,其中不少素材并未取得原作者授权。如果训练数据中的特征性表达被AI保留,并在后续生成过程中被输出到新图片之中,那么这些图片仍然可能与原作品产生版权冲突。

 

当然,从合规角度看,Adobe的做法比包括Midjourney在内的许多同行更谨慎。Adobe并没有直接从Midjourney网站大规模抓取图片建立训练库,而是允许用户将图片上传至Adobe Stock。之后Adobe再根据规则决定是否将相关内容纳入训练体系。对于被采用的素材,上传者还有机会获得相应奖励。

 

这种模式至少避免了两类常见风险。其一是违反网站用户协议。即使AI图片最终不受著作权法保护,大规模抓取平台内容仍可能违反网站服务条款。其二是不正当竞争风险。如果企业批量抓取竞争对手平台积累的大量内容,用于训练自己的商业模型,即便单张图片没有版权,也可能被认定为攫取他人成果、破坏市场竞争秩序。

 

但AI训练素材量很大,诉状引用的媒体报道称:“Adobe表示,来自Midjourney的图像仅占训练材料的5%。这不是一个很好的辩护。该公司拥有2.48亿张授权图像,所以那‘仅’可能是多达125万张图片。”(此处原文数据有误,2.48亿的5%应为1240万张图片)。表面看来,基数如此之大,其中的版权风险确实不小,但Adobe如果根据规则对加入训练体系的图片进行过审核,虽然不能百分之百的屏蔽风险,至少图片直接侵权的法律风险是不大的。

 

Adobe的真正问题是隐藏事实,其一边高调宣传萤火虫AI不同于Midjourney,生成内容默认可商用,仅使用授权内容训练,并承诺承担版权纠纷责任的AI;一边悄悄将存在版权争议的Midjourney的AI图片纳入训练数据,对外宣称的训练数据来源,与实际使用的训练数据之间存在极大的反差,这才是股东诉讼的核心问题。

 

股东诉状在结尾处有一段话,颇具警示意味,值得引用:"对于像Adobe这样的软件公司而言,包括版权保护在内的知识产权,是公司的核心命脉。如果第三方可以任意侵犯Adobe的版权,Adobe的软件将毫无价值,公司的收入将会崩溃。同理,如果Adobe侵犯了他人的版权,便将自身暴露于巨额赔偿的风险之中。更糟糕的是,如果Adobe自己的软件开发方式违反了知识产权法规……后果将是灾难性的。这些违法行为将威胁到公司从软件中获得的大量重复性收入,因此不仅会使公司面临损害赔偿责任,还会对其收入、利润和增长率产生不利影响。"

 

说起来,这段话本来是Adobe用来向投资者讲述自身价值主张的,如今却被股东用来起诉它自己。

 

本文作者:游云庭,知识产权律师。Email: yytbest@gmail.com,本文仅代表作者观点。

AI原生产品日报频道: 前沿科技
本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定