2026年6月26日,纽约时报正式更新了针对OpenAI的版权侵权诉状,新增微软公司作为新的主要被告。这一重大法律动作标志着持续近两年半的AI版权诉讼战进入了一个全新阶段——从单纯挑战AI公司的数据训练行为,升级为同时追究其核心算力供应商的法律责任。新诉状指控微软不仅为OpenAI提供算力支持,还专门定制了用于爬取网络版权内容的超级计算系统,并直接参与了侵权内容的选择过程。
根据纽约时报提交的最新诉状,微软被指控在其中扮演了远比"被动算力提供者"更为积极的角色。诉状指出,微软专门为OpenAI设计并构建了定制化的超算系统,该系统的主要功能之一就是大规模爬取互联网上的版权内容,用于训练GPT系列模型。这一指控如果成立,将意味着微软不再是AI版权侵权链条中的旁观者,而是核心参与者之一。
更激进的指控在于,微软据称直接参与了侵权训练内容的选择决策。诉状引用了微软和OpenAI之间的内部通信记录,显示微软工程师团队参与了训练数据集的构建工作,包括从新闻网站中筛选和优先排序特定版权内容的技术实现方案。纽约时报认为,微软之所以积极参与这一过程,是因为其看到了AI搜索和新闻聚合产品对传统新闻业的替代潜力,这是一项具有明确商业动机的行为。
诉状还提出了一项新的法律论据:微软通过将AI能力深度整合到其Azure云服务和Office办公套件中,正在利用侵权训练出的模型构建一个"事实上的新闻内容再分发网络",这直接冲击了纽约时报等原创新闻机构的商业模式和收入来源。该论据将版权侵权的损害评估从训练阶段扩展到了模型应用和商业化阶段,大大扩展了诉讼的追责范围。
微软被追加为被告后,其在AI领域的法律风险急剧上升。作为全球市值最高的科技公司之一,微软已经在AI基础设施领域投入了数百亿美元,包括对OpenAI的累计超过130亿美元投资、Azure AI平台的全球部署,以及将Copilot产品线整合到Windows、Office和GitHub等核心产品中。如果纽约时报的诉讼成功,微软可能面临的不仅是经济赔偿,还包括产品下架、训练数据清理等运营层面的实质影响。
法律专家分析认为,纽约时报选择将微软加入诉讼,是基于前期证据开示阶段获得的关键证据。在2025年末至2026年初的证据交换过程中,纽约时报的法律团队挖掘出了微软与OpenAI之间远超公开披露的合作细节,包括双方在训练数据处理方面的联合工作机制。这些证据使纽约时报相信,微软的责任范围远不止于"提供算力"那么简单。
微软对此回应称,纽约时报的新诉状"缺乏事实依据",并表示微软在AI训练数据使用方面一直严格遵守版权法律。微软强调,其与OpenAI的合作关系在法律上是独立的,微软不参与OpenAI的模型训练决策。但法律观察人士指出,在开放源代码、协同开发协议和共享技术基础设施的背景下,"独立性"的抗辩在法律上可能难以站住脚。
纽约时报诉OpenAI版权侵权案始于2023年12月,当时纽约时报在曼哈顿联邦法院提起诉讼,指控OpenAI未经授权使用数百万篇版权文章训练ChatGPT等AI产品。这起诉讼被视为AI版权领域的标杆案件,其结果将对整个AI产业的合法性基础产生深远影响。此后,包括《华尔街日报》母公司新闻集团、《卫报》等多家新闻机构也相继提起诉讼或达成许可协议。
在过去两年多的时间里,案件历经了多轮证据开示、动议辩论和初步听证。2025年,法院驳回了OpenAI的部分驳回动议,允许案件进入实质性审理阶段。正是在这一阶段,纽约时报的法律团队获得了更为详细的技术证据,揭示出微软在训练数据处理中的角色。此外,国会听证会上也多次提及该案件,部分议员呼吁立法明确AI训练数据的版权豁免边界。
纽约时报诉微软的新动作给整个AI行业敲响了警钟。如果法院最终认定算力提供方也需承担版权侵权责任,那么AI产业链上的每一环——从芯片制造商到云服务商,从模型开发商到应用部署方——都可能面临版权追责的风险。这将迫使整个行业重新审视AI训练数据的合规框架,目前依靠"合理使用"抗辩和自愿数据授权协议的做法将面临根本性挑战。
受此消息影响,6月26日当天微软股价下跌约2.3%,OpenAI的估值在二级市场交易中也出现约5%的折让。与此同时,一些AI公司开始加速与版权方的商业授权谈判。据报道,谷歌在消息公布后立即与多家新闻机构接洽,希望在大规模AI训练之前达成内容授权协议,试图避免类似的法律纠纷。这场诉讼的结果,无论胜负,都将定义AI时代内容创作与技术进步之间的边界。值得关注的是,欧洲和亚太地区的多家新闻机构也在密切关注该案的进展,准备根据结果调整自己的法律策略。
与此同时,AI行业自身的应对也在加速。由新闻媒体联盟和部分AI公司共同推动的"内容使用透明度标准"正在制定中,旨在建立一套自愿披露AI训练数据来源的行业规范,试图为内容创作者和技术开发者之间搭建沟通桥梁,减少法律纠纷的发生。该标准预计将在2026年下半年发布初版,涵盖数据来源标注、版权内容识别和收益分配机制等核心议题。