财联社1月5日讯(编辑 刘蕊)随着OpenAI的生成式人工智能工具ChatGPT热度持续,关于该工具训练材料来源的知识产权问题也面临更多关注。

美东时间周四,OpenAI表示,它正在与数十家出版商谈判,以获得他们的文章授权。

OpenAI正与数十家出版商谈判

此前早有传闻称,OpenAI正在与多家出版商谈判,寻求海量内容授权来训练其人工智能模型,不过这一次公布的谈判对象数量,比之前外界所知的更多的多。

“我们正在与许多发行商进行许多谈判和讨论。他们很活跃,也非常积极。谈判进展得很顺利,”OpenAI的知识产权和内容主管汤姆·鲁宾( Tom Rubin)表示,“你已经看到了我们公开的部分交易,未来还会有更多。”

上个月,OpenAI刚刚与Politico的母公司Axel Springer SE签署了一项为期多年的许可协议,价值数千万美元。去年7月,OpenAI宣布与美联社达成一项协议,但未透露协议金额。

这些知识产权交易对OpenAI的未来至关重要,因为它正在平衡对构建模型所需的更新、准确数据的需求,以及对数据来源的日益严格的审查。

不过据外媒报道,最近与OpenAI进行谈判的两名媒体公司高管表示,OpenAI仅仅愿意向部分媒体公司提供每年100万至500万美元的授权费用。即使对小型出版商来说,这也是一个很小的数字,可能会让OpenAI很难达成协议。

相比之下,最近试图在生成式人工智能领域赶上OpenAI的苹果,也在试图与出版商达成协议,以使用它们的内容。而且,苹果给出的资金条件要丰厚的多。

OpenAI正苦陷在与《纽约时报》的官司里

就在上周,与OpenAI进行过谈判的公司之一——《纽约时报》就对OpenAI和微软公司发起了起诉,指控他们在未经许可的情况下,使用该媒体的文章。

这起诉讼对OpenAI的业务构成了生死存亡的挑战。如果《纽约时报》胜诉,OpenAI不仅可能欠下数十亿美元,还可能需要被迫销毁其所有训练数据,这将意味着巨大的复杂工作量和高昂的金钱成本。而且,更直接的是,这起诉讼使OpenAI与媒体行业达成交易的努力复杂化。

鲁宾表示:“目前的情况与出版商过去在搜索引擎和社交媒体上面临的情况大不相同……在这里,内容是用来训练模型的。它不是用来复制内容的。它不是用来取代内容的。”

然而,《纽约时报》并不同意OpenAI的说辞,认为ChatGPT完全是在不付费的情况下抄袭其记者的作品。

在诉讼中,《纽约时报》出版商展示了ChatGPT几乎一字不差地从《纽约时报》上摘录整段文字的例子——尽管也有些人指出,在某些出版商举的例子中,它使用了特别的手段,诱使ChatGPT更可能复制《纽约时报》的内容。出版商认为,这证明OpenAI使用了《纽约时报》的数据。

《纽约时报》在一份声明中表示:“如果微软和OpenAI想将我们的成果用于商业目的,法律要求他们首先获得我们的许可……但他们没有这么做。”

OpenAI正在与数十家出版商谈合作 可开价被曝太小气  第1张