Les entreprises d’IA ont exploité les articles du journal pour leur apprentissage.
Tl;dr
- The New York Times poursuit OpenAI et Microsoft pour violation de droits d’auteur.
- Ils ont utilisé des articles de news du NYT pour entraîner leurs chatbots IA.
- The NYT allègue que plus de 66 millions de ses articles ont été utilisés.
- Cela pourrait ouvrir la voie à des actions en justice similaires d’autres éditeurs.
Défense des droits d’auteur par le New York Times
Le New York Times (NYT) a déposé une plainte contre OpenAI et Microsoft en affirmant que ces derniers ont utilisé leurs articles publiés pour former leurs chatbots d’intelligence artificielle sans accord de rémunération pour leur propriété intellectuelle.
Atteinte à l’équité économique
Selon le NYT, ces deux entreprises technologiques cherchent à profiter gratuitement de l’énorme investissement du Times dans le journalisme sans avoir aucun accord de licence. En effet, plus de 66 millions de dossiers, allant des articles de presse aux éditoriaux, publiés sur les sites web du NYT et d’autres marques affiliées, ont été utilisés pour entraîner les modèles d’intelligence artificielle.
Mimétisme stylistique et bénéfice indu
Le Times ajoute également que les produits d’OpenAI et de Microsoft peuvent “générer des sorties qui recitent le contenu du Times mot pour mot, le résume de manière concise, et imitent son style expressif”. Cela reflète d’autres plaintes similaires d’auteurs et de comédiens qui prétendent qu’OpenAI a tiré profit de leurs œuvres.
The New York Times sued OpenAI and Microsoft for copyright infringement, a new front in the debate over the use of published work to train AI. https://t.co/u8qZ247dCl
— The New York Times (@nytimes) December 27, 2023
Effets sur le marché éditorial et la législation
Si ce procès aboutit, il pourrait créer des opportunités pour d’autres éditeurs de poursuivre une action en justice similaire et rendre plus coûteuse la formation de modèles d’intelligence artificielle à des fins commerciales.
Certaines entreprises concurrentes, comme CNN et BBC News, ont déjà essayé de limiter les données que les web crawlers d’intelligence artificielle peuvent extraire pour la formation et le développement.