{"id":89573,"date":"2024-12-29T15:05:36","date_gmt":"2024-12-29T15:05:36","guid":{"rendered":"http:\/\/www.tunimedia.tn\/fr\/deepseek-lia-chinoise-qui-se-prend-pour-chatgpt\/"},"modified":"2024-12-29T15:05:36","modified_gmt":"2024-12-29T15:05:36","slug":"deepseek-lia-chinoise-qui-se-prend-pour-chatgpt","status":"publish","type":"post","link":"https:\/\/tunimedia.tn\/fr\/deepseek-lia-chinoise-qui-se-prend-pour-chatgpt\/","title":{"rendered":"DeepSeek, l&rsquo;IA chinoise qui se prend pour ChatGPT"},"content":{"rendered":"<p> [ad_1]\n<\/p>\n<div>\n<p class=\"chapo\">Le dernier mod\u00e8le de DeepSeek r\u00e9ussit sur tous les plans, sauf \u00e0 se souvenir de son propre nom.<\/p>\n<div class=\"tldr\">\n<h2 id=\"Tldr\" class=\"adn_sommaire\">Tl;dr<\/h2>\n<ul>\n<li>DeepSeek s\u2019identifie comme <a title=\"ChatGPT\" href=\"https:\/\/www.begeek.fr\/chatgpt\">ChatGPT<\/a>.<\/li>\n<li>Son entra\u00eenement sur des donn\u00e9es g\u00e9n\u00e9r\u00e9es par GPT-4 pourrait expliquer cette anomalie.<\/li>\n<li>Cela soul\u00e8ve des questions \u00e9thiques et techniques pour l\u2019avenir de l\u2019<a title=\"intelligence artificielle\" href=\"https:\/\/www.begeek.fr\/ia\">intelligence artificielle<\/a>.<\/li>\n<\/ul>\n<\/div>\n<h2 id=\"Un-modele-performant-mais-deroutant\" class=\"adn_sommaire\">Un mod\u00e8le performant mais d\u00e9routant<\/h2>\n<p>DeepSeek V3, fra\u00eechement lanc\u00e9, surpasse plusieurs concurrents sur des benchmarks populaires gr\u00e2ce \u00e0 son efficacit\u00e9 dans des t\u00e2ches comme la programmation et la r\u00e9daction. Pourtant, ce mod\u00e8le d\u2019IA pr\u00e9sente une bizarrerie inhabituelle : il affirme \u00eatre <a href=\"https:\/\/www.begeek.fr\/lascension-rapide-de-chatgpt-dans-le-monde-de-lia-407871\">ChatGPT<\/a>, le c\u00e9l\u00e8bre chatbot d\u2019<a href=\"https:\/\/www.begeek.fr\/openai-bascule-vers-une-structure-a-but-lucratif-pour-attirer-des-investisseurs-408989\">OpenAI<\/a>. Lorsqu\u2019on l\u2019interroge, DeepSeek V3 se revendique m\u00eame comme une version de <a href=\"https:\/\/www.begeek.fr\/un-nouveau-modele-dia-surpassant-gpt-4-fonctionne-sur-un-simple-ordinateur-portable-403570\">GPT-4<\/a> sortie en 2023. <strong>Cette confusion n\u2019est pas anodine et soul\u00e8ve des questions sur la formation et les sources de donn\u00e9es utilis\u00e9es pour entra\u00eener le mod\u00e8le.<\/strong><\/p>\n<h2 id=\"Une-formation-sur-des-donnees-controversees\" class=\"adn_sommaire\">Une formation sur des donn\u00e9es controvers\u00e9es<\/h2>\n<p>DeepSeek n\u2019a pas d\u00e9voil\u00e9 l\u2019origine pr\u00e9cise des donn\u00e9es d\u2019entra\u00eenement de son mod\u00e8le, mais des indices sugg\u00e8rent que des textes g\u00e9n\u00e9r\u00e9s par GPT-4 via ChatGPT pourraient en faire partie. En int\u00e9grant ces donn\u00e9es, DeepSeek V3 semble avoir m\u00e9moris\u00e9 certains outputs de GPT-4 et les reproduit presque \u00e0 l\u2019identique. Cette pratique, intentionnelle ou non, pose un probl\u00e8me majeur de qualit\u00e9. Comme l\u2019explique Mike Cook, chercheur en IA \u00e0 King\u2019s College, cela \u00e9quivaut \u00e0 \u00ab photocopier une photocopie \u00bb, ce qui d\u00e9grade la fiabilit\u00e9 et l\u2019originalit\u00e9 des r\u00e9ponses.<\/p>\n<h2 id=\"Un-probleme-ethique-et-legal\" class=\"adn_sommaire\">Un probl\u00e8me \u00e9thique et l\u00e9gal<\/h2>\n<p>Outre les implications techniques, l\u2019entra\u00eenement de DeepSeek V3 sur des donn\u00e9es g\u00e9n\u00e9r\u00e9es par ChatGPT pourrait violer les conditions d\u2019utilisation d\u2019OpenAI. Celles-ci interdisent explicitement de d\u00e9velopper des mod\u00e8les concurrents \u00e0 partir de leurs outputs. Cette situation met en lumi\u00e8re un probl\u00e8me croissant dans l\u2019industrie : l\u2019utilisation opportuniste des productions d\u2019autres IA. Si cette m\u00e9thode r\u00e9duit les co\u00fbts et acc\u00e9l\u00e8re le d\u00e9veloppement, elle pourrait nuire \u00e0 l\u2019innovation et \u00e0 l\u2019int\u00e9grit\u00e9 du secteur, comme l\u2019a soulign\u00e9 <a href=\"https:\/\/www.begeek.fr\/sam-altman-se-dit-gene-par-la-menace-dopenai-de-retirer-des-actions-aux-employes-qui-refusent-de-signer-un-accord-de-confidentialite-397677\">Sam Altman<\/a>, PDG d\u2019OpenAI, dans une critique implicite de ces pratiques.<\/p>\n<h2 id=\"Un-avenir-contamine-par-lIA-generee\" class=\"adn_sommaire\">Un avenir contamin\u00e9 par l\u2019IA g\u00e9n\u00e9r\u00e9e ?<\/h2>\n<p>Le cas de DeepSeek V3 illustre une tendance inqui\u00e9tante : l\u2019omnipr\u00e9sence de contenus g\u00e9n\u00e9r\u00e9s par l\u2019IA sur le web. Avec des sites automatis\u00e9s, des bots prolif\u00e9rant sur les <a title=\"r\u00e9seaux sociaux\" href=\"https:\/\/www.begeek.fr\/reseaux-sociaux\">r\u00e9seaux sociaux<\/a>, et une estimation que 90% des contenus en ligne pourraient \u00eatre g\u00e9n\u00e9r\u00e9s par l\u2019IA d\u2019ici 2026, les datasets d\u2019entra\u00eenement deviennent de plus en plus pollu\u00e9s. Cette contamination complique la cr\u00e9ation de mod\u00e8les fiables et amplifie les biais et erreurs des IA pr\u00e9c\u00e9dentes. Si DeepSeek a effectivement absorb\u00e9 des outputs de GPT-4, le mod\u00e8le risque non seulement d\u2019aggraver les biais existants, mais aussi de remettre en question sa propre identit\u00e9.<\/p>\n<\/div>\n[ad_2]\n<br \/><a href=\"https:\/\/www.begeek.fr\/deepseek-lia-chinoise-qui-se-prend-pour-chatgpt-409033\">Source link <\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>[ad_1] Le dernier mod\u00e8le de DeepSeek r\u00e9ussit sur tous les plans, sauf \u00e0 se souvenir de son propre nom. Tl;dr DeepSeek s\u2019identifie comme ChatGPT. Son entra\u00eenement sur des donn\u00e9es g\u00e9n\u00e9r\u00e9es par GPT-4 pourrait expliquer cette anomalie. Cela soul\u00e8ve des questions \u00e9thiques et techniques pour l\u2019avenir de l\u2019intelligence artificielle. Un mod\u00e8le performant mais d\u00e9routant DeepSeek V3, &hellip;<\/p>\n","protected":false},"author":1,"featured_media":89574,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_seopress_robots_primary_cat":"","_seopress_titles_title":"","_seopress_titles_desc":"","_seopress_robots_index":"","_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[16,335,19,349,239],"tags":[],"class_list":["post-89573","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-high-tech","category-tie-games","category-mode","category-tech-net","category-web"],"jetpack_featured_media_url":"https:\/\/tunimedia.tn\/fr\/wp-content\/uploads\/2024\/12\/DeepSeek.jpeg","jetpack_sharing_enabled":true,"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/tunimedia.tn\/fr\/wp-json\/wp\/v2\/posts\/89573","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/tunimedia.tn\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/tunimedia.tn\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/tunimedia.tn\/fr\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/tunimedia.tn\/fr\/wp-json\/wp\/v2\/comments?post=89573"}],"version-history":[{"count":0,"href":"https:\/\/tunimedia.tn\/fr\/wp-json\/wp\/v2\/posts\/89573\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/tunimedia.tn\/fr\/wp-json\/wp\/v2\/media\/89574"}],"wp:attachment":[{"href":"https:\/\/tunimedia.tn\/fr\/wp-json\/wp\/v2\/media?parent=89573"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/tunimedia.tn\/fr\/wp-json\/wp\/v2\/categories?post=89573"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/tunimedia.tn\/fr\/wp-json\/wp\/v2\/tags?post=89573"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}