{"id":65318,"date":"2023-08-09T07:10:56","date_gmt":"2023-08-09T07:10:56","guid":{"rendered":"http:\/\/www.tunimedia.tn\/fr\/openai-lance-son-webcrawler-gptbot-et-les-instructions-pour-le-bloquer\/"},"modified":"2023-08-09T07:10:56","modified_gmt":"2023-08-09T07:10:56","slug":"openai-lance-son-webcrawler-gptbot-et-les-instructions-pour-le-bloquer","status":"publish","type":"post","link":"https:\/\/tunimedia.tn\/fr\/openai-lance-son-webcrawler-gptbot-et-les-instructions-pour-le-bloquer\/","title":{"rendered":"OpenAI lance son webcrawler GPTBot et les instructions pour le bloquer"},"content":{"rendered":"<p> [ad_1]\n<\/p>\n<div>\n<p class=\"chapo\">OpenAI lance son webcrawler GPTBot et les instructions pour le bloquer<\/p>\n<p><a target=\"_blank\" href=\"https:\/\/mashable.com\/article\/open-ai-gptbot-crawler-block\" rel=\"noopener\">OpenAI a lanc\u00e9 un webcrawler<\/a> pour am\u00e9liorer ses mod\u00e8les d\u2019<a target=\"_blank\" title=\"intelligence artificielle\" href=\"https:\/\/www.begeek.fr\/ia\" rel=\"noopener\">intelligence artificielle<\/a> comme GPT-4. Baptis\u00e9 <strong>GPTBot<\/strong>, le syst\u00e8me navigue sur le web pour s\u2019entra\u00eener et am\u00e9liorer les capacit\u00e9s de son IA. Selon un post de blog d\u2019OpenAI, utiliser GPTBot a le potentiel d\u2019am\u00e9liorer les mod\u00e8les d\u2019IA existants en ce qui concerne la pr\u00e9cision et la s\u00e9curit\u00e9.<\/p>\n<h2 id=\"OpenAI-lance-son-webcrawler-GPTBot-et-les-instructions-pour-le-bloquer\" class=\"adn_sommaire\">OpenAI lance son webcrawler GPTBot et les instructions pour le bloquer<\/h2>\n<p>\u201cLes pages web r\u00e9cup\u00e9r\u00e9es avec le user agent GPTBot peuvent potentiellement \u00eatre utilis\u00e9es pour am\u00e9liorer de futurs mod\u00e8les et \u00eatre filtr\u00e9es pour retirer des sources qui n\u00e9cessitent un acc\u00e8s payant, qui sont connues pour rassembler des informations personnelles identifiables (PII) ou qui contiennent des textes qui enfreignent nos politiques\u201d, peut-on notamment lire dans le post.<\/p>\n<p>Les sites web peuvent cependant choisir de restreindre l\u2019acc\u00e8s \u00e0 ce robot et emp\u00eacher GPTBot d\u2019acc\u00e9der \u00e0 leurs sites, que ce soit de mani\u00e8re partielle ou totale. OpenAI explique que les administrateurs des sites peuvent interdire le crawler en bloquant son adresse IP ou via le fichier robots.txt.<\/p>\n<p>OpenAi a d\u00e9j\u00e0 suscit\u00e9 la controverse pour la mani\u00e8re dont il collecte les donn\u00e9es et pour des infractions relatives au droit d\u2019auteur ou encore pour des failles de s\u00e9curit\u00e9. En juin, la plateforme a m\u00eame \u00e9t\u00e9 attaqu\u00e9e en <a target=\"_blank\" title=\"justice\" href=\"https:\/\/www.begeek.fr\/justice\" rel=\"noopener\">justice<\/a> pour \u201cvol\u201d de <a target=\"_blank\" title=\"donn\u00e9es personnelles\" href=\"https:\/\/www.begeek.fr\/donnees-personnelles\" rel=\"noopener\">donn\u00e9es personnelles<\/a> visant \u00e0 entra\u00eener <a target=\"_blank\" href=\"https:\/\/www.begeek.fr\/des-chercheurs-sont-parvenus-a-jailbreak-des-chatbots-ia-dont-chatgpt-385008\" rel=\"noopener\">ChatGPT<\/a>.<\/p>\n<p>Des fonctions pour ne pas participer \u00e0 ces programmes d\u2019am\u00e9lioration ont \u00e9t\u00e9 impl\u00e9ment\u00e9es r\u00e9cemment, permettant notamment de d\u00e9sactiver l\u2019historique des conversations, donnant aux utilisateurs davantage de contr\u00f4le sur leurs donn\u00e9es personnelles.<\/p>\n<p>ChatGPT 3.5 et 4 ont \u00e9t\u00e9 entra\u00een\u00e9s sur des donn\u00e9es en ligne et des textes remontant \u00e0 septembre 2021 pour les plus r\u00e9cents. Il n\u2019y a actuellement aucun moyen de retirer du contenu de cet ensemble de donn\u00e9es.<\/p>\n<p>Selon <a target=\"_blank\" href=\"https:\/\/www.begeek.fr\/anthropic-google-microsoft-et-openai-forment-un-groupe-pour-la-securite-de-lia-384915\" rel=\"noopener\">OpenAI<\/a>, vous pouvez d\u00e9sactiver GPTBot en ajoutant quelques lignes au fichier Robots.txt de votre site. Ce fichier sert d\u00e9j\u00e0 pr\u00e9cis\u00e9ment \u00e0 donner des directives aux web crawlers, \u00e0 indiquer ce \u00e0 quoi ils peuvent ou non acc\u00e9der.<\/p>\n<p>Vous pouvez personnaliser ce qu\u2019un tel robot peut utiliser, autoriser certaines pages et en interdire d\u2019autres.<\/p>\n<blockquote>\n<p>User-agent: GPTBot<\/p>\n<p>Allow: \/mon-dossier-1\/<\/p>\n<p>Disallow: \/mon-dossier-2\/<\/p>\n<\/blockquote>\n<p>pour autoriser la collecte de contenu dans \/mon-dossier-1\/ et l\u2019interdire dans \/mon-dossier-2\/. Avec Disallow: \/, vous interdisez l\u2019acc\u00e8s complet \u00e0 votre site.<\/p>\n<\/div>\n[ad_2]\n<br \/><a href=\"https:\/\/www.begeek.fr\/openai-lance-son-webcrawler-gptbot-et-les-instructions-pour-le-bloquer-385354\">Source link <\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>[ad_1] OpenAI lance son webcrawler GPTBot et les instructions pour le bloquer OpenAI a lanc\u00e9 un webcrawler pour am\u00e9liorer ses mod\u00e8les d\u2019intelligence artificielle comme GPT-4. Baptis\u00e9 GPTBot, le syst\u00e8me navigue sur le web pour s\u2019entra\u00eener et am\u00e9liorer les capacit\u00e9s de son IA. Selon un post de blog d\u2019OpenAI, utiliser GPTBot a le potentiel d\u2019am\u00e9liorer les &hellip;<\/p>\n","protected":false},"author":1,"featured_media":51353,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_seopress_robots_primary_cat":"","_seopress_titles_title":"","_seopress_titles_desc":"","_seopress_robots_index":"","_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[16,335,19,349,239],"tags":[],"class_list":["post-65318","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-high-tech","category-tie-games","category-mode","category-tech-net","category-web"],"jetpack_featured_media_url":"https:\/\/tunimedia.tn\/fr\/wp-content\/uploads\/2023\/01\/openAI-ChatGPT.jpg","jetpack_sharing_enabled":true,"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/tunimedia.tn\/fr\/wp-json\/wp\/v2\/posts\/65318","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/tunimedia.tn\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/tunimedia.tn\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/tunimedia.tn\/fr\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/tunimedia.tn\/fr\/wp-json\/wp\/v2\/comments?post=65318"}],"version-history":[{"count":0,"href":"https:\/\/tunimedia.tn\/fr\/wp-json\/wp\/v2\/posts\/65318\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/tunimedia.tn\/fr\/wp-json\/wp\/v2\/media\/51353"}],"wp:attachment":[{"href":"https:\/\/tunimedia.tn\/fr\/wp-json\/wp\/v2\/media?parent=65318"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/tunimedia.tn\/fr\/wp-json\/wp\/v2\/categories?post=65318"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/tunimedia.tn\/fr\/wp-json\/wp\/v2\/tags?post=65318"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}