ChatGPT veut vos données personnelles… Comment s’en protéger ?
OpenAI nous apprend que la prochaine tendance majeure sera l’information. Qu’est-ce que cela signifie ?
OpenAI a créé un nouveau robot nommé GPTBot. Ce nouveau scrapper va constamment parcourir l’internet pour trouver des informations nouvelles qui pourront être réintroduites dans l’entraînement de leur modèle. Ils affirment qu’il n’inculera pas de sources nécessitant un accès payant ou qui sont connues pour collecter des informations personnelles ou qui ont du texte qui enfreint leur politique.
Ils ont aussi publié des méthodes pour empêcher le scrapper de parcourir votre site web.
Voici 3 manières différentes de le faire :
- Bloquer Common Crawl : Utilisez le fichier robots.txt pour bloquer le robot CCBot sur tout votre site. Ajouter les informations suivantes : User-agent: CCBot Disallow: /
- Utiliser une balise nofollow : Ajoutez une balise nofollow dans les métadonnées de votre site pour éviter l’indexation par CCBot. Le code est le suivant : <meta name= »CCBot » content= »nofollow »>
- Recourir à des captchas : Utilisez des captchas pour protéger votre site contre les robots, y compris ceux qui pourraient exploiter le contenu pour ChatGPT.
