Les robots de surveillance des entreprises sont réels

Parce que le capitalisme

Cet article a été initialement publié sur OH.MG le 5 juin 2022

Nous savons tous que si on raconte des conneries sur le Colonel Sanders sur les médias sociaux, on finira par recevoir une réponse du compte officiel de la marque, avec des excuses génériques et une demande de message privé. Il existe des tas d’applications de médias sociaux qui, pour un prix raisonnable, parcourent les silos à la recherche de noms de marques pour s’introduire dans les conversations.

Bien que cela soit ennuyeux, on accepte en quelque sorte que ces absurdités se produisent, car c’est la raison d’être des plateformes. L’engagement forcé par les conditions d’utilisation.

Cependant, c’est à l’âge d’aujourd’hui que j’ai découvert une pratique plus immonde. Salesforce utilise un robot (créé par Radian6, qu’ils ont racheté, je suppose) qui scanne tous les sites web qu’il trouve pour les mettre en avant auprès des maîtres de la marque. Il ne respecte aucun standard (robots.txt) et ils ont remplacé la page d’information du robot pour rediriger vers leur écran d’accueil commercial.

Les robots espions d’entreprise existent depuis un certain temps maintenant, il s’agit principalement des robots de référencement qui aiment créer des graphiques de merde pour agiter votre bite par obligation envers Google. Mais là, c’est encore plus miteux : ils indexent des sites pour les reconditionner de force à l’intention de leur base d’utilisateurs payants, sans permettre au propriétaire du site de s’y opposer (il vaudrait mieux qu’il s’agisse d’une option d’inclusion, mais j’en ai marre de vos sentiments).

Je publie mon contenu sur une base de partage non-commercial, je n’ai rien de spécial ici et cela ne me dérange pas de partager des choses tant que vous n’essayez pas de les vendre.

C’est l’une des raisons pour lesquelles j’ai envoyé à Salesforce un email plutôt merdique aujourd’hui, leur bot vient s’écraser, gaspillant de la bande passante pour voler du contenu à revendre derrière un paywall pour des entreprises qui viennent faire irruption sur des sites où elles n’ont pas le droit d’être, et plus néfaste encore, ce connard semble chercher une section de commentaires pour s’y injecter.

Si l’on ignore l’aspect RGPD de la question, à savoir la création de profils d’utilisateurs à leur insu et à partir de l’endroit qu’il juge approprié pour le faire, la décision d’ignorer la licence d’utilisation du contenu est assez choquante. Je suppose que je peux me considérer comme un créateur de contenu (je crée du contenu, tu vois) et il est affreux de détourner mes œuvres pour cela.

Puisque ce robot ignore votre demande de fairefoutre.txt, j’ai trouvé quelques instructions en ligne sur la façon dont vous, en tant que personne sur un site web, pouvez empêcher ce robot de vous regarder. Une option d’exclusion de l’intermédiaire, si vous voulez. Je dois rendre hommage à un article de 2008 que j’ai trouvé en cherchant plus d’informations / des détails de contact pour ce trou du cul de robot pour la réponse : Wow another corp snoop bot

tl;dr .htaccess avec (pour autant que vous ayez déjà activé le moteur de réécriture) :

RewriteCond %{HTTP_USER_AGENT} ^R6_
RewriteRule .* - [F]