Accueil Archivage Archive.today banni de Wikipédia : quand l’archive devient un risque

Archive.today banni de Wikipédia : quand l’archive devient un risque

La version anglophone de Wikipédia a décidé de supprimer tous les liens vers Archive.today, également connu sous le nom archive.is. En cause : l’utilisation d’un script déclenchant des requêtes massives contre un blog, et des soupçons de modification de contenus archivés.

Un service d’archivage au cœur d’une riposte technique

Archive.today fait partie des services d’archivage web les plus utilisés pour conserver une copie d’une page en ligne. Mais ces dernières semaines, le site s’est retrouvé au centre d’une controverse.

La communauté anglophone de Wikipédia a acté un consensus clair : les liens pointant vers Archive.today doivent être retirés et bloqués. La décision est d’ampleur. Elle implique la suppression de près de 695 000 liens répartis sur environ 400 000 pages. Motif invoqué : l’encyclopédie ne souhaite pas rediriger ses lecteurs vers un site susceptible d’exploiter leurs navigateurs pour mener une attaque par déni de service distribué.

Au cœur de l’affaire, un script JavaScript intégré à la page de vérification CAPTCHA d’Archive.today. Toute personne tentant d’accéder au service devait passer par cette page, laquelle déclenchait en continu des requêtes vers le blog d’un ingénieur de Google, Jani Patokallio. Depuis plus d’un mois, ce mécanisme contribuait à saturer le site ciblé.

L’origine du conflit remonte à un billet publié en 2023 par ce même ingénieur, dans lequel il s’interrogeait sur l’opacité entourant l’organisation du service d’archivage. Il y soulignait notamment la différence de transparence entre Internet Archive, structure à but non lucratif identifiée et documentée, et Archive.today, dont les responsables et le fonctionnement demeurent peu clairs, lit-on chez next.ink.

De la demande de retrait au bannissement

Selon l’auteur du blog, le webmaster d’Archive.today l’aurait contacté en janvier pour lui demander de retirer temporairement son billet, le temps que l’attention médiatique retombe. La discussion, rendue publique, montre une volonté de limiter la reprise d’informations jugées sorties de leur contexte, notamment après que plusieurs médias ont cité le billet dans le cadre d’une enquête sur l’identité du responsable du service.

La riposte technique via le script de CAPTCHA a toutefois changé la nature du débat. Pour les contributeurs de Wikipédia, le fait qu’un site puisse détourner les ordinateurs de ses visiteurs pour générer du trafic massif vers une cible constitue un seuil inacceptable. La question n’était plus seulement celle de la transparence, mais celle de la sécurité des utilisateurs.

Au fil des échanges, d’autres éléments ont été avancés : des preuves auraient montré que certaines pages archivées par Archive.today avaient été modifiées après coup, altérant leur fiabilité. Un point sensible pour un service dont la raison d’être est précisément de figer un contenu à un instant donné.

Malgré le fait qu’Archive.today héberge des archives introuvables ailleurs, y compris sur la Wayback Machine, la communauté a tranché. L’accès à ces contenus ne justifie pas, à ses yeux, l’exposition des lecteurs à un site impliqué dans une attaque DDoS et soupçonné d’avoir altéré des captures.