Vous souhaitez connaître la date exacte de création d’un site internet ? Nous sommes désolés de vous apprendre que c’est souvent impossible. Lors de la création d’un site internet, il se passe presque systématiquement un délai entre le dépôt du nom de domaine et la publication d’un service web au design abouti. Selon la complexité du projet, cette période peut aller de quelques jours à plusieurs mois.
Dès lors, la détermination exacte de la date de première publication des pages d’un site web relève de la divination. Il existe toutefois quelques techniques pour se faire une idée assez précise de cette période.
Pour vous éclairer, nous avons demandé à Mickael Mondon de Cmondon.com, consultant webmarketing et spécialiste de la création de site à la Réunion, de passer en revue les principales possibilités qui s’offrent à nous. Il décrypte l’efficacité de techniques communes, comme la date de publication du premier article, et présente la méthode la plus fiable pour déterminer l’antériorité d’un site web.
Voici les possibilités qui s’offrent à nous pour connaître la date de création d’un site internet.
Consulter les « archives » du Web
Depuis 1996, un site archive le World Wide Web et compte aujourd’hui plus de 150 milliards de copies de pages web. Il s’agit de Internet Archive que vous pouvez consulter sur archive.org. Détenu et géré par une association à but non lucratif, cette bibliothèque enregistre des millions de logiciels, de films, de livres et de sites internet. Complètement gratuit, il permet de retracer les évolutions des domaines que vous souhaitez suivre, de la création du site originel à sa version actuelle.
Pour connaître, la date de lancement d’un site ou ses évolutions, il vous suffit de consulter le moteur de recherche The Wayback Machine. Son utilisation est simple, vous n’avez qu’à copier l’URL du site ou du blog qui vous intéresse, puis de la coller dans la barre de recherche et de faire un retour chariot. Vous accédez aux archives du site en question présentées chronologiquement. Vous pourrez d’ailleurs retrouver à l’aide de cet outil, les sites qui n’existent plus ou qui ont fermé. Il est également parfois possible d’y retrouver des pages qui ont disparu de la circulation
La page de résultat de votre recherche est organisée selon les dates de publication. Juste au-dessus de l’histogramme, la Wayback Machine vous indique le nombre de copies du site qu’elle a réalisé entre la date de première détection et sa dernière copie. Cela vous permet de déterminer avec précision le premier archivage du site, en consultant l’archive vous allez pouvoir vérifier s’il s’agit d’une page d’attente ou d’un vrai service web. Selon votre constat, vous aurez une bonne idée de la mise en ligne du site.
Cette technique ne fonctionne pas à tous les coups. Certains sites ne sont pas archivés par cet outil. Il s’agit toutefois essentiellement de petits sites personnes, à l’audience confidentielle, ou de pages créées sur les plateformes de blogging. Malgré ces limites, The Wayback Machine est sans conteste l’outil numéro 1 pour déterminer la date de publication d’un service en ligne.
Rechercher les informations du registre des noms de domaine
Un site professionnel possède son propre nom de domaine (NDD). Les informations relatives à l’enregistrement et au renouvellement des noms de domaine sont répertoriées dans un registre central.
Qu’est-ce qu’un registre ? Il s’agit d’organismes publics ou privés dont l’objectif est de gérer les noms de domaine. Chaque registre est responsable d’une ou plusieurs extensions génériques, comme le .com, le .net ou le .edu, ou nationales, comme le .fr pour la France, le .be pour la Belgique ou le .tv pour Tuvalu. Ces organisations tiennent des bases de données qui rassemblent l’ensemble des noms de domaines déposés pour une extension spécifique (TLD pour Top Level Domains en anglais).
Vous pouvez accéder à ces bases via des services « whois » qui est la contraction de l’interrogation : “Who is ?”. Ces whois peuvent être trouvés sur les sites des registres, mais également au travers services qui vont consolider en une base centralisée les données de différents registres.
Ces bases sont riches en informations (incomplètes malheureusement) sur les déposants, les dates de dépôt, etc… Elles possèdent toutefois d’importantes limites qui compliquent sérieusement votre travail de détermination de la date de genèse d’un site internet. Voici les deux principales :
- Un site web d’une entreprise peut avoir au cours de sa vie différents noms de domaines. Ce changement de NDD est généralement causé par une changement de marque (“Raider” qui devient “Twix”), une volonté de s’internationaliser (le .com remplace un .fr), un conflit avec un webmaster qui omet de renouveler le domaine ou un oubli de renouvellement.
- Une nom de domaine peut retomber dans le domaine public avant d’être repris par un autre déposant. Dans ce cas là, la date de création indiquée est celle du nouveau dépôt.
Comme vous pouvez le constater, cette méthode est particulièrement imparfaite.
Analyser d’URL des pages
Sur certains sites, il est possible de déterminer la date de publication grâce à l’URL de la page. C’est notamment le cas des blogs créés avec les paramètres standards de WordPress. Elle va donc essentiellement concerner les sites éditoriaux, les blogs ou les sites d’entreprises qui proposent une section éditoriale.
Pour ce faire, allez sur un article et regardez si l’adresse présentée dans la barre d’URL est sous le format suivant :
https://sitewordpress.fr/2021/09/25/exemple-article/
Comme vous pouvez le voir, cette URL issue d’un site WordPress est structurée à l’aide de l’année, du mois et du jour de publication.
Lorsqu’elle est possible, cette méthode permet d’avoir une idée approximative et non pas exacte de la publication d’un article ou du post d’un blog. La date présentée dans l’URL est en effet souvent celle de la création de l’article dans le back office du site, et non sa date de mise en ligne.
Décrypter les comptes sur les réseaux sociaux : Facebook, Twitter, Instagram.
N’hésitez pas à chercher si le site possède une page Facebook, un compte Twitter ou une présence sur Instagram.
Ces actifs sur les médias sociaux sont utilisés pour relayer les informations principales et l’actualité d’une entreprise. Il y a fort à parier que la mise en ligne de site internet de l’entreprise a été annoncée dans les heures ou les jours qui ont suivi sa publication.
En passant en revue ces comptes sur les réseaux sociaux, vous allez également pouvoir déterminer avec plus de précision le lancement des différentes versions d’un site. Pour éviter de chercher une aiguille dans un botte de foin, déterminez à l’aide du Wayback Machine la plage calendaire qui correspond à un changement de design du site.
Cette méthode est assez fiable pour les sites web créés après 2009 ou 2010. Facebook a été créé en 2004, mais son nombre d’utilisateurs en France a seulement explosé qu’à partir de la fin de la décennie.
Réaliser une recherche avancée sur Google avec l’ opérateur before:
Pour être honnête, cette technique est plus utile pour tenter de déterminer la date de publication d’un article que celle d’un site. Elle consiste à utiliser la syntaxe de recherche avancée de Google. Ce moteur de recherche met à disposition des internautes des opérateurs qui permettent d’affiner la recherche.
Dans le cas qui nous intéresse, l’opérateur before: va permettre de demander à Google d’afficher uniquement les résultats indexés avant une date donnée. Pour les connaître, c’est très simple. : recherchez le “nom de domaine” suivi de before:DATE. Voici ce que cela donne
rev3days.fr before:2018
Regarder le copyright dans le pied de page
Il arrive parfois qu’il est possible de déterminer l’année de création d’un site grâce aux informations présentées dans le copyright. Cette méthode est toutefois très peu fiable car de nombreuses entreprises choisissent de présenter uniquement l’année en cours.
Dans l’éventualité où une plage d’années est présentée, il est toutefois nécessaire de vérifier à quoi correspond la première année. Pour mener à bien cette vérification vous allez utiliser la Wayback Machine. La boucle est bouclée !