The Verge rapporte que les documents qui ont fait l'objet de la fuite, soit 2 500 pages, donnent un aperçu sans précédent de la manière dont l'algorithme de recherche de Google classe les sites web, un processus qui a longtemps été entouré de mystère. La fuite a été communiquée à Rand Fishkin, un expert en référencement ayant plus de dix ans d'expérience, par une source qui espérait contrer ce qu'elle croyait être des « mensonges » répandus par les employés de Google sur la fonctionnalité de l'algorithme de recherche.
Bien que les informations divulguées soient très techniques et plus accessibles aux développeurs et aux professionnels du référencement, elles offrent des indications précieuses sur les données que Google recueille sur les pages web, les sites et les internautes. Bien que les documents ne prouvent pas définitivement que Google utilise les données et les signaux mentionnés pour le classement des recherches, ils fournissent des indices indirects sur ce que l'entreprise juge important, selon l'expert en référencement Mike King.
La fuite concerne divers aspects de l'algorithme de recherche de Google, notamment le traitement de sujets sensibles tels que les élections, le traitement des petits sites web et les types de données collectées et utilisées. Notamment, certaines informations semblent contredire les déclarations publiques faites par les représentants de Google, comme le soulignent Fishkin et King.
"Le terme « mensonge » est un peu fort, mais c'est le seul mot exact à utiliser ici", a écrit M. King dans son analyse des documents.
Google n'a pas contesté publiquement la légitimité des documents divulgués, malgré les nombreuses demandes de commentaires de The Verge. Toutefois, un employé de Google a contacté Fishkin pour lui demander de modifier certains termes de son article concernant la caractérisation d'un événement.
L'algorithme secret du géant de la recherche a donné naissance à toute une industrie de spécialistes du marketing qui suivent de près les conseils publics de Google pour optimiser les sites web de millions d'entreprises dans le monde. L'utilisation généralisée de ces tactiques a donné l'impression que les résultats de recherche de Google se détériorent, encombrés de contenus de mauvaise qualité que les exploitants de sites web se sentent obligés de produire pour maintenir leur visibilité.
Les documents ayant fait l'objet d'une fuite soulèvent des questions quant à l'exactitude des déclarations publiques de Google concernant le fonctionnement du moteur de recherche. Par exemple, alors que les représentants de Google ont indiqué à plusieurs reprises que les données de Chrome ne sont pas utilisées pour le classement des pages, les documents mentionnent spécifiquement Chrome dans les sections traitant de la manière dont les sites web apparaissent dans les résultats de recherche.
Un autre point de désaccord concerne le rôle de E-E-A-T (expérience, expertise, autorité et fiabilité) dans le classement. Bien que les représentants de Google aient précédemment déclaré que l'E-E-A-T n'était pas un facteur de classement, les documents suggèrent que Google recueille des données sur les auteurs des pages et dispose d'un champ indiquant si une entité figurant sur la page en est l'auteur.
« Si je ne reproche pas nécessairement aux représentants publics de Google d'avoir protégé leurs informations confidentielles, je m'insurge contre leurs efforts visant à discréditer activement les personnes du monde du marketing, de la technologie et du journalisme qui ont présenté des découvertes reproductibles »