Retour à la page d'accueil

EMI | Chercher, analyser : outils spécialisés

Chercher, analyser : outils spécialisés Si tout le monde connait Google, Yahoo! ou Qwant, les services du type, Google search console, de backlinks, de recherche en cache ou en archive le sont moins.

A quoi servent les outils SEO (pour Search Engine Optimization) en français : « Optimisation pour les moteurs de recherche ». Et les autres services spécialisés dans la recherche ? Comment les utiliser ?

Panorama de quelques outils.

SOMMAIRE
Voir aussi
horloge
|
Difficulté
batterie
|
DYS DYS
NO-DYS NO-DYS

Prolégomènes

L'URL

Un site internet, une page Web, c'est d'abord une URL. Et un nom de domaine bien choisi favorisera le bouche à oreille et permettra au site de gagner plus vite en popularité. C'est donc aussi l'un des premiers éléments d'information d'un site.

4 exemples d'URL

Dans ce premier exemple, l'url est toute simple, emi.re avec un protocole sécurisé, https://
www n'est pas obligatoire, et peut d'ailleurs correspondre à une autre adresse.

Le protocole est http est en mode sécurisé (https://)
mais l'accès par http:// est également possible.

ancres 2

Cette seconde URL ne diffère de la première que de part le slash "/". A l'affichage, cela ne change pas grand chose.

ancres 2

De fait le slash "/" ne fait que précéder la véritable page par défaut affichée, à savoir ici index.html. Cette notation est une convention, par défaut et le plus souvent c'est la page index.html (ou même index.htm) ou index.php qui est affichée lorsque vous saisissez l'url emi.re. Mais ce pourrait être toute autre page.

ancres 2

Ici nous affichons la page 'Referentiel_CLEMI_final.pdf' qui se trouve elle-même dans le répertoire pdf du site emi.re. Ce nom de fichier, s'il est totalement libre ou presque, n'en est pas moins interprété par les robots qui indexent le web. Dans quel sous répertoire se trouve le fichier ? Le nom est-il signifiant ? Autant d'indications qui peuvent se révéler utiles.

ancres 2

Pour tester vos connaissances des URL, voir le module dédié.

Les ancres

Les ancres permettent de faire un lien vers un endroit précis de la page. Par exemple une sec, un bas ou un haut de page, bref n'importe quel endroit d'une page Web. Les ancres participent à la structuration des pages Internet et à leur bonne compréhension par les robots de crawl des moteurs de recherche.

L'ancre elle-même est constituée de deux partie de code.

Dans l'URL, elle est introduite par le caractère #.

ancres 1

Dans la page, la cible est constituée d'un identifiant unique.

ancres 2

Passage de variables

L'adresse ci-dessous permet de transmettre deux variables nommées q et t, et leur valeur, La Réunion (soient l'espace, %20 et le é de Réunion, %C3%A9, encodés en utf-8), et web. L'esperluette "&" sert à séparer les variables.

ancres 2

Autrement dit, l'URL permet aussi de transmettre des données en clair (lisibles), via la méthode GET au serveur, qui va les interpréter et renvoyer une réponse adaptée.

Activités

Testez l'adresse suivante : https://www.qwant.com/?q=EMI&t=web

Déduisez-en le paramètre à modifier pour faire une recherche en actualité avec le mot clé EMI ?
Et pour une image ?

Pour chercher une image, la valeur de la variable t va être égale à "images", et pour une actualité à " news".

https://www.qwant.com/?q=EMI&t=images
https://www.qwant.com/?q=EMI&t=news

La technologie d'un site web

Il existe deux technologies utilisées en matière de création de site internet. Il est soit statique, soit dynamique.

Les sites conçus en HTML sont généralement « statiques ». Le langage HTML est utilisé pour le développement côté client : c’est le navigateur qui interprète le langage. Il peut être complété par du JavaScript (extension .js).

Un site internet dynamique sera développé dans un langage de programmation spécifique, le PHP.
PHP est utilisé pour le développement « côté serveur », autrement dit les informations peuvent par exemple être extraite à la demande d'une base de données et ensuite générées sous forme de page utilisateur.

Les pages peuvent être uniques (générées en fonction du profil par exemple stocké dans un cookie) mais aussi non indexées par les moteurs de recherche.

Content Management System

Le saviez-vous ?Les CMS, Content Management System, en français Système de Gestion de Contenu sont des applications web qui gèrent la création et la publication de documents, éventuellement de façon collaborative. Le plus souvent les textes sont stockés dans des bases de données, puis extraites, mises en forme et présentées à la demande.
C'est ce qu'on appelle des sites dynamiques, autrement dit dont la forme n'est pas figée mais qui peut même être unique selon l'utilisateur.

Exemples de CMS

  • Les portails : SPIP pour l'un des plus anciens (et un coup de coeur), Wordpress l'un des plus utilisé, sans oublier Joomla, un projet collaboratif de CMS Internet et intranet en PHP ou Drupal, disposant également d’une communauté de support, avec les mêmes fonctionnalités que Joomla.
  • Les blogs : Les portails proposent souvent l'activation de blogs. Voir également TYPO3 ou eZ Publish
  • Les wikis : Ce sont des sites dont le contenu est édité par les visiteurs. Convient donc à des encyclopédies, des sites culturels généraux ou spécialisés dans un thème. Citons MediaWiki qui propulse Wikipedia, PmWiki et DokuWiki
  • Forum : Citons fluxBB, phpBB ou vBulletin. BbPress est une version de Wordpress adaptée aux forums. L'avantage est dans les extensions de Wordpress.
  • E-commerce : Citons PrestaShop, Shopify, Woocommerce, Magento
  • Education : Des CMS spécialisés dans l'apprentissage et la formation, par exemple Moodle ou Magistère
  •  …

Le propriétaire du site

Afnic Créée en 1997, l’Afnic est l’Association Française pour le Nommage Internet en Coopération. Elle est gestionnaire historique du .fr et permet de trouver des informations sur le propriétaire du nom de domaine, à minima le serveur qui héberge les données.

Plus généralement c'est le service www.whois.com/ qui permet de savoir à qui appartient un nom de domaine.

lienwww.afnic.fr/fr/
Activités

Testez différentes adresses de site (noms de domaine) pour savoir où ils sont hébergés et qui en est l'éventuel propriétaire

SEO…

Qu'est-ce que le SEO ?

L’optimisation pour les moteurs de recherche, ou SEO ( S earch E ngine O ptimization ) est un ensemble de techniques visant à favoriser le positionnement d'une page Web dans les résultats de recherche des moteurs.

Les outils SEO pour Search Engine Optimization permettent aux développeurs de site d'analyser le trafic de leur site.

Qui vient, d'où ? combien de temps reste-t-il ? Avec quel terminal ? Etc.

Sauf que l'époque des années 90, où il suffisait d'ajouter le nom de "Pamela Anderson" dans les métadonnées pour être sur de faire de buzz est bien finie.
Les algorithmes mis en œuvre par les moteurs de recherche pour classer les réponses relèvent de secrets que personne n'a véritablement trouvé. S'il y a certes des indices, des conseils même pour optimiser un site, mais la véritable recette, de surcroit changeante n'est pas connue.

L'optimisation d'un site, l'étude de son classement, son positionnement dans les réponses des moteurs de recherche est donc désormais affaire d'entreprises spécialisées qui facturent leurs services à des prix qui ne sont d'ailleurs pas négligeables (voir plus loin).

Quels sont les enjeux ?
Être proposé dans les premières réponses des moteurs de recherche. Créer de l'audience et du temps de présence, faire le buzz…

Car ici comme ailleurs le temps, c'est de l'argent. D'où la question fondamentale à toujours se poser : Pourquoi ? Quel modèle économique ?

Seules les premières pages étant généralement consultées lors d'une recherche, l'objectif pour tout référenceur ou entreprise de référencement est de vous faire remonter le plus possible dans le classement.

lienreferencement.abondance.com/

SEO

Source de l'image: http://www.alltrousers.com/

Le générateur de mots clés de Google permet de se faire une idée sur le nombre de fois qu'un mot clé a été utilisé dans un domaine, voire une langue, une région déterminée.

Plus un mot clé est utilisé, plus le nombre de pages est important.

Adwords

Adwords est un outil de planification de mots clés. Autrement dit la régie publicitaire de Google. Celui-ci affiche des annonces ou bannières publicitaires soit sur Google soit sur le réseau partenaire Display, qui sont ciblées en fonction des mots-clés que tape l'internaute ou en fonction de son comportement de navigation.

Les annonceurs paient lorsque l'internaute clique sur la publicité selon un système d'enchère et de qualité : plus l'annonce sera pertinente pour l'utilisateur, plus le prix au clic sera bas et l'annonce en évidence. Ceci afin d'inciter les publicitaires à fournir des renseignements pertinents par rapport à la demande de l'utilisateur. Les annonceurs paient lorsque l'internaute clique sur la publicité selon un système d'enchère et de qualité : plus l'annonce sera pertinente pour l'utilisateur, plus le prix au clic sera bas et l'annonce en évidence. Ceci afin d'inciter les publicitaires à fournir des renseignements pertinents par rapport à la demande de l'utilisateur.

World continents

lienadwords.google.fr/KeywordPlanner

adwordsA noter ici la notion d'enchère suggérée.
Le C oût P ar C lic (CPC) est le prix que paye un annonceur à Google lorsqu'un internaute clique sur une annonce adwords. Ces annonces sont celles qui sont affichées lors du résultat d'une recherche.
Ce coût va évoluer à la hausse ou à la baisse selon le nombre de clics sur la bannière de pub. Chaque annonceur achète un ou plusieurs mots clés et les gère en fonction du résultat généré.

Formes de publicités possibles

Google AdWords propose aux annonceurs différentes formes de publicité. Des annonces ou bannières publicitaires sont ciblées en fonction des mots-clés que tape l’internaute ou en fonction de son comportement de navigation.

Annonces textuelles : Ces annonces de deux lignes sont la forme la plus classique sous Google AdWords. Elles se composent d’un titre, d’un texte publicitaire et d’un lien (url en protocole https, 15 c. max, 3 titres de 30 c. max. 2 descriptions de 90 c. max).

Annonces textuelles

A noter. Ce format d'annonce va disparaître en juin 2022.

Annonces responsives : L'annonceur renseigne diverses occurrences de titres et descriptions possibles pour chaque annonce. L’algorithme se charge de tester les différentes combinaisons pour diffuser la plus pertinente ! 90 combinaisons possbles (protocole https, 15 c. max, 9 titres de 30C. max, 2 descriptions de 90 c. max.

Annonces Discovery Ads et Discovery Campaigns :

Annonces Discovery
  • Un court en-tête choisi par Google (catégorie de produit)
  • Un large visuel
  • Un titre précédé de la mention « Ad »
  • Une description
  • Un logo suivi par le nom de l’entreprise
  • l’URL finale qui n’apparait pas sur l’annonce
(url en protocole https, 15 c. max, 5 titres de 40 c. max. 5 descriptions de 90 c. max, nom de la société 25 c.).

Les générateurs de mots clés

Ils permettent aux annonceurs de d'analyser la position et la qualité de leurs mots clés, de trouver les mots clés des concurrents etc.

Générateur de mots clés
lienanswerthepublic.com/

Le Web caché

cerner L'essentiel du Web est invisible (en anglais deep web) car non indexé par les moteurs de recherche bien qu'accessible en ligne représentant 70 à 75 % de l'ensemble. Un moteur comme base permet toutefois des recherches de type bibliographiques. En 2012, 54% des internautes ont recours aux moteurs de recherche contre 32% aux réseaux sociaux pour trouver de nouveaux contenus en ligne.

Backlinks

Ancres et backlinks peuvent être visionnés par divers outils en ligne. Certains sont payants, d'autres proposent leur service gratuitement.

ancreComment connaitre les pages qui pointent vers un site, le vôtre ou n'importe lequel ?

Les backlinks, ce sont les liens externes pointant vers votre site. Par exemple, une page peut lister différents sites et renvoyer vers des sites soit vers la page d'accueil, le plus souvent celle par défaut, index.html, soit vers des pages précises via leur ancre, par exemple index.html#QuiSuisJe.

Testez vous-même !

Majestic

Majestic est un des outils SEO les plus connus ; il inclut notamment un backlink checker. La première recherche est gratuite puis c'est 46,99 € par mois…

Recherchez l’URL de votre site (ou de celui d’un concurrent) et cliquez sur l’onglet « Backlinks » pour accéder à la liste des liens et de leur source. S’il peut être utilisé gratuitement, il faudra choisir la version payante pour accéder à toutes les fonctionnalités de Majestic.

lienmajestic.com/

Rank Signals

Rank Signals est un outil totalement gratuit permettant d’analyser les liens externes de n’importe quel site. Il suffit de s’inscrire sur le site pour accéder à tous les résultats (sans quoi, vous ne verrez que les 5 premiers backlinks).

Pour tester un site précis, il suffit d'ajouter l'adresse.

lienwww.ranksignals.com/

Monitor Backlinks

Monitor Backlinks est un outil performant pour surveiller vos liens externes et vous assurer de leur qualité et de leur bon fonctionnement. Le service est payant mais vous pouvez réaliser un essai gratuit. Avec ces 10 outils, vous pourrez améliorer votre 'link building' et éviter des erreurs de SEO qui pourraient vous coûter cher. Besoin d’aide pour améliorer le référencement naturel de votre site ? Faites appel à un consultant SEO freelance sur Codeur.com.

lienmonitorbacklinks.com/

Buzz

Le Buzz est une technique marketing consistant à susciter du bouche à oreille autour d'un évènement, d'un produit ou d'une offre commerciale et, ce faisant, des retombées dans les médias.

C'est en quelque sorte le bruit de fond d'un évènement, d'une action, d'une information…
Il peut être recherché volontairement ou pas.

Là encore, de nombreux services payants, par exemple buzzsumo, mais aussi Google alert qui vous permet de recevoir une alerte en fonction de mots clés (compte nécessaire).

 Google alert

Le community manager

Le community manager ou CM maîtrise principalement les réseaux sociaux et les codes de communication d’Internet.
C'est un médiateur entre une communauté et la structure pour laquelle il travaille. Il devient ainsi le porte-parole de la marque ou l’entreprise sur Internet. Son travail consiste en amont à créer et à gérer une communauté : Il la recrute et l’anime en l’engageant. C’est réellement cet engagement qui est au cœur de ses préoccupations et de lui découle toute la dimension de son travail.

lienwww.onisep.fr/

Audience

Google analytics

Le service de mesure d'audience le plus connu et utilisé est sans doute Google analytics. Google Analytics est un service gratuit d'analyse d'audience d'un site Web ou d'applications utilisé par plus de 10 millions de sites, soit plus de 80 % du marché mondial (source Wikipedia).

Google analytics fournit énormément de données sur les utilisateurs, mais comme toujours récupère nativement des données personnelles (mais cela peut être désactivé).

Google analytics

Google Search console

Google Search consoleOutil complémentaire de Google Analytics, la Search Console permet de vérifier l'indexation de leur site web par Google. Les administrateurs d'un site web peuvent ainsi visualiser divers paramètres de leur site : la fréquence d'indexation des robots de Google, mots clés ayant conduit à une visite de leur site, contraintes liées au Smartphone…

Bref, c'est un outil dédié au suivi des performances et à la détection des erreurs.

Exemple de rapport

Google Search console

Les outils de recherche spéciaux

Chercher dans les archives

La Wayback Machine (littéralement « la machine à revenir en arrière ») est un site web mis à disposition par Internet Archive afin d'offrir un accès à des clichés instantanés de pages web stockés par l'organisme.

Exemple. La page du lycée Gauguin de Tahiti en 2000

Site du lycée Gauguin

Google analyticsLa BnF assure le dépôt légal de l’internet français. Sa collection de sites archivés, qui est parmi les plus anciennes et les plus riches dans le monde, est ouverte à toute personne justifiant d’une recherche.

L’archivage du web s’inscrit depuis 2006 dans le cadre de la mission de dépôt légal de la BnF. Il porte sur le domaine français, c’est-à-dire les sites enregistrés en .fr, sous une extension liée au territoire national (.re, ou .bzh par exemple), ou sous extension générique (.com ou .org par exemple) à la condition qu’ils soient produits en France ou que leur auteur y soit domicilié.

Malheureusement ces archives ne sont accessibles que dans le cadre d'une recherche et dans certaines bibliothèques en région offrant un accès distant .

lienwww.bnf.fr/fr/archives-de-linternet
lienarchive.org/web/

Chercher dans la cache des moteurs

La cache, ou plus exactement la mémoire des moteurs, ce sont des pages qui sont enregistrées et peuvent éventuellement être retrouvées. Il n'est évidemment pas question ici, à l'instar de la waybackmachine de trouver un site entier d'il y a 20 ans. Mais pour des informations récentes cela reste possible.

Le délai entre deux visites d'indexation varie en fonction des sites, de leur popularité, de leur fréquence d'actualisation, etc. (toutes les 2 à 3 semaines en moyenne, mais cela peut aussi se compter en mois). Dans cet intervalle, l'ancienne version d'une page web peut encore être visible dans le "cache" des moteurs de recherche, même si elle a été modifiée sur le site d'origine.

Chercher dans la cache des moteurs

Chercher dans les bibliothèques

Worldcat

Worldcat constitue la base de données bibliographique la plus large du web. C'est un moteur de recherche référençant les catalogues de plus de 72 000 bibliothèques situées aux quatre coins du globe.

worldcat

Vous pouvez rechercher des livres, des CD de musique et des vidéos populaires, tous les éléments physiques que vous avez l'habitude d'obtenir des bibliothèques. Vous pouvez également découvrir de nombreux nouveaux types de contenu numérique, tels que des livres audio téléchargeables. Vous pouvez également trouver des citations d'articles avec des liens vers leur texte intégral; des documents de recherche faisant autorité, tels que des documents et des photos d'importance locale ou historique; et des versions numériques d'articles rares qui ne sont pas accessibles au public. Les bibliothèques WorldCat desservant diverses communautés dans des dizaines de pays, les ressources sont disponibles dans de nombreuses langues.

lienwww.worldcat.org/

Ngram

Ngram vous permet d'afficher sous forme de graphique, le nombre d'occurrences d'un mot ou d'une phrase dans les livres numérisés par Google books.

Ngram

lienbooks.google.com/ngrams/

Sciences

Chercher des informations scientifiques

WorldWideScience.org est une passerelle scientifique mondiale qui permet d'effectuer une recherche fédérée de bases de données et de portails scientifiques nationaux et internationaux.

Worldscience

lienworldwidescience.org/

Chercher une thèse

theses.fr est le moteur de recherche des thèses de doctorat françaises. Il donne accès au signalement de la plupart des thèses de doctorat soutenues en France depuis 1985 et de toutes les thèses en préparation.
Quand les droits de diffusion en ligne ont été obtenus, on peut également consulter et interroger le texte intégral de la thèse à partir du site.

Chercher une thèse

lienwww.theses.fr/

Pour ne pas conclure

Actualité d'une recherche

Google trend permet de découvrir ce que recherchent les internautes en saisissant un mot clé ou un sujet de 2004 à ce jour. Il permet également d'afficher les tendances de recherches au quotidien ou en temps réel.

Google trend

lientrends.google.fr/