Fonctionnement de Google (1/2)
Informations sur le tutorial
Vous voici sur l'un des tutoriels les plus important pour comprendre comment fonctionne un moteur de rechercher, principalement Google. Ce petit cours va être divisé en deux partie (l'autre étant le cours suivant). Vous allez d'abord voir comment Google fait pour aller chercher l'information dans ses données pour ensuite l'envoyer à l'internaute. Puis la deuxième partie va expliquer comment Google fait pour savoir si une page est meilleur qu'une autre.
Comme je l'ai dit précédemment il est important de connaitre les bases de fonctionnement de Google pour ensuite aller plus loin.
Recherche de résultat par Google
Pouvez-vous vous rendre sur
Google puis faire la recherche du mot "ordinateur", s'il vous plait. Lorsque vous aurez effectuez cette recherche vous verrez une barre bleu horizontale avec des informations sur la recherche. Sur celle-ci il y a écrit ça:
Citation: Google
Résultats 1 - 10 sur un total d'environ 59 500 000 pour ordinateur (0,06 secondes)
Cette barre d'information signifie qu'il y a plus de 59 millions de sites internet qui contienne le mot "ordinateur" dans la base de donnée de Google. Et il vous affiche les résultats en 0,06 secondes. Extraordinaire!
Vous vous demandez peut-être comment il a fait. Si ce n'est pas le cas, vous devriez.
Et bien la réponse c'est que Google savait que quelqu'un allait lui demander de recherche "ordinateur" alors il avait la réponse déjà préparé. Effectivement, plusieurs centaine de personnes doivent rechercher ce mot chaque jour, alors pourquoi perdre un temps fou à rechercher à chaque fois quels sont les sites qui contiennent ce mot.
Avoir la réponse prête à être dites c'est une astuce pour gagner du
temps, de l'
argent et de l'
énergie.
Information
Au passage, je tiens à préciser que le parc de serveur de Google basé aux états-unis est énorme. Je ne me souvient plus le nombre exact, mais Google possède plusieurs milliers de serveurs
Néanmoins, Google n'enregistre pas les résultats pour toutes les requêtes. Il y a certains mots qui ne sont pas recherché tous les jours donc se serait une perte de temps et d'argent de préparer trop de résultat. Donc certaines fois Google va effectivement faire une recherche dans sa base de donnée.
Les deux listes de Google
Il faut savoir que Google possède deux listes pour ses résultats: une
liste principale et une
liste secondaire (
de mauvaises pages pas très pertinentes).
Lorsqu'un visiteur cherche une recherche populaire, Google ne vas même pas s'encombrer de la liste secondaire (
souvenez-vous: perte de temps, d'argent et d'énergie).
Néanmoins, si il fait une recherche un peu pointue et qu'il n'obtient pas assez de résultat sur sa liste principale, alors il va regarder dans la liste secondaire.
Information
Je n'ai pas d'exemple précis à vous montrer, mais c'est pour cela que des fois Google vous indique "Recommencez cette recherche en incluant les pages exclus".
Fonctionnement comme un glossaire
Recherche d'un mot
A partir de ce chapitre, je vais vous expliquer comment Google fait pour recherche dans son répertoire.
Est-ce que vous avez déjà lu un livre dans lequel il y a un glossaire? Le glossaire fait une liste des mots clés important. A coté de chaque mot il y a le numéro de la page ou il est écrit (
ou des pages, si il y en a plusieurs).
Si vous devez chercher une page qui contient le mot "
fromage" vous allez rechercher dans le glossaire le mot "fromage" et celui-ci va vous révéler toutes les pages concerné. Pour un même livre vous allez donc avoir un résultat tel que celui-ci:
Citation: Index
Fromage : page 1, page 5, page 6, page 8, page 12, page 15, page 39, page 57
Pour le mot "
souris" dans l'index vous pourrez avoir un résultat comme ça (exemple purement fictif):
Citation: Index
Souris : page 1, page 3, page 4, page 7, page 8, page 10, page 11, page 16, page 23, page 28, page 33, page 39
Comme vous pouvez le comprendre, Google va utilisez la même technique, il va se servir d'un index.
Recherche de 2 mots
La deuxième chose que je dois vous expliquer, c'est comment fait Google pour rechercher deux mots. En reprenant l'exemple du livre, imaginons que je recherche le mot "
fromage" ET le mot "
souris". La méthode c'est tout simplement de regarder quels sont les pages qui contiennent ces deux mots en associant les numéros de pages trouvé précédemment. Ce qui va donner ce résultat:
Citation: Index
Fromage et Souris: page 1, page 8, page 39
Ces 3 pages sont les pages communes qui contiennent à la fois "
fromage" et à la fois "
souris". Cette méthode est aussi utilisé par Google pour gagner: du temps, de l'argent et de l'énergie.
Méthode de divisions du travail
Imaginez que vous avez 100 personnes sous vos ordre. Chacun d'entre eux possède le même livre. Un jour en faisant un test vous avez remarquez que c'est Gérard le lecteur le plus rapide. Si vous voulez chercher le mot "souris" dans le livre, quel méthode allez vous utilisez:
- Demander à Gérard de lire toutes les pages le plus rapidement possible pour rechercher toutes les pages où il est écrit le mot "souris".
- Demander a chaque personnes de lire une page et de dire si oui où non elle a trouvé le mot "souris".
Sans nul doute la méthode qui consiste à diviser le travail est la meilleur. Google le sait, et au lieu d'acheter des super-ordinateurs de dernière technologie qui sont très rapide il préfère acheter plein d'ordinateur normaux pour que ceux-ci se répartissent la tache.
L'autre avantage de cette technique c'est que si un
employé serveur tombe en panne il y en a plein d'autres qui fonctionne toujours donc le service est maintenu. En revanche, si tout Google ne reposait que sur un super ordinateur: imaginez le soucis si celui-ci était en panne.
Cours suivant
Dans ce cours ont viens de voir que Google a un index avec des résultats, mais on ne sais pas comment il fait pour savoir quel est la page qui est le plus "
pertinente" à notre recherche. Autrement dit, on ne sais pas comment il fait pour classer les résultats. Ceci sera expliqué dans le prochain cours.
0 commentaire