Accueil
Forums
Turoriaux
Inscription
Connexion
Fil RSS
Bienvenue invité !
Jeudi 08 Janvier 2009
Vous êtes ici: Crea-paradise.com > Tutoriaux > Conception web > Divers > Référencement d'un site > Fonctionnement de Google (1/2)

Fonctionnement de Google (1/2)



Informations sur le tutorial
Image du tutorial Auteur : funnycat Commentaires : 0
Note : Aucune Vu : 185
Date : 23/07/2008 à 16h05 Actions : Commenter et noter ce tutorial
Dernière modification : 12/08/2008 à 21h45


Vous voici sur l'un des tutoriels les plus important pour comprendre comment fonctionne un moteur de rechercher, principalement Google. Ce petit cours va être divisé en deux partie (l'autre étant le cours suivant). Vous allez d'abord voir comment Google fait pour aller chercher l'information dans ses données pour ensuite l'envoyer à l'internaute. Puis la deuxième partie va expliquer comment Google fait pour savoir si une page est meilleur qu'une autre.
Comme je l'ai dit précédemment il est important de connaitre les bases de fonctionnement de Google pour ensuite aller plus loin.

Recherche de résultat par Google

Pouvez-vous vous rendre sur Google puis faire la recherche du mot "ordinateur", s'il vous plait. Lorsque vous aurez effectuez cette recherche vous verrez une barre bleu horizontale avec des informations sur la recherche. Sur celle-ci il y a écrit ça:
Citation: Google
Résultats 1 - 10 sur un total d'environ 59 500 000 pour ordinateur (0,06 secondes)

Cette barre d'information signifie qu'il y a plus de 59 millions de sites internet qui contienne le mot "ordinateur" dans la base de donnée de Google. Et il vous affiche les résultats en 0,06 secondes. Extraordinaire!
Vous vous demandez peut-être comment il a fait. Si ce n'est pas le cas, vous devriez.
Et bien la réponse c'est que Google savait que quelqu'un allait lui demander de recherche "ordinateur" alors il avait la réponse déjà préparé. Effectivement, plusieurs centaine de personnes doivent rechercher ce mot chaque jour, alors pourquoi perdre un temps fou à rechercher à chaque fois quels sont les sites qui contiennent ce mot.
Avoir la réponse prête à être dites c'est une astuce pour gagner du temps, de l'argent et de l'énergie.
Information
Au passage, je tiens à préciser que le parc de serveur de Google basé aux états-unis est énorme. Je ne me souvient plus le nombre exact, mais Google possède plusieurs milliers de serveurs

Néanmoins, Google n'enregistre pas les résultats pour toutes les requêtes. Il y a certains mots qui ne sont pas recherché tous les jours donc se serait une perte de temps et d'argent de préparer trop de résultat. Donc certaines fois Google va effectivement faire une recherche dans sa base de donnée.

Les deux listes de Google

Il faut savoir que Google possède deux listes pour ses résultats: une liste principale et une liste secondaire (de mauvaises pages pas très pertinentes).
Lorsqu'un visiteur cherche une recherche populaire, Google ne vas même pas s'encombrer de la liste secondaire (souvenez-vous: perte de temps, d'argent et d'énergie).
Néanmoins, si il fait une recherche un peu pointue et qu'il n'obtient pas assez de résultat sur sa liste principale, alors il va regarder dans la liste secondaire.
Information
Je n'ai pas d'exemple précis à vous montrer, mais c'est pour cela que des fois Google vous indique "Recommencez cette recherche en incluant les pages exclus".


Fonctionnement comme un glossaire

Recherche d'un mot


A partir de ce chapitre, je vais vous expliquer comment Google fait pour recherche dans son répertoire.
Est-ce que vous avez déjà lu un livre dans lequel il y a un glossaire? Le glossaire fait une liste des mots clés important. A coté de chaque mot il y a le numéro de la page ou il est écrit (ou des pages, si il y en a plusieurs).
Si vous devez chercher une page qui contient le mot "fromage" vous allez rechercher dans le glossaire le mot "fromage" et celui-ci va vous révéler toutes les pages concerné. Pour un même livre vous allez donc avoir un résultat tel que celui-ci:
Citation: Index
Fromage : page 1, page 5, page 6, page 8, page 12, page 15, page 39, page 57

Pour le mot "souris" dans l'index vous pourrez avoir un résultat comme ça (exemple purement fictif):
Citation: Index
Souris : page 1, page 3, page 4, page 7, page 8, page 10, page 11, page 16, page 23, page 28, page 33, page 39

Comme vous pouvez le comprendre, Google va utilisez la même technique, il va se servir d'un index.

Recherche de 2 mots


La deuxième chose que je dois vous expliquer, c'est comment fait Google pour rechercher deux mots. En reprenant l'exemple du livre, imaginons que je recherche le mot "fromage" ET le mot "souris". La méthode c'est tout simplement de regarder quels sont les pages qui contiennent ces deux mots en associant les numéros de pages trouvé précédemment. Ce qui va donner ce résultat:
Citation: Index
Fromage et Souris: page 1, page 8, page 39

Ces 3 pages sont les pages communes qui contiennent à la fois "fromage" et à la fois "souris". Cette méthode est aussi utilisé par Google pour gagner: du temps, de l'argent et de l'énergie.

Méthode de divisions du travail

Imaginez que vous avez 100 personnes sous vos ordre. Chacun d'entre eux possède le même livre. Un jour en faisant un test vous avez remarquez que c'est Gérard le lecteur le plus rapide. Si vous voulez chercher le mot "souris" dans le livre, quel méthode allez vous utilisez:
  • Demander à Gérard de lire toutes les pages le plus rapidement possible pour rechercher toutes les pages où il est écrit le mot "souris".
  • Demander a chaque personnes de lire une page et de dire si oui où non elle a trouvé le mot "souris".

Sans nul doute la méthode qui consiste à diviser le travail est la meilleur. Google le sait, et au lieu d'acheter des super-ordinateurs de dernière technologie qui sont très rapide il préfère acheter plein d'ordinateur normaux pour que ceux-ci se répartissent la tache.
L'autre avantage de cette technique c'est que si un employé serveur tombe en panne il y en a plein d'autres qui fonctionne toujours donc le service est maintenu. En revanche, si tout Google ne reposait que sur un super ordinateur: imaginez le soucis si celui-ci était en panne.

Cours suivant

Dans ce cours ont viens de voir que Google a un index avec des résultats, mais on ne sais pas comment il fait pour savoir quel est la page qui est le plus "pertinente" à notre recherche. Autrement dit, on ne sais pas comment il fait pour classer les résultats. Ceci sera expliqué dans le prochain cours.

Sommaire



0 commentaire