Aidenet.com  Aide informatique et nouvelles technologies
Accueil Télécharger
Actualités Boutique
Dossiers Forum
Encyclopédie Annuaire
 Créer son site
 
Accueil / Sommaire
CSS : tutoriel complet
Javascript : tutoriel
Réferencement
Les images
Les tableaux
Créer son blog
Couleur Héxa
 Internet
Accueil / Sommaire
 Informatique
Accueil / Sommaire
 Photo numérique
Accueil / Sommaire
 Logiciels
Windows XP
Skype
Claris Home Page
FTP Expert
Filezilla
Cute FTP
WinZip
 Aide
Index du site
Plan du site
Dico Anglais / FR.
Vocabulaire info.
Glossaire
Tags HTML
Liste extensions
Vocabulaire SMS
 Partenaires
Tutorial Internet
Les Outils de recherche

Page - 5  www.aidenet.com

 

 

ou Moteurs de recherche. (Search engine) 20.11.99

 

moteurs et annuaires

Je suis certain que l'information existe

mais je ne sais pas où la trouver ?

 

Généralités

Les données sur le Réseau sont si importantes et dispersées de par le monde, qu'elles ne peuvent être toutes prises en compte par les Outils de recherche. Ces derniers ne sont plus en mesure aujourd'hui d'effectuer un recensement complet et, de surcroît il n'est pas de mois qui passe sans que des accords de partenariat ou tout simplement des rachats interviennent avec les inévitables restructurations.

Hier vous aviez vos habitudes avec X et le lendemain vous découvrez que X et Z sont réunis, ce qui rend les serveurs chargés de gérer les bases de données subitement trop faibles pour faire face à la demande. A ce jour il existerait plus de 400 millions de document mais impossible de recenser avec précision.

Il faut noter également que pour les Webmasters qui cherchent à référencer leurs Sites, il y a problème devant la "fluidité" des supports avec ces regroupements ou rachats, et certains qui se trouvaient inscrits ont brutalement disparus des fiches de données.

Un référencement n'est jamais définitif.

 

Définition générale

Il est impératif, et bien que de façon non exhaustive, d'offrir à l'utilisateur la possibilité de formuler une requête  et par retour de lui fournir une réponse satisfaisante.

A la base vous trouvez un serveur(s) (ordinateur) qui héberge le maximum d'adresses URL, triées, classées et indexées pour une mise à disposition la plus complète et rapide à la fois. Au passage notez que le Web est un des services d'Internet qui recense le plus de données.

Ces adresses hébergées ne sont pas venues là par hasard mais suivant des systèmes de collecte que je définis suivant trois modèles totalement différents, même s'il existe des outils "hybrides" qui font Moteurs de recherche et Annuaires à la fois :

- Les Moteurs de recherche avec les mots clés.
- Les Annuaires qui ont adopté le classement thématique.
- Les Méta-moteurs au fonctionnement un peu "spécial".

- Les Hybrides (pour mémoire).

 

- Un Moteur de recherche utilise un programme qui contrôle un Robot , lequel va parcourir jour et nuit l'Internet pour y découvrir les informations nouvelles ou ayant été modifiées de manière substantielle pour les envoyer à son serveur de base. Là ces pages sont triées, indexées et stockées afin de les retrouver pour mise à disposition du demandeur.

Pour y parvenir chacun d'eux utilise des méthodes différentes ce qui modifiera par réaction diverses possibilités de recherche différentes mises à la disposition du chercheur. Mais avouez qu'il est dommage qu'une seule et même méthode ne puisse être employée pour obtenir ces résultats.

Même s'il est possible parfois de proposer l'inscription d'une URL, c'est normalement le robot qui va à priori vous découvrir et comme son serveur n'est aussi qu'une machine, vous risquez de vous retrouver classé dans les index de thalassothérapie ou massages en tous genres si vous avez choisi un nom de site du type "relax", pour désigner votre commerce proposant la vente de mobilier de repos.

Dans leur parcours ils vont souvent se contenter de relever les mots clés (META) placés à leur intention par les créateurs de sites ou de termes caractéristiques rencontrés dans les pages lorsqu'ils les visitent plus en profondeur grâce aux liens hypertexte rencontrés. Un petit défaut à signaler : leur nouvelle visite n'intervient environ que tous les mois et la mise à jour sur un sujet d'actualité risque d'en souffrir... un peu.

Dans le langage usuel ils désignent souvent sans distinction TOUS les outils de recherche quel que soit leur type, un peu comme le "frigidaire" est devenu un nom commun populaire (générique) alors qu'il est seulement celui d'une marque.

 

- Un Annuaire (ou Répertoire) est pour sa part structuré thématiquement, et la collecte des données s'opère à partir d'un formulaire à remplir avec précision, qui doit préciser aussi la catégorie dans laquelle vous souhaitez figurer (arts, loisirs, sports, multimédia....) et des sous-catégories (cinéma, théâtre, musique.. pour les arts) et ainsi la présentation est dite hiérarchique. Ici intervention directe du Webmaster qui sollicite son référencement.

La différence fondamentale d'avec les moteurs, c'est qu'il y a intervention humaine pour contrôler le Site avant enregistrement dans la base de données. Suivant leur spécificité certains annuaires vont s'attacher au contenu général et les autres au contenu de chaque chapitre ou encore aux deux.

Ainsi votre requête vous renverra l'adresse d'un Site spécialisé dans le premier cas, et dans le second vous obtiendrez l'adresse d'un chapitre répondant parfois de façon très précise et qui pourtant ne se trouve pas dans un thème spécialisé.

Crawlers sont les annuaires par indexation analysant l'ensemble d'un site (meta tags, liens).
Up-to-date sont les annuaires thématiques avec les sites classés par répertoires.

- Les Méta-moteurs ou Méta-chercheurs qui ne possèdent pas eux-mêmes de bases de données et se contentent d'aller chercher la réponse dans celles des autres serveurs de recherche qu'ils ont sélectionné.

- Les Hybrides offrent le choix entre le classement thématique et le mot-clé sont de plus en plus nombreux. Mais ce choix lorsqu'il existe, est présenté dans une seule fenêtre et ainsi très pratique.

 

Gratuit ?

-novembre 1999 - Oui et là intervient un facteur important, lorsqu'on sait que le financement est pour l'essentiel assuré par la présence de bandeaux publicitaires payés par les annonceurs, et qui sont d'autant plus nombreux que la fréquentation de l'outil de recherche est importante. C'est l'Audimat qui détermine la base de rentabilité comme dans beaucoup d'autres secteurs économiques et un outil souvent visité présente de très nombreux bandeaux et par ricochet le Webmaster de l'outil doit à son tour maintenir et améliorer une base de donnée performante pour conserver ses sponsors.

Si un moteur de recherche fournit bien et vite les renseignements demandés, il devient célèbre et si on précise que des centaines de millions de pages ont fait l'objet d'une requête auprès des outils de recherche en 1998 vous avez une idée de l'affaire.

 

Pourquoi faire ?

Vous avez constaté que l'Internet en général et le Web en particulier se sont rapidement développés et, les ressources existantes et sans cesse croissantes représentent une quantité gigantesque d'informations. Malheureusement si on ne peut les trouver, il est alors impossible d'en bénéficier.

Sachant qu'il existe des millions de Sites comportant chacun quelques fichiers ou plusieurs centaines, stockés sur des milliers de serveurs disséminés dans le monde et que de nouveaux fichiers s'ajoutent sans arrêt, voilà pourquoi dès le début il a fallu résoudre ce problème de gestion. Aux premières solutions trouvées il s'en est ajouté et même substitué de nouvelles sans cesse tendant vers la meilleure performance possible.

*** Ici je vous propose d'ouvrir une petite parenthèse pour définir ce sympathique internaute spécialiste du Web, le Surfeur nullement troublé ou intimidé par cette profusion de richesses, il ouvre son Navigateur et sur la page d'accueil qui s'affiche il choisit de cliquer sur un titre qui a retenu son attention et s'élance ainsi sur "sa planche". Parfois il démarre à partir d'une URL trouvée sur une revue, et pousse voir jusqu'où les liens hypertexte vont le conduire. Voilà qui s'appelle surfer au gré des vagues avec le plaisir de la découverte à chaque clic de souris, et pourquoi pas réussir une balade fort agréable et instructive. Il navigue à vue. Un seul risque : le chronomètre qui tourne régulièrement !! ***

Mais d'autres internautes souhaitent utiliser cette bibliothèque de données pour y trouver des informations spécifiques et bien définies, ce qui par la même occasion leur fait découvrir parfois grâce aux liens hypertexte des documents dont ils ignoraient même l'existence. Le tout dans un minimum de temps, assis tranquillement devant un ordinateur, avec possibilité d'imprimer off-line

ATTENTION, ne pas confondre d'une part les serveurs de recherche qui sont des ordinateurs permettant de fournir des informations, et d'autre part les liens hypertexte qui sont les moyens de navigation permettant de passer d'un endroit à un autre.

 

Comment ça fonctionne ?  spider

 

Les Moteurs de recherche utilisent des Agents, souvent appelés les "araignées" ou encore les "rampants" du Web qu'ils parcourent inlassablement.

Base de données : voilà où se trouve le trésor patiemment récolté, trié et archivé car pour fournir une réponse la plus précise possible il est souhaitable de posséder un répertoire renfermant le maximum d'URL correspondant à des données constamment actualisées.

Cette recherche permanente pour conserver et si possible augmenter les requêtes (autrement dit les clients) représente un travail titanesque rendu possible par des logiciels adaptés, ce qui n'exclut pas, comme déjà dit, pour certains de subordonner l'inscription des pages perso ou des sites commerciaux par exemple à un contrôle humain.

Il vous faut bien comprendre dès le début, que les serveurs de tous ces outils de recherche ne stockent pas les documents mais simplement les liens qui vont leur permettre d'aller les chercher pour vous les adresser.

Pour les Moteurs de recherche :

Si la plupart sont affectés aux recherches de données du Web, il en existe qui fouillent aussi d'autres services du Réseau et sont spécialisés pour les adresses e-mail, newsgroups, FTP,...

Pour le Web ces agents ont des programmes bien précis pour explorer tous les documents, certains suivant même les liens rencontrés (internes au site ou externes) alors que d'autres ignorent tous les liens externes et ne sortiront pas du contenu analysé. Il arrive que certains se focalisent sur les sites ou les pages les plus demandées et peuvent ainsi donner des réponses complètes ou presque, auquel cas tout de même ils limitent leurs informations concernant les autres sujets .

La bibliothèque virtuelle des connaissances humaines est à notre portée ! On y trouve il faut l'avouer de tout, mais je vous propose d'approfondir ce problème en lisant cette fiche :

 

"L'Internet, est-il dangereux ?"

Si vous venez de la page 13 "référencement", cliquez retour

tutoriel internet

Sommaire Internet ... @ ... Méthodes de recherche

Tous droits réservés © 1997- 2006. www. aidenet.com

 

 

 

 

 

 

 

 

- Requête, demande formulée dans un serveur de recherche par un utilisateur.Mais également employée lorsqu'une demande est formulée auprès d'un serveur pour obtenir l'envoi d'une page par exemple. (retour texte)

- Surf (surfer, surfeur), Sachant qu'il existe plusieurs centaines de milliers de sites qui chacun proposent plusieurs milliers de pages, que ces pages contiennent des liens hypertextes permettant de se déplacer suivant sa volonté d'un point à un autre, nous pouvons tout simplement "naviguer" sur cet océan d'informations mises à notre disposition. Naviguer, vagues, sommet des vagues, et nous voilà transformés en surfeur. Il existe d'autres explications plus détaillées ou fantaisistes, l'important c'est de se comprendre. A la télévision nous "zappons" ?! (retour texte)

- Off-line (hors ligne), toutes opérations effectuées sur notre ordinateur sans être connecté à l'Internet. On dit aussi qu'on est en "mode local" ou en "local". (retour texte)

 

 aide gratuite

Google
 
DERNIERS MESSAGES DU FORUM
probleme creation d'un site [HTML / CSS / Javascript]
Probleme pour affichage de mon menu entre FF et IE [HTML / CSS / Javascript]
afficher masquer un div en javascript [HTML / CSS / Javascript]
extenxsion .exe sur mac [A l'aide !]
Création d'un site Web d'hébergement [HTML / CSS / Javascript]
menu [HTML / CSS / Javascript]
probleme [Internet]
Problème de reconnaissance de cartouches (impriman... [Péripheriques]
Plus de souris sur PC [Péripheriques]
sauvegarde win.vista [Portables]
Probleme site php [PHP / ASP]
Installation de webmin sur ubuntu pour serveur ded... [Linux]
choix [Appareils photos numériques]
ma cam est bloquée [Internet]
Je suis là! [Présentez-vous]
Tous les messages ici...
Toshiba Satellite A200-214
590 € Details
Apple iPhone
369 € Details
Airis PDA T620
195 € Details
 



Partenaires : Youpil |  DivertissonsNous |  Annuaire blog |  Live Messenger |  Logiciels photo |  Hébergeur d'images |  Meuble TV |  Videosduweb |  Blog Webmaster |  PSP |  Sorties cinéma
Tous droits réservés © 1997-2008. www.aidenet.com     Edité par FAPROD