Les moteurs de recherche sont le nom donné à des programmes informatiques qui nous permettent d'atteindre rapidement et facilement les informations que nous voulons atteindre sans se perdre dans l'infini de l'Internet. Afin de répondre aux requêtes envoyées à lui, un moteur de recherche doit «voir» les informations sur l'Internet dans ADVAN. En d'autres termes, un moteur de recherche ne peut que vous fournir les pages "il voit" et "se souvient" précédemment. Les pages ne peuvent pas être présentes aux utilisateurs s'ils ne l'ont pas vu ou vu auparavant. Mais comment un ordinateur voir et se souvenir des pages?
Les pages sur Internet sont connectées via des liens (lien). Cela permet de passer d'une page à l'autre. En outre, ils sont normalement des pages de lien vers des pages qui sont pertinentes pour eux. Par exemple, une page turque qui mentionne les chirurgies cardiaques, même sur le site, est peu susceptible de voir un lien vers une page française sur la nourriture pour chats. Ici, les moteurs de recherche commencent à partir d'un site, en tirant parti de cette fonctionnalité, et ils commencent à errer sur Internet. Quand ils voient une page, ils regardent la page comme un utilisateur sera à la recherche d'un navigateur comme Internet Explorer ou Firefox, et ils essaient de comprendre son contenu. Ils écrivent alors le contenu dans leur mémoire (encres dures) et suivent les liens sur la page à d'autres pages et font la même chose. Ainsi, ils peuvent visiter et essayer de se rappeler autant de sites que possible tout en naviguant sur Internet.
Se souvenir des pages est essentiellement grâce aux mots sur la page. Dans les listes appelées «index», elles détiennent des mots qui apparaissent sur la page, tels que le contenu au début d'un livre ou l'index à la fin. Donc, ils essaient de les garder dans leur mémoire que les mots sont en passant par les pages qu'ils voient. Moteurs de recherche plus avancés la fréquence (nombre) de mots passant par la page, l'emplacement des mots, la position par rapport à l'autre, les mots utilisés pour les liens externes dans la page, le titre de la page, les titres sur la page, les minuscules en majuscules Lettre de la taille des mots, la couleur des écritures, le sujet dominé par le site, le contenu des autres pages qui lient à la page, et le contenu des liens externes que la page Liens vers, ils servent et les stocker dans les indices.
Le but de l'indexation plutôt que stiting la page comme il est de le rendre facile d'atteindre les informations sur la page si nécessaire. Pour faire une analogie, nous aurons encore besoin de la section des contenus, même si nous avons tout le livre. Dans notre livre nous regardons des titres de chapitre, des titres de page, etc. avant que nous cherchions un sujet. Ou, en se référant à un autre livre dans un livre important pour nous, si elle est sous notre main, nous serons d'accord et essayer de le revoir. Les moteurs de recherche sont également la mise en œuvre d'une pensée similes pour les pages Internet et les sites.
Lorsqu'un utilisateur transmet une requête, les moteurs de recherche consultent immédiatement leur index et essaient de trouver des pages dans la requête que les mots ont transmis. Ils trient ensuite par divers critères entre ces pages et montrent les résultats à l'utilisateur.
Pour résumer une fois de plus, les moteurs de recherche sont essentiellement composé de trois parties. La première partie est en anglais, qui est appelé Crawler ou Spider, et de recueillir le contenu des pages. Le deuxième module est le module qui examine le contenu des pages collectées à partir d'Internet et les stocke dans les index. Le module de requête, qui est la dernière section, trie et affiche les requêtes de l'utilisateur en localisant les index créés dans la deuxième section et affiche l'utilisateur.