Depuis sa création, la toile mondiale ne cesse de s’étendre. Le web comprenait 11 161 854 sites en février 2000, 27 585 719 sites en janvier 2001, 46 067 743 sites début 2004, 92 615 362 en août 2006 et 108 810 358 sites en février 2007. Le World Wide Web, souvent confondu avec Internet a beaucoup contribué à la popularité de ce dernier. Explorons plus en détail les arcanes du système.
Définition
Le World Wide Web, communément appelé le web, est le système qui permet de consulter grâce à un navigateur des pages mises en ligne dans des sites.
Le Web, fréquemment confondu avec Internet, n'est qu'une de ses applications et a été inventé plusieurs années après Internet. Mais c’est le Web qui a rendu Internet populaire auprès du grand public.
Les métaphores associées
On l’appelle aussi parfois la Toile ou plus littéralement la "toile d'araignée mondiale", le mot web signifiant "toile d'araignée" en anglais. Cette image provient des liens hypertextes qui relient les pages Web entre elles et dont la représentation graphique ressemble à une toile d’araignée.
L'expression "surfer sur le Web", qui désigne simplement le fait d’en consulter les pages, a été inventée pour mettre l'accent sur le fait que la consultation consiste à suivre de nombreux hyperliens de page en page.
Que trouve-t-on sur le web ?
Le World Wide Web est constitué de plusieurs millions de pages web du monde entier. On appelle page web un fichier Informatique écrit en Langage html qui peut contenir
du texte, des images, des sons ou des animations et peut être reliée à d'autres pages web.
Un site web n’est qu’un groupement de pages et d'éventuelles autres ressources, liées en une structure cohérente, créé par une organisation ou par un particulier (le propriétaire) et hébergée sur un ou plusieurs serveurs Web.
On y trouve aussi des ressources conçues pour être consultées séparément comme les documents PDF, PostScript, Word, etc, les fichier texte, les images de tout types, les morceaux de musique, les vidéos.
Le vocabulaire du web
On appelle une ressource du Web une entité Informatique (texte, image, etc.) accessible indépendamment d'autres ressources. On distingue une ressource locale présente sur l'ordinateur utilisé d’une ressource distante (ou en ligne), accessible à travers un réseau. L’accès à une ressource distante nécessite le respect d’un protocole de communication.
Le signe HTTP (HyperText Transfer Protocol) désigne le protocole de communication communément utilisé pour transférer les ressources du web.
On appelle URL (Uniform Resource Locator) une chaîne de caractères permettant d'indiquer un emplacement pour toute ressource du web.
Un hyperlien (ou lien) est un élément d’une ressource associé à une URL. Les liens permettent d'aller d'une source à une destination, de passer d’une page à une autre.
On appelle HTML (HyperText Markup Language) le langage Informatique utilisé pour décrire le contenu d'une page web et pour y inclure des hyperliens. Les documents HTML sont les ressources les plus consultées du Web.
Pour consulter des pages Web, vous avez besoin d'un navigateur Web, un logiciel conçu pour accéder aux ressources du Web, plus précisément aux documents HTML disponibles sur les serveurs HTTP.
Une adresse Web est une URL de page Web : l’adresse d’un site est en fait l'adresse d'une page du site prévue pour accueillir les visiteurs, la page d’accueil.
Les origines du web
Tim Berners-Lee, informaticien à l'Organisation européenne pour la recherche nucléaire (CERN), est le père du web : c’est en 1989 qu’il propose de créer un système hypertexte distribué sur le réseau informatique du CERN pour que les collaborateurs puissent partager les informations. La même année, les responsables du réseau du CERN décident d'utiliser le protocole de communication Tcp/ip et le CERN ouvre sa Première connexion extérieure avec Internet.
En 1990, l’ingénieur système Robert Cailliau, deuxième personnalité à l'origine du World Wide Web, se joint au projet d'hypertexte au CERN, et se consacre activement à sa promotion.
En 1993, l'apparition de NCSA Mosaic, un navigateur Web développé par Eric Bina et Marc Andreessen jette les bases de l'interface graphique des navigateurs modernes et entraîne un accroissement exponentiel de la popularité du Web.
Sorti fin 1994, Netscape Navigator supplante NCSA Mosaic en quelques mois.
Le sigle WWW a été largement utilisé pour abréger World Wide Web avant que l'abréviation Web ne prenne le pas. Les lettres www sont encore utilisées dans les adresses Web et quelques autres usages formels, bien que cela ne réponde à aucune contrainte technique.
L’organisation du web
Les technologies du Web n'imposent pas d'organisation entre les pages, ni entre les sites qui le cobnstitueny. Toute page web peut contenir un hyperlien vers toute autre ressource accessible d'Internet.
L'établissement d'un hyperlien ne requiert absolument aucune action du côté de la ressource pointée (la destination).
Il n’existe pas de registre centralisé d'hyperliens, de pages ou de sites.
Cette conception décentralisée a favorisé l’augmentation rapide de la taille du Web, ainsi que l'essor des sites spécialisés dans les informations sur les autres sites : les annuaires et les moteurs de recherche.
L’inconvénient de la décentralisation est le manque de suivi lorsqu'une ressource est déplacée ou supprimée : les hyperliens qui la pointaient ne fonctionnent plus, d’où un message d'erreur lorsqu’on tente d’activer l'hyperlien.
La partie cachée du web
On appelle "Web profond" ou "Web invisible" la partie de la Toile qui n'est pas explorée par les Robots d'indexation et qui est de ce fait introuvable avec les moteurs de recherche généralistes.
Or, la partie invisible du Web représente plus de 99% de l’ensemble. Elle est constituée des ressources dont le format de donnée est incompatible avec les moteurs de recherche, des ressources contenues dans des sites Web si grands que les Robots d'indexation renoncent à les indexer entièrement et des ressources qui n'ont pas d'adresse connue.
Plus d'information :
Tag : web, World Wide Web, WWW, Toile , Web, Internet, CERN, hyperlien, hyperliens, protocole de communication, HTML, page web, pages web, URL, hypertexte, NCSA Mosaic, araignée, moteurs de recherche, robots d'indexation, nucléaire, 1989, européenne, informaticien, Tim Berners-Lee, réseau informatique, TCP, 1990, moteurs de recherche généralistes, décentralisation, annuaires, décentralisée, Www, Sigle, Netscape Navigator, 1994, interface graphique, Andreessen, 1993, serveurs HTTP, logiciel, fichier informatique, toile mondiale, hypertextes, Anglais, toile d'araignée mondiale, métaphores, navigateur, 2007, 2004, 2001, Site web, PDF, PostScript, langage informatique,