Éducation, société et technologie
Comment ça marche ?

Qu’est ce qu’Internet ?

Protocoles, adresses, noms de domaine, ports...
dimanche 30 novembre 2008 par André Vincent , Jean-François Pillou

Protocoles, adresses IP, services Internet, nom de domaine, chemin d’accès aux ressources, URL et URI, codage des caractères...

 Internet

Qu’est-ce qu’Internet ?

Aux débuts de l’informatique personnelle des ordinateurs ont été mis au point, dès qu’ils furent aptes à fonctionner seuls, des personnes eurent l’idée de les relier entre eux afin qu’ils puissent échanger des données, c’est le concept de réseau informatique. Il a donc fallu mettre au point des liaisons physiques entre les ordinateurs pour que l’information puisse circuler, mais aussi un langage de communication pour qu’il puisse y avoir un réel échange, on a nommé ce langage : protocole. Sur Internet, de nombreux protocoles sont utilisés, ils font partie d’une suite des protocoles Internet qui s’appelle TCP/IPTCP (Transmission Control Protocol) et IP (Internet Protocol). TCP/IP est basé sur le repérage de chaque ordinateur par une adresse appelée adresse IP qui permet d’acheminer les données à la bonne adresse. Puis on a associé à ces adresses des noms de domaine pour permettre de s’en souvenir plus facilement.

PNGDes réseaux hétérogènes (de natures différentes) se sont développés aux quatre coins du globe ; des personnes décidèrent donc de relier ces réseaux entre eux (des universités par exemple, ou l’armée). Les protocoles ont donc évolué pour permettre la communication de tous ces réseaux pour former le réseau des réseaux, formant petit à petit une gigantesque toile d’araignée (en anglais "web") formant le réseau le plus vaste, puisque contenant tous les réseaux, que l’on appelle Internet ! Sur Internet il existe différents protocoles (langages entre les ordinateurs) qui permettent de faire différentes choses :

  • http : accéder à des pages web
  • ftp : transférer des fichiers
  • IRC : discuter en direct
  • et bien d’autres choses

On assigne à chacun d’entre eux un numéro (le port) qui est transmis lors de la communication (la transmission est effectuée par petits paquets d’informations). Ainsi on sait à quel programme correspond chaque petit paquet :

  • les paquets http arrivent sur le port 80 et sont transmis au navigateur internet à partir duquel la page a été appelée,
  • les paquets irc arrivent sur le port 6667 (ou un autre situé généralement autour de 7000) et sont transmis à un programme tel que iChat (ou autre).

La connexion grand public

Pour accéder à Internet il faut disposer d’un équipement IP ainsi qu’une connexion à un fournisseur d’accès. Pour cela, l’utilisateur emploie les matériels et logiciels suivants :

  • Un ordinateur personnel ou tout autre équipement terminal d’un réseau :
    • Assistant personnel
    • Console de jeux vidéo
    • Téléphone mobile
  • Un canal de communication vers le fournisseur d’accès :
    • Réseau de câbles coaxiaux
    • Réseau de Fibre optique
    • Ligne téléphonique fixe : ligne analogique, xDSL
    • Ligne téléphonique mobile : 3G+, 3G, Edge, GPRS, GSM (CSD)
    • Internet par satellite
    • Wi-Fi
  • Un système (logiciel/matériel) client pour le protocole réseau utilisé (PPP, PPPoX, Ethernet, ATM, etc.)
  • Un fournisseur d’accès à Internet (FAI) (en anglais ISP pour Internet Service Provider)
  • Des logiciels sont, eux, nécessaires pour exploiter Internet suivant les usages :
  • World Wide Web : un navigateur Web
  • Courrier électronique : un client SMTP et POP (ou POP3) ou IMAP (ou IMAP4)
  • Transferts de fichiers : un client ou un serveur FTP (File Transfert Protocol)
  • Pair à pair : l’un des nombreux logiciels de P2P en fonction de l’usage (partage de fichiers en pair à pair, Calcul distribué, P2P VoIP, etc.)

 Protocoles

Qu’est-ce qu’un protocole ?

Un protocole informatique est une méthode standard qui permet la communication entre des processus (s’exécutant éventuellement sur différentes machines), c’est-à-dire un ensemble de règles et de procédures à respecter pour émettre et recevoir des données sur un réseau. Il en existe plusieurs selon ce que l’on attend de la communication. Certains protocoles seront par exemple spécialisés dans l’échange de fichiers (le FTP), d’autres pourront servir à gérer simplement l’état de la transmission et des erreurs (c’est le cas du protocole ICMP), ...

Sur Internet, les protocoles utilisés font partie d’une suite de protocoles, c’est-à-dire un ensemble de protocoles reliés entre-eux. Cette suite de protocole s’appelle TCP/IP.
Elle contient, entre autres, les protocoles suivants :

  • IP - Internet Protocol (gère le transport et le routage des paquets sur le réseau)
  • TCP - Transmission Control Protocol (gère l’établissement de la connexion, les transferts de données, et la fin de la connexion dans une communication IP)
  • UDP - User Data Protocol (gère la transmission rapide de données sans contrôle - à la différence de TCP)
  • ICMP - Internet Control Message Protocol (contrôle des erreurs de transmission sur Internet)
  • HTTP - HyperText Transport Protocol (pages web)
  • FTP - File Transfer Protocol (transfert de fichiers)
  • SMTP - Simple Mail Transfer Protocol (expédition du courriel)
  • POP - Post Office Protocol (récupération du courriel)
  • IMAP - Internet Mail Access Protocol (récupération du courriel avec fonctionnalités avancées)
  • SSH - Secure SHell (pour l’accès distant sécurisé sur les stations de type Unix ou Linux)
  • NNTP - Network News Transport Protocol (Usenet ou newsgroups - messages organisés par groupes de discussion stockés et relayés par serveurs NTTP)

L’adresse 127.0.0.1 est appelée adresse de boucle locale (en anglais loopback), car elle désigne la machine locale (en anglais localhost).

Les classes de réseaux

Les adresses IP sont donc réparties en classes, c’est-à-dire selon le nombre d’octets qui représentent le réseau.

Classe A

Dans la classe A, il y a 128 possibilités de réseaux. Le réseau 0 n’existe pas et le nombre 127 est réservé pour désigner votre machine, les réseaux disponibles en classe A sont donc les réseaux allant de 1.0.0.0 à 126.0.0.0 (lorsque les derniers octets sont des zéros cela indique qu’il s’agit d’un réseau et non d’un ordinateur !)

Chaque réseau de classe A peut contenir jusqu’à 16 777 214 ordinateurs

Classe B

Dans la classe B, il y a 16 384 possibilités de réseaux. Les réseaux disponibles en classe B sont les réseaux allant de 128.0.0.0 à 191.255.0.0

Un réseau de classe B peut contenir 65 534 ordinateurs.

Classe C

Dans la classe C, il y a 2 097 152 possibilités de réseaux. Les réseaux disponibles en classe C sont donc les réseaux allant de 192.0.0.0 à 223.255.255.0.

Un réseau de classe C peut contenir 254 ordinateurs.

Attribution des adresses IP

Le but de la division des adresses IP en trois classes A,B et C est de faciliter la recherche d’un ordinateur sur le réseau. En effet avec cette notation il est possible de rechercher dans un premier temps le réseau que l’on désire atteindre puis de chercher un ordinateur sur celui-ci. Ainsi l’attribution des adresses IP se fait selon la taille du réseau.

Classe Nbe de réseaux Nbre d’ordis sur chacun
A 126 16 777 214
B 16 384 65 534
C 2 097 152 254

Les adresses de classe A sont réservées aux très grands réseaux, tandis que l’on attribuera les adresses de classe C à des petits réseaux d’entreprise par exemple.

Adresses IP réservées

Il arrive fréquemment dans une entreprise qu’un seul ordinateur soit relié à Internet, c’est par son intermédiaire que les autres ordinateurs du réseau accèdent à Internet (on parle généralement de proxy ou routeur). Dans ce cas, seul l’ordinateur relié à Internet a besoin de réserver une adresse IP auprès de l’INTERNIC. Toutefois, les autres ordinateurs ont tout de même besoin d’une adresse IP pour pouvoir communiquer ensemble de façon interne.

Ainsi, l’INTERNIC a réservé une poignée d’adresses dans chaque classe pour permettre d’affecter une adresse IP aux ordinateurs d’un réseau local relié à Internet sans risquer de créer de conflits d’adresses IP sur le réseau. Il s’agit des adresses suivantes :

  • 10.0.0.1 à 10.255.255.254
  • 172.16.0.1 à 172.31.255.254
  • 192.168.0.1 à 192.168.255.254

 Noms de domaine

Qu’appelle-t-on DNS ?

Chaque station possède une adresse IP propre. Cependant, les utilisateurs ne veulent pas travailler avec des adresses numériques du genre 194.153.205.26 mais avec des noms de stations ou des adresses plus explicites (appelées adresses FQDN - Fully Qualified Domain Name) du style http://www.commentcamarche.net/ ou webmaster@commentcamarche.net.

Ainsi, TCP/IP permet d’associer des noms en langage courant aux adresses numériques grâce à un système appelé DNS (Domain Name System).

On appelle résolution de noms de domaines (ou résolution d’adresses) la corrélation entre les adresses IP et le nom de domaine associé.

Noms d’hôtes

Aux origines de TCP/IP, étant donné que les réseaux étaient très peu étendus, c’est-à-dire que le nombre d’ordinateurs connectés à un même réseau était faible, les administrateurs réseau créaient des fichiers appelés tables de conversion manuelle (fichiers généralement nommés hosts ou hosts.txt), associant sur une ligne, grâce à des caractères ASCII, l’adresse IP de la machine et le nom littéral associé, appelé nom d’hôte.

Le Domain Name System

Le système précédent a l’inconvénient majeur de nécessiter la mise à jour des tables de tous les ordinateurs en cas d’ajout ou modification d’un nom de machine. Ainsi, avec l’explosion de la taille des réseaux, et de leur interconnexion, il a fallu mettre en place un système plus centralisé de gestion des noms. Ce système est nommé Domain Name System, traduisez Système de nom de domaine.

Ce système consiste en une hiérarchie de noms permettant de garantir l’unicité d’un nom dans une structure arborescente.

On appelle nom de domaine, le nom à deux composantes, dont la première est un nom correspondant au nom de l’organisation ou de l’entreprise, le second à la classification de domaine (.fr, .com, ...). Chaque machine d’un domaine est appelée hôte. Le nom d’hôte qui lui est attribué doit être unique dans le domaine considéré (le serveur web d’un domaine porte souvent le nom www).

L’ensemble constitué du nom d’hôte, d’un point, puis du nom de domaine est appelé adresse FQDN (Fully Qualified Domain Name, soit Nom de Domaine Totalement Qualifié). Cette adresse permet de repérer de façon unique une machine. Ainsi www.ca.edu représente une adresse FQDN.

Les machines appelées serveurs de nom de domaine permettent d’établir la correspondance entre le nom de domaine et l’adresse IP sur les machines d’un réseau. Chaque domaine possède ainsi, un serveur de noms de domaines, relié à un serveur de nom de domaine de plus haut niveau. Ainsi, le système de nom est une architecture distribuée, c’est-à-dire qu’il n’existe pas d’organisme ayant à charge l’ensemble des noms de domaines. Par contre, il existe un organisme qui gère certaines classes de noms de domaine (l’InterNIC pour les noms de domaine en .com, .net, et .org par exemple). Le système de noms de domaine est transparent pour l’utilisateur, néanmoins il ne faut pas oublier les points suivants :

Chaque ordinateur doit être configuré avec l’adresse d’une machine capable de transformer n’importe quel nom en une adresse IP. Cette machine est appelée Domain Name Server.

  • L’adresse IP d’un second Domain Name Server (secondary Domain Name Server) doit également être introduite : il peut relayer le premier en cas de panne.
  • Le nom d’un serveur de nom de domaines ne peut bien sûr pas être utilisé pour d’autres services internet.

Codes des domaines internet

La classification du domaine, parfois appelées TLD (Top Level Domain, soit domaines de plus haut niveau), correspond généralement a une répartition géographique. Toutefois, il existe des noms, créés pour les Etats-Unis à la base, permettant de classifier le domaine selon le secteur d’activité, par exemple :

  • .arpa* correspond aux machines issues du réseau originel.
  • .com correspond aux entreprises à vocation commerciales (désormais ce code de domaine ne rime plus à grand chose et est devenu international).
  • .net correspond aux organismes ayant trait aux réseaux.
  • .org correspond aux entreprises à but non lucratif.
  • .info correspond aux sites d’information.
  • .biz correspond aux petites et moyennes entreprises à vocation commerciales.
  • .name correspond aux sites web personnels basé sur le nom des individus.
  • .tv correpond aux sites riches en contenu multimédia.
  • .org correspond aux entreprises à but non lucratif.
  • .edu* réservé aux établissements d’enseignement supérieur américains et parfois canadiens.
  • .gov* réservé aux organismes gouvernementaux américains.
  • .mil* réservé aux organismes militaires américains.

* Les classes .arpa, .edu, .gov et .mil ne sont évidemmment pas disponibles chez les registraires de noms de domaine grand public. Toutes les autres classes génériques sont en général disponibles pour enregistrement.

Voir le code des pays en Annexe

Beaucoup des noms de domaines nationaux sont régis par des organismes nationaux ou régionaux. Les conditions d’enregistrement et les informations à fournir varient d’un pays à l’autre. Pour de nombreux pays, seuls les résidents ou les entreprises ayant une place d’affaires dans le pays peuvent s’y enregistrer. Pour quelques pays, toutefois, les enregistrements sont disponibles sans aucune restriction. Les plus connus et populaires sont .bz, .cc, .gs, .ms, .vg, .ws. Pour ces pays, l’enregistrement de noms de domaine constitue souvent une importante source de revenus. Fait cocasse, les noms de domaine enregistrés dans la classe .us sont peu nombreux, la plupart des entreprises, organismes et individus des États-Unis préférant s’identifier sur internet dans une classe générique.

L’utilité des ports

De nombreux programmes TCP/IP peuvent être exécutés simultanément sur Internet (vous pouvez par exemple ouvrir plusieurs navigateurs simultanément ou bien naviguer sur des pages HTML tout en téléchargeant un fichier par FTP). Chacun de ces programmes travaille avec un protocole, toutefois l’ordinateur doit pouvoir distinguer les différentes sources de données.

Ainsi, pour faciliter ce processus, chacune de ces applications se voit attribuer une adresse unique sur la machine, codée sur 16 bits : un port (la combinaison adresse IP : port est alors une adresse unique au monde, elle est appelée socket). Elle prend alors cette forme 127.2.3.4:8181.

L’adresse IP sert donc à identifier de façon unique un ordinateur sur le réseau tandis que le numéro de port indique l’application à laquelle les données sont destinées. De cette manière, lorsque l’ordinateur reçoit des informations destinées à un port, les données sont envoyées vers l’application correspondante. S’il s’agit d’une requête à destination de l’application, l’application est appelée application serveur. S’il s’agit d’une réponse, on parle alors d’application cliente.

La fonction de multiplexage

Le processus qui consiste à pouvoir faire transiter sur une connexion des informations provenant de diverses applications s’appelle le multiplexage. De la même façon le fait d’arriver à mettre en parallèle (donc répartir sur les diverses applications) le flux de données s’appelle le démultiplexage.

Ces opérations sont réalisées grâce au port, c’est-à-dire un numéro associé à un type d’application, qui, combiné à une adresse IP, permet de déterminer de façon unique une application qui tourne sur une machine donnée.

Assignations par défaut

Il existe des milliers de ports (ceux-ci sont codés sur 16 bits, il y a donc 65 536 possibilités), c’est pourquoi une assignation standard a été mise au point, afin d’aider à la configuration des réseaux.

Voici certaines de ces assignations par défaut :

Code Pays
Port Service ou Application
21 FTP
23 Telnet
25 SMTP
53 Domain Name Server
63 Whois
70 Gopher
79 Finger
80 HTTP
110 POP3
119 NNTP
  • Les ports 0 à 1023 sont les ports reconnus ou réservés (Well Known Ports). Ils sont assignés par le IANA (Internet Assigned Numbers Authority) et sont, sur beaucoup de systèmes, uniquement utilisables par les processus système ou les programmes exécutés par des utilisateurs privilégiés. Un administrateur réseau peut toutefois lier des services aux ports de son choix.
  • Les ports 1024 à 49151 sont appelés ports enregistrés (Registered Ports).
  • Les ports 49152 à 65535 sont les ports dynamiques ou privés.

Ainsi, un serveur (un ordinateur que l’on contacte et qui propose des services tels que FTP, Telnet, ...) possède des numéros de port fixes auxquels l’administrateur réseau a associé des services. Ainsi, les ports d’un serveur sont généralement compris entre 0 et 1023 (fourchette de valeurs associées à des services connus).

Du côté du client, le port est choisi aléatoirement parmi ceux disponibles par le système d’exploitation. Ainsi, les ports du client ne seront jamais compris entre 0 et 1023 car cet intervalle de valeurs représente les ports connus.

 URL

Qu’est-ce qu’une URL ?

Une URL (Uniform Resource Locator) est un format de nommage universel pour désigner une ressource sur Internet. Il s’agit d’une chaîne de caractères ASCII imprimables qui se décompose en cinq parties :

  • Le nom du protocole : c’est-à-dire en quelque sorte le langage utilisé pour communiquer sur le réseau. Le protocole le plus largement utilisé est le protocole HTTP (HyperText Transfer Protocol), le protocole permettant d’échanger des pages Web au format HTML. De nombreux autres protocoles sont toutefois utilisables (FTP,News,Mailto,Gopher,...)
  • Identifiant et mot de passe : permet de spécifier les paramètres d’accès à un serveur sécurisé. Cette option est facultative et même déconseillée car le mot de passe est visibledansl’URLet voyage donc en clair sur Internet.
  • Le nom du serveur : Il s’agit d’un nom de domaine de l’ordinateur hébergeant la ressource demandée. Notez qu’il est possible d’utiliser l’adresse IP du serveur, ce qui rend par contre l’URL moins lisible.
  • Le numéro de port : il s’agit d’un numéro associé à un service permettant au serveur de savoir quel type de ressource est demandée. Le port associé par défaut au protocole HTTP est le port numéro 80. Ainsi, lorsque le service Web du serveur est associé au numéro de port 80, le numéro de port est facultatif.
  • Le chemin d’accès à la ressource : Cette dernière partie permet au serveur de connaître l’emplacement auquel la ressource est située, c’est-à-dire de manière générale l’emplacement (répertoire) et le nom du fichier demandé

Une URL a donc la structure suivante :

Protocole  Mot de passe    Nom du serveur       Port  Chemin
   http://user:password@www.commentcamarche.net:80/internet/internet.php3

Les protocoles suivant peuvent par exemple être utilisés par l’intermédiaire de l’URL :

  • http, pour la consultation de pages web
  • ftp, pour la consultation de sites FTP
  • telnet, pour la connexion à un terminal distant
  • mailto, pour l’envoi d’un courrier électronique
  • news, pour la consultation d’une liste de nouvelles (NTTP)
  • gopher, pour la connexion à un serveur Gopher

Le nom de fichier dans l’URL peut être suivi d’un point d’interrogation puis de données au format ASCII, il s’agit de données supplémentaires envoyées en paramètre d’une application sur le serveur (un script CGI par exemple). L’URL ressemblera alors à une chaîne de caractères comme celle-ci :

        http://www.commentcamarche.net/forum/index.php3?cat=1&page=2

Ce document issu de CommentCaMarche.net est soumis à la licence GNU FDL. Vous pouvez copier, modifier des copies de cette page tant que cette note apparaît clairement.


forum

Accueil | Contact | Plan du site | | Statistiques du site | Visiteurs : 41831 / 1820693

Suivre la vie du site fr  Suivre la vie du site Cours Web  Suivre la vie du site Sites web statiques  Suivre la vie du site Généralités   ?    |    titre sites syndiques OPML   ?

Site réalisé avec SPIP 3.1.4 + AHUNTSIC

Creative Commons License

Visiteurs connectés : 4