Les URL

Décomposition d'URL (Uniform Resource Locator)

Une URL permet d'identifier une ressource comme une page web, un fichier pdf, une image...

Une URL est composée de plusieurs parties, dont certaines obligatoires (protocole et adresse) et d'autres optionnelles :

* si le port n'est pas précisé c'est qu'il s'agit :

  • du port TCP 80 pour le protocole http

  • du port TCP 443 pour le protocole https

A noter que dans les URL on ne peut pas utiliser n'importe quel caractère. La norme RFC1378 définit les 3 possibilités suivantes :

  • des caractères alphanumériques : 0→9, a→z, A→Z

  • des caractères spéciaux : $-_.+ !*()

  • des caractères encodés : %C3%A0 pour à, %C3%A9 pour é...

Concernant les caractères encodés, ils sont construits en récupérant leurs codes UTF-8 en hexadécimal (base 16), puis en préfixant chaque octet d'un caractère %. Quelques exemples :

Caractère

Code UTF-8*

Encodage dans une URL

à

C3A0

%C%A0

B

42

%42

C280

%C2%80

* : http://www.fileformat.info/info/charset/UTF-8/list.htm

Paramètres supplémentaires des URL

Dans une URL, on peut également ajouter à la fin, des données supplémentaires. Ces dernières peuvent être utilisées pour transmettre des informations au serveur ou paramétrer son action.

Ces paramètres d'URL utilisent alors la syntaxe suivante :

Bien qu'il n'existe pas de limite précise pour la longueur des URL, il est recommandé de ne pas dépasser 2048 caractères pour s'assurer une bonne compatibilité avec tous les outils du web (serveur, client, crawlerbot...)

ExempleDécomposition URL

Déterminez pour chaque URL ci-dessous le protocole, le serveur, le port utilisé, le dossier et finalement la ressource demandée. Précisez également si les ressources sont accessibles de manière sécurisée ou non

  1. http://eduscol.education.fr/pid25852/actualites-du-numerique.html

  2. http://portquiz.net:1337/

  3. https://fr.wikipedia.org/wiki/%C3%89diteur_de_texte

  4. https://www.fun-mooc.fr/courses/course-v1%3Ainria%2B41018%2Bsession01/about

  5. https://fr.wikipedia.org/wiki/Linux#Histoire

  6. https://www.google.fr

  7. ftp://ftp.fr.debian.org/debian/README

  8. file:///C:/Users/Public/Desktop/document.odt

  9. https://%77%77%77%2E%67%6F%6F%67%6C%65%2E%66%72

Protocole

Serveur

Port

Dossier

Ressource

1

2

3

Test paramètre URL

Le moteur de recherche Google permet de configurer ses recherches avec différents paramètres listés dans le tableau ci-dessous.

Paramètre/valeur

Description

q=xxx+yyy+zzz

Recherche les mots xxx, yyy et zzz séparés par le caractère +

hl=xxx

Change la langue de l'interface (fr, en, it, es, ja, hr...)

https://www.google.com/search?q=snt&hl=fr

num=xxx

Limite le nombre de résultats à la valeur xx (1<xx<100)

https://www.google.com/search?q=snt&num=3

lr=lang_xx

Limite les résultats à une certaine langue

https://www.google.com/search?q=snt&lr=lang_fr

as_filetype=xxx

Filtre les résultats en ne gardant que les fichiers avec l'extension xxx

https://www.google.com/search?q=snt&as_filetype=pdf

as_sitesearch=xxx

Limite la recherche à un site

https://www.google.com/search?q=snt&as_sitesearch=lemonde.fr

as_qdr=x

Limite les résultats en fonction du temps (d=24h, w=7j, m=mois, y=année)

https://www.google.com/search?q=snt&as_qdr=w

ExempleExercice

A votre tour testez ces différents paramètres d'URL pour effectuer des recherches plus ciblées, par exemple :

  • des articles concernant la nouvelle matière SNT sur eduscol.education.fr

  • les recettes au saumon publiées le mois dernier sur marmiton.org

  • des mots de passe dans un fichier XLS oublié sur un serveur web

  • ...