Les URL
Décomposition d'URL (Uniform Resource Locator)
Une URL permet d'identifier une ressource comme une page web, un fichier pdf, une image...
![](../res/03_01.png)
Une URL est composée de plusieurs parties, dont certaines obligatoires (protocole et adresse) et d'autres optionnelles :
* si le port n'est pas précisé c'est qu'il s'agit :
du port TCP 80 pour le protocole http
du port TCP 443 pour le protocole https
A noter que dans les URL on ne peut pas utiliser n'importe quel caractère. La norme RFC1378 définit les 3 possibilités suivantes :
des caractères alphanumériques : 0→9, a→z, A→Z
des caractères spéciaux : $-_.+ !*()
des caractères encodés : %C3%A0 pour à, %C3%A9 pour é...
Concernant les caractères encodés, ils sont construits en récupérant leurs codes UTF-8 en hexadécimal (base 16), puis en préfixant chaque octet d'un caractère %. Quelques exemples :
Caractère | Code UTF-8* | Encodage dans une URL |
---|---|---|
à | C3A0 | %C%A0 |
B | 42 | %42 |
€ | C280 | %C2%80 |
Paramètres supplémentaires des URL
Dans une URL, on peut également ajouter à la fin, des données supplémentaires. Ces dernières peuvent être utilisées pour transmettre des informations au serveur ou paramétrer son action.
Ces paramètres d'URL utilisent alors la syntaxe suivante :
Bien qu'il n'existe pas de limite précise pour la longueur des URL, il est recommandé de ne pas dépasser 2048 caractères pour s'assurer une bonne compatibilité avec tous les outils du web (serveur, client, crawlerbot...)
Exemple : Décomposition URL
Déterminez pour chaque URL ci-dessous le protocole, le serveur, le port utilisé, le dossier et finalement la ressource demandée. Précisez également si les ressources sont accessibles de manière sécurisée ou non
http://eduscol.education.fr/pid25852/actualites-du-numerique.html
https://www.fun-mooc.fr/courses/course-v1%3Ainria%2B41018%2Bsession01/about
ftp://ftp.fr.debian.org/debian/README
file:///C:/Users/Public/Desktop/document.odt
https://%77%77%77%2E%67%6F%6F%67%6C%65%2E%66%72
N° | Protocole | Serveur | Port | Dossier | Ressource |
---|---|---|---|---|---|
1 | |||||
2 | |||||
3 |
Test paramètre URL
Le moteur de recherche Google permet de configurer ses recherches avec différents paramètres listés dans le tableau ci-dessous.
Paramètre/valeur | Description |
---|---|
q=xxx+yyy+zzz | Recherche les mots xxx, yyy et zzz séparés par le caractère + |
hl=xxx | Change la langue de l'interface (fr, en, it, es, ja, hr...) |
num=xxx | Limite le nombre de résultats à la valeur xx (1<xx<100) |
lr=lang_xx | Limite les résultats à une certaine langue |
as_filetype=xxx | Filtre les résultats en ne gardant que les fichiers avec l'extension xxx |
as_sitesearch=xxx | Limite la recherche à un site https://www.google.com/search?q=snt&as_sitesearch=lemonde.fr |
as_qdr=x | Limite les résultats en fonction du temps (d=24h, w=7j, m=mois, y=année) |
Exemple : Exercice
A votre tour testez ces différents paramètres d'URL pour effectuer des recherches plus ciblées, par exemple :
des articles concernant la nouvelle matière SNT sur eduscol.education.fr
les recettes au saumon publiées le mois dernier sur marmiton.org
des mots de passe dans un fichier XLS oublié sur un serveur web
...