La réécriture des URL “à la volée”

Le module Apache mod_rewrite

SPIP fournit en standard tout ce qu’il faut pour présenter des URL à l’apparence statique. Pour permettre au Webmaster de mieux comprendre le mécanisme de cette réécriture, découvrons ensemble la puissance du module Apache mod_rewrite, le “couteau Suisse de la manipulation”

Le module Apache mod_rewrite et la réécriture d’URL

Une des fonctions les plus puissantes permises par le fichier .htaccess est la réécriture « à la volée» des URL.
Sur le site officiel Apache, le module mod_rewrite est présenté à raison comme le couteau suisse de la manipulation.
Comme dans notre article sur le fichier .htaccess, il est utile de préciser que certains hébergeurs n’ont pas activé le module de réécriture. Dans ce cas, vous n’avez malheureusement aucune possibilité de l’utiliser, à moins de casser le petit cochon en porcelaine qui traîne chez vous et changer d’hébergeur.

Si vous gérez votre propre serveur dédié, assurez-vous que le module mod_rewrite est activé en modifiant le cas échéant le fichier de configuration du serveur Apache (httpd.conf).
Vérifiez que les deux lignes suivantes ne soient pas mises en commentaire :

LoadModule rewrite_module modules/mod_rewrite.so
AddModule mod_rewrite.c


Si vous devez changer ces deux lignes, il vous faudra redémarrer Apache pour que vos modifications soient prises en compte.

On teste d’abord !

Avant de se lancer plus loin dans les explications, voici comment tester si le module mod_rewrite est actif chez votre hébergeur. Comme pour toutes manipulations qui peuvent impacter le bon fonctionnement de votre site, nous vous conseillons de faire ces essais en période creuse, en évitant par exemple la période de « full crawl » de Google.

1. Créez un fichier html simple, nommez le « trouve.html ».
2. Modifiez le fichier .htaccess en y ajoutant les 3 lignes suivantes. Faites très attention à utiliser la syntaxe précise ou mieux, utilisez le copier/coller :

Options +FollowSymlinks
RewriteEngine on 
RewriteRule   ^nexistepas.html$   trouve.html  [L]

Nous reviendrons plus tard sur l’explication de ces deux instructions

3. Télécharger le fichier .htaccess et le fichier trouve.html à la racine de votre site web, ou mieux encore dans un répertoire de test créé pour l’occasion. Laissez votre client FTP ouvert pour pouvoir enlever le fichier .htaccess au cas où cela ne fonctionne pas.
4. Lancez votre navigateur et entrez l’URL : http://www.votresite.com/nexistepas.html

Et là, deux solutions se présentent :

-  Soit votre page test « trouve.html » s’affiche c’est parfait, le module est activé.
-  Soit vous avez une erreur 404 ou encore plus probablement une erreur 500 et malheureusement il n’y a pas grand-chose à faire... si ce n’est retirer tout de suite le fichier .htaccess avec le client FTP (vous l’aviez bien laissé ouvert comme suggéré plus haut, non ?).

Si vous êtes face à ce deuxième cas, vous comprendrez mieux pourquoi nous vous avons suggéré de choisir une période creuse ainsi qu’un répertoire de test. Nous ne pouvons que répéter ici que toute modification du fichier .htaccess peut fortement impacter le fonctionnement de votre site web.

Heureusement, les problèmes rencontrés ne sont pas irréversibles et disparaissent avec la suppression du fichier ou des règles erronées. La prudence s’impose.

Quelques explications sur la règle précédente.

Dans les trois lignes de l’exemple ci-dessus, la première autorise le serveur Apache à suivre les liens symboliques dans ce répertoire. Son utilité permet de corriger un éventuel défaut de configuration dans le fichier httpd.conf.
La deuxième ligne est une instruction d’activation de la réécriture d’URL. Quelles que soient les règles de réécriture que vous voulez mettre en place, de la plus triviale à la plus complexe, l’instruction « RewriteEngine on » devra toujours être insérée dans le fichier .htaccess.
Elle donne simplement au serveur Apache l’instruction de lancer le moteur de réécriture.
La troisième ligne est la règle de réécriture proprement dite, analysons la plus en détail :

RewriteRule ce mot-clé introduit toute règle de réécriture, il est indispensable
^nexistepas.html$ c’est la première partie de la règle, celle qui determine la chaîne de caractères que le module devra rechercher pour la réécrire.
Elle contient deux caractères spéciaux marquant le début (^) et la fin ($) de la ligne
trouve.html la chaîne par laquelle il faudra remplacer celle trouvée à l’étape précédente. En règle générale, elle correspond au nom d’un fichier existant réellement dans votre espace Web.
[L] Un flag (drapeau) signifiant que cette règle est la dernière à appliquer dans ce cas ( L = last = dernier ) et que le module ne doit plus rechercher à réécrire cette chaîne.

Ce premier exemple est bien évidemment trivial mais vous servira de base à l’établissement de toutes les règles de réécriture que vous serez amené à rédiger.
Vous la trouvez trop simple ? Assurez-vous d’avoir parfaitement compris le mécanisme avant de passer aux étapes suivantes, cela va se corser !

Les pièges dans lesquels il ne faut pas tomber.

Nous l’avons déjà mentionné, mais jugeons utile de le répéter. La réécriture d’URL permet le meilleur comme le pire.
Imaginez 2 règles, la première réécrivant abc.html en def.html, la seconde réécrivant def.html en abc.html . Si aucune des deux règles ne comporte le flag [L], vous voilà face à une version informatisée du mouvement perpétuel. Vous avez créé une boucle de laquelle votre serveur ne pourrait pas sortir s’il n’avait ses propres mécanismes de sécurité.
L’aisance avec laquelle une règle mal écrite peut mettre un serveur « sur les genoux » est la raison principale de la non implémentation du module de réécriture chez certains hébergeurs.

Des règles plus utiles.

Il est clair que l’exemple précédent n’a pas de véritable utilité. Ce simple exemple aurait pu s’écrire beaucoup plus simplement avec une seule instruction « Redirect ».
Prenons un cas plus concret...
Les réécritures d’URL sont le plus souvent utilisées pour présenter aux visiteurs une URL plus mnémotechnique ou pour permettre à certains moteurs d’indexer des pages dynamiques avec de nombreux paramètres qu’ils n’auraient pas visité sans réécriture.
Pour les robots d’indexation, la raison en est simple.
Dans le cas d’une URL dynamique du type article.php?num=12 , un moteur ne peut pas déterminer s’il ne va pas tomber dans une boucle sans fin. Un script article.php mal écrit - volontairement ou non - peut l’entraîner vers une multitude de pages satellites ne différant que par leur URL. C’est pour la même raison qu’ils n’indexent pas les pages avec des identifiants de session PHP, une même page étant retournée au navigateur avec une multitude d’identifiants de session différents.

Vous avez un site sur lequel vous présentez un catalogue en ligne. Sur ce site, chaque article comporte 2 pages, par exemple une page commerciale et une fiche technique.
De plus, les informations concernant l’article sont extraites d’une base de données, en se basant sur le numéro d’article.
Les URL des deux pages de l’article 8125 seront donc sous la forme (si votre script se nomme article.php):

http://www.votresite.tld/article.php?numero=8125&page=1
http://www.votresite.tld/article.php?numero=8125&page=2 

Vous préféreriez, et cela se comprend, que vos visiteurs accèdent à cet article par :

http://www.votresite.tld/article-8125-1.html 
http://www.votresite.tld/article-8125-2.html

Analysons point par point comment réécrire cette règle toujours simple.
Nous voyons dans ces URL qu’elles contiennent deux parties variables : le numéro d’article et le numéro de page, tout le reste étant fixe comme le nom du script et le nom des variables.
La règle s’écrirait comme ceci :

RewriteEngine on
RewriteRule ^article-([0-9]+)-([0-9]+)\.html$  article.php?numero=$1&page=$2  [L]

Cela vous semble compliqué ? Il n’en est rien, voici l’explication :

Nous ne reviendrons pas sur la ligne RewriteEngine on qui est, vous le savez, indispensable. Nous l’omettrons d’ailleurs de manière systématique pour la suite de nos exemples.

Nous retrouvons dans notre règle les parties constantes « article - - .html » et « article.php?numero= &page= » que nous avons identifiées.
De même, les caractères de début (^) et fin ($) de ligne ont été expliqués précédemment.

Appliquons nous à remplir les blancs.

-  Partie gauche de l’expression

Dans cette partie, nous trouvons deux fois une même chaîne de caractères « ([0-9]+) » qui est basée sur les expressions régulières (regular expressions) familières aux utilisateurs Unix/Linux.
Les parenthèses carrées [ ] déterminent un intervalle, donc [0-9] détermine l’intervalle des nombres « 0 » à « 9 ».
Le signe « + » qui suit immédiatement l’intervalle signifie « une ou plusieurs occurrence(s) de l’expression qui précède», notre intervalle [0-9] dans cet exemple.
Ce qui signifie qu’avec l’intervalle suivi du signe « + », nous sommes en mesure de matérialiser tout nombre entier supérieur ou égal à 0 , ce qui correspond bien à la forme de notre numéro d’article.
Enfin, les parenthèses qui entourent le tout « ([0-9]+) » donnent instruction au moteur de réécriture de grouper la chaîne trouvée et la stocker dans une variable interne parce que nous souhaitons l’utiliser plus tard. Apache stockera donc ces chaînes dans les variables $1, $2, ... $n dans l’ordre dans lequel elles sont analysées, de gauche à droite et nous pourrons y faire référence dans la partie droite de notre règle.
Dans notre exemple, Apache aura stocké les chaînes « 8125 » dans la variable interne $1 et « 2 » dans la variable $2.
Le point décimal ayant une signification particulière dans les expressions, il est utile dans notre cas de le faire précéder par le caractère d’échappement « \. ». Nous verrons ceci plus en détail par la suite.

-  Partie droite de l’expression

Une fois compris ce qui précède, elle est vraiment triviale à comprendre.
Dans l’expression « article.php?numero=$1&page=$2 » les variables $1 et $2 sont remplacées
respectivement par les chaînes « 8125 » et « 2 » ce qui nous donne bien l’URL avec les paramètres que notre script article.php s’attend à recevoir.
Le dernier élément « [L] » fait comprendre, comme expliqué précédemment que c’est la dernière règle qui s’applique pour cet élément.

Quelques expressions régulières à connaître:

. n’importe quel caractère
[abcd] n’importe lequel de cette liste de caractères
[^abcd] tout caractère non compris dans la liste (autre que a, b, c ou d)
blanc|noir alternative, soit « blanc », soit « noir »
+ Une ou N occurrence(s) de l’expression qui précède (N > 1)
* Zéro ou N occurrence(s) de l’expression qui précède (N>0)
(texte) Groupement permettant l’utilisation des références inverses ($1,... $n)
Est aussi utilisé pour délimiter une alternative comme dans (blanc|noir)
ancre de début de ligne
$ ancre de fin de ligne
\ permet d’échapper tout caractère qui suit et lui ôter sa signification particulière, par exemple \.

Quelques drapeaux (ou flags) utiles.

Voici quelques drapeaux utiles pour faciliter la maintenance d’un site :

[L] Celui-ci vous semble familier, comme nous l’avons vu dans notre précédent exemple. Il mérite toutefois une précision. Lorsque le module de réécriture est actif, les règles sont lues séquentiellement et l’URL est comparée ligne à ligne avec le premier argument de celles-ci jusqu’à la dernière.

Si une réécriture est effectuée, c’est la forme réécrite qui sera utilisée en entrée pour les règles suivantes.

Le flag [L] permet de sortir prématurément de la boucle.

Un autre exemple serait, en début d’une liste de règles :

RewriteRule ^.*\.gif$  -  [L]
RewriteRule ^.*\.jpg$  -  [L]
Nous introduisons ici un nouveau concept, à savoir un second argument vide (ou presque, car il consiste en un seul caractère « - » ) . Cette règle particulière implique qu’il n’y a pas de réécriture, l’URL étant passée sans modification aucune. Elle signale au serveur Apache de passer toutes les URL d’images gif ou jpg sans réécriture, ni traitement successif.
[R]

[R=code]

Dans ces deux formes une redirection est effectuée.

Si l’argument code n’est pas précisé, une redirection 302 (déplacé temporairement) est effectuée. Si vous souhaitez faire savoir au navigateur/robot qu’une page a été remplacée définitivement, utiliser le code 301 comme dans :

RewriteRule ^ancien\.html$ http://domaine.tld/nouveau.html [R=301,L]

Dans ce cas précis, une réécriture “externe” s’impose (utilisation de http://...)

Vous voyez ci-dessus que nous avons combiné deux flags en les séparant par une virgule.
[F] Forbidden - interdit. Retourne un code 403, par exemple :

RewriteRule ^secret.html$ - [F]

( pas de réécriture vu le deuxième argument - )

[NC] NoCase, ou « insensible à la casse ». La règle suivante :

RewriteRule  ^script\.php$  programme.php  [NC,L]

S’appliquera aussi bien à script .php, SCRIPT.PHP ou ScRiPt .PhP

[G] Gone. Cette page n’existe plus et retourne une entête http 410
[N] Force l’analyse et l’exécution de toutes les règles en repartant du début de la liste. Ici encore, comme expliqué plus haut ([L]), c’est l’URL modifiée après exécution de la dernière règle qui est utilisée en entrée, et non l’URL originelle. Attention aux boucles infinies !!
[C] Chain, chaînage avec la ou les règles suivantes jusqu’à la première règle ne se terminant pas par [C]

Apache interprète ce flag comme suit : s’il y a réécriture (la règle est vérifiée), la règle suivante est exécutée avec la chaîne réécrite en entrée.

Si la règle ne se vérifie pas, toutes les règles qui suivent jusqu’à la première ne comportant pas le flag [C] ne sont pas appliquées.

Cette liste n’est pas exhaustive, car il existe d’autres flags supportés. La liste complète est décrite dans la documentation du module mod_rewrite sur le site d’Apache.

Attention aux « répertoires virtuels »

Dans les exemples qui précèdent, nous avons effectué des réécritures qui n’impactaient pas l’arborescence apparente de vos pages, pour simplifier les exemples.

Si, au lieu de réécrire, en reprenant l’exemple précédent:
RewriteRule ^article-([0-9]+)-([0-9]+)\.html$  article.php?numero=$1&page=$2  [L]
nous utilisons
RewriteRule ^article/([0-9]+)/([0-9]+)\.html$  article.php?numero=$1&page=$2  [L]

L’URL apparente aurait la forme /article/8126/2.html au lieu de /article-8126-2.html
Dans ce cas, le navigateur « estime » que la page se trouve dans un répertoire /article/8126 qui n’a pas d’existence réelle sur votre site. Toute tentative de résolution de liens relatifs se fera donc à partir de ce répertoire inexistant et sera vouée à l’échec.

Pour éviter cela, deux solutions se présentent:

-  Utiliser des liens absolus, ou mieux...
-  Faire usage de la balise <base href="http://www.votresite.tld/repertoire/" > à mettre dans l'entête de votre page, entre <head> et  </head>

Les réécritures conditionnelles

Dans les quelques exemples qui précèdent, nous n’avons vu que des réécritures d’URL inconditionnelles, c.à.d. s’appliquant indépendamment du navigateur, de l’adresse IP ou du domaine émettant la requête.
Nous allons maintenant passer à l’étape suivante, à savoir la réécriture sous conditions, à travers quelques exemples concrets.

Une page d’accueil différente selon le navigateur

RewriteCond  %{HTTP_USER_AGENT}  ^Mozilla.*
RewriteRule  ^/$    /complexe.html  [L]
RewriteCond  %{HTTP_USER_AGENT}  ^Lynx.*
RewriteRule  ^/$    /simple.html  [L]
RewriteRule  ^/$    /standard.html  [L]
Un nouveau mot-clé fait son apparition ici: “RewriteCond” ou “condition de réécriture”.

La syntaxe est simple et de la forme:
RewriteCond variable_testée valeur_de_comparaison

Dans l’exemple, testons si l’identifiant du navigateur (%{HTTP_USER_AGENT}) commence par Mozilla (^Mozilla) et est suivi par une chaîne quelconque. (.*)
Si cette règle est vraie, nous réécrivons le répertoire racine du site(^/$ signifie “début de ligne/fin de ligne” ou simplement / seul sur la ligne)) en page “complexe.html” et arrêtons nos réécritures [L]
Procédons de meme pour Lynx, qui se satisfera d’une page simple vu ses fonctionnalités réduites et enfin, si aucune des 2 règles précédentes ne s’applique, soit pour tous les autres navigateurs, redirigons les vers notre page “standard.html”

Protégeons nos fichiers images

Evitons maintenant que d’autres sites ne fassent un lien direct vers nos images, en nous détournant de la bande passante :

RewriteEngine On
RewriteCond %{HTTP_REFERER} !^$
RewriteCond %{HTTP_REFERER} !^http://www.votredomaine.net/.*$ [NC]
ReWriteRule .*\.(gif|png|jpe?g)$ - [F]
En mettant plusieurs conditions à la suite, un ET logique est effectué entre elles. Pour que la règle de réécritue soit effectuée, il faut donc que toutes les conditions soient varies prises isolément. A la première condition FAUSSE, le moteur de réécriture branche directement après la règle et ne teste pas les conditions suivantes.
Si un OU logique est nécessaire, on rajoute le drapeau [OR] en fin de ligne, en le combinant aux autres le cas échéant [NC,OR]

Dans notre exemple, on compare la variable HTTP_REFERER au domaine du site.
Les conditions s’énonceraient en clair « Si la variable HTTP_REFERER n’est pas vide et n’est pas égale au nom de domaine http://www.votredomaine.net/ suivi de n’importe quelle chaîne de caractères (même vide) en faisant abstraction de la casse [NC], alors... »

Notez que le point d’exclamation inverse le test et signifie donc « n’est pas ».
Changez aussi le nom de domaine pour qu’il corresponde au vôtre.

La règle donne instruction de ne pas réécrire l’URL (grâce au signe - utilisé en second argument) mais de retourner une entête « 403 - Forbidden » pour tout fichier se terminant en .gif, .png , .jpeg et .jpg [F]

Le point d’interrogation suivant le « e » dans « jpe?g » rend cette lettre facultative. Il y aura donc correspondance pour « jpg » et « jpeg ».

Un commentaire toutefois : Certains navigateurs permettent de masquer le HTTP_REFERER, et certains proxies ou firewall ne transmettent pas cette référence.
C’est la raison pour laquelle nous avons la première condition testant si HTTP_REFERER n’est pas vide. Sans cette règle, les visiteurs derrière certains firewall ou proxies ne verraient pas vos images.
Cette dernière limitation démontre bien qu’il n’est pas possible d’éliminer 100% des liens sauvages vers vos images puisqu’il suffit de masquer le HTTP_REFERER pour éviter l’interdiction. Une élimination de 95-98% des liens représente déjà une économie substantielle de bande passante.

Si vous souhaitez autoriser certains domaines amis à faire des liens directs, il suffit d’ajouter pour chacun d’eux une condition supplémentaire :

RewriteCond %{HTTP_REFERER} !^http://votredomaine.net/.*$ [NC]

Cet exemple permet d’accéder aux images dans le cas où votre domaine serait invoqué sans le sous-domaine « www ».

Débarrassons-nous des visiteurs indésirables

La condition s’écrira généralement sous une des formes suivantes :

RewriteCond %{REMOTE_HOST} ^badhost\.baddomain\.tld$
-  teste le nom d’un ordinateur hôte spécifique

RewriteCond %{REMOTE_HOST}  baddomain\.tld$
-  teste le domaine complet (se termine par..., notez l’absence du caractère ^)

RewriteCond %{HTTP_USER_AGENT}   ^VilainRobot.*
-  teste le nom du robot indésirable (HTTP_USER_AGENT commence par la chaîne “VilainRobot”)

RewriteCond %{REMOTE_ADDR}  ^123\.45\.67\.12[5-9]$
-  teste une plage d’adresses IP (de 123.45.67.125 à 123.45.67.129 inclus)

Pourquoi éviter certains robots ?

Tous les robots ne sont pas bénéfiques pour votre sites.
Certains d’entre-eux sont des aspirateurs de site, d’autres collectent les addresses email et finissent par remplir votre boîte aux lettres de courier non-sollicité (spam). Ils ont tous une caractéristique commune: utiliser les resources de votre serveur sans vous apporter aucun visiteur “utile”.
Tous ces robots “indélicats” ne respectent pas le protocole d’exclusion représenté sous la forme du fichier “/robots.txt”.

Soyez très attentifs dans l’écriture de vos règles d’exclusion, par exemple la condition:

RewriteCond %{HTTP_USER_AGENT}   Bot

est beaucoup trop générique et vous priverait du passage de GoogleBot, ce qui n’est sûrement pas ce que vous souhaitez.

Un exemple concret :

RewriteCond %{REMOTE_HOST}  \.laurion\.(com|net)$  [OR]
RewriteCond %{REMOTE_HOST} \.cn$ [OR]
RewriteRule ^.*$   -   [F]

La première condition interdit toute visite en provenance de laurion.com et laurion.net. Cela peut sembler un peu brutal comme règle mais ce robot ne respectant pas le protocole d’exclusion et ne se gênant pas pour « pomper » plus de 100 pages/minutes nous n’avons pas vraiment eu envie de mettre de gants le concernant.

Elle aurait pu s’écrire, en se basant sur le HTTP_USER_AGENT :

RewriteCond %{HTTP_USER_AGENT}  ^IPiumBot   [OR]

La deuxième condition élimine encore plus radicalement tout visiteur provenant de Chine.
Ces règles et conditions ne sont que des exemples et ne sont pas dictées par une quelconque xénophobie de la part de l’auteur. Elles ont néanmoins contribué à réduire de manière significative la bande passante utilisée.

Comment tester différents HTTP_USER_AGENT ?

Il est bien évident que nous ne pouvons pas installer tous les USER_AGENT possible, la liste est trop longue. Certains navigateurs tels que Opera permettent de choisir le USER_AGENT sous lequel on « butine »...
Certains sites Web permettent de vérifier les entêtes reçues très facilement, par exemple http://www.wannabrowser.com/
Cette page, combinée avec une analyse approfondie de vos fichiers logs, vous permettra de mettre au point vos conditions de réécriture pour les différents visiteurs de votre site.

Pour effectuer vos tests, il est judicieux de créer un répertoire temporaire sur votre site, dans lequel vous mettrez un fichier index.html et le fichier .htaccess sur lequel vous travaillez.
Une fois votre fichier .htaccess mis au point, déplacez le dans le répertoire que vous voulez protéger, ou à la racine de votre site.

Des règles différentes selon les répertoires

Un fichier .htaccess placé dans un répertoire régit l’accès à ce répertoire ainsi qu’à tous les sous-répertoires et fichiers de celui-ci.
Vous pouvez bien sûr avoir plusieurs fichiers .htaccess dans des répertoires différents, selon les différentes protections ou réécritures que vous désirez appliquer.

Dans le cas d’un fichier .htaccess situé dans un sous-répertoire du site, les règles et conditions remplacent celles définies à l’échelon supérieur.
Si votre souhait est d’ajouter des règles de réécriture à celles du niveau supérieur au lieu de les remplacer, ajoutez la ligne suivante juste après le « RewriteEngine on » :

RewriteOptions inherit

Cette instruction spécifie que toutes les règles et conditions définies au niveau supérieur sont héritées, en supplément à celles que vous rajouterez dans le fichier .htaccess

updated on 16 December 2006

Discussion

49 discussions

  • 1

    Bonjour,
    La réécriture d’url ne fonctionne pas :
    Erreur 404 systématique
    SAUF pour le test avec
    « RewriteRule ^nexistepas.html$ trouve.html [L] »

    Ma configuration :

    Serveur local (debian)

    Apache 2, PHP5, SPIP 1.8.3, Mysql 5.0.18

    mod_rewrite activé dans apache,

    url propres2 dans mes_options.php3,

    fichier .htaccess par défaut

    Une idée ?

    • erreur dans le texte : ne fonctionne pas non plus avec « RewriteRule ^nexistepas.html$ trouve.html [L] »

    Reply to this message

  • 1

    Bonjour,
    je suis face à un petit problème dont personne n’a trouvé la solution sur le phorum : J’utilise la réécriture d’url, tout fonctionne... sauf que quand je change le titre d’un article existant, l’url ne change pas !

    Y a t il un “cache” ou sont stockées ces urls ? J’ai tout tenté, mais même en réinstallant la base sur un autre spip, c’est toujours les premières url qui apparaissent !!!!

    Help, je sèche !!

    • Bon, quand on cherche, on finit toujours par trouver. Les url propres sont stockées dans la base de données !!

      Mais, existe-t-il une fonction cachée pour vider les champs stockés dans la base ?

      Bon, peut-être que ça ne sert à personne d’autre que moi, mais quand je bosse sur 5 site à la structure identique, je fais la base sur le premier, puis je la recopie sur les autres. Je n’ai plus qu’a changer quelques titre d’articles et hop !

    Reply to this message

  • 1
    kishkaya

    j’ai lu tout le tutorial mais j’ai toujours pas la solution a mon probleme (bien que l’article soit extremement bien redigé)
    jaimerais empecher les gens d’aller à toute url qui n’est pas un fichier à la racine de mon hebergement (soit, avoir une redirection de tous les .php qui sont dans des sous dossiers) mais j’arrive pas à le faire, et faire une redirection pour chaque fichier serait longue et repetitive, je sui ssur qu’il y a un moyen simple.

    Si vous le connaissez merci de m’aide =)
    _Marikou

    • Tu peux peut-être essayer de mettre un .htaccess dans chacun des répertoires que tu veux rediriger.

    Reply to this message

  • 1

    Bonjour et bravo pour ce site, son equipe et son travail.
    cette contrib et super...mais...j’arrive pas a la mettre en place...:(
    . Je voudrais ré-ecrire mes fichiers de squelette de cette facon
    agenda.php3?id_rubrique=xx a la facon agendaxx.html
    J’ai donc fait modif ds htaccess de la facon suivante
    Options +FollowSymlinks
    RewriteEngine on

    RewriteRule ^/agenda([0-9]+)\.html$ /agenda.php3?id_rubrique=$1 [QSA,L]
    RewriteRule ^/planning([0-9]+)\.html$ /planning.php3?id_rubrique=$1 [QSA,L]]
    RewriteRule ^/categorie([0-9]+)\.html$ /categorie.php3?id_rubrique=$1 [QSA,L]]
    RewriteRule ^/ou([0-9]+)\.html$ /ou.php3?id_mot=$1 [QSA,L]]

    # urls spip]
    RewriteRule ^/rubrique([0-9]+)\.html$ /rubrique.php3?id_rubrique=$1 [QSA,L]]
    RewriteRule ^/article([0-9]+)\.html$ /article.php3?id_article=$1 [QSA,L]]
    RewriteRule ^/breve([0-9]+)\.html$ /breve.php3?id_breve=$1 [QSA,L]]
    RewriteRule ^/secteur([0-9]+)\.html$ /secteur.php3?id_rubrique=$1 [QSA,L]]
    et....rien du tout alors que le test avec trouve.html fonctionne....]
    Si quelqu’un peu me donner un indice...

    • As tu essayé d’écrire l’url directement dans la barre de navigation ?

      ex: http://monsite/rubrique1.html

      la balise #URL_RUBRIQUE renvoi l’url a la old school rubrique.php3?id_rubrique=2

      c’est peut être de là que vient ton soucis.

    Reply to this message

  • 2
    wonderphone

    Bonjour!

    En gros, voici mon problème : dans une appli, je cherche à rediriger toutes les archives archive.jar dans un script appelé force-jar.php.

    Voici ma ligne de code dans le htaccess :

    RedirectMatch (.*)\.jar$ http://www.mon-serveur.com/wap/downloadservice/upload/force-jar.php?jarpath=$1.jar

    mais au lieu d’éffectuer la requête, apache me fais une redirection infinie.

    c’est à dire :

    http://www.mon-serveur.com/wap/downloadservice/upload/force-jar.php?jarpath=/wap/downloadservice/upload/force-jar.php?jarpath=/wap/downloadservice/upload/force-jar.php?jarpath etc...

    Une suggestion ?

    Merci

    • Peut-être parce que ta redirection pointe vers une adresse valide pour ta règle...

      Essaye d’ajouter [L] à la fin de la ligne pour stopper les redirections suivantes, sinon enleve le .jar après $1 et force le à l’intérieur du script.

    • Autre solution :
      RedirectMatch (.*\.jar)$ http://domain/path/to/script.php?jarpath=$1 [L,QSA]

      Permet de ne plus faiure d’autre redirection et ajoute les autres paramètres à la fin.

    Reply to this message

  • 1

    ça ne marche pas bien en fait.

    le MAJ_htaccess.php3 rajoute du contenu au précédent .htaccess, alors qu’il devrait d’abbord l’effacer.
    actuellement, on a un .htaccess qui grossit, grossit, grossit. il faut le vider à la main avant de le réécrire. c’est pas très embétant mais un peu dans la mesure ou c’est censser permettre l’actualisation des url sans acces ftp ou trucs du genre.

    si quelqu’un à des pistes, pour l’insant, je ne sais pas faire.

    salut

    Reply to this message

  • tito@infokiosques.net

    salut

    j’ai l’impression d’avoir vraiment saisi une nouvelle dimension de la réécriture des url. alors peut-être que ce petit post deviendra une contribution avec plus d’explications.

    les 2 choses:
    -  création du .htaccess avec des boucles spip.
    c’est le squellette MAJ_htaccess.htlm qui écrit le .htaccess

    -  éviter les boucles infinies dans la redirection d’anciens url.
    l’astuce, c’est de nommer autrement mes fichier .php3 de squellettes. là, c’est un petit 2 en plus. distro2.php3 à la place de distro.php3. voir aussi l’usage des RewriteCond et de ? bien placé.

    voilà en tous cas où j’en suis :

    le code que j’ai mis dans un squellette MAJ_htaccess.html un
    peu spécial :

    <?php
    
           $somecontent = '
    
    ##################################
    # FICHIER GENERE PAR MAJ_htaccess.php3
    ##################################
    
    RewriteEngine on
    
    
    ##################################
    #URL POUR LES ARTICLES
    ##################################
    
    RewriteCond %{QUERY_STRING} id_article=([0-9]+)
    RewriteRule article.php3 /%1? [R=permanent,L]
    
    RewriteCond %{QUERY_STRING} id_article=([0-9]+)
    RewriteRule article-spe.php3 /%1? [R=permanent,L]
    
    RewriteRule ^([0-9]+)$    /article2.php3?id_article=$1 [QSA,L]
    
    ##################################
    #URL POUR LES IMPRESSIONS
    ##################################
    
    RewriteCond %{QUERY_STRING} id_article=([0-9]+)
    # ? n'est pas un caractère comme les autre. je me suis tapper la tête contre les murs
    # avant de comprendre que c'est le début d'une query_string et donc qu'il faut
    # utiliser  un RewriteCond. je pensais qu'un contreslash devait faire l'affaire
    # ceci dit, peut-être que ça marche et que c'était d'autres choses qui foiraient
    # comme les boucles infinies. vu que je suis mainteant sur mon petit mac et que
    # je n'ais pas les antislach, je vous laisse me répondre ou tester
    
    RewriteRule imprimersans.php3 /%1.html? [R=permanent,L]
    # le ? renvoie la string toute vide. si on ne met pas le ?, apache la colle sans rien demander
    
    RewriteRule ^([0-9]+).html$  /imprimersans2.php3?id_article=$1 [QSA,L]
    # le 2 rajouté, en vrai, sur le serveur. éviter à apache de tourner en rond.
    # de toutes manières, on les verra plus ces url de fichiers
    
    
    
    ##################################
    #URL POUR LES DISTROS
    ##################################
    
    <BOUCLE_distro(MOTS){id_groupe=2}>
    
    # #TITRE
    RewriteCond %{QUERY_STRING} id_mot=#ID_MOT
    RewriteRule distro.php3 /#DESCRIPTIF? [R=permanent,L]
    RewriteRule #DESCRIPTIF /distro2.php3?id_mot=#ID_MOT  [QSA,L]
    
    </BOUCLE_distro>
    
    
    ##################################
    #URL POUR LES THEMES
    ##################################
    
    <BOUCLE_themes(MOTS){id_groupe=1}>
    
    # #TITRE
    RewriteCond %{QUERY_STRING} ^id_mot=#ID_MOT$
    RewriteRule theme.php3 /#DESCRIPTIF? [R=permanent,L]
    RewriteRule #DESCRIPTIF /theme2.php3?id_mot=#ID_MOT  [QSA,L]
    
    </BOUCLE_themes>
    
    
    ';
    
    # on a mis tout dans $somecontent
    # maintenant, on va mettre $somecontent dans .htaccess
    # ce bout de script ne viens pas de ma tête, mais de je ne sais plus où
    # fr.php.net genre.
    
    
    $filename = '.htaccess';
    
    // Assurons nous que le fichier est accessible en écriture
    if (is_writable($filename)) {
    
       // Dans notre exemple, nous ouvrons le fichier $filename en mode d'ajout
       // Le pointeur de fichier est placé à la fin du fichier
       // c'est là que $somecontent sera placé
       if (!$handle = fopen($filename, 'a')) {
             echo "Impossible d'ouvrir le fichier ($filename)";
             exit;
       }
    
       // Ecrivons quelque chose dans notre fichier.
       if (fwrite($handle, $somecontent) === FALSE) {
           echo "Impossible d'écrire dans le fichier ($filename)";
           exit;
       }
    
       echo "L'écriture de ($somecontent) dans le fichier ($filename) a réussi";
    
       fclose($handle);
    
    } else {
       echo "Le fichier $filename n'est pas accessible en écriture.";
    }
    
    ?>

    avec, bien entendu, un MAJ_htaccess.php3 comme à l’habitude:

    <?php
    
    $fond = "MAJ_htaccess";
    $delais = 24 * 3600;
    
    include ("inc-public.php3");
    
    ?>

    quand je rentre un nouveau mot-clef, un petite visite avec mon navigateur sur MAJ_htaccess.php3 et les url sont à jour.

    (un grand merci à fil et lunar^)

    Reply to this message

  • J’avais repéré sur transfert.net une autre façon de proposer les urls, sans le .html:
    http://monsite.net/a384
    pour l’article 384.

    Ci-dessous
    dans .htaccess

    #pas de reecriture pour certaines ressources
    RewriteRule \.(gif|jpg|png|css|php|php3) - [NC,L]
    RewriteRule ^(ecrire|IMG|NAVPICS|oo)/ - [NC,L]
    #urls spip rediriger lancien format
    RewriteRule ^rubrique([0-9]+)\.html$   /r$1 [R,L]
    RewriteRule ^article([0-9]+)\.html$    /a$1 [R,L]
    RewriteRule ^breve([0-9]+)\.html$      /b$1 [R,L]
    RewriteRule ^secteur([0-9]+)\.html$    /s$1 [R,L]
    RewriteRule ^auteur([0-9]+)\.html$    /auteur$1 [R,L]
    RewriteRule ^site([0-9]+)\.html$    /site$1 [R,L]
    #urls spip
    RewriteRule ^r([0-9]+)$   /rubrique.php3?id_rubrique=$1 [QSA,L]
    RewriteRule ^a([0-9]+)$    /article.php3?id_article=$1 [QSA,L]
    RewriteRule ^m([0-9]+)$      /mot.php3?id_mot=$1 [QSA,L]
    RewriteRule ^b([0-9]+)$      /breve.php3?id_breve=$1 [QSA,L]
    RewriteRule ^s([0-9]+)$    /secteur.php3?id_rubrique=$1 [QSA,L]
    RewriteRule ^auteur([0-9]+)$    /auteur.php3?id_auteur=$1 [QSA,L]
    RewriteRule ^site([0-9]+)$    /site.php3?id_syndic=$1 [QSA,L]
    RewriteRule ^f([0-9]+)$    /forum.php3?id_article=$1 [QSA,L]

    et dans inc-urls-court.php3

    <?php
    
    // executer une seule fois
    if (defined("_INC_URLS2")) return;
    define("_INC_URLS2", "1");
    
    function generer_url_article($id_article) {
    	return "a$id_article";
    }
    
    function generer_url_rubrique($id_rubrique) {
    	return "r$id_rubrique";
    }
    
    function generer_url_breve($id_breve) {
    	return "b$id_breve";
    }
    
    function generer_url_mot($id_mot) {
    	return "m$id_mot";
    }
    
    function generer_url_auteur($id_auteur) {
    	return "auteur$id_auteur";
    }
    
    
    function generer_url_document($id_document) {
    	if ($id_document > 0) {
    		$query = "SELECT fichier FROM spip_documents WHERE id_document = $id_document";
    		$result = spip_query($query);
    		if ($row = spip_fetch_array($result)) {
    			$url = $row['fichier'];
    		}
    	}
    	return $url;
    }
    
    function recuperer_parametres_url($fond, $url) {
    	global $contexte;
    	return;
    }
    
    
    //
    // URLs des forums
    //
    
    // a mettre dans ecrire/inc_threads.php3 avec les autres trucs de forum
    function racine_forum($id_forum){
    	$query = "SELECT id_parent, id_rubrique, id_article, id_breve FROM spip_forum WHERE id_forum=".$id_forum;
    	$result = spip_query($query);
    	if($row = spip_fetch_array($result)){
    		if($row['id_parent']) {
    			return racine_forum($row['id_parent']);
    		}
    		else {
    			if($row['id_rubrique']) return array('rubrique',$row['id_rubrique'], $id_forum);
     			if($row['id_article']) return array('article',$row['id_article'], $id_forum);
    			if($row['id_breve']) return array('breve',$row['id_breve'], $id_forum);
    		}
    	}
    } 
    
    function generer_url_forum($id_forum, $show_thread=false) {
    	list($type, $id, $id_thread) = racine_forum($id_forum);
    	if ($id_thread>0 AND $show_thread)
    		$id_forum = $id_thread;
    	switch($type) {
    		case 'article':
    			return generer_url_article($id)."#forum$id_forum";
    			break;
    		case 'breve':
    			return generer_url_breve($id)."#forum$id_forum";
    			break;
    		case 'rubrique':
    			return generer_url_rubrique($id)."#forum$id_forum";
    			break;
    		default:
    			return "forum$id_forum.html";
    	}
    }
    
    ?>

    J’ai testé sur le site, tout semble fonctionner correctement. Maintenant ce qui n’est pas clair pour moi c’est la référence au fichier ecrire/inc_threads.php3, je n’ai pas déplacé ce bout de code. Si quelqu’un peut m’éclaire...

    Reply to this message

  • 1

    Très bon article, merci encore.

    > Uzume

    A mon avis c’est au cas où tu mettes :

    RewriteCond %HTTP_BIDULE ^blabla&blibli$

    Dans ce cas ça voudrais dire que HTTP_BIDULE peut valoir à la fois “blabla” et “blibli” ce qui n’a aucun sens. (Enfin c’est une supposition)

    J’aurais tout de même une question à poser.

    J’ai utilisé les régles de réécriture d’url pour un site php/mysql, ça marche nikel et j’ai donc des pages du style page-x.hmtl qui me renvoi vers page.php?id=x et j’ai donc deux url possible pour mes pages (page-x.hmtl et page.php?id=x).

    Cela peut me poser problème car si google essai d’indexer mes pages dans les deux versions il risque de me pénaliser (plusieurs pages avec le même contenu), de plus mes pages sous google sont toujours référencées sous la forme page.php?id=x après plusieurs de ses danses ce qui n’est pas très élégant.

    L’idéal pour résoudre ce problème serait de lui faire une redirection 301. Mais si je met ce code dans mon .htaccess :

    Options +FollowSymlinks
    RewriteEngine on
    RewriteRule ^(.*)/page.php?id=([0-9]+)$ $1/page-$2.html [NC,QSA,R=301,L]
    RewriteRule ^(.*)/page-([0-9]+)\.html$ $1/page.php?id=$2 [NC,QSA,L]

    Je risque de tourner en boucle infinie ! :o/

    Quelqu’un a-t-il une suggestion ?

    • Après test visiblement je ne tourne pas en boucle infini et les deux url ont l’air de bien fonctionner, mais est-ce correcte de procéder ainsi ?

      Merci

    Reply to this message

  • ... Avec les accolades où il faut bien sûr ;o)

    Reply to this message

Ajouter un commentaire

Who are you?
[Log in]

To show your avatar with your message, register it first on gravatar.com (free et painless) and don’t forget to indicate your Email addresse here.

Enter your comment here

This form accepts SPIP shortcuts {{bold}} {italic} -*list [text->url] <quote> <code> and HTML code <q> <del> <ins>. To create paragraphs, just leave empty lines.

Add a document

Follow the comments: RSS 2.0 | Atom