Un nouveau compilateur de squelettes

Ceci est une archive périmée mais qui reste intéressante, parfois autant pour l’article que les commentaires associés.

Division par 2 de la taille des squelettes produits et corrections de qq bugs

Débutant en SPIP il y a 2 mois, j’ai été gêné par l’absence de messages d’erreur en cas de paramètres de boucle ineptes. Du coup, j’ai regardé le code du fichier inc-calcul-squel.php3, et l’ai modifié en appliquant des techniques standards de compilation pour clarifier le code produit, savoir :

-  éliminer l’affectation d’une variable inutilisée ou réaffectée dans la suite du code ;

-  éliminer l’affectation d’une variable utilisée une seule fois dans la suite du code,
en remplaçant cette unique occurrence par la partie droite de l’affectation ;

-  remplacer toutes les occurrences d’une variable par sa valeur lorsque celle-ci est connue à la compilation ;

-  remplacer « if condition alors sinon » par l’alternant approprié lorsque la condition est connue à la compilation (constante ou objet non vide typiquement)

-  éliminer « while condition {} » (cas se produisant avec TOTAL_BOUCLE, qui est en fait équivalent à num_rows ce que SPIP ne permet pas de dire autrement qu’en
parcourant toute la table, ce qui n’est ainsi plus le cas).

Ces méthodes ont apporté un gain de 50% sur les squelettes standards :

Nom Taille initiale Taille finale
article-dist.php3 71140 36628
breve-dist.php3 45934 23435
forum-dist.php3 20518 10115
plan-dist.php3 23718 11188
resume-dist.php3 36398 18025
rubrique-dist.php3 48099 23781
sommaire-dist.php3 33499 16673
Total 298701 139845

Les bugs repérés :

-  en cas de hiérarchie, les Rows n’étaient pas transmises aux boucles internes (par suite d’une confusion entre la variable $boucles du compilo et $pile_boucle du squelette produit) et les doublons étaient mal calculés (même cause, avec $doublon et $instance->doublon) ;

-  dans la fonction principale du squelette, on pouvait référencer $id_instance qui n’y est pas définie (bug visible dans le squelette forum) ;

-  le + important : le séparateur (paramètre comme {", "}) était rajouté à chaque tour de boucle, et non à chaque fois qu’un résultat nouveau est produit, ce qui n’est pas la même chose en cas de boucles imbriquées (voir exemple utile en pièce jointe : calcul de tous les mots-clés de toutes les rubriques).

En outre, un paramètre fautif est dénoncé (ceux de BIOSPIP oublient les guillemets, d’où absence de séparateur, sans explication ; j’ai prévenu l’auteur qui a corrigé).

Les optimisations réalisées devraient diminuer la taille des processus (moins d’allocation de mémoire) et autoriser les squelettes à rester plus longtemps dans le cache disque du serveur. Sur la durée d’exécution du processus lui-même une amélioration n’est perceptible que sur des exemples où la base de donnée est
réduite, car les réponses de MySQL sont le plus gourmand en temps.

Une suite à mon travail serait précisément de calculer les champs effectivement utilisés dans un squelette pour minimiser ces réponses (c’est d’ailleurs ce qui est
fait depuis longtemps pour la table ARTICLE). Je veux bien me lancer là-dedans,
mais il faudrait d’abord intégrer ce que j’ai fait au CVS. J’étais parti de la version
1.6 officielle (fichier inc-calcul-squel du 10 Mai), je veux bien prendre le temps de synchroniser avec la dernière version sur CVS (le diff avec la 1.6 est encore assez petit) si vous souhaitez adopter mon travail. A signaler que j’ai éclaté ce fichier en
5 (parsing/production/debug/écriture/donnees) ce qui réduira d’ailleurs les conflits
d’accès sous CVS par la suite.

La première pièce jointe contient les 5+1 fichiers PHP.
La deuxième est une modif du squelette sommaire, comportant le calcul de tous les mot-clés du site.

Tout commentaire est évidemment le bienvenu.

Mille mercis à Antoine de m’avoir donné le tuyau de l’Apache Benchmark (/usr/sbin/ab) et surtout d’avoir copieusement éprouvé une première version.

Discussion

Aucune discussion

Ajouter un commentaire

Avant de faire part d’un problème sur un plugin X, merci de lire ce qui suit :

  • Désactiver tous les plugins que vous ne voulez pas tester afin de vous assurer que le bug vient bien du plugin X. Cela vous évitera d’écrire sur le forum d’une contribution qui n’est finalement pas en cause.
  • Cherchez et notez les numéros de version de tout ce qui est en place au moment du test :
    • version de SPIP, en bas de la partie privée
    • version du plugin testé et des éventuels plugins nécessités
    • version de PHP (exec=info en partie privée)
    • version de MySQL / SQLite
  • Si votre problème concerne la partie publique de votre site, donnez une URL où le bug est visible, pour que les gens puissent voir par eux-mêmes.
  • En cas de page blanche, merci d’activer l’affichage des erreurs, et d’indiquer ensuite l’erreur qui apparaît.

Merci d’avance pour les personnes qui vous aideront !

Par ailleurs, n’oubliez pas que les contributeurs et contributrices ont une vie en dehors de SPIP.

Qui êtes-vous ?
[Se connecter]

Pour afficher votre trombine avec votre message, enregistrez-la d’abord sur gravatar.com (gratuit et indolore) et n’oubliez pas d’indiquer votre adresse e-mail ici.

Ajoutez votre commentaire ici

Ce champ accepte les raccourcis SPIP {{gras}} {italique} -*liste [texte->url] <quote> <code> et le code HTML <q> <del> <ins>. Pour créer des paragraphes, laissez simplement des lignes vides.

Ajouter un document

Suivre les commentaires : RSS 2.0 | Atom