Carnet Wiki

langdoc

Version 4 — Août 2013 severo

Affecter une langue à un document

Attention, cette contribution est un document de spécifications pour un nouveau plugin langdoc. Il n’y a pas encore de code.

Présentation

Ce plugin permettra de spécifier la langue d’un document.

Il sera éventuellement utilisé par le plugin ocr pour une meilleure extraction du texte contenu dans une image, en effet les modèles de langues aident à la bonne reconnaissance de texte.

Spécifications

Il s’agira simplement d’ajouter une colonne lang à la table spip_documents et de créer les formulaires à ajouter via les pipelines dans les pages de modification des documents.

Développement

Le code du plugin est sera sur la zone.

On développera dans trunk.

Améliorations

En cas d’utilisation de doc2img, appliquer par défaut la même langue aux images créées qu’au document original.