Ingreso masivo de contenido de multiples documentos en articulos

Aplicativo para ingresar en masa el contenido de documentos html o documentos doc como articulos de spip. Es posible determinar la seccion, el autor y el titulo del articulo a ingresar. Este programa se libera en su version mas incipiente. Inicialmente se desarrollo en una version sin php, para facilitarme la labor de entrar masivamente unas cuantas decenas de documentos al sitio de la Comunidad de Paz de San Jose de Apartado, http://cdpsanjose.org. Previamente la entrada de multiples documentos constituia una labor tediosa repetitiva y consumidora de tiempo. Desafortunadamente mucha gente guarda sus documentos en formato word. Para pasarlo a spip se requeria abrir un word, que yo no tenia, y correr una macro de spip que cambia ciertos formateos word a formateos spip, luego se ingresa el documento, esto repetido decenas y hasta cientos de veces. Agregar articulo, publicar, etc, se consume ancho de banda y se consume tiempo. Con este aplicativo se gana tiempo y se ahorra trabajo. Espero que sea util para otras personas.

Requerimientos: ha sido probado en una maquina gnu/linux con perl (cualquier version), debe funcionar sin cambios en un equipo *BSD. Para aceptar documentos en word se requiere el aplicativo wvHtml del paquete wvware de http://wvware.sourceforge.net Ha sido probado con Spip 1.7x, con spip 1.8 debe funcionar, (pues la estructura de spip_articles no se modifica mas que en un campo: url_propre, y este tiene un default de cadena vacia).

Instalacion:

cree un subdirectorio

mkdir /var/tmp/spip

asignele permisos de escritura para el usuario con el que corre el apache: chmod 777 /var/tmp/spip

o chown www-data.www-data /var/tmp/spip chmod 755 /var/tmp/spip

copie los archivos .doc que necesita ingresar como articulos al spip a este subdirectorio. El nombre de los archivos no deben contener espacios. Se desconoce la limitante de tamaño para estos archivos doc y los resultantes html. Si el doc contiene imagenes estas no seran incluidas en el articulo correspondiente. cp directorio-archivos/*.doc /var/tmp/spip

Suponemos que tenemos corriendo un servidor web con apache, php y mysql en este servidor. En algun subdirectorio desde donde se sirvan documentos web copie los archivos php: masa.php, config.php, htmlmasa.php, convertirmasa.php, formarmasa.php, llenarmasa.php. Modifique config.php con los passwords, usuario de la base de datos spip.

Descomprima masaspip.tar.gz mkdir /var/www/masa cp masaspip.tar.gz /var/www/masa tar -zxvf masa.tar.gz

Abra desde el navegador el archivo: masa.php http://servidor/masa.php

siga las instrucciones primero digite el directorio donde se encuentran los word. /var/tmp/spip Elija los doc que va a pasara a html Continue Chulee los html que va a ingresar, digite el titulo de cada articulo, elija el autor, elija la seccion en donde quedara cada articulo, determine si quedara publicado (publie) o estara en prepa.

Pulse ingresar

Visite su sitio spip, vacie el cache y compruebe los cambios y modifique otros datos de los articulos.

Envie sus sugerencias, bugs, parches, etc. a mauricio [at] findesa.com

Licencia: Fuentes de dominio publico. La idea es que un proyecto de licencia gpl o BSD o cualquier otra pueda utilizar parte de este codigo si asi lo requiere.

Autor: Mauricio Rivera Pineda

updated on 14 June 2005

Discussion

Aucune discussion

Comment on this article

Who are you?
  • [Log in]

To show your avatar with your message, register it first on gravatar.com (free et painless) and don’t forget to indicate your Email addresse here.

Enter your comment here

This form accepts SPIP shortcuts {{bold}} {italic} -*list [text->url] <quote> <code> and HTML code <q> <del> <ins>. To create paragraphs, just leave empty lines.

Add a document

Follow the comments: RSS 2.0 | Atom