Pasar de PDF a HTML

En este post vamos a tratar como convertir ficheros PDF a formatos HTML o XML, junto con sus imágenes. pdftohtml es un programa que nos permite realizar la conversión de ficheros PDF a html. Soporta crifrado de ficheros.

En Ubuntu, este paquete esta incluido en el paquete “poppler-utils“, por lo que será necesario instalar este paquete. Para ello, abriremos el terminal y teclearemos:

$ sudo apt-get install poppler-utils

Una vez terminado ya podremos usar la aplicación desde nuestra consola.

Uso de pdftohtml

$ pdftohtml [opciones] [fichero pdf] [fichero html]

Algunas Opciones disponibles:

-h, -help: Nos muestra las opciones disponibles
-f: primera página a convertir
-l: última página a convertir
-q: no imprimir ningún mensaje de error por pantalla
-v: Imprime en pantalla la versión
-i: ignorar las imágenes
-c: Modo complejo, permite ver los gráficos
-stdout: usar la salida standard
-zoom: Hacer un zoom del documento pdf (por defecto 1.5)
-xml: Salida en xml
-enc: salida codificada
-hidden: ver la extracción del fichero
-dev: salida para Ghostscript
-nomerge: sin margen

Ver mas opciones utilizando la opción “-h” o mediante un “man”.

Encontré un simple script para nautilus que os permitirá realizar la conversión mas facilmente desde el explorador de Gnom, Nautilus.

Os dejo el codigo aquí:

#!/bin/bash
while [ $# -gt 0 ]; do
filename=$1
html_file=`echo “$filename” | sed ‘s/.w*$/.html/’`
pdftohtml -q “$filename” “$html_file”
shift
done

Grabar como “Convertpdf”, dar permisos de ejecución y situar en “/home/[usuario]/.gnome2/nautilus-scripts”

Recordad que para usar los scripts de Nautilus debeis tener instalado el paquete “python-nautilus”. Una vez incluido el script dispondremos de la opción desde: Boton derecho sobre el fichero -> Scripts -> Convertpdf.

3 comentarios to “Pasar de PDF a HTML”

  1. Un pequeño indice de posts (1) « LinuxSan Says:

    […] LinuxSan Linux para todos « Pasar de PDF a HTML […]

  2. Javier Says:

    Hola, gracias por el script, muy util.

    Bueno ya lo he hecho todo tal cual, con permisos y todo pero al hacer click derecho sobre el erchivo que quiero convertir y decirle que use el scrpt a nautilus, sencillamente no pasa nada, que puede ser’

  3. cristiansan Says:

    Hola Javier,

    Este finde le echaré un vistazo y haber si puedo ayudarte, algo debo haber escrito mal. Error no te aparece ninguno ¿no?

    saludos

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s


A %d blogueros les gusta esto: