miércoles, 6 de julio de 2011

Extraer imaxes dun pdf

Mediante un paquete software e a consola podemos extraer facilmente todas as imaxes dun pdf.
Para eso abrimos a consola e escribimos o seguinte comando para instalar o paquete software:

" sudo apt-get install imagemagick xpdf-utils "


Agora o que precisamos é un pdf de onde extraer as imaxenes, para facilitar este traballo crearei uha carpeta no escritorio e un pdf.pdf con imaxenes.

No meu caso situareime mediante consola no escritorio, na carpeta PDF :

" cd Escritorio "
" cd PDF"
" ls " [para comprobar o contido]


Para extraer as imaxes farei un pdfimages “nome do arquivo” imaxen, onde o meu nome do arquivo será o pdf, e "imaxen" será o nome base das imaxenes.

" pdfimages pdf.pdf imaxen "



Como ben se ve na captura anterior, fixen un ls a continuación do comando pdfimages como verificación, pero se preferides ver as imaxes en miniatura, aqui van.


Un ultimo apunte, existen varias opcións dentro deste comando (pdfimages), que poderemos usar desta forma " pdfimages 'opcion' 'nome do arquivo' imaxes ".
As distintas opcións son as seguintes:

-f número [especifica a primeira páxina a escanear]

-l número [especifica a última páxina a escanear]

-j [en lugar de escribir as imaxes como PBM (para imaxes monocolor)
ou PPM (para non monocolor). As imaxes en formato DCT son salvadas
como JPEG. Todas as Non-DCT imaxes serán gardadas en formato PBM/PPM.]

-opw password [especifica o owner password do ficheiro PDF]

-upw password [especifica o user password do ficheiro PDF]

No hay comentarios:

Publicar un comentario