Pagina 1 di 1

[Risolto] Estrarre indice da pdf

Inviato: giovedì 5 aprile 2012, 13:05
da Joe-crono
Ciao a tutti, vi spiego la soluzione che sto cercando ;). Ho un pdf molto grande composto completamente da immagini, quindi per cercare quello che mi serve non posso usare la normale funzione cerca, che funziona solo con il testo. Nel pdf è però incluso un indice che ti indirizza direttamente alla pagina che cerchi. Il problema sta nel fatto che questo indice è immenso e, almeno con il lettore predefinito (ubuntu 10.04), non è possibile usare la funzione cerca su di esso. Si tratta di migliaia di voci..
Quindi in breve cerco un modo per effettuare ricerche automatiche su quell'indice. Ho pensato che una soluzione potrebbe essere quella di estrarlo su di un file di testo. Grazie in anticipo per l'interessamento ;).

Re: Estrarre indice da pdf

Inviato: giovedì 5 aprile 2012, 18:33
da Udun
convertire il pdf in txt potrebbe raggiungere un qualche risultato?  :-\
http://shibuvarkala.blogspot.co.uk/2008 ... buntu.html

Re: Estrarre indice da pdf

Inviato: giovedì 5 aprile 2012, 18:47
da Joe-crono
No, perché essendo immagini non c'è alcun testo riconoscibile da poter estrarre. Devo trovare il modo di mettere mano a quell'indice..


EDIT: Risolto! Ho installato Okular che permette la ricerca all'interno dell'indice. Perfetto :D!