[Risolto] stampare pdf e ocr
[Risolto] stampare pdf e ocr
un saluto a tutti,
premetto che ormai tutto ciò che potevo fare, l'ho fatto.
non so se è semplice la cosa, ho un file pdf con ocr,
e avrei la necessita di dover rimpaginare il tutto avendo due pagine per ogni foglio
con un paio di stampanti virtuali ci sono riuscito, ma poi perdo il riconoscimento del testo
in pratica mi converte le pagini in immagini. ci sarebbe un modo per superare questo problema?
premetto che ormai tutto ciò che potevo fare, l'ho fatto.
non so se è semplice la cosa, ho un file pdf con ocr,
e avrei la necessita di dover rimpaginare il tutto avendo due pagine per ogni foglio
con un paio di stampanti virtuali ci sono riuscito, ma poi perdo il riconoscimento del testo
in pratica mi converte le pagini in immagini. ci sarebbe un modo per superare questo problema?
Ultima modifica di salvo2020 il mercoledì 21 ottobre 2020, 17:29, modificato 2 volte in totale.
- nuzzopippo
- Entusiasta Emergente

- Messaggi: 1633
- Iscrizione: giovedì 12 ottobre 2006, 11:34
Re: stampare pdf e ocr
Suppongo che dipenda un po' da come lo fai, con "Visualizzatore di documenti" ho appena provato a "stampare" un pdf in un file pdf con due pagine a facciata ed il riconoscimento del testo con il visualizzatore viene mantenuto, se si cerca del testo nel documento viene trovato.salvo2020 ha scritto: ↑martedì 20 ottobre 2020, 3:19non so se è semplice la cosa, ho un file pdf con ocr,
e avrei la necessita di dover rimpaginare il tutto avendo due pagine per ogni foglio
con un paio di stampanti virtuali ci sono riuscito, ma poi perdo il riconoscimento del testo
in pratica mi converte le pagini in immagini. ci sarebbe un modo per superare questo problema?
Definisci correttamente il Tuo problema : cosa significa "ho un file pdf con ocr"?, forse, che il file di partenza è una immagine e "posizionando" due immagini su singola pagina un eventuale ocr funziona male?
Nel caso su, può essere risolto (con una certa perdita di precisione) utilizzando, p.e., imagemagik e tesseract in uno script.
Fatti non foste a viver come bruti ...
Re: stampare pdf e ocr
magari, spero che sia un problema di esecuzione.nuzzopippo ha scritto: ↑martedì 20 ottobre 2020, 7:51Suppongo che dipenda un po' da come lo fai, con "Visualizzatore di documenti" ho appena provato a "stampare" un pdf in un file pdf con due pagine a facciata ed il riconoscimento del testo con il visualizzatore viene mantenuto, se si cerca del testo nel documento viene trovato.
Definisci correttamente il Tuo problema : cosa significa "ho un file pdf con ocr"?
premetto che sto in windows10, ed ho provato vari programmi diversi sia lettori pdf che stampanti virtuali,
avevo pensato che ci potesse essere un problema su come è realizzato il pdf originale per questo sto provando anche con una stampa in pdf di una pagina del forum dove viene riconosciuto il testo. ma anche in questo caso con i programmi che sto usando si perde la possibilità di ricercare le parole diventando un'immagine.
grazie per la risposta nuzzopippo,
mi potresti dire col "Visualizzatore di documenti" cosa intendi di preciso?
parli di un programma standard su ubuntu/derivate oppure di windows?
comunque sia mi potresti indicare il SO e software che hai usato?
- nuzzopippo
- Entusiasta Emergente

- Messaggi: 1633
- Iscrizione: giovedì 12 ottobre 2006, 11:34
Re: stampare pdf e ocr
Windows? ... non so che dirti, non lo uso da vent'anni e non ho idea di come funzioni attualmente, credevo Tu parlassi di sistemi Linux, dato che questo è un forum ubuntu.
Parlavo di "strumenti" software normalmente disponibili in linux, "Visualizzatore di documenti" è una applicazione standard nelle distribuzioni Ubuntu o debian, versioni "ordinarie" (Gnome), manca in alcuni diversi contesti (tipo debian LXDE).
Personalmente uso diverse distribuzioni Linux su diverse macchine, preferenzialmente Debian ed Ubuntu, per lavoro manipolo spesso file PDF, se derivati da scansione di documenti (immagini, quindi) li manipolo tramite script a linea di comando basati su pdftk, imagemagik e, se devo estrarre testo, tesseract.
Fatti non foste a viver come bruti ...
- giulux
- Amministratore

- Messaggi: 25438
- Iscrizione: domenica 10 gennaio 2010, 12:17
- Desktop: ubuntu 18.04
- Distribuzione: Ubuntu 18.04.3 LTS x86_64
- Sesso: Maschile
- Località: Roma
Re: stampare pdf e ocr
Sposto in altri sistemi operativi.
Leggere per favore la descrizione delle varie sezioni prima di postare, grazie.
Leggere per favore la descrizione delle varie sezioni prima di postare, grazie.
"Non è una segno di buona salute l'essere ben adattato ad una società malata". (Jiddu Krishnarmurti)
Re: stampare pdf e ocr
ok nuzzopippo grazie per il suggerimento, proverò utilizzando lubuntu o xubuntu live da usb (spero di riuscirci)nuzzopippo ha scritto: ↑martedì 20 ottobre 2020, 8:31Windows? ... non so che dirti, non lo uso da vent'anni e non ho idea di come funzioni attualmente, credevo Tu parlassi di sistemi Linux, dato che questo è un forum ubuntu.
Parlavo di "strumenti" software normalmente disponibili in linux, "Visualizzatore di documenti" è una applicazione standard nelle distribuzioni Ubuntu o debian, versioni "ordinarie" (Gnome), manca in alcuni diversi contesti (tipo debian LXDE).
Personalmente uso diverse distribuzioni Linux su diverse macchine, preferenzialmente Debian ed Ubuntu, per lavoro manipolo spesso file PDF, se derivati da scansione di documenti (immagini, quindi) li manipolo tramite script a linea di comando basati su pdftk, imagemagik e, se devo estrarre testo, tesseract.
ps grazie giulux e scusate per aver aperto una nuova discussione nella sezione sbagliata.
Re: stampare pdf e ocr
ciao nuzzopippo ancora grazie, non solo ha funzionato alla grande, ma è stata anche una procedura semplice come volevo 
- trekfan1
- Moderatore Globale

- Messaggi: 23518
- Iscrizione: domenica 21 maggio 2006, 10:51
- Desktop: Gnome
- Distribuzione: Ubuntu 23.10 e 24.04 (dev)
- Sesso: Maschile
- Località: Formigine (MO) | Accecante Asceta
Re: [RISOLTO] stampare pdf e ocr
Il [Risolto] vuole messo evitando di scriverlo tutto maiuscolo, correggi, grazie 
Regolamento del Forum Il forum di StarTrek in italia Gruppo Seti Script per il [Risolto] Rufus Multiboot Linux/Linux Seriale Win8/8.1/10 da Linux PPA amule 20.04
Da Regolamento è VIETATO chiedere supporto con i messaggi privati!!
Da Regolamento è VIETATO chiedere supporto con i messaggi privati!!
Re: [Risolto] stampare pdf e ocr
sorry trekfan1, aggiustato.
Chi c’è in linea
Visualizzano questa sezione: 0 utenti iscritti e 3 ospiti