[Risolto] stampare pdf e ocr

Informazioni, consigli e novità sulla galassia delle distribuzioni GNU/Linux, *nix, *BSD e su altri sistemi operativi non liberi.
salvo2020
Prode Principiante
Messaggi: 199
Iscrizione: giovedì 26 marzo 2020, 15:49

[Risolto] stampare pdf e ocr

Messaggio da salvo2020 »

un saluto a tutti,
premetto che ormai tutto ciò che potevo fare, l'ho fatto.

non so se è semplice la cosa, ho un file pdf con ocr,
e avrei la necessita di dover rimpaginare il tutto avendo due pagine per ogni foglio
con un paio di stampanti virtuali ci sono riuscito, ma poi perdo il riconoscimento del testo
in pratica mi converte le pagini in immagini. ci sarebbe un modo per superare questo problema?
Ultima modifica di salvo2020 il mercoledì 21 ottobre 2020, 17:29, modificato 2 volte in totale.
Avatar utente
nuzzopippo
Entusiasta Emergente
Entusiasta Emergente
Messaggi: 1633
Iscrizione: giovedì 12 ottobre 2006, 11:34

Re: stampare pdf e ocr

Messaggio da nuzzopippo »

salvo2020 ha scritto:
martedì 20 ottobre 2020, 3:19
non so se è semplice la cosa, ho un file pdf con ocr,
e avrei la necessita di dover rimpaginare il tutto avendo due pagine per ogni foglio
con un paio di stampanti virtuali ci sono riuscito, ma poi perdo il riconoscimento del testo
in pratica mi converte le pagini in immagini
. ci sarebbe un modo per superare questo problema?
Suppongo che dipenda un po' da come lo fai, con "Visualizzatore di documenti" ho appena provato a "stampare" un pdf in un file pdf con due pagine a facciata ed il riconoscimento del testo con il visualizzatore viene mantenuto, se si cerca del testo nel documento viene trovato.

Definisci correttamente il Tuo problema : cosa significa "ho un file pdf con ocr"?, forse, che il file di partenza è una immagine e "posizionando" due immagini su singola pagina un eventuale ocr funziona male?
Nel caso su, può essere risolto (con una certa perdita di precisione) utilizzando, p.e., imagemagik e tesseract in uno script.
Fatti non foste a viver come bruti ...
salvo2020
Prode Principiante
Messaggi: 199
Iscrizione: giovedì 26 marzo 2020, 15:49

Re: stampare pdf e ocr

Messaggio da salvo2020 »

nuzzopippo ha scritto:
martedì 20 ottobre 2020, 7:51
Suppongo che dipenda un po' da come lo fai, con "Visualizzatore di documenti" ho appena provato a "stampare" un pdf in un file pdf con due pagine a facciata ed il riconoscimento del testo con il visualizzatore viene mantenuto, se si cerca del testo nel documento viene trovato.

Definisci correttamente il Tuo problema : cosa significa "ho un file pdf con ocr"?
magari, spero che sia un problema di esecuzione.
premetto che sto in windows10, ed ho provato vari programmi diversi sia lettori pdf che stampanti virtuali,
avevo pensato che ci potesse essere un problema su come è realizzato il pdf originale per questo sto provando anche con una stampa in pdf di una pagina del forum dove viene riconosciuto il testo. ma anche in questo caso con i programmi che sto usando si perde la possibilità di ricercare le parole diventando un'immagine.

grazie per la risposta nuzzopippo,
mi potresti dire col "Visualizzatore di documenti" cosa intendi di preciso?
parli di un programma standard su ubuntu/derivate oppure di windows?
comunque sia mi potresti indicare il SO e software che hai usato?
Avatar utente
nuzzopippo
Entusiasta Emergente
Entusiasta Emergente
Messaggi: 1633
Iscrizione: giovedì 12 ottobre 2006, 11:34

Re: stampare pdf e ocr

Messaggio da nuzzopippo »

salvo2020 ha scritto:
martedì 20 ottobre 2020, 8:22
grazie per la risposta nuzzopippo,
mi potresti dire col "Visualizzatore di documenti" cosa intendi di preciso?
parli di un programma standard su ubuntu/derivate oppure di windows?
comunque sia mi potresti indicare il SO e software che hai usato?
Windows? ... non so che dirti, non lo uso da vent'anni e non ho idea di come funzioni attualmente, credevo Tu parlassi di sistemi Linux, dato che questo è un forum ubuntu.

Parlavo di "strumenti" software normalmente disponibili in linux, "Visualizzatore di documenti" è una applicazione standard nelle distribuzioni Ubuntu o debian, versioni "ordinarie" (Gnome), manca in alcuni diversi contesti (tipo debian LXDE).
Personalmente uso diverse distribuzioni Linux su diverse macchine, preferenzialmente Debian ed Ubuntu, per lavoro manipolo spesso file PDF, se derivati da scansione di documenti (immagini, quindi) li manipolo tramite script a linea di comando basati su pdftk, imagemagik e, se devo estrarre testo, tesseract.
Fatti non foste a viver come bruti ...
Avatar utente
giulux
Amministratore
Amministratore
Messaggi: 25438
Iscrizione: domenica 10 gennaio 2010, 12:17
Desktop: ubuntu 18.04
Distribuzione: Ubuntu 18.04.3 LTS x86_64
Sesso: Maschile
Località: Roma

Re: stampare pdf e ocr

Messaggio da giulux »

Sposto in altri sistemi operativi.
Leggere per favore la descrizione delle varie sezioni prima di postare, grazie.
"Non è una segno di buona salute l'essere ben adattato ad una società malata". (Jiddu Krishnarmurti)
salvo2020
Prode Principiante
Messaggi: 199
Iscrizione: giovedì 26 marzo 2020, 15:49

Re: stampare pdf e ocr

Messaggio da salvo2020 »

nuzzopippo ha scritto:
martedì 20 ottobre 2020, 8:31
Windows? ... non so che dirti, non lo uso da vent'anni e non ho idea di come funzioni attualmente, credevo Tu parlassi di sistemi Linux, dato che questo è un forum ubuntu.

Parlavo di "strumenti" software normalmente disponibili in linux, "Visualizzatore di documenti" è una applicazione standard nelle distribuzioni Ubuntu o debian, versioni "ordinarie" (Gnome), manca in alcuni diversi contesti (tipo debian LXDE).
Personalmente uso diverse distribuzioni Linux su diverse macchine, preferenzialmente Debian ed Ubuntu, per lavoro manipolo spesso file PDF, se derivati da scansione di documenti (immagini, quindi) li manipolo tramite script a linea di comando basati su pdftk, imagemagik e, se devo estrarre testo, tesseract.
ok nuzzopippo grazie per il suggerimento, proverò utilizzando lubuntu o xubuntu live da usb (spero di riuscirci)

ps grazie giulux e scusate per aver aperto una nuova discussione nella sezione sbagliata.
salvo2020
Prode Principiante
Messaggi: 199
Iscrizione: giovedì 26 marzo 2020, 15:49

Re: stampare pdf e ocr

Messaggio da salvo2020 »

ciao nuzzopippo ancora grazie, non solo ha funzionato alla grande, ma è stata anche una procedura semplice come volevo :birra:
Avatar utente
trekfan1
Moderatore Globale
Moderatore Globale
Messaggi: 23518
Iscrizione: domenica 21 maggio 2006, 10:51
Desktop: Gnome
Distribuzione: Ubuntu 23.10 e 24.04 (dev)
Sesso: Maschile
Località: Formigine (MO) | Accecante Asceta

Re: [RISOLTO] stampare pdf e ocr

Messaggio da trekfan1 »

Il [Risolto] vuole messo evitando di scriverlo tutto maiuscolo, correggi, grazie :)
salvo2020
Prode Principiante
Messaggi: 199
Iscrizione: giovedì 26 marzo 2020, 15:49

Re: [Risolto] stampare pdf e ocr

Messaggio da salvo2020 »

sorry trekfan1, aggiustato.
Scrivi risposta

Ritorna a “Altre distribuzioni e sistemi operativi”

Chi c’è in linea

Visualizzano questa sezione: 0 utenti iscritti e 3 ospiti